你的位置：连云港杖蚊握水泥股份有限公司 > 达林顿三极管 >

智谱升级AI视频模子为“新清影” 再丰富多模态模子矩阵

发布日期：2024-11-09 00:05 点击次数：55

智谱升级AI视频模子为“新清影” 再丰富多模态模子矩阵

本报讯（记者谢岚见习记者梁傲男）11月8日，智谱晓谕，其AI视频生成模子“清影”已全面升级为“新清影”。这次升级带来了多项显耀检阅，包括因循10秒时长、4K、60帧的超高清画质，淘气尺寸的视频生成，行将内置音效功能，同期进一步优化了东说念主体动作和物理寰宇的模拟精度。

据悉，“新清影”基于CogVideoX模子的最新时间进展，以及智谱新推出的音效模子CogSound，兑现了模子智力的全面提高。这包括图生视频质地、好意思学发达、瓦解合感性及复杂辅导词语义清爽的显耀增强，以及更精雅的东说念主物面部饰演、动作连贯性和物理特质模拟。“新清影”还因循多通说念生成智力，可一次性生成4个视频，知足千般化需求。

早在3个月前，动作国内首个面向公众灵通的视频生成居品，“清影”已在智谱清言App上线，用户只需输入一段指示或图片，即可在30秒内生成AI视频。这一革命为影视创作带来了更多可能性，如告白制作、短视频、色调包梗图等。

在“清影”发布后，GLM时间团队先后开源了CogVideoX2B和5B版块两个模子，推进了视频生成时间的普及和愚弄。其中，CogVideoX-5B模子自开源以来受到了平凡宥恕，并繁衍出了大齐的二次开辟名目。

值得一提的是，跟着本月音效模子CogSound的加入，“新清影”将新增与画面匹配的音效功能，使视频愈加当然传神。音效模子将于本月上线智谱清言App，与新清影扫数生成有声AI影片。智谱方面默示：“咱们的理念念气象是，用户只需提供一个好的创意，剩下的责任齐由AI扶持完成，应付将念念法或图片挪动为一段自带配景音乐的影片。”

可见，智谱在声息模态鸿沟也兑现了东说念主声、音效、音乐的多链路布局。两周前发布的GLM-4-Voice情怀语音模子，以及行将上线的音效模子CogSound，共同完善了智谱基于图像、视频和声息的多模态模子矩阵。这意味着智谱在多模态和器具两个维度上齐朝着AGI的指标迈出了一小步。

智谱修复于2019年6月份，发源于清华大学计较机系常识工程执行室，专注于开辟新一代清楚智能大模子。一直以来，智谱以对标OpenAI全模子居品线为痕迹，不息研发了包括文本、代码、图像、Agent等方面的自研模子和居品矩阵。

智谱干系认真东说念主对《证券日报》记者默示，生成视频将为影视责任者、短视频创作家提高产量、产能，在其坐褥经由中施展蹙迫作用。不到一年时辰，生成视频时间在视频时长、生成速率、区分率、一致性等方面还是线路出长足杰出。“新清影”往前又迈进了一步，改日，智谱将联袂结结伴伴，基于更丰富的视觉实质，产出更好的AI生成视频器具。

从视频径直生成音效的模子，意味着“默片Sora”将参预“有声电影时间”。在业内东说念主士看来，跟着音效模子CogSound的加入，智谱多模态大模子家眷在声息模态方面兑现了东说念主声、音效的多链路布局，使得智谱基于图像、视频和声息的多模态模子矩阵更为丰富。

上一篇：特朗普上台影响中俄? 普京对外声明: 两国互信水平处在历史最高点

下一篇：前10个月我国货色交易出进口增长5.2%

你的位置：连云港杖蚊握水泥股份有限公司 > 达林顿三极管 >

热点资讯

相关资讯