騰訊今日宣布,混元大模型上線并開源文生視頻能力,參數(shù)量 130 億,支持中英文雙語輸入。
▲ 提示詞:肩攝視角平移切入,清晨陽光透過紗簾灑落。畫面中央是一位老爺爺,正在木工臺前專注雕刻。攝影機徐徐推近,特寫他布滿皺紋的手指和木屑紛飛。背景虛化的老房間里,木工工具整齊排列,墻上掛滿完成的作品。
官方宣稱,騰訊混元視頻生成大模型可以生成“超寫實的”高質(zhì)量視頻,生成的畫面不容易變形;在鏡面或鏡子場景中,可以做到鏡面反射動作和外面完全同步,光影反射基本符合物理規(guī)律。
▲ 提示詞:超大水管浪尖,沖浪者在浪尖起跳,完成空中轉(zhuǎn)體。攝影機從海浪內(nèi)部穿越而出,捕捉陽光透過海水的瞬間。水花在空中形成完美弧線,沖浪板劃過水面留下軌跡。最后定格在沖浪者穿越水簾的完美瞬間。
▲ 提示詞:手持長焦跟拍,磨砂金屬車廂在高速中留下光帶。隧道燈光斷續(xù)閃過,映照出乘客若隱若現(xiàn)的側(cè)臉。防護玻璃上的水珠隨速度扭曲變形,構(gòu)建出城市地下的光影迷宮。
據(jù)介紹,騰訊混元視頻生成大模型采用 DiT 架構(gòu),適配了新一代文本編碼器提升語義遵循,更好地應(yīng)對多個主體描繪,實現(xiàn)更加細致的指令和畫面呈現(xiàn)。
▲ 提示詞:超廣角俯拍,熱氣球節(jié)。數(shù)百只彩色熱氣球緩緩升空,篝火在地面點亮黎明。云層被晨光染成粉色,構(gòu)成壯觀的空中景觀。
在“騰訊元寶 App”,進入“AI 應(yīng)用”,選擇“AI 視頻”,可申請試用。
騰訊表示,本次開源包含模型權(quán)重、推理代碼、模型算法等完整模型,可供企業(yè)與個人開發(fā)者免費使用和開發(fā)生態(tài)插件。
附相關(guān)鏈接如下:
主頁:https://aivideo.hunyuan.tencent.com/
Github:https://github.com/Tencent/HunyuanVideo