2024/12/3 15:54

騰訊混元大模型上線并開源文生視頻能力：支持中英文雙語輸入，參數(shù)量130億

IT之家沛霖（實習(xí)）

騰訊今日宣布，混元大模型上線并開源文生視頻能力，參數(shù)量 130 億，支持中英文雙語輸入。

▲ 提示詞：肩攝視角平移切入，清晨陽光透過紗簾灑落。畫面中央是一位老爺爺，正在木工臺前專注雕刻。攝影機徐徐推近，特寫他布滿皺紋的手指和木屑紛飛。背景虛化的老房間里，木工工具整齊排列，墻上掛滿完成的作品。

官方宣稱，騰訊混元視頻生成大模型可以生成“超寫實的”高質(zhì)量視頻，生成的畫面不容易變形；在鏡面或鏡子場景中，可以做到鏡面反射動作和外面完全同步，光影反射基本符合物理規(guī)律。

▲ 提示詞：超大水管浪尖，沖浪者在浪尖起跳，完成空中轉(zhuǎn)體。攝影機從海浪內(nèi)部穿越而出，捕捉陽光透過海水的瞬間。水花在空中形成完美弧線，沖浪板劃過水面留下軌跡。最后定格在沖浪者穿越水簾的完美瞬間。

▲ 提示詞：手持長焦跟拍，磨砂金屬車廂在高速中留下光帶。隧道燈光斷續(xù)閃過，映照出乘客若隱若現(xiàn)的側(cè)臉。防護玻璃上的水珠隨速度扭曲變形，構(gòu)建出城市地下的光影迷宮。

據(jù)介紹，騰訊混元視頻生成大模型采用 DiT 架構(gòu)，適配了新一代文本編碼器提升語義遵循，更好地應(yīng)對多個主體描繪，實現(xiàn)更加細致的指令和畫面呈現(xiàn)。

▲ 提示詞：超廣角俯拍，熱氣球節(jié)。數(shù)百只彩色熱氣球緩緩升空，篝火在地面點亮黎明。云層被晨光染成粉色，構(gòu)成壯觀的空中景觀。

在“騰訊元寶 App”，進入“AI 應(yīng)用”，選擇“AI 視頻”，可申請試用。

騰訊表示，本次開源包含模型權(quán)重、推理代碼、模型算法等完整模型，可供企業(yè)與個人開發(fā)者免費使用和開發(fā)生態(tài)插件。

附相關(guān)鏈接如下：

主頁：https://aivideo.hunyuan.tencent.com/

Github：https://github.com/Tencent/HunyuanVideo

Huggingface：https://huggingface.co/tencent/HunyuanVideo

給作者點贊

0 VS 0

寫得不太好

免責(zé)聲明：本文僅代表作者個人觀點，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實，對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實相關(guān)內(nèi)容。

相關(guān)鏈接

騰訊、榮耀達成戰(zhàn)略合作：AI、云計算、游戲科技等領(lǐng)域?qū)ⅰ皟?yōu)勢互補”
IT之家清源12-20
蘋果與騰訊、字節(jié)跳動就AI合作進行商討
C114通信網(wǎng) 岳明12-19
傳AI集成到蘋果iPhone 騰訊大漲4% 字節(jié)概念股漲停
快科技隨心12-19
消息稱蘋果與騰訊、字節(jié)跳動談判，希望在中國推出AI功能
鳳凰科技簫雨12-19