C114通信網(wǎng)  |  通信人家園

人工智能
2024/12/3 15:54

騰訊混元大模型上線并開源文生視頻能力:支持中英文雙語輸入,參數(shù)量130億

IT之家  沛霖(實習(xí))

騰訊今日宣布,混元大模型上線并開源文生視頻能力,參數(shù)量 130 億,支持中英文雙語輸入。

▲ 提示詞:肩攝視角平移切入,清晨陽光透過紗簾灑落。畫面中央是一位老爺爺,正在木工臺前專注雕刻。攝影機徐徐推近,特寫他布滿皺紋的手指和木屑紛飛。背景虛化的老房間里,木工工具整齊排列,墻上掛滿完成的作品。

官方宣稱,騰訊混元視頻生成大模型可以生成“超寫實的”高質(zhì)量視頻,生成的畫面不容易變形;在鏡面或鏡子場景中,可以做到鏡面反射動作和外面完全同步,光影反射基本符合物理規(guī)律。

▲ 提示詞:超大水管浪尖,沖浪者在浪尖起跳,完成空中轉(zhuǎn)體。攝影機從海浪內(nèi)部穿越而出,捕捉陽光透過海水的瞬間。水花在空中形成完美弧線,沖浪板劃過水面留下軌跡。最后定格在沖浪者穿越水簾的完美瞬間。

▲ 提示詞:手持長焦跟拍,磨砂金屬車廂在高速中留下光帶。隧道燈光斷續(xù)閃過,映照出乘客若隱若現(xiàn)的側(cè)臉。防護玻璃上的水珠隨速度扭曲變形,構(gòu)建出城市地下的光影迷宮。

據(jù)介紹,騰訊混元視頻生成大模型采用 DiT 架構(gòu),適配了新一代文本編碼器提升語義遵循,更好地應(yīng)對多個主體描繪,實現(xiàn)更加細致的指令和畫面呈現(xiàn)。

▲ 提示詞:超廣角俯拍,熱氣球節(jié)。數(shù)百只彩色熱氣球緩緩升空,篝火在地面點亮黎明。云層被晨光染成粉色,構(gòu)成壯觀的空中景觀。

在“騰訊元寶 App”,進入“AI 應(yīng)用”,選擇“AI 視頻”,可申請試用。

騰訊表示,本次開源包含模型權(quán)重、推理代碼、模型算法等完整模型,可供企業(yè)與個人開發(fā)者免費使用和開發(fā)生態(tài)插件。

附相關(guān)鏈接如下:

主頁:https://aivideo.hunyuan.tencent.com/

Github:https://github.com/Tencent/HunyuanVideo

Huggingface:https://huggingface.co/tencent/HunyuanVideo

給作者點贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141