C114通信網(wǎng)  |  通信人家園

人工智能
2024/8/23 09:49

微軟 Azure AI 語音服務(wù)推出虛擬人形象,支持文本轉(zhuǎn)視頻

IT之家  汪淼

微軟 Azure AI 語音服務(wù)允許開發(fā)者構(gòu)建多語言生成式 AI 語音應(yīng)用,Azure AI 語音服務(wù)最新推出了文本到語音虛擬人功能,可以將簡單的文本轉(zhuǎn)換為人類自然說話視頻

今天,微軟宣布全面推出 Text to Speech Avatar功能。這項(xiàng)新功能使開發(fā)者能夠?yàn)槠溆脩魟?chuàng)建個性化虛擬人。該服務(wù)的輸出視頻分辨率為 1920 x 1080,每秒 25 幀。IT之家附示例如下:

Text to Speech Avatar 具有以下功能:

將文本轉(zhuǎn)換為由 Azure AI 文本轉(zhuǎn)語音提供支持的人類說話視頻,該視頻具有自然的聲音。

提供不同的人物預(yù)設(shè)形象。

形象的聲音由 Azure AI 文本轉(zhuǎn)語音生成。

使用批量合成 API 異步或?qū)崟r合成文本到語音人像視頻。

在 Speech Studio 中提供內(nèi)容創(chuàng)建工具,無需編碼即可創(chuàng)建視頻內(nèi)容。

通過 Speech Studio 中的實(shí)時聊天頭像工具啟用實(shí)時人像對話。

定價方面,文本轉(zhuǎn)視頻服務(wù)的收費(fèi)將根據(jù)視頻輸出的長度計(jì)算并按秒收費(fèi)。該服務(wù)現(xiàn)已在東南亞、北歐、西歐、瑞典中部、美國中南部和美國西部地區(qū)推出。

給作者點(diǎn)贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點(diǎn),與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141