騰訊會議背后又一黑科技浮出水面。7月7日,為了應對復雜聲學場景下的實時語音通信技術挑戰(zhàn),解決企業(yè)會議室開會難題,騰訊會議旗下天籟實驗室推出天籟語音模組方案,由騰訊AI Lab多項技術加持,實現(xiàn)12米超長距離拾音,消除超過200種會議噪聲,在雙講,回聲消除等方面實現(xiàn)突破性升級。
據(jù)了解,該方案將應用于騰訊會議Rooms?顧C型上,并已率先授權開放給騰訊會議Rooms專款硬件合作伙伴,助力打造會議室場景高清、純凈、流暢的開會體驗。與此同時,不做硬件的騰訊會議,目前還通過開放音視頻認證標準,聯(lián)合硬件設備廠商,共同為企業(yè)量身打造“軟硬一體”的云視頻會議解決方案。
解決企業(yè)會議室復雜場景開會難題,給企業(yè)會議室裝上“順風耳”
當下,在線會議成為企業(yè)高效辦公的標配,越來越多的企業(yè)衍生出線上線下協(xié)同開會的混合式會議需求,隨之而來的是會議室場景下面臨的聲學挑戰(zhàn),一方面,在遠場情景下,講話者會因離麥克風距離遠,導致麥克風采集到的有效信號逐漸減弱,信噪比降低。另一方面則經(jīng)常因為會議室場地空曠,聲音經(jīng)過玻璃和墻面的折射后產(chǎn)生反射聲和混響、各類噪聲也會嚴重影響到開會質量。
對于企業(yè)來說,如何有效應對企業(yè)會議室場景下復雜的聲學環(huán)境,成為一個新課題。
騰訊會議基于會議室的特定場景,推出天籟語音模組方案,首次結合房間聲場感知、采集和空間聲場重建技術,開創(chuàng)性地解決了會議室復雜場景下,遠場多人音頻通信、多講話人實時追蹤、多人自動取景等實時音視頻技術難題,幫助企業(yè)和用戶實現(xiàn)在遠場復雜物理空間下通信體驗的突破性提升。
例如,同一會議室中,隨著人與音視頻設備的距離變遠,聲音在傳播過程中也會逐漸減弱,因此參加企業(yè)培訓、工作匯報等企業(yè)會議時,最常見的一個現(xiàn)象就是聽不清甚至聽不到。針對這一點,天籟語音模組方案將多個MEMS麥克風板嵌入到會議大屏中,結合音頻處理器,能夠實現(xiàn)180度廣角、12米超長距離拾音,相當于參會者即使相隔4層樓的距離,也完全可以像面對面交流般清晰、自然,給予參會者更靈活的活動空間,讓其在自由不設限的氛圍中開展討論。
在遠程會議中,很多人經(jīng)常會遇到延遲而導致的聲音卡頓、聲音忽快忽慢,甚至與會者同時安靜或同時說話等尷尬的情況,極易破壞會議溝通思路,影響會議溝通進度。為了解決這一痛點,天籟語音模組方案突破性地將設備上行時延降低至幾十毫秒,可以讓遠程語音交流如面對面交談般實時。
值得一提的是,針對多人同時說話時聲音明顯失真現(xiàn)象,天籟語音模組方案則能有效實現(xiàn)雙講無剪切、無回聲泄露、無近端語音抑制,有效確保多人討論時,每個人的聲音都聽得見、聽得清、聽得真,提升會議參與感。天籟語音模組還基于深度學習模型,不僅可以將空調(diào)聲、風扇聲等平穩(wěn)噪聲的降噪深度提高至40dB,還對包括寫筆觸屏聲、鍵盤聲、手指敲桌子、放水杯、翻紙等會議室場景下超200種各種突發(fā)噪聲進行針對性消除,提升語音信噪比,為用戶打造更加專注高效的會議氛圍。
開放技術能力,打造“軟硬一體”的云視頻會議生態(tài)
作為一款云視頻會議產(chǎn)品,騰訊會議自2019年底推出以來,一直致力于滿足用戶在不同場景下的開會需求。去年9月,騰訊會議發(fā)布企業(yè)版、會議室連接器以及新一代云視頻會議室解決方案“騰訊會議Rooms”, 試圖從根源上解決了企業(yè)會議組織難、效率低、管理難等問題。
除了與硬件廠商的合作,騰訊會議還積極通過開放標準API接口以及二次開發(fā),助力企業(yè)IT、系統(tǒng)集成商等合作伙伴輕松適配多種會議場景,快速實現(xiàn)與騰訊會議的連接。數(shù)據(jù)顯示,近萬家企業(yè)通過接入騰訊會議API,大幅提升不同場景的會議體驗。
此次推出天籟語音模組方案,是騰訊會議基于企業(yè)用戶需求,在企業(yè)會議室場景下的再次發(fā)力。騰訊天籟實驗室的融合感知編碼、聲學硬件設計、經(jīng)典語音信號處理和深度學習技術,通過覆蓋不同應用場景,網(wǎng)絡條件和終端設備,為騰訊會議提供底層實時音頻通信技術。
未來,騰訊會議將持續(xù)深耕用戶需求、創(chuàng)新技術、打磨產(chǎn)品,為用戶提供更清晰、更流暢、實時互動會議體驗,增強企業(yè)的協(xié)作溝通,從而不斷提升企業(yè)競爭力,為企業(yè)的組織升級提供源動力。