近日,由工業(yè)和信息化部電子科學(xué)技術(shù)情報(bào)所洪京一所長(zhǎng)代表聯(lián)盟秘書處單位發(fā)布的《2013中國智能語音產(chǎn)業(yè)發(fā)展白皮書》指出,智能語音已經(jīng)進(jìn)入快速應(yīng)用階段,預(yù)計(jì)到2017年,產(chǎn)業(yè)規(guī)模將達(dá)到101.4億元。而語音作為人類溝通和獲取信息最自然最便捷的方式,勢(shì)必會(huì)成為人機(jī)交互的未來趨勢(shì)。
智能語音開啟移動(dòng)互聯(lián)網(wǎng)發(fā)展新時(shí)代
隨著移動(dòng)互聯(lián)網(wǎng)時(shí)代的來臨,智能語音作為信息交互的重要入口之一,成為各大手機(jī)制造商、運(yùn)營商和互聯(lián)網(wǎng)企業(yè)等巨頭爭(zhēng)相搶占的制高點(diǎn)。在過去的三年中,全球智能語音市場(chǎng)不斷擴(kuò)大。日前,微軟也亮出其智能語音技術(shù)的最新成果:“實(shí)時(shí)語音翻譯系統(tǒng)”和“基于Kinect的手語翻譯系統(tǒng)”。此前,在“百度世界2013”大會(huì)上,百度宣布向開發(fā)者免費(fèi)開放整個(gè)語音識(shí)別平臺(tái)。
事實(shí)上,智能語音產(chǎn)業(yè)主要指通過語音合成技術(shù)和語音識(shí)別技術(shù),為用戶提供各種服務(wù)的產(chǎn)業(yè)。一般來說,用戶只需要用說話的方式給服務(wù)終端發(fā)布命令,就能得到相應(yīng)的服務(wù)。智能語音交互首先改變的是移動(dòng)互聯(lián)網(wǎng)。以iPhone中內(nèi)置的Siri為例,用戶以自然語言的方式對(duì)智能手機(jī)下達(dá)指令,而手機(jī)根據(jù)用戶語音和用戶當(dāng)前的環(huán)境及上下文對(duì)用戶意圖進(jìn)行理解,并按照用戶意圖執(zhí)行命令的過程。
盡管目前智能語音產(chǎn)業(yè)規(guī)模相對(duì)較小,但業(yè)內(nèi)人士普遍認(rèn)為,語音技術(shù)在兩三年內(nèi),會(huì)徹底改變當(dāng)前的人機(jī)交互方式。移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)技術(shù)的飛速發(fā)展,智能語音已由技術(shù)研發(fā)進(jìn)入快速應(yīng)用階段,產(chǎn)業(yè)規(guī)模大幅提升。根據(jù)工業(yè)和信息化部電子科學(xué)技術(shù)情報(bào)研究所數(shù)據(jù),2012年全球智能語音產(chǎn)業(yè)規(guī)模整體達(dá)到24.4億美元,同比增長(zhǎng)24.0%。其中,中國智能語音產(chǎn)業(yè)規(guī)模近8.6億元,同比增長(zhǎng)38.2%,帶動(dòng)移動(dòng)互聯(lián)網(wǎng)、智能家電、教育等相關(guān)產(chǎn)業(yè)規(guī)模增長(zhǎng)100億元。
智能語音應(yīng)用漸成信息消費(fèi)熱點(diǎn)
目前,在全球電子設(shè)備制造業(yè)中,微型電聲元器件的應(yīng)用較為廣泛,隨著下游手機(jī)、筆記本電腦、平板電視、數(shù)碼相機(jī)等個(gè)人消費(fèi)類電子產(chǎn)品的持續(xù)發(fā)展,其市場(chǎng)需求將不斷快速增長(zhǎng)。百度多媒體負(fù)責(zé)人余凱曾表示“如今的語音搜索不同于傳統(tǒng)搜索模式,不是基于無關(guān)聯(lián)的幾個(gè)關(guān)鍵詞來反饋結(jié)果,而是能夠理解用戶指令,完成一項(xiàng)完整的任務(wù)。”基于此,語音必將成為日后移動(dòng)互聯(lián)網(wǎng)的入口之一。
智能語音技術(shù)發(fā)展至今,市場(chǎng)上也涌現(xiàn)出越來越多的語音識(shí)別軟件,如語音類搜索應(yīng)用Dragon Search、語音類聽寫功能整合軟件訊飛口訊、語音類音樂軟件Shazam、口語在線學(xué)習(xí)平臺(tái)思必馳AIChinese,以及語音控制軟件Siri等。在國外語音市場(chǎng)主要以語音識(shí)別為主,具有代表性的產(chǎn)品有Nuance的Dragon Dictation,蘋果新推出的Siri;而在國內(nèi),語音市場(chǎng)主要以語音合成為主,其中科大訊飛及捷通華聲基本占領(lǐng)了語音合成市場(chǎng)!
市場(chǎng)規(guī)模的大幅提升為行業(yè)企業(yè)提供了巨大的市場(chǎng)空間。微信的微語音插件、搜狗語音助手、易信等,都采用了語音識(shí)別應(yīng)用。另外,電視和機(jī)頂盒也是采用智能語音交互比較積極的行業(yè)。傳統(tǒng)的電視機(jī)和機(jī)頂盒的遙控操作都比較復(fù)雜,而采用智能語音交互技術(shù),只需對(duì)著遙控器說話,就可以控制電視,輸入文字、打開應(yīng)用、播放視頻都可輕松實(shí)現(xiàn)。汽車、玩具、穿戴設(shè)備也都對(duì)智能交互技術(shù)能提供的全新交互方式抱有很大的期待。語音技術(shù)作為一個(gè)已經(jīng)漸漸成熟的基礎(chǔ)技術(shù),用戶認(rèn)知度和市場(chǎng)規(guī)模也正在逐漸擴(kuò)大。
智能語音產(chǎn)業(yè)如何破解技術(shù)壁壘?
雖然人工智能技術(shù)是從計(jì)算機(jī)出現(xiàn)以來就開始研究,但智能語音離實(shí)際應(yīng)用還有相當(dāng)?shù)木嚯x,路還很長(zhǎng)。據(jù)易觀智庫發(fā)布的數(shù)據(jù)顯示,語音助手類應(yīng)用累積下載量排行中,沖動(dòng)語音助手以29.8%占比第一,其次是智能360占25.2%,而科大訊飛旗下的訊飛語點(diǎn)由于靈犀的分流,排名第三,占到20.1%。據(jù)蟲洞語音助手創(chuàng)始團(tuán)隊(duì)成員王向一透露,目前蟲洞語音助手總用戶為1600萬。按比例計(jì)算,國內(nèi)所有語音助手總每月下載量?jī)H為4442萬,用戶量總和僅5000萬。
此外,一份國外最新的調(diào)查顯示,截至目前,約有85%的iOS 7用戶從未使用過Siri,在使用Siri的用戶中,有46%的用戶感到失望,認(rèn)為Ssiri發(fā)揮的實(shí)際作用不大。這些數(shù)據(jù)都可以看出,智能語音技術(shù)離實(shí)際應(yīng)用還很遠(yuǎn)。當(dāng)前,智能語音類應(yīng)用在語音識(shí)別,語義解析,內(nèi)容問答等方面存在較大的技術(shù)壁壘。在全球范圍內(nèi),將此技術(shù)與商業(yè)化完美結(jié)合的廠商也是寥寥無幾。人機(jī)交互式的語音技術(shù)僅是在諸如輸入法等產(chǎn)品中充當(dāng)配角,真正的語音產(chǎn)品形態(tài)尚未出現(xiàn)!
目前還沒有一個(gè)較為成功的前端語音產(chǎn)品可以主宰市場(chǎng),功能上的同質(zhì)化、用戶體驗(yàn)的不流暢、語音識(shí)別的準(zhǔn)確率不高等等問題嚴(yán)重影響其發(fā)展。如何突破技術(shù)壁壘實(shí)行商業(yè)化運(yùn)作將是智能語音規(guī)模普及的關(guān)鍵。因此,在未來發(fā)展過程中,廠商仍應(yīng)加強(qiáng)語音操控功能的技術(shù)完善。另外,還應(yīng)著眼于提升用戶的綜合使用體驗(yàn),而不僅僅是技術(shù)層面的應(yīng)用,切忌陷入單純的技術(shù)比拼怪圈。