編者按:回顧2013,智能語音熱潮整整嗨了一整年,最終以工信部牽頭主辦的中國語音產(chǎn)業(yè)聯(lián)盟年會為此畫上了一個圓滿的句號。然而2014年國內(nèi)整個語音產(chǎn)業(yè)開局卻顯疲軟,熱度呈下滑趨勢,而智能圖像、人工智能等新概念卻逐漸興起,為何?
一波三折的“智能語音”熱
早在2013年底中國語音產(chǎn)業(yè)聯(lián)盟年會上,北大信息技術(shù)學(xué)院智能科學(xué)系副主任吳璽宏教授就已拋出了“隨意說”一詞,他說:“現(xiàn)在的語音識別是否能在噪音環(huán)境中優(yōu)先識別人聲?是否真正能達(dá)到語義理解?……”并且著重強(qiáng)調(diào)產(chǎn)業(yè)界切勿過早過度宣傳“語音識別”準(zhǔn)確率、“語義理解”等大詞,這容易拉高用戶的期望值,其實對產(chǎn)業(yè)的發(fā)展有阻礙作用。而清華大學(xué)鄭方博士也對北大觀點給予了支持,表示產(chǎn)業(yè)界切勿過早熱炒“語義理解”等熱詞,在語音熱潮背后更需務(wù)實,技術(shù)與宣傳應(yīng)保持一致;同時也建議政府多多支持中小型創(chuàng)新企業(yè),強(qiáng)調(diào)好點子多來自中小型公司,對于中小型企業(yè)而言沒有創(chuàng)新突破就意味著馬上被市場淘汰,生存就是一個很大的問題,而大公司可能更多地需要照顧整體發(fā)展,創(chuàng)新進(jìn)度相比之下較慢于中小型企業(yè)。此外,也希望加強(qiáng)學(xué)院與產(chǎn)業(yè)的合作,政府給予支持,以此吸引流失在外的尖端科技人才回歸祖國。
果不其然,一語成讖,一大批新興智能語音技術(shù)公司拔地而起,擁擠進(jìn)智能語音圈,百度、騰訊、谷歌、微軟等大公司也紛紛進(jìn)入這一領(lǐng)域,整體看上去一片大好的景象,然而實際情況卻不容樂觀。從用戶的使用率和體驗評價可以看出,大多數(shù)移動端和其它硬件上的智能語音交互功能基本還是一個你有我也有的“擺飾”,就連最著名的蘋果Siri的使用率也低至15.2%。
進(jìn)入2014年后,隨著人工智能概念的崛起,語音熱潮暫時脫離了大眾和媒體的關(guān)注視野,這股熱潮也隨之“又”再次落去--之所以說“又”,是因為智能語音熱潮早在幾年前就已經(jīng)歷了幾次起起落落,因此有專家笑稱“智能語音五年火一次,經(jīng)歷著‘熱一陣、死一陣’的輪回。”
追其原因,高AI智能語音的實現(xiàn)還是一個任重而道遠(yuǎn)的夢想,除了用戶數(shù)據(jù)積累等技術(shù)因素,語音識別率、用戶習(xí)慣與對智能語音單方面的理解仍然是不得小視的問題。
那么,借鑒國內(nèi)最高學(xué)府兩位教授的勸言,國內(nèi)又有多少企業(yè)接納并實行了以上建議了呢?
“ASR+TTS”智能語音的完整組合
作為國內(nèi)智能語音圈數(shù)一數(shù)二的語音技術(shù)服務(wù)商捷通華聲在中國語音產(chǎn)業(yè)聯(lián)盟年會結(jié)束后,審時度勢,借助在京城中關(guān)村軟件園的“地利”之勢以及核心團(tuán)隊人員來自清華大學(xué)的“人和”關(guān)系,積極聯(lián)動清華學(xué)府,并成功吸引清華大學(xué)注資捷通華聲,成為第二大股東。更重要的是捷通華聲得到了清華大學(xué)的長年積累研究的學(xué)術(shù)和技術(shù)支持,打通了國內(nèi)產(chǎn)、學(xué)、研三派互通有無的“任督二脈”,也成就了“TTS+ASR”雙劍合璧的靈云智能語音完美展現(xiàn)。