CTI論壇(ctiforum.com)(編譯/老秦):在過去的幾年里,語音技術(shù)似乎以光速發(fā)展。隨著人工智能(AI)以更強(qiáng)的能力進(jìn)一步滲透到該行業(yè),2020年尤為關(guān)鍵。自冠狀病毒危機(jī)爆發(fā)以來,這些能力肯定受到了考驗(yàn)。這場(chǎng)危機(jī)迫使全球數(shù)百萬人在家工作、購物和娛樂,并日益依賴由人工智能驅(qū)動(dòng)的語音技術(shù)支持的創(chuàng)新應(yīng)用程序、平臺(tái)和在線解決方案。
Cogito的信號(hào)處理和機(jī)器學(xué)習(xí)主管JohnKane說,人工智能和語音終于達(dá)到了一個(gè)新的高度。
這個(gè)行業(yè)正在經(jīng)歷重大的勝利,比如能夠準(zhǔn)確地從語音中識(shí)別文本,創(chuàng)造出聽起來自然的計(jì)算機(jī)聲音。他說:新產(chǎn)品現(xiàn)在可以分析語言的非言語特征。言語中的許多意義來自于說話的方式,而不僅僅是所說的話。而語音技術(shù)讀取和分析這些特征的能力是該行業(yè)向前邁出的一大步。
Orbita首席執(zhí)行官Bill Rogers也同意這一觀點(diǎn)。
如今的機(jī)器學(xué)習(xí)算法可以預(yù)測(cè)并提出建議,從而實(shí)現(xiàn)與人類水平的自動(dòng)對(duì)話。這方面的高級(jí)應(yīng)用包括結(jié)合生物標(biāo)記來理解人類的情緒,并從語調(diào)模式和基于語音識(shí)別的用戶識(shí)別中得出結(jié)論,他解釋道。
其他人也同意,后一點(diǎn)尤為重要。
在同理心和同情心對(duì)成功互動(dòng)至關(guān)重要的時(shí)代,語音技術(shù)的門檻已經(jīng)提高,Interactions的研究與創(chuàng)新總監(jiān)Michael Johnston堅(jiān)持說?,F(xiàn)代人工智能系統(tǒng)不僅提供日常自動(dòng)化,而且已經(jīng)開始依靠客戶和座席之間的對(duì)話,并以許多新的方式增加價(jià)值,例如提供個(gè)性化建議和呈現(xiàn)相關(guān)信息和內(nèi)容。
最新的統(tǒng)計(jì)數(shù)據(jù)強(qiáng)調(diào)了語音和人工智能的重要性:
- Allied Market Research預(yù)計(jì),未來7年,全球虛擬助理市場(chǎng)將增長37.7%,到2027年將達(dá)到443億美元。
- 根據(jù)insightSLICE的數(shù)據(jù),到2030年,全球語音和語音識(shí)別市場(chǎng)預(yù)計(jì)將達(dá)到430億美元。
- 據(jù)谷歌統(tǒng)計(jì),全球27%的在線用戶使用語音搜索;eMarketer顯示,幾乎40%的美國互聯(lián)網(wǎng)用戶和三分之一的總?cè)丝谑褂谜Z音;據(jù)Perficient統(tǒng)計(jì),目前55%的智能手機(jī)用戶使用語音搜索。
- 根據(jù)New Vantage的研究,10家企業(yè)中有9家以上正在對(duì)人工智能進(jìn)行投資。
年度回顧
如果不優(yōu)先考慮COVID-19以及它如何迫使人工智能迎接挑戰(zhàn),就不可能評(píng)估2020年。
毫不奇怪,冠狀病毒是人工智能采用和語音技術(shù)創(chuàng)新的主要催化劑。廣泛的社會(huì)隔離以及對(duì)遠(yuǎn)程通信和連接的需求將會(huì)話人工智能推向了中心舞臺(tái),Rogers說。
例如:傳統(tǒng)的聯(lián)絡(luò)中心越來越多地轉(zhuǎn)向?qū)υ捠饺斯ぶ悄?,以確保業(yè)務(wù)連續(xù)性。
Johnston說:在一個(gè)充滿不確定性和混亂的時(shí)代,為客戶提供一致、有效服務(wù)的能力可能比以往任何時(shí)候都更為重要。
醫(yī)療保健組織和提供者也令人印象深刻地采用人工智能和語音技術(shù)來清除冠狀病毒的障礙。
Just AI首席執(zhí)行官兼創(chuàng)始人Kiril lPetrov說:以人工智能為動(dòng)力的聊天機(jī)器人和虛擬助理站在對(duì)抗COVID的最前線,幫助篩選和分類患者、進(jìn)行調(diào)查、共享信息,并在人們無法離開家的時(shí)候?qū)崿F(xiàn)遠(yuǎn)程醫(yī)療。
使用語音分析和護(hù)理協(xié)調(diào)團(tuán)隊(duì),高?;颊咭材軌蚋l繁地聯(lián)系,從而推動(dòng)實(shí)時(shí)數(shù)據(jù)和參與。
Cosán集團(tuán)創(chuàng)始人兼首席營銷和發(fā)展官DavidHunt說:隨著疫情的持續(xù),人們對(duì)心理健康的擔(dān)憂增加,人工智能技術(shù)已經(jīng)被用來提高患者的參與度,監(jiān)測(cè)心理健康的變化。
總的來說,2020年讓商界領(lǐng)袖意識(shí)到,消費(fèi)者習(xí)慣將繼續(xù)快速演變。
越來越多的公司認(rèn)識(shí)到,人工智能可以幫助應(yīng)對(duì)這些變化,繼續(xù)提供優(yōu)質(zhì)的客戶體驗(yàn),從而幫助公司與客戶建立更好的關(guān)系。Read Speaker北美區(qū)總裁Matt Muldoon說:公司已經(jīng)開始利用人工智能開發(fā)出更感性、更高質(zhì)量的聲音,品牌也使用了更多的交互式語音廣告,讓他們能夠直接與消費(fèi)者交談。
2020年的其他亮點(diǎn)也很重要:
- 自動(dòng)語音識(shí)別通過不斷增加的遞歸神經(jīng)網(wǎng)絡(luò)傳感器的應(yīng)用,實(shí)現(xiàn)了又一個(gè)飛躍,從而提高了準(zhǔn)確性,減少了計(jì)算量。
- FacebookAI的wav2vec2.0吸引了大量的關(guān)注。Kane說:wav2vec2.0是音頻和語音的一項(xiàng)創(chuàng)新,不需要自動(dòng)語音識(shí)別,它為下游的音頻和語音分類任務(wù)提供了強(qiáng)大的原材料。
- 引入OpenAI的GPT-3,以實(shí)現(xiàn)自然語言的預(yù)測(cè)和生成。
- 語音克隆得到改進(jìn),AI的本地化功能證明了這一點(diǎn)。他們的合成語音克隆可以被訓(xùn)練說六種語言。這項(xiàng)新功能允許將數(shù)字語音翻譯成其他語言,這將使本地化更加容易,Petrov說。
展望未來
業(yè)內(nèi)專家看好未來幾個(gè)月相關(guān)技術(shù)的快速擴(kuò)張。
到2021年,我們將看到越來越多地使用會(huì)話人工智能來替代人類智能的增強(qiáng)。Johnston預(yù)測(cè):我們還將見證對(duì)話人工智能從語音和文本渠道不斷擴(kuò)展到富媒體和多模式交互,智能虛擬助理將能夠通過語音和文本的視覺媒體組合向客戶呈現(xiàn)信息。
Muldoon預(yù)測(cè),由于流感大流行而改變的消費(fèi)者習(xí)慣可能會(huì)加速人工智能和語音技術(shù)的應(yīng)用,特別是在今年上半年。
我們將開始看到支持語音的人工智能能力的擴(kuò)展。他說:隨著越來越多的模型繼續(xù)被構(gòu)建,將會(huì)有機(jī)會(huì)創(chuàng)造出更強(qiáng)大的交互,幾年后,人工智能將成為完成任務(wù)的第二種方式,而不是支持性角色。
Kane預(yù)計(jì),由于無監(jiān)督的表征學(xué)習(xí),諸如聲音事件檢測(cè)和語音情感識(shí)別等分類問題的準(zhǔn)確率會(huì)有顯著的提高。
Kane說:今年可能是交互式會(huì)話數(shù)據(jù)得到應(yīng)有的研究和開發(fā)關(guān)注的一年,我們看到了更多關(guān)于交互式語音合成的學(xué)術(shù)研究,以幫助語音助理等強(qiáng)大應(yīng)用。
其他人則希望,人工智能的進(jìn)步將在智能手機(jī)上帶來更好的語音文本轉(zhuǎn)換功能。
現(xiàn)在,當(dāng)我們要求手機(jī)通過語音創(chuàng)建信息時(shí),我們會(huì)看到很多錯(cuò)誤。但隨著創(chuàng)新的繼續(xù)和算法的日益強(qiáng)大,我們將受益于這一應(yīng)用的準(zhǔn)確性提高,這也將影響智能說話者擴(kuò)大他們對(duì)人類語言的理解,以及更廣泛地與用戶交談的能力,Rogers建議。
Wolters Kluwer的應(yīng)用數(shù)據(jù)科學(xué)主管John Langton認(rèn)為,我們可以預(yù)期,今年人工智能和其他技術(shù)(如面部識(shí)別和語音識(shí)別)之間的協(xié)同效應(yīng)將會(huì)增強(qiáng)。
為了改進(jìn)整合,我們現(xiàn)在可以使用情感計(jì)算作為額外的信號(hào)到語音輸入,在回答消費(fèi)者問題時(shí)推斷用戶意圖,他說。
許多人同意,人工智能也將繼續(xù)在醫(yī)療保健領(lǐng)域提供更好的患者護(hù)理服務(wù)。
我們將觀察到為患者提供更加個(gè)性化的護(hù)理,為提供者提供更加高效和有效的手術(shù)。此外,遠(yuǎn)程醫(yī)療的迅速采用,加上消費(fèi)者對(duì)語音智能家居技術(shù)的廣泛使用,將可能推動(dòng)交流醫(yī)療AI機(jī)器人的發(fā)展,Hunt說。
聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載
作者:Erik J.Martin
原文網(wǎng)址:https://www.speechtechmag.com/Articles/Editorial/Features/The-State-of-Artificial-Intelligence-145107.aspx