如何讓機器學(xué)會保持一個完整的對話始終是人工智慧界最困難的問題之一。因為若想了解一句話或一段文字的真正意義,機器(甚至人)需要對世界有一定程度的理解,它們需要「常識」。
他們發(fā)現(xiàn),當(dāng)一個機器學(xué)習(xí)系統(tǒng)學(xué)會如何把一種語言翻譯成另外一種語言時,它會自動學(xué)會單詞之間的關(guān)系。而若以這個系統(tǒng)為基礎(chǔ),再訓(xùn)練另外一個應(yīng)用時(比如對話,或察覺文字中的情緒),它的表現(xiàn)將遠好于從零建立的系統(tǒng)。
Salesforce的首席科學(xué)家、機器學(xué)習(xí)專家Richard Socher對此表示:「我們所做的基本上就是把機器翻譯的數(shù)據(jù)拿來,去教一個模型如何理解單詞和情境?!?/div>
有很多「機器學(xué)習(xí)的創(chuàng)新」可以用來提高機器人的語言能力,Salesforce的研究成果只是其中之一。正如許多基于深度學(xué)習(xí)的計算機視覺系統(tǒng)都會提前接受網(wǎng)路訓(xùn)練,Socher認為,機器翻譯對自然語言系統(tǒng)的作用也是類似的。
作為一個集銷售、營銷以及客戶互動管理為一體的大型網(wǎng)路平臺,Salesforce已經(jīng)在其Einstein平臺中提供一系列的人工智慧工具。比如,一個可以對電郵和訊息中的情緒進行自動分類的工具,以及一個根據(jù)員工之前的工作,自動對他需要追查的線索進行優(yōu)化的工具。
Socher相信,他們這個發(fā)現(xiàn)將會提高Einstein平臺的自動語言能力,「對于聊天機器人和自動客服來說,它‘超級’有用?!?/div>
在測試中,研究人員首先需要訓(xùn)練一個深度學(xué)習(xí)系統(tǒng)在英語和德語之間進行翻譯。為此,他們給一個多層神經(jīng)網(wǎng)路提供了大量已經(jīng)翻譯好的文件,并慢慢調(diào)試各種參數(shù),直至它可以自行產(chǎn)生不錯的翻譯結(jié)果。
在學(xué)會翻譯之后,研究人員們就開始訓(xùn)練這個「雙語人工智慧」去學(xué)習(xí)更多的技能了,比如判斷一段文字背后的情緒,對各種問題進行分類,以及回答問題。在對比測試中,經(jīng)過雙語訓(xùn)練的神經(jīng)網(wǎng)路的成績遠好于沒有經(jīng)過雙語訓(xùn)練的系統(tǒng)。
由于機器翻譯已經(jīng)是一個成熟的領(lǐng)域,研究人員有大量的數(shù)據(jù)來進行訓(xùn)練。「翻譯和語言的其他部分之間有著極其重要的關(guān)聯(lián),」Salesforce的研究員Bryan Mc Cann說道:「(翻譯數(shù)據(jù))一般涉及面非常廣,它們包含著各種對自動語言處理有用的信息?!?/div>