主頁(yè) > 知識(shí)庫(kù) > IBM語(yǔ)音識(shí)別系統(tǒng)實(shí)現(xiàn)錯(cuò)詞率重大突破

IBM語(yǔ)音識(shí)別系統(tǒng)實(shí)現(xiàn)錯(cuò)詞率重大突破

熱門(mén)標(biāo)簽:朝陽(yáng)導(dǎo)航地圖標(biāo)注 智能電銷(xiāo)機(jī)器人獲客成本 高德地圖標(biāo)注停車(chē)在哪 高德地圖標(biāo)注公司標(biāo)鋪 機(jī)器人電銷(xiāo)獲客 阿古斯指揮官地圖標(biāo)注 學(xué)校地圖標(biāo)注的內(nèi)容點(diǎn) 電商智能外呼系統(tǒng)誠(chéng)信為本 地圖標(biāo)注位置怎么取消

  技術(shù)領(lǐng)域的從業(yè)者花了數(shù)年時(shí)間開(kāi)發(fā)語(yǔ)音識(shí)別軟體。目前,IBM稱(chēng)其語(yǔ)音識(shí)別軟體的字詞錯(cuò)誤率僅為5.5%,低于之前的6.9%的記錄。這對(duì)于語(yǔ)音識(shí)別行業(yè)來(lái)說(shuō)是重大的里程碑,可能最終會(huì)引領(lǐng)Siri和Alexa等語(yǔ)音助手的技術(shù)改進(jìn)。
  微軟聲稱(chēng)去年10月使用類(lèi)似于聯(lián)想詞云的神經(jīng)語(yǔ)言模型達(dá)到5.9%的錯(cuò)詞率。當(dāng)時(shí),該公司認(rèn)為這個(gè)數(shù)據(jù)能與人類(lèi)錯(cuò)詞率相媲美。但I(xiàn)BM說(shuō)這個(gè)數(shù)據(jù)并不值得慶祝。IBM主要研究科學(xué)家喬治·薩恩(George Saon)在本周發(fā)表的一篇博客中寫(xiě)道:「我們是實(shí)現(xiàn)今天里程碑的重要貢獻(xiàn)者,然而我們確定人類(lèi)實(shí)際錯(cuò)詞率比目前所有語(yǔ)音識(shí)別系統(tǒng)能達(dá)到的錯(cuò)詞率都低-僅為5.1%?!?/div>
  IBM通過(guò)所謂的長(zhǎng)短期內(nèi)存(Long Short-Term Memory),人工神經(jīng)網(wǎng)路、與三種強(qiáng)大的聲學(xué)模型相結(jié)合的WaveNet語(yǔ)言模型,開(kāi)發(fā)出了錯(cuò)誤率僅為5.5%的語(yǔ)音識(shí)別系統(tǒng)。然后使用「SWITCHBOARD」語(yǔ)料庫(kù)對(duì)此語(yǔ)音識(shí)別系統(tǒng)進(jìn)行測(cè)量,該語(yǔ)料庫(kù)是幾十年來(lái)被用作語(yǔ)音識(shí)別軟體測(cè)量的標(biāo)準(zhǔn)。實(shí)現(xiàn)5.5%的詞錯(cuò)率是一個(gè)大突破,但實(shí)際上,測(cè)試標(biāo)準(zhǔn)并不總能體現(xiàn)真實(shí)數(shù)據(jù)的復(fù)雜性和多樣化,與此同時(shí),人類(lèi)實(shí)際詞錯(cuò)率的確定也表明我們還遠(yuǎn)沒(méi)有達(dá)到最終目標(biāo)。
  哥倫比亞大學(xué)計(jì)算機(jī)科學(xué)系教授Julia Hirschberg說(shuō):「降低語(yǔ)音識(shí)別錯(cuò)詞率和衡量人類(lèi)詞錯(cuò)率是一個(gè)持續(xù)性的挑戰(zhàn)。因?yàn)槿祟?lèi)的言語(yǔ),特別是在隨意交談的時(shí)候,是非常復(fù)雜的。同時(shí),我們也很難為人類(lèi)錯(cuò)詞率做標(biāo)準(zhǔn)界定,因?yàn)槊恳粋€(gè)不同的個(gè)體在理解他人語(yǔ)言上水平參差不齊?!?/div>
  相關(guān)信息補(bǔ)充:
  IBM公司語(yǔ)音識(shí)別研究團(tuán)隊(duì)一直以「創(chuàng)造一種更具活力的電腦交互方式」作為重要使命之一。IBM于上世紀(jì)50年代末開(kāi)始語(yǔ)音識(shí)別的技術(shù)研究。在1962年西雅圖世界博覽會(huì)上,由IBM研發(fā)出的「鞋盒」大放異彩,成為當(dāng)時(shí)世界上最先進(jìn)的語(yǔ)音識(shí)別機(jī)器,這臺(tái)機(jī)器能理解人類(lèi)口述數(shù)字0~9以及簡(jiǎn)單的運(yùn)算口令。但在之后的很長(zhǎng)一段時(shí)間里,由于電腦技術(shù)和語(yǔ)音識(shí)別研究方法的限制,語(yǔ)音識(shí)別并沒(méi)有太大進(jìn)展。直到信息理論的強(qiáng)大統(tǒng)計(jì)演算法的出現(xiàn),語(yǔ)音識(shí)別才重新踏上了進(jìn)步發(fā)展之路,能識(shí)別5000個(gè)英語(yǔ)單詞的語(yǔ)音識(shí)別系統(tǒng)面世。但還有一個(gè)問(wèn)題擺在技術(shù)人員面前:這臺(tái)語(yǔ)音識(shí)別處理機(jī)大的出奇,無(wú)法實(shí)現(xiàn)應(yīng)用普及化。
  時(shí)至今日,對(duì)于大眾最為熟悉的語(yǔ)音識(shí)別系統(tǒng)是Apple的Siri。藉助高速網(wǎng)路的發(fā)展,Apple利用高性能伺服器代替了手機(jī)來(lái)進(jìn)行有大量復(fù)雜運(yùn)算需求的語(yǔ)音識(shí)別工作。同時(shí),搜索引擎和ios手機(jī)系統(tǒng)的結(jié)合,更使得Siri用戶(hù)體驗(yàn)性得到大幅度提升。在Siri大獲全勝后,Google等高科技企業(yè)也紛紛加入語(yǔ)音識(shí)別的開(kāi)發(fā)洪流,而曾經(jīng)的「語(yǔ)音識(shí)別奠基人」IBM也在這個(gè)洪流中再度占據(jù)鰲頭。
  時(shí)至今日,對(duì)于大眾最為熟悉的語(yǔ)音識(shí)別系統(tǒng)是Apple的Siri。藉助高速網(wǎng)路的發(fā)展,Apple利用高性能伺服器代替了手機(jī)來(lái)進(jìn)行有大量復(fù)雜運(yùn)算需求的語(yǔ)音識(shí)別工作。同時(shí),搜索引擎和ios手機(jī)系統(tǒng)的結(jié)合,更使得Siri用戶(hù)體驗(yàn)性得到大幅度提升。在Siri大獲全勝后,Google等高科技企業(yè)也紛紛加入語(yǔ)音識(shí)別的開(kāi)發(fā)洪流,而曾經(jīng)的「語(yǔ)音識(shí)別奠基人」IBM也在這個(gè)洪流中再度占據(jù)鰲頭?! 〖夹g(shù)領(lǐng)域的從業(yè)者花了數(shù)年時(shí)間開(kāi)發(fā)語(yǔ)音識(shí)別軟體。目前,IBM稱(chēng)其語(yǔ)音識(shí)別軟體的字詞錯(cuò)誤率僅為5.5%,低于之前的6.9%的記錄。這對(duì)于語(yǔ)音識(shí)別行業(yè)來(lái)說(shuō)是重大的里程碑,可能最終會(huì)引領(lǐng)Siri和Alexa等語(yǔ)音助手的技術(shù)改進(jìn)。
  微軟聲稱(chēng)去年10月使用類(lèi)似于聯(lián)想詞云的神經(jīng)語(yǔ)言模型達(dá)到5.9%的錯(cuò)詞率。當(dāng)時(shí),該公司認(rèn)為這個(gè)數(shù)據(jù)能與人類(lèi)錯(cuò)詞率相媲美。但I(xiàn)BM說(shuō)這個(gè)數(shù)據(jù)并不值得慶祝。IBM主要研究科學(xué)家喬治·薩恩(George Saon)在本周發(fā)表的一篇博客中寫(xiě)道:「我們是實(shí)現(xiàn)今天里程碑的重要貢獻(xiàn)者,然而我們確定人類(lèi)實(shí)際錯(cuò)詞率比目前所有語(yǔ)音識(shí)別系統(tǒng)能達(dá)到的錯(cuò)詞率都低-僅為5.1%?!?/div>
  IBM通過(guò)所謂的長(zhǎng)短期內(nèi)存(Long Short-Term Memory),人工神經(jīng)網(wǎng)路、與三種強(qiáng)大的聲學(xué)模型相結(jié)合的WaveNet語(yǔ)言模型,開(kāi)發(fā)出了錯(cuò)誤率僅為5.5%的語(yǔ)音識(shí)別系統(tǒng)。然后使用「SWITCHBOARD」語(yǔ)料庫(kù)對(duì)此語(yǔ)音識(shí)別系統(tǒng)進(jìn)行測(cè)量,該語(yǔ)料庫(kù)是幾十年來(lái)被用作語(yǔ)音識(shí)別軟體測(cè)量的標(biāo)準(zhǔn)。實(shí)現(xiàn)5.5%的詞錯(cuò)率是一個(gè)大突破,但實(shí)際上,測(cè)試標(biāo)準(zhǔn)并不總能體現(xiàn)真實(shí)數(shù)據(jù)的復(fù)雜性和多樣化,與此同時(shí),人類(lèi)實(shí)際詞錯(cuò)率的確定也表明我們還遠(yuǎn)沒(méi)有達(dá)到最終目標(biāo)。
  哥倫比亞大學(xué)計(jì)算機(jī)科學(xué)系教授Julia Hirschberg說(shuō):「降低語(yǔ)音識(shí)別錯(cuò)詞率和衡量人類(lèi)詞錯(cuò)率是一個(gè)持續(xù)性的挑戰(zhàn)。因?yàn)槿祟?lèi)的言語(yǔ),特別是在隨意交談的時(shí)候,是非常復(fù)雜的。同時(shí),我們也很難為人類(lèi)錯(cuò)詞率做標(biāo)準(zhǔn)界定,因?yàn)槊恳粋€(gè)不同的個(gè)體在理解他人語(yǔ)言上水平參差不齊?!?/div>
  相關(guān)信息補(bǔ)充:
  IBM公司語(yǔ)音識(shí)別研究團(tuán)隊(duì)一直以「創(chuàng)造一種更具活力的電腦交互方式」作為重要使命之一。IBM于上世紀(jì)50年代末開(kāi)始語(yǔ)音識(shí)別的技術(shù)研究。在1962年西雅圖世界博覽會(huì)上,由IBM研發(fā)出的「鞋盒」大放異彩,成為當(dāng)時(shí)世界上最先進(jìn)的語(yǔ)音識(shí)別機(jī)器,這臺(tái)機(jī)器能理解人類(lèi)口述數(shù)字0~9以及簡(jiǎn)單的運(yùn)算口令。但在之后的很長(zhǎng)一段時(shí)間里,由于電腦技術(shù)和語(yǔ)音識(shí)別研究方法的限制,語(yǔ)音識(shí)別并沒(méi)有太大進(jìn)展。直到信息理論的強(qiáng)大統(tǒng)計(jì)演算法的出現(xiàn),語(yǔ)音識(shí)別才重新踏上了進(jìn)步發(fā)展之路,能識(shí)別5000個(gè)英語(yǔ)單詞的語(yǔ)音識(shí)別系統(tǒng)面世。但還有一個(gè)問(wèn)題擺在技術(shù)人員面前:這臺(tái)語(yǔ)音識(shí)別處理機(jī)大的出奇,無(wú)法實(shí)現(xiàn)應(yīng)用普及化。
  IBM02
  時(shí)至今日,對(duì)于大眾最為熟悉的語(yǔ)音識(shí)別系統(tǒng)是Apple的Siri。藉助高速網(wǎng)路的發(fā)展,Apple利用高性能伺服器代替了手機(jī)來(lái)進(jìn)行有大量復(fù)雜運(yùn)算需求的語(yǔ)音識(shí)別工作。同時(shí),搜索引擎和ios手機(jī)系統(tǒng)的結(jié)合,更使得Siri用戶(hù)體驗(yàn)性得到大幅度提升。在Siri大獲全勝后,Google等高科技企業(yè)也紛紛加入語(yǔ)音識(shí)別的開(kāi)發(fā)洪流,而曾經(jīng)的「語(yǔ)音識(shí)別奠基人」IBM也在這個(gè)洪流中再度占據(jù)鰲頭。

標(biāo)簽:莆田 紅河 新鄉(xiāng) 鄭州 運(yùn)城 天門(mén) 荊門(mén) 鹽城

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《IBM語(yǔ)音識(shí)別系統(tǒng)實(shí)現(xiàn)錯(cuò)詞率重大突破》,本文關(guān)鍵詞  IBM,語(yǔ)音,識(shí)別,系統(tǒng),實(shí)現(xiàn),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《IBM語(yǔ)音識(shí)別系統(tǒng)實(shí)現(xiàn)錯(cuò)詞率重大突破》相關(guān)的同類(lèi)信息!
  • 本頁(yè)收集關(guān)于IBM語(yǔ)音識(shí)別系統(tǒng)實(shí)現(xiàn)錯(cuò)詞率重大突破的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章