阿里妹導(dǎo)讀:2020年面對突如其來的新冠疫情,14億人心系家國共渡難關(guān)。阿里人更是此時此刻,非我莫屬,用技術(shù)的力量聚沙成塔,守護著千萬家。你可能在釘釘群里見過一個名字叫防疫精靈的小機器人,準(zhǔn)時準(zhǔn)點地為你播報著全國新冠肺炎的實時輿疫情數(shù)據(jù);有求必應(yīng)地為你解答關(guān)心的各類問題,例如防疫知識、線上問診、小區(qū)附近確診病例、發(fā)熱門診分布等等。更神奇的是,防疫精靈機器人最初從一個想法到上線釘釘,僅用了一個下午的時間,目前已累計至少服務(wù)了500萬個釘釘用戶。這看似不可能背后,是機器人工廠,這個強大的智能會話機器人孵化平臺,以其成熟的NLP算法能力及QA問答能力,將一切變成了可能。
什么是機器人工廠?
2016年開始,世界進(jìn)入Chatbot時代,科技行業(yè)巨頭也紛紛發(fā)布了各自在Chatbot領(lǐng)域的相關(guān)產(chǎn)品,例如蘋果Siri、微軟小冰、百度小度、阿里的天貓精靈等等。會話機器人的出現(xiàn)帶來的是用戶與計算機之間交互方式的變革,從以計算機為中心的一串有序的操作指令,發(fā)展到以用戶為中心的自然語言會話AI。
機器人工廠就是在會話AIFirst浪潮中應(yīng)運而生的Chatbot智能機器人孵化平臺。有了機器人工廠,任何人只需一分鐘就可以搭建一個專屬的會話機器人,不懂NLP技術(shù)、搞不定編程各種問題都不存在的!
機器人工廠整體架構(gòu)圖如下所示,下面將圍繞產(chǎn)品場景和核心能力兩大塊做詳細(xì)介紹。
用于哪些產(chǎn)品場景?
機器人工廠的應(yīng)用場景主要分為答疑、運營、運維三大類。
答疑是三種場景中最常見的。用戶對商家的產(chǎn)品問詢、員工對企業(yè)的規(guī)章制度,總會有大量共性重復(fù)的問題需要解答,將這些共性的問題抽取出來整理成問答對沉淀在機器人工廠平臺上,答疑機器人就可以幫你解答大部分問題,既省時省力,就降低了人工成本。比如:機器人工廠為云棲大會提供了大會引導(dǎo)機器人。
運營場景主要是通過機器人將消息準(zhǔn)確快速的統(tǒng)一觸達(dá)到所有用戶。比如,小明運營著天南海北的100個商家群,只需機器人工廠一次配置消息內(nèi)容、發(fā)送時間,就可以準(zhǔn)時觸達(dá)100個商家群。輕松解決了人工操作100次的低效與時延。
運維場景就更厲害了,機器人不僅會回答問題還能夠執(zhí)行命令。比如,你在阿里云上購買了一臺服務(wù)器,跑了一些任務(wù),可以讓機器人幫你查詢?nèi)蝿?wù)執(zhí)行的狀態(tài),發(fā)現(xiàn)異常,終止任務(wù)等等。用戶提問—理解指令——調(diào)用服務(wù)(執(zhí)行指令)——返回答案,是運維場景的鏈路。
還有更多新奇的玩法兒,比如結(jié)合語音文字互轉(zhuǎn)技術(shù),與阿里云通信、菜鳥驛站一起打造了智能外呼機器人。調(diào)查問卷、電話回訪、上門服務(wù)確認(rèn)是否在家等等場景都可以由機器人完成,機器人一天可以打出的電話可是多了好幾倍。
有哪些核心能力?
介紹了這么多,你應(yīng)該對機器人工廠可以做什么有了一些基本認(rèn)識。下面將為你介紹機器人工廠有哪些核心能力,到底怎樣玩轉(zhuǎn)起來。
智能會話機器人的看家本領(lǐng)就是QA問答。意圖和實體是兩個最基本的概念。意圖由用戶輸入、動作、回應(yīng)三部分組成。其中用戶輸入定義了用戶問題;回應(yīng)定義了對應(yīng)的答案;動作非必選,定義了理解用戶意圖后需要去執(zhí)行一系列指令。實體作用于用戶輸入,將用戶輸入中的結(jié)構(gòu)化信息抽取出來,高效地解決了存在大量類似意圖匹配場景的問題。例如,杭州2020-03-08的天氣怎么樣?杭州可以抽取成一個枚舉實體,2020-03-08可以抽取成一個正則實體,動作可以定義為調(diào)用一個根據(jù)城市和時間去查詢天氣的服務(wù),最后回應(yīng)返回天氣信息。
上述例子說明,QA問答首先要做到對用戶意圖的精準(zhǔn)理解。機器人工廠底層有一套完備的算法框架,傳統(tǒng)機器學(xué)習(xí)算法與基于深度神經(jīng)網(wǎng)絡(luò)的自然語言處理算法相結(jié)合,離線的特征提取模型訓(xùn)練與在線的實時預(yù)測相結(jié)合,純文本的FAQ意圖匹配與基于實體槽位的意圖匹配相結(jié)合,從而提高意圖匹配的準(zhǔn)確率。這里不做詳細(xì)展開,后續(xù)會有專題文章介紹。
會話機器人的智能程度在一定意義上取決于它所理解的語料的豐富性。但絕大部分的知識都是以非結(jié)構(gòu)化的文本形式沉淀下來,而非會話機器人所能理解的一問一答的意圖形式。因此,新創(chuàng)建的會話機器人怎樣快速構(gòu)建語料具有智能問答的能力?機器人工廠提供了三種方式解決冷啟動問題,單個機器人應(yīng)用內(nèi),通過語料爬?。ㄗ詣踊┡c批量導(dǎo)入(人工)和預(yù)置意圖(系統(tǒng)公共語料)豐富語料;在多個應(yīng)用之間實現(xiàn)語料共享(應(yīng)用拼裝)。
語料爬取是指自動地將用戶已有非結(jié)構(gòu)化的知識庫或文檔,通過機器閱讀和理解能力,抽取整理成會話機器人可以理解的問答對的形式。語料爬取不僅可以代替人工錄入快速豐富會話機器人的語料,而且極大的降低了知識庫對接機器人工廠的遷移成本。目前,機器人工廠平臺80%的語料都由語料爬取生成。此外,還支持人工的將excel或json格式的語料,批量導(dǎo)入自動生成意圖。
預(yù)置意圖是機器人工廠將用戶高頻、通用的場景下沉到平臺層面,使其可以賦能所有平臺上的機器人應(yīng)用,增強QA問答能力。例如,閑聊、查詢天氣、查詢值班等等。用戶只需在平臺上勾選啟用,即可使自己的機器人擁有回答這些問題的能力。
語料共享是指不同會話機器人之間相互復(fù)用語料的能力。例如,所有銀泰百貨的會員手冊都一致,但不同的店打折促銷活動不同。機器人工廠支持將通用普適的語料創(chuàng)建一個機器人A,各自差異的語料分別創(chuàng)建各自的機器人,但大家都共享復(fù)用機器人A的語料。語料共享能夠提高語料的復(fù)用率,讓用戶更專注差異化的部分。
上文提到過意圖是由用戶輸入——動作——回應(yīng)三部分組成,其中動作定義了理解用戶意圖后需要去執(zhí)行一系列指令。通常動作會通過HTTP請求的方式去調(diào)用用戶自定義的一個服務(wù)。但發(fā)現(xiàn)經(jīng)常會遇到以下問題:
若用戶已有服務(wù)接口,會遇到服務(wù)格式不適配;機器人工廠的特殊處理邏輯與業(yè)務(wù)邏輯強耦合等問題。
若用戶沒有服務(wù)接口,需要開發(fā)、部署、聯(lián)調(diào)、發(fā)布一系列流程,還會遇到機器、網(wǎng)絡(luò)、環(huán)境等問題,如果線上驗證失敗,上面步驟需要重新來過。
新增一些具有時效性的臨時功能,都需要牽一發(fā)而動全身。
為了解決上述問題,機器人工廠與阿里云計算平臺的在線開發(fā)平臺AppStudio合作開發(fā)出基于AppStudio的在線服務(wù)開發(fā)IDE,為用戶提供云上在線編程平臺,幫助你打通下游的服務(wù)實現(xiàn)數(shù)據(jù)查詢,指令執(zhí)行,知識庫檢索,內(nèi)容推薦等功能??梢詾槟闾峁?/div>
- 靈活性:支持在線編程,自定義業(yè)務(wù)邏輯、安全性校驗等,與業(yè)務(wù)系統(tǒng)本身解耦;
- 開放性:可以引入需要依賴的sdk,支持odps、hsf等服務(wù);
- 簡便性:封裝了基本類和openApi便于開發(fā);
- 即時性:不依賴任何發(fā)布系統(tǒng),隨改隨生效;
- 共享性:支持協(xié)同編輯開發(fā),代碼共享;
- 調(diào)試:支持在線debug、服務(wù)測試等功能;
未來已來
機器人工廠在阿里巴巴集團內(nèi)經(jīng)過2年的發(fā)展與打磨,已經(jīng)孵化2w+機器人,服務(wù)44w+用戶。連續(xù)2年參加云棲大會讓我們感受到用戶對智能機器人的強烈訴求,2020年機器人工廠正式發(fā)布公有云版本。最后,獻(xiàn)上機器人工廠為飛天大數(shù)據(jù)開發(fā)平臺DataWorks打造的一鍵答疑機器人的Demo。