在互聯(lián)網(wǎng)的世界,從來不缺乏新鮮玩法,也從來不缺少顛覆式創(chuàng)新案例。但無論行業(yè)怎樣發(fā)展,搜索廣告仍是數(shù)字營銷領(lǐng)域的一座金礦。
那么,搜索能夠變得年輕、有趣、智能嗎?
近期,搜狗商業(yè)廣告產(chǎn)品部總經(jīng)理李剛分享了搜狗在人工智能領(lǐng)域的探索。他說,這是一群人在AI領(lǐng)域的飛速狂奔。
第三次人工智能浪潮
去年AlphaGo戰(zhàn)勝了李世石, 然后,AlphaGo又戰(zhàn)勝了全世界排名第一的圍棋選手柯潔。圍棋是所有游戲里面最難的游戲,機(jī)器卻戰(zhàn)勝了人類。由此,第三次人工智能浪潮發(fā)作。
當(dāng)然,人工智能并不是一個(gè)新話題。從 1950 年開始,人工智能經(jīng)歷了兩次高潮,也經(jīng)歷了兩次衰落。
距人工智能概念誕生,到本年剛好 60 年,為什么在今天能迎來第三次浪潮?是DNN、計(jì)算能力的發(fā)展,以及數(shù)據(jù)規(guī)模的擴(kuò)大。
以機(jī)器代替人的智慧,產(chǎn)生人可以使用的人工智能,包孕無人汽車、Siri。李剛分析:這主要得益于深度學(xué)習(xí)、計(jì)算能力和大數(shù)據(jù)這三方面發(fā)生了質(zhì)的變革。
第一,傳統(tǒng)的深度學(xué)習(xí)DNN網(wǎng)絡(luò)里面,只有兩三層, 2012 年開始,微軟第一次把網(wǎng)絡(luò)推到了八層,比來的推進(jìn)是 152 層!
第二,計(jì)算能力在近幾年獲得了飛躍式發(fā)展。目前計(jì)算最快的速度實(shí)現(xiàn)者是中國的神威·太湖之光。神威·太湖之光超級計(jì)算機(jī)是由國家并行計(jì)算機(jī)工程技術(shù)研究中心研制的超級計(jì)算機(jī),峰值性能可達(dá)每秒125P浮點(diǎn)運(yùn)算。
第三,互聯(lián)網(wǎng)數(shù)據(jù)規(guī)模的指數(shù)級增長,以及在某一領(lǐng)域?qū)I(yè)、海量、深度的數(shù)據(jù),是訓(xùn)練某一領(lǐng)域“智能”的前提,大數(shù)據(jù)給人工智能領(lǐng)域帶來了充分的訓(xùn)練量。
無論是互聯(lián)網(wǎng)還是移動互聯(lián)網(wǎng),,深度學(xué)習(xí)、大數(shù)據(jù)和計(jì)算能力的提升,促使人工智能有了飛速發(fā)展。過了臨界點(diǎn),應(yīng)用層面將有很多創(chuàng)新玩法。
搜狗在人工智能的布局
“搜狗要成為人工智能領(lǐng)域最強(qiáng)的公司”談及此,李剛激情滿滿。搜狗在人工智能的布局分為四個(gè)方面:智能輸入、智能搜索、智慧商業(yè)和大數(shù)據(jù)。
去年,搜狗CEO王小川在香港科技大學(xué)做演講,面對全場外國學(xué)生,全程用中文分享了 40 分鐘。
整場演講的溝通交流全部依靠搜狗的機(jī)器翻譯技術(shù),在現(xiàn)場屏幕上除了語音識別實(shí)時(shí)顯示的中文內(nèi)容外,還有機(jī)器同步翻譯的英文內(nèi)容,實(shí)時(shí)生成了演講內(nèi)容的雙語滾動字幕。
據(jù)介紹,搜狗的實(shí)時(shí)機(jī)器翻譯技術(shù),利用注意力模型聚焦源端,使用循環(huán)神經(jīng)網(wǎng)絡(luò)生成翻譯結(jié)果,翻譯的結(jié)果比傳統(tǒng)機(jī)器翻譯更加流暢。并且在人工評測里,這項(xiàng)技術(shù)在演講、旅游、閑聊、日常白話等領(lǐng)域,采用五分制人工評分,它能達(dá)到4. 4 分。
李剛增補(bǔ):在語音領(lǐng)域,搜狗輸入法已經(jīng)實(shí)現(xiàn)了從對語音的識別、理解語義、語言識別,到跨語種翻譯溝通。
別的,從搜狗搜索來看,更加智能的是推理答案。
一個(gè)有趣的案例:好比,提問“梁啟超的兒子的妻子的情人是誰?”,人工智能的搜索結(jié)果是什么?徐志摩。人工智能讓搜索有了基本的推理水平。李剛透露,其實(shí)這背后搜狗做了一套完整千萬量級的實(shí)體發(fā)掘。
除此之外,搜狗“汪仔”還參加了江蘇衛(wèi)視的《一站到底》角逐,在節(jié)目里挑戰(zhàn)人類選手。
李剛談到:最復(fù)雜的技術(shù)不但僅是把答案說出來,關(guān)鍵是搶答,搶答和回答問題有質(zhì)的不同,好比,諸葛亮的對手是誰,不但僅是文字的回答,更多的是猜測出題人的意圖,并非常快速的告訴答案。
“未來的搜索就是問答“,李剛概括了搜索問答的技術(shù)要點(diǎn),可以歸納為:
1、實(shí)體挖掘(千萬級實(shí)體)
各類型實(shí)體挖掘、屬性名稱挖掘
實(shí)體屬性抽取
實(shí)體對齊
2、大數(shù)據(jù)上的實(shí)體關(guān)系抽?。▋|級關(guān)系)
3、大規(guī)模實(shí)體庫上推理技術(shù)
搜狗將AI應(yīng)用于數(shù)字營銷
過去,受限于技術(shù)瓶頸,在使用搜索引擎的時(shí)候要使用“關(guān)鍵字”,因?yàn)闄C(jī)器無法理解整句的問題。但在未來,70%的用戶搜索請求應(yīng)該直接給予答案,而不是讓用戶本身去做二次篩選。
這樣的發(fā)展標(biāo)的目的升級了現(xiàn)有的搜索引擎營銷模式,通過對于目標(biāo)群體特征及需求更加深度和準(zhǔn)確的理解,以此與廣告主信息進(jìn)行智能對接,最終實(shí)現(xiàn)更為抱負(fù)的營銷效果。
人工智能技術(shù)貫穿在搜狗的商業(yè)體系中。基于技術(shù)存儲和計(jì)算能力的大幅度提升,搜狗可以實(shí)現(xiàn)對海量用戶商業(yè)意圖的識別,進(jìn)而達(dá)成精準(zhǔn)營銷。好比,搜狗通過深度學(xué)習(xí)體系形成了一個(gè)從圖片到文字完整的概念體系,一個(gè)雙十一期間的商業(yè)AI圖。圖上的每個(gè)點(diǎn)代表著一個(gè)商品或者一個(gè)辦事,點(diǎn)越紅代表著商品和辦事越來越被大家關(guān)注,越綠就是這個(gè)商品越來越冷,以這種方式非常精準(zhǔn)的保舉廣告。
據(jù)悉,在強(qiáng)大計(jì)算能力的支撐下,搜狗廣告收入獲得了數(shù)十倍的增長。
業(yè)內(nèi)人士指出,人工智能即將開啟一個(gè)萬億美元的市場。擁有 10 多年搜索技術(shù)積累的搜狗,能否真的站在人群的最前面,值得期待。