本期局內(nèi)人:桑文鋒(神策數(shù)據(jù)創(chuàng)始人&CEO)
一:大數(shù)據(jù)領(lǐng)域的新機(jī)會(huì)
大數(shù)據(jù)這個(gè)領(lǐng)域,已經(jīng)有谷歌分析、百度統(tǒng)計(jì)這些做得比較好的產(chǎn)品了,但是我們還是做了神策,歸根到底是需求。有新的需求冒出來(lái)的時(shí)候,就會(huì)形成新的機(jī)會(huì)。
我把 2000 年的之后的互聯(lián)網(wǎng)分層 3 個(gè)階段:
第一階段:2000- 2006 年,流量時(shí)代。不管是三大門戶還是其他網(wǎng)站,歸根到底都是流量性質(zhì)。阿誰(shuí)時(shí)候你的產(chǎn)品流量大,你就牛。
第二階段:2006- 2011 年,用戶時(shí)代。這個(gè)階段大家更關(guān)注的是用戶數(shù),像國(guó)內(nèi)的開(kāi)心、人人,國(guó)外的Facebook。對(duì)比產(chǎn)品的時(shí)候,更會(huì)偏向用戶活躍度,而不像最開(kāi)始的時(shí)候以pv來(lái)衡量。
第三階段: 2012 年至今,,甚至到未來(lái)五年八年,我們進(jìn)入了訂單時(shí)代。從 2012 年擺布的團(tuán)購(gòu)、到 2014 年擺布的O2O、再到去年的直播、互聯(lián)網(wǎng)金融的發(fā)展,我們看到一種趨勢(shì),就是線下的交易在往線上搬。
發(fā)展到這個(gè)階段,我們做用戶分析的深度就紛歧樣了。從最開(kāi)始的一個(gè)數(shù)據(jù)統(tǒng)計(jì)、分析用戶、到訂單交易、用數(shù)據(jù)漏斗做來(lái)源分析。這個(gè)時(shí)候你就會(huì)關(guān)心用戶留存,希望用戶下單、長(zhǎng)久消費(fèi)。所以你對(duì)信息的分析深度就紛歧樣。這就是需求的變革,需要更精細(xì)化的、更深度的用戶行為分析。
二:用戶行為數(shù)據(jù)在企業(yè)中有什么價(jià)值?
一個(gè)價(jià)值是用行為數(shù)據(jù)驅(qū)動(dòng)決策。具體有三點(diǎn):
1.產(chǎn)品改進(jìn)。我們可以按照用戶行為數(shù)據(jù)分析出用戶的愛(ài)好,進(jìn)一步改進(jìn)產(chǎn)品。這個(gè)按鈕是放在左角還是右角,整個(gè)流程設(shè)計(jì),怎么感官效果更好。
2.運(yùn)營(yíng)監(jiān)控。我們做了一些運(yùn)營(yíng)活動(dòng),效果怎么樣?這時(shí)候就需要進(jìn)行運(yùn)營(yíng)監(jiān)控的數(shù)據(jù)分析。
3.商業(yè)決策。對(duì)辦理者來(lái)說(shuō),按照整體的運(yùn)營(yíng)分析數(shù)據(jù),我們就能決定下一步該怎么走。
其實(shí)這是我們傳統(tǒng)的BI(商務(wù)智能),只發(fā)揮了數(shù)據(jù)價(jià)值的20%,數(shù)據(jù)更大的價(jià)值是驅(qū)動(dòng)產(chǎn)品智能。好比現(xiàn)在最火的AI,其實(shí)邏輯有三步。第一步有了數(shù)據(jù)基礎(chǔ);第二步在這個(gè)數(shù)據(jù)基礎(chǔ)上抄上必然的策略算法;第三步把這個(gè)策略算法和這個(gè)數(shù)值再回歸到產(chǎn)品里面去,這樣就形成了一個(gè)循環(huán)。對(duì)這個(gè)產(chǎn)品自己就是一個(gè)的學(xué)習(xí)過(guò)程,這就是智能。
最簡(jiǎn)單的例子是有兩個(gè)產(chǎn)品,一個(gè)是百度搜索。按照用戶的點(diǎn)擊的情況,它會(huì)決定哪些結(jié)果往前排,哪些結(jié)果往后排,這個(gè)就是用戶行為引入到搜索引擎里面去。
那別的一個(gè)產(chǎn)品就是今日頭條,今日頭條是一個(gè)以替代引擎為核心的媒體渠道,它能按照用戶接觸的各種新聞,決定進(jìn)一步給你推送什么類型的。
總結(jié)來(lái)說(shuō),用戶行為數(shù)據(jù)在企業(yè)里起到的作用,一方面是驅(qū)動(dòng)決策,另一方面是驅(qū)動(dòng)產(chǎn)品智能。
三:數(shù)據(jù)分析的四個(gè)環(huán)節(jié)
▎數(shù)據(jù)采集
第一個(gè)環(huán)節(jié)是數(shù)據(jù)采集,就是數(shù)據(jù)從哪里來(lái)。在搭建百度大數(shù)據(jù)系統(tǒng)的過(guò)程中,我有一個(gè)很重要的心得:數(shù)據(jù)要做好,最重要的就是數(shù)據(jù)源。
從源頭上來(lái)說(shuō),我把大數(shù)據(jù)分解為四個(gè)字:大,全,細(xì),時(shí)。
大,并不是物理上的大, 98 年谷歌最開(kāi)始做搜索引擎的時(shí)候,它抓取了整個(gè)網(wǎng)站的網(wǎng)頁(yè)信息,一共 2500 萬(wàn)個(gè)網(wǎng)頁(yè)才47GB,一個(gè)U盤就能裝下,但它必定是大數(shù)據(jù),因?yàn)樗颜麄€(gè)網(wǎng)絡(luò)全都放進(jìn)去了。
全,以美國(guó)選舉為例,網(wǎng)上的調(diào)研都說(shuō)希拉里會(huì)獲勝,但結(jié)果特郎普獲勝了。后來(lái)分析原因說(shuō),美國(guó)中部的農(nóng)民都是不上網(wǎng)的。這就印證了一個(gè)問(wèn)題,就是我們收集數(shù)據(jù)的時(shí)候,不能只收集客戶端的數(shù)據(jù),辦事端的數(shù)據(jù)也要收集的。
細(xì),其實(shí)就是強(qiáng)調(diào)多維度。維度越多,占的數(shù)字規(guī)模不見(jiàn)得多,但是可能的組合形式就越多,你就會(huì)發(fā)現(xiàn)一些紛歧樣規(guī)律。
時(shí),就是時(shí)效性。以前我們?nèi)丝谄詹槭敲?5 年做一次,準(zhǔn)備一年、做一年、一年之后出結(jié)果。但現(xiàn)在上今日頭條上看新聞,你剛看完這條新聞,數(shù)據(jù)系統(tǒng)馬上就會(huì)記住你的優(yōu)先選擇,決定接下來(lái)給你保舉的內(nèi)容。
▎數(shù)據(jù)建模
所謂建模,就是把數(shù)據(jù)進(jìn)行儲(chǔ)存,把它整理得更便利以后使用。就像是一個(gè)倉(cāng)庫(kù),如果運(yùn)來(lái)的東西不去分類,而是隨便往那一堆,等以后要用的時(shí)候,找起來(lái)就麻煩了。
▎數(shù)據(jù)分析
漏斗分析、用戶留存分析、多維交叉分析、用戶點(diǎn)擊分析,這些都是在數(shù)據(jù)模型基礎(chǔ)上的應(yīng)用。
▎數(shù)據(jù)指標(biāo)