軟件預(yù)測能比人工預(yù)測準(zhǔn)多少?
這是我們在與同行業(yè)溝通探討時經(jīng)常會被問道的一個問題,其實這里面存在一個誤區(qū),準(zhǔn)確度的高低并不是由系統(tǒng)或者人工來決定的,而是由選取的歷史數(shù)據(jù)、分析的方法以及特殊事宜的考慮而決定的,要做到精準(zhǔn)的預(yù)測,往往與預(yù)測人員的工作經(jīng)驗有著非常大的關(guān)系。
要做好準(zhǔn)確的預(yù)測,目前普遍認(rèn)為需要做到以下三點:
1、選取適當(dāng)?shù)臍v史數(shù)據(jù);
2、依靠經(jīng)驗來撫平或剔除業(yè)務(wù)異常數(shù)據(jù);
3、對業(yè)務(wù)未來活動、節(jié)假日等因素的預(yù)估。
選取適當(dāng)?shù)臍v史數(shù)據(jù)
歷史數(shù)據(jù)是一切預(yù)測的基礎(chǔ),后續(xù)的話量預(yù)測都會是在歷史數(shù)據(jù)的基礎(chǔ)上進行提升或下降的,那么按照統(tǒng)計學(xué)的原理來說是不是收集的樣本數(shù)越多就越可以反映出未來話量趨勢的走向呢?
其實不然。按理說數(shù)據(jù)應(yīng)選取與未來業(yè)務(wù)變化一致的歷史數(shù)據(jù)進行預(yù)測,如下周或下個月業(yè)務(wù)將進行技能的調(diào)整或用戶群體的變化,那之前取的長時間的歷史話量參考性將會大幅下降,應(yīng)該多參考近期業(yè)務(wù)的話量變化作為預(yù)測歷史數(shù)據(jù),也就是說業(yè)務(wù)越不穩(wěn)定,我們選擇的歷史數(shù)據(jù)應(yīng)當(dāng)越短較好,因為短時間的數(shù)據(jù)可以反應(yīng)出業(yè)務(wù)話量起伏變化的趨勢與規(guī)律,而長時間的歷史數(shù)據(jù)會將業(yè)務(wù)的話務(wù)起伏抹平”;
反之,如果業(yè)務(wù)較為穩(wěn)定且未來沒有重大的變化,我們就可以選擇較長的歷史數(shù)據(jù)進行預(yù)測,這樣會將短期內(nèi)或少量的異常情況進行撫平”。
依靠經(jīng)驗來撫平或剔除業(yè)務(wù)異常數(shù)據(jù)
在選取歷史數(shù)據(jù)中往往會選到節(jié)假日、活動日以及線路故障等日期數(shù)據(jù),如果使用這部分?jǐn)?shù)據(jù)對未來話量進行預(yù)測將會默認(rèn)未來的一段時間內(nèi)會同樣有節(jié)假日、活動日或故障,這顯然是不合適的,我們無法預(yù)測未來會出現(xiàn)故障問題,這就需要我們在業(yè)務(wù)運營時每日要記錄業(yè)務(wù)出現(xiàn)的臨時狀況如線路故障、天氣異常、國家政策等對于話務(wù)線路的沖擊,在將來進行預(yù)測的時候需要將這部分異常的日期數(shù)據(jù)進行拋出;
至于活動日和節(jié)假日,它們與故障不同,活動日和節(jié)假日無論是歷史數(shù)據(jù)還是未來都是有明確日期的,所以像這類特殊情況一般是將他們單獨提取出來單獨進行預(yù)測。
在上述的選取適當(dāng)?shù)臍v史數(shù)據(jù)”與依靠經(jīng)驗撫平或剔除業(yè)務(wù)異常數(shù)據(jù)”中可以看出基本上是依靠個人經(jīng)驗或者是說直覺進行數(shù)據(jù)選取和話務(wù)剔除,有人會說這完全就是拍腦袋的決定,毫無科學(xué)依據(jù)”,但如果大家能夠真正能明白直覺”是什么時就會知道依靠直覺來進行判斷并不是毫無依據(jù),歷史數(shù)據(jù)與數(shù)據(jù)剔除的影響因素有千千萬萬,我們必須承認(rèn)如此海量的影響因素是無法全部收集的,既然無法收集全部的影響因素,那么即使運用科學(xué)的方法做出的預(yù)測又怎么會有科學(xué)依據(jù)呢?
反而直覺是依靠自己在平時工作、生活中的經(jīng)驗而通過左右權(quán)衡得出的一個大體的數(shù)字,雖然這在很大程度上取決于操作者的時間經(jīng)驗,但我們必須相信這種經(jīng)驗并且頻繁地實施,之后我們才可以從經(jīng)驗中得出數(shù)據(jù)上的結(jié)論,當(dāng)然,這個結(jié)論可能只適用于某個業(yè)務(wù)。
對業(yè)務(wù)未來活動、節(jié)假日等因素的預(yù)估
對于這列特殊日期的預(yù)測需要用到特殊方法,不能像其他普通日期使用長時間歷史話量進行預(yù)測,而是提取特殊因子進行計算。
特殊因子存在于歷史發(fā)生過的活動日或節(jié)假日中,我們需要分析往年的活動或節(jié)假日對于線路的影響比例并將這種影響的比例進行計算后套用到今年的活動或節(jié)假日中,在基礎(chǔ)數(shù)據(jù)上進行折算,譬如對2017年國慶日的節(jié)假日預(yù)測,我們可以取2016年及2015年國慶日當(dāng)周的話量以及前1-7天、8-14天、15-21天、22-28天來計算出國慶日當(dāng)周的話量下降因子,例如把2016年國慶周的前22-28天話量當(dāng)做是100%從而分析出前15-21天話量已經(jīng)開始出現(xiàn)下降,假設(shè)話量下降了5%,那國慶前15-21天的話量只有國慶前22-28天話量的95%。
以此類推,一直展示到國慶當(dāng)周的話量是百分之多少,這樣當(dāng)我們預(yù)測出國慶前22-28天的話量時就可以套用話量下降或上升的百分比因子來計算出國慶當(dāng)周的話量。
最終,我們將獲取一段時間業(yè)務(wù)穩(wěn)定的話務(wù)數(shù)據(jù),之后進行了異常數(shù)據(jù)的剔除并在加入了未來活動、節(jié)假日的考慮后得到了想要的基礎(chǔ)數(shù)據(jù)。
1、 將這些基礎(chǔ)數(shù)據(jù)按周維度統(tǒng)計后可以看到業(yè)務(wù)的話量在周中是存在遞減或遞增的趨勢,同樣可以將遞增或遞減的趨勢與當(dāng)周的話量進行計算來得到未來一周的話量。
2、將選取的歷史數(shù)據(jù)按照星期維度再進行統(tǒng)計可以得到一周內(nèi)每天的話量比例,即星期占比,用預(yù)測出的未來一周的話量與星期占比相乘可以計算出未來一周每天的話務(wù)量。
3、將選擇的歷史數(shù)據(jù)以時段的形式進行統(tǒng)計,這樣可以得到星期一至星期日每個時段的話量數(shù)據(jù),將每個時段的話量與全天總量相除就可以得到歷史星期一至星期日每個時段的時段話量占比。
4、最終將我們計算出的未來一周每日的話務(wù)量與每天的時段占比相乘,就可以得出最終預(yù)測的每天每時段的話量數(shù)據(jù)。
預(yù)測的終點其實并不是100%契合實際話量,話量是自然發(fā)生的事情,任何人都無法做到預(yù)測與實際完全一致,我們能做到的是不斷收集數(shù)據(jù)并分析問題,在未來的預(yù)測中盡可能全面地考慮未來的影響因素,這樣即使無法與實際相同,但也不至于出現(xiàn)重大的預(yù)測錯誤。
隨著我們工作經(jīng)驗的增加和預(yù)測水平的提升,終會有一天,我們可以完全地掌握未來話務(wù)所發(fā)生的所有因素,到時候,預(yù)測的準(zhǔn)確度自然會得到提升。