各位下午好,上午大家聆聽了各位專家和國家統(tǒng)計局領(lǐng)導精彩紛呈的演說,現(xiàn)在有很多同志可能有點昏昏欲睡,我盡量說的輕松愉快一點,大家湊合著聽吧。
其實所謂大數(shù)據(jù),我覺得是許多人愿意把它從量級進行理解,大家都認為,大數(shù)據(jù)顧名思義這個數(shù)據(jù)必須要很大才行,大數(shù)據(jù)從單類別的數(shù)據(jù)體量足夠大以外,有一個很高的要求就是必須用不同類別的數(shù)據(jù)進行交叉比對分析挖掘,然后從中得到一個深層次的洞察力,其中我覺得從我們的研究來說,就是消費者的這個角度,研究人與人群,人與物,人與品牌,人與物與物之間的各種關(guān)聯(lián)性的挖掘,這才是大數(shù)據(jù)真正應(yīng)該有的應(yīng)用。
我大致把大數(shù)據(jù)分成五類,第一類就是今天我的專題演講,政府大數(shù)據(jù);第二類是公共機構(gòu)大數(shù)據(jù),公共機構(gòu)大數(shù)據(jù)是政府以外的三大運營商水電煤各種慈善機構(gòu)基金產(chǎn)生的數(shù)據(jù);第三類是自然科學大數(shù)據(jù),就是指自然運行產(chǎn)生的數(shù)據(jù)和人類探索自然的科學實踐產(chǎn)生的大數(shù)據(jù);第四類是企業(yè)大數(shù)據(jù),其實可以分為兩端,第一就是由商業(yè)模式的形式到產(chǎn)品的研發(fā)、生產(chǎn)、倉儲、物流,包括企業(yè)本身的人事管理和財務(wù)管理過程當中形成的數(shù)據(jù),一直到產(chǎn)品和服務(wù)進入市場之前,在這之前我們稱之為企業(yè)內(nèi)部運營大數(shù)據(jù),一旦產(chǎn)品和服務(wù)進入了市場,與消費者產(chǎn)生碰撞之后就產(chǎn)生了商業(yè)大數(shù)據(jù),除了四類數(shù)據(jù)以外,最底層的就是以人為本的用戶大數(shù)據(jù),這也是SPD所著重研究的領(lǐng)域。
接下來談一下政府與公共機構(gòu)大數(shù)據(jù)在國內(nèi)的利用,在中國是一個大政府小社會的格局,我談的公共機構(gòu)里面,很多都是隸屬于政府的公共機構(gòu),比如說三大運營商也好,水電煤也好,他們都是屬于政府屬下的國企,由國資委管理的,所以其實也是政府的一部分,從政府機構(gòu)的特點來看,他們的數(shù)據(jù)源極為豐富,數(shù)據(jù)類別也極為豐富,但是政府現(xiàn)在無一例外的是,坐擁巨大的數(shù)據(jù)財富,但是他們的特點是捧著金飯碗在要飯,他們沒有把數(shù)據(jù)很好利用起來,因為在前年年初的時候,也就是2014年年初的時候,楊雄市長發(fā)了一個毒誓,將上海24個市委辦的數(shù)據(jù)打通,所以形成了上海大數(shù)據(jù)交易中心,但是交易的是初級數(shù)據(jù),不能再次進行深加工,價值就比原始數(shù)據(jù)少了很多,從我們從事消費者大數(shù)據(jù)的研究,大數(shù)據(jù),其實不產(chǎn)生任何直接的價值,但是產(chǎn)生巨大的間接價值,從消費者應(yīng)用的目的來看,無非是兩點,一個是盡可能的把價值加以變現(xiàn),第二是大大的降低各種成本,從而提高運營和資金效率,從目前的消費市場來看,我們目前處于一個消費者訴求快速變化,市場的環(huán)境快速變化,以前傳統(tǒng)的B2C企業(yè),所有的這些關(guān)鍵管略的制定,從研發(fā)到渠道到消費者的滿意度其實都是評價企業(yè)高管本身對于行業(yè)對于產(chǎn)生對于品牌的傳統(tǒng)經(jīng)驗和認知來自己擬定所有的策略,但是現(xiàn)在這種拍腦袋的模式越來越不能適應(yīng)消費者對于個性化、差異化的需求,因此我們必須從眾多的數(shù)據(jù)源里面加以分析、挖掘,把消費者對于產(chǎn)生對于服務(wù)的訴求加以精煉,然后從而對各個關(guān)鍵環(huán)節(jié)加以數(shù)據(jù)支持,因為只有這樣,才能很好地服務(wù)于企業(yè),使他們能夠盡可能的做到差異化和價值化。
同樣的一種方法,也是可以針對政府而言,也是可以引用的,因為政府和公共機構(gòu)現(xiàn)在目前也存在著能耗大、運營效率低、所有產(chǎn)品資源服務(wù)其實價值利用沒有得到達到一個非常完整的地步。
在2016年年初,今年年初,我們受上海市消費者權(quán)益保護委員會的委托,發(fā)布了今年315消費者權(quán)益白皮書,我也想就今天利用這個案例和大家做一個分享,就是在我們與消協(xié)作為一個公共管理機構(gòu),但是很大程度上受制于工商行政管理局,所以我們目前還可以把它認為是一個大半政府部門,這個報告大家可以在互聯(lián)網(wǎng)上都可以找到,整個項目的背景是他們對于整個過往十年消費者投訴的數(shù)據(jù)庫自己感到無從下手,所以就把我們請去對他們的數(shù)據(jù)庫做一個判斷,然后利用這些數(shù)據(jù)怎么樣利用大數(shù)據(jù)的方法,在今年315白皮書上找出更多的亮點,適應(yīng)目前市場形勢的變化,當時看了以后我們蠻傻眼的,因為第一次會議的時候一位副秘書長和我說了這么一句話,他們自己本身對這個數(shù)據(jù)只有恨沒有愛,這個數(shù)據(jù)庫真是覺得愛不起來,因為上面的問題我覺得就是出現(xiàn)在這上面,第一數(shù)據(jù)庫的結(jié)構(gòu)非常老化,他們的標簽的分類可以說連上世紀九十年代的水平都沒有達到,他們接投訴的渠道大部分是來自于電話,消費者權(quán)益保護涉及個人生活、社會生活的各個領(lǐng)域各個方面,其實覆蓋的商品數(shù)量、種類非常繁多,大類上就超過了兩千類,而且數(shù)據(jù)量非常巨大,單條投訴數(shù)據(jù)就超過了三十個字段,我們針對這種情況進行了以下幾個處理。
第一,我們對舊有的數(shù)據(jù)庫重新建立了新的標簽,針對現(xiàn)在目前已經(jīng)新興行業(yè),比如說新能源汽車、月子會所、跨境電商,我們進行了重新的標簽細分,重建了他們的標簽庫。
第二是我們對字段進行了重新分類和挖掘,針對不同類別的投訴內(nèi)容進行高頻詞的抓取,進行數(shù)據(jù)的抓取。
第三我們在這些數(shù)據(jù)經(jīng)過整理以后的數(shù)據(jù)庫去跑,然后找出現(xiàn)在目前整個消費投訴和消費市場的新趨勢,其實價值點就從這一步開始體現(xiàn)了。
最后是我們對于拿到的所有結(jié)果進行解讀,最后形成315報告,這個報告大家如果有興趣可以從微信公眾平臺或者是從百度搜索得到,大家有興趣可以讀一下。
我們現(xiàn)在詳細談一下,第一步,我們的標簽系統(tǒng)的重建,但是可以看看,左邊就是消保委舊的商品分類,應(yīng)該說比較原始的,在我們重建之后,我們針對十個大類進行了重新梳理、重新構(gòu)建,使得商品品牌符合目前消費市場的狀態(tài)。之后對于問題的挖掘,消保委原來針對投訴都是全部歸結(jié)為質(zhì)量問題,我們這次對不同行業(yè)的投訴問題進行了分類,比如說房地產(chǎn)中介行業(yè)存在不能按期交房,對于電商來說可能有假貨問題,對于新能源汽車來說有這樣那樣的技術(shù)問題,所以我們主要把這些投訴問題重新進行歸納和分類。
其中對于深度挖掘,以前是以文字描述為主,我們是用了很多的新模型和算法,用目前眾多電商網(wǎng)站的分類方法對投訴內(nèi)容進行映射和比對,從中可以挖出很多的新的洞察力和數(shù)據(jù)結(jié)論。
這些我想行業(yè)內(nèi)部對于這些工具比如說貝葉斯、交叉分析工具都比較熟悉,我們用目前主流的算法進行統(tǒng)計分析,我們增加了不同維度的分析,比如說線上線下投訴情況比對,比例是多少,可以細化到某一個類別某一個品牌的線下比例是多少,這樣同不同的維度進行比對,就可以看出整個消費者各種投訴的習慣媒體瀏覽的習慣,這些都可以看得出來,溫故而知新,我們從這些歷史當中其實也就看到了行業(yè)的趨勢、產(chǎn)品的趨勢、品牌的趨勢。
所謂利用大數(shù)據(jù)挖掘的成果,也就是第一,我們把大量的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變成為一個結(jié)構(gòu)化的數(shù)據(jù)。第二是把淺表層非常粗淺的分析,做成了深度挖掘。從錄入和輸出我們都是變成了一個智能化的過程,盡可能地減少人工干預(yù)的成分,從而把這個過程當中的不可控因素大大降低和減少,然后把單一數(shù)據(jù)變成了多層次數(shù)據(jù),對數(shù)據(jù)背后的成因進行了分析進行了比對。
從這個案子來說,我們可以看到第一,政府所掌握的這些數(shù)據(jù)源真是非常豐富,也是非??少F的,在接這個項目的時候,政府領(lǐng)導和我們說,你們掌握的這些數(shù)據(jù),你們隨便拿三五條出來,就可以殺掉這個企業(yè),這些數(shù)據(jù)非常敏感,在政府數(shù)據(jù)的應(yīng)用當中,是怎么樣加以重建,怎么樣加以分類,在應(yīng)用過程當中如何平衡數(shù)據(jù)應(yīng)用和保護機密保護個人隱私這兩方面之間很重要的是求得一個規(guī)則,怎么樣平衡這兩方面不同的利益訴求,不要觸及法律底線。
對于政府和公共機構(gòu)大數(shù)據(jù),在應(yīng)用方面我們只是做了一個初步的探索,而通過初步探索,我們見到了背后巨大的價值和一個對于我們行業(yè)來說巨大的利益點。所以我們也是希望政府能夠進一步持開放的態(tài)度,把他們的數(shù)據(jù)源頭依據(jù)一種規(guī)則盡可能地對我們的行業(yè),包括所有的行業(yè)進行開放,使得大數(shù)據(jù)能夠真正發(fā)揮應(yīng)有的作用。謝謝大家!
|