沈浩:大家好,非常高興坐到最后了。其實(shí)這張圖片我剛才特別緊張,因?yàn)閯偛挪恍⌒母孪到y(tǒng),結(jié)果這個(gè)系統(tǒng)不知道要更新多長時(shí)間,緊張了半天,剛剛更新好,我沒有意識到,這張圖片其實(shí)挺好,這是我們CMRA去美國組團(tuán)訪問拍的,當(dāng)時(shí)我記得一個(gè)美國人他說他也沒見過,想用五千美金買我的相片,后來我說送給他吧。今天我的演講主題《大數(shù)據(jù)時(shí)代的人工智能與市場研究》,但是巧了,前兩天我剛剛參加了一個(gè)全域數(shù)據(jù)會議,他們希望我做一個(gè)主題發(fā)言叫“大數(shù)據(jù)技術(shù)2025”,又巧了,我今天住的房間正好是2025,所以讓我去預(yù)測大數(shù)據(jù)技術(shù)的2025,那我是來自于傳媒大學(xué)調(diào)查研究所,柯老師是我們的旗幟,也是柯老師把我們帶入市場研究,但是今天其實(shí)我們在談?wù)摓椋?/span>2025其實(shí)也就六年時(shí)間,所以預(yù)測未來的時(shí)候,如果你讓我預(yù)測2140年,這個(gè)我敢預(yù)測,為什么?因?yàn)?/span>2140年比特幣將被挖光,如果預(yù)測未來6年,那我就在想過去是什么樣呢?我在準(zhǔn)備PPT的時(shí)候想,2017年的時(shí)候11月7號,我剛講完在我們雙年會上,2011年我舉辦過一個(gè)中國網(wǎng)絡(luò)科學(xué)論壇,當(dāng)時(shí)我記得請了三十多個(gè)專家,沒有人談大數(shù)據(jù),如果讓我預(yù)測未來,我會發(fā)現(xiàn)今天站在現(xiàn)在,展望未來,回顧歷史,其實(shí)我們說了大數(shù)據(jù)真的是我們要熱情擁抱的,并且大數(shù)據(jù)已經(jīng)到來。
但是到底什么是大數(shù)據(jù)呢?其實(shí)它就像瞎子摸象,不同的人摸到不同的位置可能就是大數(shù)據(jù),所以我們更愿意說大數(shù)據(jù)時(shí)代,對于大數(shù)據(jù)來講,其實(shí)這張圖2005年的時(shí)候,我就找到了這張圖,這張圖當(dāng)時(shí)指的是數(shù)據(jù)挖掘,但是從2005到2025這樣的二十年時(shí)間,我們不僅關(guān)注于在知識上已經(jīng)看到了AI,已經(jīng)看到了神經(jīng)科學(xué),或者神經(jīng)網(wǎng)絡(luò)科學(xué),這些概念已經(jīng)出現(xiàn),成為今天最熱的,換句話說人們在談?wù)摰脑掝},在去年一個(gè)非常重要的研究者之夜,有現(xiàn)場三百多個(gè)所謂研究者,大家現(xiàn)場投票,投出的結(jié)果呢,大家說2016年是大數(shù)據(jù)年,2017年是人工智能年,2018年會是什么呢?大家預(yù)測應(yīng)該是區(qū)塊鏈年。對于市場研究來講,它對大數(shù)據(jù)還沒有完全消化的時(shí)候,又來了人工智能,人工智能的概念還沒火呢,就到了區(qū)塊鏈,當(dāng)然了2018年馬上就要過去了,2019年是什么呢?有人說也許是視頻年。所以在這個(gè)過程中,一種機(jī)器學(xué)習(xí),這樣一個(gè)核心技術(shù)以變革性的方式正在讓我們重新思考,我們過去所做的事情,所以在考慮我們?nèi)绾伍_發(fā)產(chǎn)品,如何做Maketing,如何去做廣告,哪怕游戲的東西,我們會發(fā)現(xiàn)機(jī)器學(xué)習(xí)都有可能出現(xiàn)。
我理解的數(shù)據(jù)進(jìn)化從最開始我們談DI這個(gè)詞,叫數(shù)據(jù)整合,整合的問題,如果我能夠把線下線上的數(shù)據(jù)整合,如何把大小數(shù)據(jù)整合,如何把不同的數(shù)據(jù)源整合,如何整合異構(gòu)數(shù)據(jù)源整合。進(jìn)而會發(fā)現(xiàn)DI這個(gè)詞還包括數(shù)據(jù)洞察,什么是數(shù)據(jù)洞察呢?我經(jīng)常說這個(gè)洞察有可能只可意會不可言傳,是一種腦筋,是一種直覺,是一種悟性,還是一種積累的經(jīng)驗(yàn),今天我認(rèn)為最重要的數(shù)據(jù)是DI,是數(shù)據(jù)智能,它是數(shù)據(jù)的聰明,或者聰明智慧的數(shù)據(jù),如何讓數(shù)據(jù)變成智能呢?這時(shí)候讓我預(yù)測大數(shù)據(jù)技術(shù)2025,除了我住的房間是2025之外,我們還有中國制造2025,盡管在中美貿(mào)易中,大家知道有一個(gè)很重要的導(dǎo)向是說,要對中國的2025,中國制造,那么大數(shù)據(jù)已經(jīng)成為了生產(chǎn)要素,大數(shù)據(jù)跟小數(shù)據(jù)不可同日而語,小數(shù)據(jù)是我們才用抽樣的方法,采用洞察的方式,采用更好的研究者智慧,去解決商業(yè)、社會問題,但是大數(shù)據(jù)它是社會生產(chǎn)要素,它將助力中國制造2025,實(shí)現(xiàn)中國在實(shí)體經(jīng)濟(jì),在智慧城市、社會治理等領(lǐng)域,所以如何賦能中國2025的中國制造,我們市場研究至少在這里邊是重要的一股力量。
我這里特別強(qiáng)調(diào),我們從來不是為了做大數(shù)據(jù)挖掘而去采集數(shù)據(jù),而是商業(yè)自動化和社會治理導(dǎo)致海量數(shù)據(jù)存儲,數(shù)據(jù)是生產(chǎn)要素!因此從我們市場研究的角度去理解的話,應(yīng)該更好的看待這個(gè)疆界,這個(gè)疆界會變得更大。在過去我們市場研究最傳統(tǒng)的,最掌控的是統(tǒng)計(jì)分析技術(shù),在量化研究層面上,所以這種技術(shù)主要采用的是抽樣、是統(tǒng)計(jì)推斷,但是大數(shù)據(jù)呢?大數(shù)據(jù)挖掘采用的是自動生成,是機(jī)器學(xué)習(xí),而現(xiàn)在進(jìn)入人工智能,我說了它是喂養(yǎng)數(shù)據(jù),所謂喂養(yǎng)就是我把一千張的圖片貓、一千張的圖片狗,讓機(jī)器去學(xué),學(xué)著學(xué)著就學(xué)會了它會判別它是貓還是狗,是你喂養(yǎng)給它是什么,你告訴它是什么,這樣的深度學(xué)習(xí)就會起作用,而且目前就我對人工智能和深度學(xué)習(xí)算法的感知,我認(rèn)為現(xiàn)在只要是打好標(biāo)簽,屬于監(jiān)督類的算法,深度學(xué)習(xí)的技術(shù)所得到的結(jié)果,幾乎打倒人類,甚至已經(jīng)超過人類。所以從這個(gè)角度來講,今天大數(shù)據(jù)所帶來的這種進(jìn)化,從過去我們所提到的一個(gè)洞察力,就是我們市場研究一直強(qiáng)調(diào)我們的價(jià)值所在,但是未來它更多的是預(yù)見性,是一種預(yù)見力,機(jī)器學(xué)習(xí)具有預(yù)見力,傳統(tǒng)的市場研究由于大量采用的是橫斷面的研究,而大數(shù)據(jù)自動生成的數(shù)據(jù),所有的數(shù)據(jù)都打著時(shí)間的標(biāo)簽,所有的數(shù)據(jù)可能都打著位置的標(biāo)簽,而這些隨著時(shí)間的變化的數(shù)據(jù),將給我們帶來一種預(yù)見性,當(dāng)人工智能的技術(shù)普遍應(yīng)用的時(shí)候,我們就見到了行動力,過去傳統(tǒng)的市場研究不太向往著預(yù)見力、預(yù)測性的東西,也不太關(guān)注行動力,盡管我們希望行動力,這些技術(shù)本身具有這樣的能力。
市場研究實(shí)際上是一個(gè)服務(wù)經(jīng)濟(jì),從狹義的角度來講,而服務(wù)經(jīng)濟(jì)是一個(gè)價(jià)值交換,你沒有獲得產(chǎn)品,無論是我們的甲方還是我們的乙方,你只是獲得了它的功能和它的價(jià)值。所以在今天大數(shù)據(jù)到底是什么?為什么它能助力我們的市場研究?其實(shí)這時(shí)候我們的市場研究已經(jīng)有了更寬的,或者更廣義的概念,所以大數(shù)據(jù)實(shí)際上它是一個(gè)使得我們更好的人類,更好的借助于數(shù)據(jù)科學(xué),去感知這個(gè)社會,這種感知會出現(xiàn)這句話我是最喜歡引用的,這也是我給《爆發(fā)》這本書寫的推薦語,它核心觀點(diǎn)是說人類行為的93%是可預(yù)知的,我們更關(guān)注的是什么是大數(shù)據(jù),今天的大數(shù)據(jù)和傳統(tǒng)市場研究有些不同,就像有人說傳統(tǒng)的市場研究采用抽樣的方法,是割裂了消費(fèi)者,割裂了人的社會情景,它變成了一個(gè)社會學(xué)的絞肉機(jī),是一個(gè)獨(dú)立的樣本,但實(shí)際上人類這樣一個(gè)人的行為,他是有社會溝通的,從這個(gè)角度來講,我們?nèi)パ芯咳说臅r(shí)候,他會變得非常具體,我上次已經(jīng)提到了這個(gè)概念,就像說什么呢?就像有人說了,沈老師,特朗普當(dāng)選了,我曾經(jīng)說過了這個(gè)案例,因?yàn)橛泻芏嗫蛻?,也有很多新的朋友,我再次闡述一下,當(dāng)時(shí)人們就說了民調(diào)顯示,特朗普不當(dāng)選,希拉里當(dāng)選,民調(diào)顯示不脫歐最后脫歐了,什么是真正的民意?如何獲取真正的民意?這是當(dāng)時(shí)的一個(gè)問題,也涉及到我們市場研究,所以當(dāng)時(shí)市場的研究很多人都參與了關(guān)于可能落地的民間市場調(diào)查管理能力,但是在這個(gè)過程中,曾經(jīng)有人問,特朗普的性格很重要,所以我立刻就分析了特朗普的性格,這時(shí)候我們在分析特朗普性格的時(shí)候,實(shí)際上我用了一個(gè)模型,叫大五碼,在這個(gè)大五碼里面,我分析他性格的時(shí)候,可以打開它,可以分析這個(gè)性格里面不同的元素,在這個(gè)分析結(jié)論當(dāng)中,特朗普在我的分析中,他是一個(gè)非常優(yōu)秀的人,為什么呢?從我的數(shù)據(jù)上大家可以看到,在這個(gè)數(shù)據(jù)里面,特朗普真的是很優(yōu)秀的,這是我當(dāng)時(shí)做的一個(gè)結(jié)論,在那個(gè)時(shí)候做出來的一個(gè)結(jié)論,你會發(fā)現(xiàn)對特朗普一個(gè)人做一個(gè)性格分析,他的盡責(zé)性非常強(qiáng),責(zé)任感在一百個(gè)人里邊處于前四名,他的開放性、智力前三名,他的外向性是0.98,前兩名,他的同情心是第一名,暴躁非常低,這跟我的直覺不一樣,是的,因?yàn)樘乩势账苯訏仐壔蛘咧苯臃艞壛藗鹘y(tǒng)的媒體,而用推特,所以他在推特上表露更多的他的行為特征,是他的語言,他的文本,所以這些文本去分析以后,會發(fā)現(xiàn)特朗普他的需求,我們知道有馬斯洛需求理論,你會發(fā)現(xiàn)特朗普的需求它的結(jié)構(gòu)穩(wěn)定性占比非常高,60%以上,這說明什么?說明如果我早去陳述這個(gè)問題,我們對特朗普這樣一個(gè)人的認(rèn)知就會更好,為什么?因?yàn)橹袊畲蟮慕Y(jié)構(gòu)叫人口結(jié)構(gòu),結(jié)構(gòu)往往具有穩(wěn)定性,因此結(jié)構(gòu)具有預(yù)見性。所以像中國這么大的人口結(jié)構(gòu),那沒有一代人、兩代人是改變不了的,所以如果當(dāng)初意識到了這個(gè)結(jié)構(gòu),我們對于特朗普來講,我們似乎想的選前他所說的話,選后絕對會這么做,如果從性格特質(zhì)上來看他是這樣的結(jié)構(gòu),他的穩(wěn)定性也會不錯(cuò)。在這里面可以分析他的價(jià)值觀,那時(shí)候分析還真不錯(cuò),他上班時(shí)間從來不發(fā)推特,他都是在7點(diǎn)到10點(diǎn),10點(diǎn)之后他才發(fā)推特,您做得到嗎?我還分析了他133種消費(fèi)行為,大家會說了沈老師你分析的準(zhǔn)嗎?我就做了這個(gè)東西玩一玩,如果我做的是消費(fèi)者,我才不關(guān)心它準(zhǔn)不準(zhǔn)呢,對于消費(fèi)者來講你是誰跟你沒關(guān)系,是我怎么看你,我分析出你這樣的行為特征,我就Marketing你了,這個(gè)過程也給特朗普打了標(biāo)簽,做了用戶畫像。
在這個(gè)過程中你會發(fā)現(xiàn)一個(gè)很重要的大數(shù)據(jù)挖掘想法,既然沈老師可以分析一個(gè)特朗普,是不是推特上所有人我都可以分析,今天的群體行為是每一個(gè)活生生的個(gè)體所構(gòu)成的群體,過去市場研究看到姚明在這兒,我們要把他剔除掉,為什么?異常值,但是今天我們要去抓的人,我們要去挖掘的人,是挖那些跟正派不太一致的人,我們希望找到姚明,所以大數(shù)據(jù)挖掘更多的是異常監(jiān)測,更多的是那些不能靠直覺發(fā)現(xiàn)的東西,甚至是違背直覺的,有時(shí)候挖的東西越出乎意料,越有商業(yè)價(jià)值。那么從這個(gè)視角來看,我既然可以去挖特朗普,那是不是可以把特朗普他關(guān)注的人,他的團(tuán)隊(duì)都分析一下,那時(shí)候我就分析了這個(gè)女的,這是他女兒,上回我記得就是跟建新,我們打Uber問出租車司機(jī),你會投誰?他說支持希拉里,但是最終投票一定會投特朗普,這是為什么呢?這個(gè)人說了,如果我投票給特朗普,一旦特朗普當(dāng)選,他女兒特別漂亮,每天就會上電視,你說這消費(fèi)者什么樣的心,所以我就做了一個(gè)分析,后來我就特別無聊,我既然能夠做這個(gè)事情,那是不是我可以把世界各國領(lǐng)導(dǎo)人全做一遍,這可不可以呢?這時(shí)候你會發(fā)現(xiàn),完全可以對世界各國領(lǐng)導(dǎo)人171個(gè)全分析了,這一塊大家看到了一種可視化的效果,而且這個(gè)可視化你可以秒懂,大數(shù)據(jù)很重要的特征就是要秒懂,所以我們才創(chuàng)建了新的一個(gè)專業(yè)方向,在過去我們因?yàn)楦袌鲅芯康暮献鳎菚r(shí)候叫小數(shù)據(jù),我們叫媒體市場調(diào)查與分析,當(dāng)然我愿意去掉媒體,就叫市場調(diào)查與分析專業(yè),之后大數(shù)據(jù)來了,我們成立了一個(gè)數(shù)據(jù)新聞這樣一個(gè)專業(yè)方向,自主招生,非?;鸨?,這個(gè)是為了可視化而可視化,這是假的,為什么?世界各國領(lǐng)導(dǎo)人互相不關(guān)注。
從這個(gè)角度來講,今天我們一個(gè)很重要的特點(diǎn),這是和傳統(tǒng)的市場研究有新的區(qū)別,我們可以分析一個(gè)獨(dú)特的個(gè)體了,我不再需要分析兩個(gè)人,從這個(gè)角度來講,數(shù)據(jù)的多樣性和復(fù)雜性需要我們立刻獲取數(shù)據(jù),滿足數(shù)據(jù)的結(jié)構(gòu),以規(guī)模和速度解決復(fù)雜數(shù)據(jù)問題,所以有人說大數(shù)據(jù)就是復(fù)雜的數(shù)據(jù),而且提供實(shí)時(shí)洞察?,F(xiàn)在大家都會想了,那我如果想實(shí)現(xiàn)實(shí)時(shí)洞察有沒有可能性呢?請問誰有推特,如果你有推特我立刻就可以分析出你的結(jié)果。我現(xiàn)在的分析也許跟明天的分析不太一樣,但是如果我們認(rèn)為人的行為特征很多不可改變的時(shí)候,這種趨勢也許是我們更好的捕捉,我只要敲入這個(gè)地址,這時(shí)候就部署了這樣一個(gè)模型,也就是說我只要在這樣一個(gè)地址上,敲入你的賬號,我立刻可以抓來你在推特上的信息,抓來信息以后,投入到性格特征模型,然后得到一個(gè)包,立刻把這個(gè)包替換我原來的數(shù)據(jù),就會展示出一種新的可視化效果,這時(shí)候它是一個(gè)產(chǎn)品了,我們模型已經(jīng)部署上去了。在這個(gè)過程中,其實(shí)微博可不可以呢?當(dāng)然可以,所以你對微博任何一個(gè)人,只要說自己的話,就可以分析他的行為特征,這時(shí)候如何實(shí)現(xiàn)這一點(diǎn)?因?yàn)橛辛舜髷?shù)據(jù)以后,我們對消費(fèi)者的追蹤技術(shù)已經(jīng)相當(dāng)?shù)某墒?,這種追蹤不僅僅是我們看到的一種社會治理層面,而這些在營銷方面,使得我們營銷變得更復(fù)雜的領(lǐng)域,具有更準(zhǔn)確的結(jié)果,直接行動力,這時(shí)候計(jì)算機(jī)將接管手動或勞動密集型的任務(wù),也可以提前感知消費(fèi)者需要感知的東西,我們就可以提供服務(wù)。
我們可以通過一個(gè)視頻感知這一點(diǎn)的應(yīng)用場景,這一種場景已經(jīng)開始出現(xiàn),可以看到在這樣的場景里面,當(dāng)你進(jìn)入一個(gè)超市的時(shí)候,你會發(fā)現(xiàn)在這個(gè)過程中,它可以實(shí)時(shí)的通過視頻來實(shí)現(xiàn),當(dāng)你進(jìn)來的時(shí)候就可以給你打上標(biāo)簽,你是男的、女的,高興、不高興,年齡,現(xiàn)在的計(jì)算機(jī)都可以識別,當(dāng)然它有區(qū)間和概率,當(dāng)我的攝像頭可以針對某一個(gè)人的時(shí)候,實(shí)際上我是可以做到跟這個(gè)人,如果他是一個(gè)流量監(jiān)控,我可以做這樣的統(tǒng)計(jì),如果正好是一個(gè)無人購物,當(dāng)我拿起這件衣服的時(shí)候,它是能看到我拿起衣服很高興,看到價(jià)簽就很悲傷了,我們可以監(jiān)控這樣的過程,對于我們實(shí)現(xiàn)這個(gè)過程來講,其實(shí)這個(gè)東西并不太困難,因?yàn)槭裁??作為大?shù)據(jù)來講,如果你想從事大數(shù)據(jù)的分析,必然你需要進(jìn)入到一種云計(jì)算,如果我們今天依然依賴于我們自身所謂的建模,在這兒如果采用了機(jī)器學(xué)習(xí)的技術(shù),科技看到有Deeplens,相當(dāng)于攝像頭將來有計(jì)算能力,我們?nèi)A為手機(jī)可以做美顏了,實(shí)際上后臺還有強(qiáng)大的云計(jì)算,如果我點(diǎn)擊這樣一個(gè)云計(jì)算的服務(wù),你會發(fā)現(xiàn)在這個(gè)里邊,我們可以去進(jìn)行面部的分析,在這個(gè)面部分析,大家立刻看到我上傳一張我的相片,所以我上傳一張我的相片,我看一看我的相片長的什么樣,它會發(fā)現(xiàn)99.9%他是男的,年齡在35到52歲之間,這個(gè)判斷是錯(cuò)誤的,因?yàn)樯蚶蠋熆隙ㄔ谶@個(gè)區(qū)間之外,但是我喜歡這樣的區(qū)間,而且它知道我表現(xiàn)出是否高興是否戴著眼鏡,我們可以看到這樣的過程,現(xiàn)在拿到一張相片,可以自動從相片中提取它的標(biāo)簽,同時(shí)可以自動給相片加上標(biāo)題,同時(shí)可以實(shí)現(xiàn)人臉識別,去年年初的時(shí)候我做了一個(gè)人臉識別的應(yīng)用。
我們會發(fā)現(xiàn)今天完全可以追蹤,而這種追蹤得益于云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng),當(dāng)然了最重要的是我們的手機(jī),所以手機(jī)導(dǎo)致我們的海量數(shù)據(jù)形成一個(gè)新的信息空間,在這里面我們會發(fā)現(xiàn),我們的數(shù)據(jù)大家已經(jīng)不再叫單一的數(shù)據(jù)了,而希望構(gòu)建一個(gè)全域數(shù)據(jù),就像剛才阿里所演講的。我們現(xiàn)在到底有什么樣的數(shù)據(jù)呢?首先我們有各種支付、消費(fèi)、銀行刷卡記錄,我們有各種購物消費(fèi)行為數(shù)據(jù),我們有各種社交媒體,整天在微博微信上交流,當(dāng)然了,我們還有我們看到的文旅數(shù)據(jù),看各種電影、影視劇等等,同樣我們也有位置地理大數(shù)據(jù),還有一類傳感器大數(shù)據(jù),如果我們一個(gè)企業(yè)擁有所有這些數(shù)據(jù),不可能,所以我們需要開放大數(shù)據(jù),不可能,所以誰擁有大數(shù)據(jù)?政府,政府是擁有大數(shù)據(jù)、使用大數(shù)據(jù)和開放大數(shù)據(jù)的重要角色,所以從這個(gè)角度來講,你的開放數(shù)據(jù)、刷卡銀行的數(shù)據(jù)、投資股票的數(shù)據(jù)、投資企業(yè)的數(shù)據(jù),所有這些數(shù)據(jù)跟我們這些數(shù)據(jù)如何融合呢?對我們企業(yè)來講,也許你有部分的某一類數(shù)據(jù),如何跟另一個(gè)部分的數(shù)據(jù)去產(chǎn)生數(shù)據(jù)整合之后的價(jià)值呢?盡管不需要全域,盡管我不可能有全域,但是我們需要你有各種各樣的技術(shù),比方說我們可能需要去解決認(rèn)知技術(shù),像剛才分析特朗普的行為,而認(rèn)知技術(shù)是我們市場研究非常核心的算法,為什么?我們需要能夠通過它的語言、聲音來解決我們的分析問題,所以在今天對于這些用戶畫像、性格分析,需要我們有新的知識結(jié)構(gòu)。
自然語音處理技術(shù),所以認(rèn)知技術(shù)正在成熟,這種認(rèn)知技術(shù)會有更好的算法,將用于分析個(gè)體數(shù)據(jù)和人類行為。認(rèn)知技術(shù)可以歸到我們今天所說的人工智能技術(shù),所以在這里面我們可以看到原來的劍橋分析就是這樣的一個(gè)技術(shù),只不過劍橋分析過去它沒有想改變所有的政治水平,但當(dāng)我們用在政治層面上,臉書所暴露出來的數(shù)據(jù)問題,就會產(chǎn)生政治影響,所以在這里面我們會發(fā)現(xiàn),我們需要大數(shù)據(jù)同時(shí)需要實(shí)時(shí)大數(shù)據(jù),這種實(shí)時(shí)大數(shù)據(jù)我一直在演示這樣一張圖表,就是希望大家可以看到,我們經(jīng)常看到如果給的數(shù)據(jù)是可以實(shí)時(shí)的,而所謂實(shí)時(shí)呢,就可以秒懂,你會發(fā)現(xiàn)小數(shù)據(jù)需要我們向甲方去闡釋我們的結(jié)論,我們小數(shù)據(jù)有點(diǎn)像碩士博士論文,但是我們的大數(shù)據(jù)不需要,我們的用戶、消費(fèi)者,甚至所有的領(lǐng)導(dǎo)都可以秒懂,我們希望他秒懂,所以我們瞬間可以看到那個(gè)地方一片黑,為什么?說明我們中國人不喜歡推特,你可以感知到,感知就是不精確,感知就是快速,從這個(gè)角度來講,我們可以做一些非常重要的分析,而這個(gè)分析需要我們?nèi)诤细嗟募夹g(shù),包括數(shù)據(jù)科學(xué)、人工智能,當(dāng)然也包括商業(yè)智能,未來物聯(lián)網(wǎng)和AP數(shù)據(jù)的接口,會成為數(shù)據(jù)之間交融的很重要的技術(shù)手段,所以在這個(gè)里面圖像處理也會有更加好的結(jié)果,臉書已經(jīng)實(shí)現(xiàn)了一張相片中,在秒級毫米級上找到這張圖片,過去我們說十個(gè)人里面搜到誰,現(xiàn)在可以在上億圖片中去處理,為什么呢?現(xiàn)在都是一個(gè)faceID,我們叫做向量化,這個(gè)概念可能有些人不太理解。
我們會發(fā)現(xiàn)當(dāng)我們捕獲更多的消費(fèi)者數(shù)據(jù),我們可以有更好的算法用于消費(fèi)者行為分析的時(shí)候,這種數(shù)據(jù)的分析已經(jīng)不僅僅來源于我們現(xiàn)在看到的所采取的結(jié)構(gòu)化數(shù)據(jù),我們更多的從視頻、圖像、文言、文字、聲音中實(shí)現(xiàn)處理能力,而這種處理能力采用的是一種建模的思想,這種建模的思想它實(shí)現(xiàn)了我們可以更好的去感知,這一點(diǎn)我去比喻一下,這是一個(gè)人們把神經(jīng)網(wǎng)絡(luò)、人工智能的深度學(xué)習(xí),叫卷機(jī)神經(jīng)網(wǎng)絡(luò)CNN,這個(gè)CNN怎么算這些東西呢?你會發(fā)現(xiàn)我們現(xiàn)在想?yún)^(qū)分這樣的過程,在區(qū)分這個(gè)過程中,如果數(shù)據(jù)的結(jié)構(gòu),比如說現(xiàn)在給你數(shù)據(jù),只要長的這樣,分的那么細(xì)有什么方法都好分,但是如果我們的數(shù)據(jù)長成這樣呢?顯然它已經(jīng)不是我們的因果關(guān)系了,不是我們的線性關(guān)系了,它已經(jīng)變得非常復(fù)雜,所以我們要想?yún)^(qū)分這樣的效果,我們?nèi)ミ\(yùn)行它會是什么樣的效果呢?它會不斷地訓(xùn)練,它在出現(xiàn)這些效果的時(shí)候,這個(gè)不好,我們要增加幾個(gè)隱含層,通過增加隱含層再次訓(xùn)練這個(gè)模型的時(shí)候,這個(gè)過程就需要上百、上千萬的參數(shù)輸入進(jìn)去,它很快就能尋找,甚至我們說了需要加入二次方,這時(shí)候我們會發(fā)現(xiàn),也許這時(shí)候我們的算法會更好的能夠區(qū)分出它的特征來,甚至達(dá)到在這個(gè)區(qū)分上,我們怎么能夠去算出它的一個(gè)效果來,當(dāng)然了它的很好的,但是時(shí)間不要等,因?yàn)橛锌赡芩?jì)算的過程需要GPU的電腦,或者需要更長的訓(xùn)練時(shí)間。如果我們需要這個(gè)模式的時(shí)候,用市場研究過去的建模方式已經(jīng)無法替代,只能依賴于神經(jīng)網(wǎng)絡(luò)的技術(shù),它在不斷算的過程,當(dāng)然也要改變這些抽樣的方式。比方說在深度學(xué)習(xí)里面,它就采用的是過度抽樣、欠抽樣,它的抽樣方式是完全不一樣的,從這個(gè)角度來講,未來的分析技術(shù),由于它具有一致性,所以對人工智能的技術(shù)帶來很大的發(fā)展。
如果我們希望,比方說市場研究公司說了我怎么去做呢?現(xiàn)在很多的算法都已經(jīng)變成了自動化的,我啟動一個(gè)數(shù)據(jù),啟動這個(gè)數(shù)據(jù)以后,然后啟動云計(jì)算的實(shí)力,我點(diǎn)擊它,這樣就啟動了云服務(wù)器,我只愿意利用阿里,或者百度云等等,我只需要運(yùn)行這一次,我支付一百塊錢、一萬塊錢,總好過我這樣一個(gè)記。在這個(gè)過程中我的數(shù)據(jù)全部在這兒,就是這個(gè)DATA,這個(gè)DATA非常簡單,現(xiàn)在把數(shù)據(jù)模型直接運(yùn)行出來,自動會生成這個(gè)模型,在這個(gè)模型里邊,我們可以看到拿過來就行了,就像搭積木一樣,生動以后就會開始調(diào)參,調(diào)完參就訓(xùn)練,訓(xùn)練以后就出結(jié)果,然后就進(jìn)行部署,部署什么呢?我現(xiàn)在需要預(yù)測了,只要啟動需要預(yù)測的新數(shù)據(jù)直接給出結(jié)果,這個(gè)結(jié)果給出來以后,像這種叫做自動化模式有很多類型。
在這個(gè)過程中人工智能似乎給人帶來了一絲絲恐懼,其實(shí)不需要這樣,是我們在教會機(jī)器如何創(chuàng)造合理的未來,是我們的數(shù)據(jù)在教會機(jī)器如何創(chuàng)造合理的未來。從這個(gè)角度來講,盡管有著一些像給出的未來人類概念,但是人工智能將可能成為未來社會的核心技術(shù),這些技術(shù)可能在很多領(lǐng)域,人臉識別、對象偵測、語言的自動合成,這些工作都可能會產(chǎn)生。我經(jīng)常愿意表現(xiàn),如果你愿意我也經(jīng)常會做這樣一個(gè)工作,就像我現(xiàn)在打開這個(gè),我打開這個(gè)工具以后,就可以看到這里面存在這樣一個(gè)邏輯,在這個(gè)邏輯里面,會發(fā)現(xiàn)今天我非常高興能夠有機(jī)會在我們市場研究行業(yè)峰會上,一起探討這樣一個(gè)關(guān)于大數(shù)據(jù)人工智能,我說這是一個(gè)令人興奮的時(shí)代,也是大數(shù)據(jù)的時(shí)代,數(shù)據(jù)科學(xué)讓我們越來越多從數(shù)據(jù)中觀察到人類社會的行為模式,我們從數(shù)據(jù)中擁有更多的可用知識的增加,我有意把時(shí)間放的非??欤浅B?,在這個(gè)過程中大家會發(fā)現(xiàn)原來真的是可以,你只要說話就變成了文本,這就成為了我們的DATA,我們聲音就變成DATA了,如果是這樣的話,我們依然還可以嘗試著另外一種思考問題的方法,就是說如果我同時(shí)錄入的時(shí)候,還真的希望說今天非常高興能夠來到上海,我們在探討人工智能、大數(shù)據(jù)和區(qū)塊鏈技術(shù),
我如果在說話的時(shí)候它在不斷翻譯,如果能夠同聲翻譯,我們的速記和同傳,大家不要小看它,它還是有一些問題,但它在不斷地進(jìn)化,人工智能它的最大價(jià)值在不斷進(jìn)化,它在不斷地學(xué)習(xí),這個(gè)學(xué)習(xí)的過程會讓我們越來越知道,未來它會替代68%的那些同傳,未來它會達(dá)到90%的同傳水平,從這些技術(shù)的角度來看,我們會發(fā)現(xiàn)人工智能的技術(shù),它實(shí)際上并不是對我們市場研究這樣一個(gè),如果把它定義的非常狹窄,實(shí)際上我們已經(jīng)看到了,像我們戴著攝像頭,戴著眼鏡就可以進(jìn)行貨架的識別和掃描,就可以通過這樣一個(gè)應(yīng)用場景,來實(shí)現(xiàn)什么呢?比方說人工智能現(xiàn)在說的都是弱人工智能,為什么呢?如果我們把一個(gè)人,把他的鼻子、眼睛、腦袋全部調(diào)個(gè)個(gè),但依然會認(rèn)為它是人。我通過一個(gè)程序?qū)崿F(xiàn)車損的自動定損,也可以數(shù)人流量,同時(shí)也可以數(shù)客流量,這些技術(shù)的應(yīng)用場景,使得我們越來越多看到自動化的狀態(tài),實(shí)現(xiàn)這種行動力,換句話說它是產(chǎn)品,在這里面這種技術(shù),我也可以給大家演示,但是時(shí)間不太夠了,我就不再啟動,要演示這個(gè)啟動我需要立刻登錄我的實(shí)驗(yàn)室,我實(shí)驗(yàn)室是有它的服務(wù)器,所以我需要登錄,這實(shí)際上就是我們所說的云計(jì)算,相當(dāng)于我現(xiàn)在已經(jīng)登錄到了我的云計(jì)算,登錄云計(jì)算以后,比如我出差就可以實(shí)時(shí)的,可能我的學(xué)生在做這個(gè),我沒有邀約,我就不做了。
其實(shí)我們用云計(jì)算和我用實(shí)驗(yàn)室的計(jì)算,而且用我手機(jī)的4G,其實(shí)使用上并沒有太大的差異。當(dāng)然了,我們還是希望大量數(shù)據(jù)的使用可以更好。有了這些以后,我們會發(fā)現(xiàn)將來所有事物都將感知、連接和智能化,我們也可以看到傳感器大數(shù)據(jù),就像我們現(xiàn)在看到行業(yè)里面越來越多的采用第三方評估,也可能這不是接觸性的評估,也可能通過攝像機(jī)、照相機(jī),也可能通過監(jiān)測點(diǎn),這時(shí)候我們會發(fā)現(xiàn)基于未來的人聯(lián)網(wǎng)、車聯(lián)網(wǎng)、互聯(lián)網(wǎng),還有情感傳感器、社會傳感器,位置信息將非常重要,越來越多的企業(yè)會將他們預(yù)測分析模型轉(zhuǎn)移到云端,比如說在IBM上它有什么樣的預(yù)測能力。我們也需要有編程,像沈這個(gè)歲數(shù)還要學(xué)Assa,對市場研究的人來講,是否擁有能夠掌握編程的技術(shù)呢?就像現(xiàn)在的記者,我們一直在問急著要不要學(xué)編程呢?我們數(shù)據(jù)新聞的學(xué)生已經(jīng)開始開設(shè)編程課,這樣才能進(jìn)入系統(tǒng)和工程層面。當(dāng)然我們面對這么多數(shù)據(jù),一直談GDPR,它的核心就是數(shù)據(jù)的主體,應(yīng)該完全明確的說我既可以同意,也可以不同意,我即使同意了也可以隨時(shí)不同意。從這個(gè)角度來講數(shù)據(jù)的安全性,數(shù)據(jù)的隱私,數(shù)據(jù)的確權(quán),數(shù)據(jù)的邏輯,這些都可能提到議程。當(dāng)然了,我們也需要去思考數(shù)據(jù)的刪除和數(shù)據(jù)的可遺忘,這些是大數(shù)據(jù)所關(guān)注的話題。
所以在這個(gè)過程中,我們更深入的大數(shù)據(jù)挖掘問題,是如何當(dāng)我們擁有了這些數(shù)據(jù),如何從收集的數(shù)據(jù)和分析的數(shù)據(jù)中,能夠獲得更好的最佳見解,我們經(jīng)常說洞察、洞見,這是我們市場研究說的,但是這種見解會發(fā)現(xiàn)我們市場研究公司也好,我們其他的甲方,還有整個(gè)社會也好,都在加大大數(shù)據(jù)的投入,那些不投入大數(shù)據(jù)的階級也許跟大數(shù)據(jù)投入的企業(yè),或者大數(shù)據(jù)擁有的企業(yè)產(chǎn)生巨大的鴻溝,這種鴻溝所帶來的可能性就是改變企業(yè)、政府,甚至我們商業(yè)的運(yùn)作模式,就像我們的市場研究公司,如果說我想重新起步,開始進(jìn)入大數(shù)據(jù),這不僅是一個(gè)收集大數(shù)據(jù)人才的問題,而可能改變了整個(gè)企業(yè)的性質(zhì),改變了企業(yè)整個(gè)的行動方式,包括管理方式。在這里面我們會有很多的應(yīng)用,我經(jīng)常愿意講這樣一個(gè)例子,在里邊我們啟動一個(gè)程序,這些所有的程序都是免費(fèi)的,因?yàn)槊赓M(fèi)意味著你也可以做,在這里面當(dāng)我們?nèi)舆@樣一些算法程序的時(shí)候,我們就可以看到在這個(gè)里邊,計(jì)算機(jī)完全可以實(shí)現(xiàn)一些新的思考問題的方法,甚至帶來一種改變,這種改變是什么呢?就像我看到這樣一個(gè)程序,我先去跑一跑,這個(gè)我曾經(jīng)想演示過,在跑這個(gè)數(shù)據(jù)的時(shí)候我已經(jīng)算出來了,模型我就不再去運(yùn)行了,直接就跑了,實(shí)際上是這樣一個(gè)場景,這個(gè)場景非常重要,我也希望耽誤點(diǎn)時(shí)間跟大家交流一下。在這個(gè)場景中,它是這樣一個(gè)邏輯,這個(gè)邏輯是說,在我的數(shù)據(jù)中,如果我擁有這樣一些圖片,這是什么?電影海報(bào),假如你去看電影,你不會不識字,不識字看什么呢?反正不懂中文、不懂英文只能看畫,當(dāng)我選擇0這張圖片的時(shí)候,我們程序就會告訴你說,如果選擇了0這個(gè)圖片,回車,回車,你會發(fā)現(xiàn)我立刻就找到了跟它相似的圖片,我既然可以做這個(gè),同樣也可以隨便取一張圖片,來看一下,比方說我們隨便取這個(gè)945,我們再換一張圖片,這個(gè)圖片的945執(zhí)行執(zhí)行,大家看到像不像呢?像,那就叫個(gè)性化推薦,不像這就叫精細(xì)?,F(xiàn)在我們知道在所有的媒體上,所有的電商上都存在著個(gè)性化推薦,那么個(gè)性化內(nèi)容推薦、協(xié)同過濾,都需要我們擁有消費(fèi)者信息歷史記錄,對歷史記錄的使用帶來數(shù)據(jù)的隱私,以及個(gè)性化推薦所帶來的信息解防,還有一個(gè)很重要的問題就是冷啟動的問題,冷啟動就是一個(gè)消費(fèi)者沒有信息,或者新產(chǎn)品沒有歷史記錄,但在今天可以發(fā)現(xiàn)根據(jù)不需要消費(fèi)者的數(shù)據(jù),通過圖片就可以推測他喜歡什么。我可以把新聞做成圖片,我可以把文字做成圖片,而形成的創(chuàng)意就變得重要了,人們通過看畫來實(shí)現(xiàn)他的選擇行為。
在這個(gè)里面我做了一些對所有圖書進(jìn)行相應(yīng)的選擇,可不可以,我也可以對所有的煙盒做選擇,可不可以,比如說上萬張煙盒也可以去做分析,當(dāng)然了,你要有圖片,你有所有碳酸飲料的圖像,我們?nèi)匀豢梢杂?xùn)練出相似性,這樣就可以快速尋找到這些結(jié)果,這個(gè)訓(xùn)練過程只要借助深度學(xué)習(xí)機(jī)都可以實(shí)現(xiàn),換句話說對我來講,只要給我圖片就可以實(shí)現(xiàn),而這個(gè)處理過程具有通用性,這就帶來了什么呢?帶來了人工智能的應(yīng)用場景會變得越來越特殊,所以在這里面我們就會面臨很多,比方說如何做地理空間的分析,如何去圈住它,就像我現(xiàn)在這樣,這是傳媒大學(xué)的校園,我隨便點(diǎn)了二十個(gè)點(diǎn),然后畫了一個(gè)區(qū)域,我想知道誰落了這個(gè)區(qū)域內(nèi),只要用了我的APP就可以測算出落地在這個(gè)位置,這時(shí)候就可以進(jìn)行人數(shù)的統(tǒng)計(jì),可以算出二三環(huán)之內(nèi)的人,甚至可以知道落在天安門或者哪個(gè)店里面,當(dāng)然上海外灘的踩踏事件,將來就可以實(shí)現(xiàn)公共安全的人流監(jiān)測,我們可以實(shí)現(xiàn)社區(qū)的網(wǎng)格化,我們可以實(shí)現(xiàn)傳感器的物流、選址和智慧足跡,這些應(yīng)用就像我們把一個(gè)城市網(wǎng)格化,城市網(wǎng)格化管理就會精細(xì)化,我們可以實(shí)時(shí)計(jì)算每一個(gè)人距離我的位置,就像現(xiàn)在我可以給大家再次啟動,可能耽誤了時(shí)間,我建議如果有些特別忙的趕飛機(jī),離開就行了。
我們來看看這個(gè),就用傳媒大學(xué),假如說我現(xiàn)在在這個(gè)位置上,我現(xiàn)在想做一個(gè)區(qū)域性的劃分,比如說這樣一個(gè)劃分,這個(gè)劃分以后,我選擇一個(gè)距離,我是開車還是什么,這樣我還可以選擇一個(gè)五百米的距離直徑,就可以立刻去計(jì)算什么呢?計(jì)算在這個(gè)區(qū)域內(nèi)它的一個(gè)網(wǎng)格,這個(gè)網(wǎng)格就是你看到剛才我的PPT里面所顯示的這個(gè)區(qū)域狀況,這樣就可以看到對很多技術(shù)的實(shí)現(xiàn)都可以應(yīng)用,包括在這些大屏顯示上,也成為數(shù)據(jù)、大數(shù)據(jù)應(yīng)用,和未來我們?yōu)槠髽I(yè)、為甲方,或者為政府提供各種應(yīng)用很重要的場景,這個(gè)場景像這種大屏顯示,包括在我們這里邊可以看到的,像這樣的大屏顯示,帶來整個(gè)大屏變化的這種。
講到這兒呢,實(shí)際上我們對大數(shù)據(jù)的分析和人工智能的未來,當(dāng)然它是一個(gè)更寬的東西,它是一個(gè)更全域的東西,對市場研究來講,我們畢竟是它的一分子,我們需要人才,已經(jīng)不僅僅是傳統(tǒng)數(shù)據(jù)定量研究的統(tǒng)計(jì)人才,大數(shù)據(jù)實(shí)際上狹義的講,它已經(jīng)不是統(tǒng)計(jì)了,它是數(shù)學(xué),人工智能主要是數(shù)學(xué)的技術(shù),因?yàn)樯蚶蠋煍?shù)學(xué)系畢業(yè),所以更偏愛于人工智能這樣一個(gè)技術(shù)。在這里面我們說了,未來不遠(yuǎn),也希望我們能夠擁抱,我今天上午在這兒準(zhǔn)備的時(shí)候,我發(fā)現(xiàn)好像忻雷跑到我前面了,是不是又騰出時(shí)間了,我就想是不是要講一講區(qū)塊鏈呢,所以我又準(zhǔn)備了區(qū)塊鏈的東西,我這一兩年大部分時(shí)間在研究區(qū)塊鏈的技術(shù),如果大家愿意聽我就接著講,如果下次有機(jī)會我們再來講。下回我們再分享,作為最后一個(gè)總結(jié),堅(jiān)持到這兒,再次代表協(xié)會,代表在座的各位會長領(lǐng)導(dǎo),特別是我一直看到我的老師,柯老師,一直在這兒在學(xué),相信大家一樣都會有收獲,這次論壇再次感謝我們各位嘉賓,各位市場研究的同仁,和甲方乙方、各位老師,再次感謝上?;I辦這次峰會的各家市場研究公司,最重要的要感謝我們的工作人員,我們的秘書處、秘書長,再次感謝!還有兩位主持人非常辛苦,也感謝所有為這次峰會做出貢獻(xiàn)的,我們期待著下一次,期待著明年我們有雙年會,期待著我們有更好的知識分享,謝謝大家!
主持人:時(shí)間過的很快,我們的會議接近了尾聲,這次大會的主題是聚合·共生,我們正是因?yàn)閷I銷和市場研究的熱愛,讓我們聚合在上海,也是因?yàn)閷?shù)據(jù)和對應(yīng)用價(jià)值的渴望,讓我們共生向未來,不確定的明年會在哪個(gè)城市,但是明年的會更精彩、更豐富,這一定是確定的,各位明年見,謝謝。
|