謝謝主持人,謝謝主辦方的邀請,其實只要介紹我是上海大數據聯盟的常務副秘書長就可以了,今天我分享的主題主要是大數據和產業(yè)創(chuàng)新這塊領域,我在這里給大家推薦一些對于大數據領域的一些認識,在這個領域里面為大數據企業(yè)做了很多服務。從我自己做大數據聯盟最大的體會,今天是在交大,我們聯盟里有一家企業(yè),研究生二年級,三個人創(chuàng)業(yè),前年開始做,去年創(chuàng)業(yè)平臺做的不錯,一個大數據的競賽平臺,這個平臺去年大概估值一千萬,在這個領域里頭,行業(yè)也對他認同,今年以來承擔了大量的大數據競賽,一系列大賽奠定了平臺,他們今年下半年又要進行再一輪融資,現在這幾個小伙子已經休學了,其實包括在這個時代,確實有很多人在緊緊把握互聯網+ 和 大數據+的風口。這個領域里頭有一大批的熱血青年,時不我待型的,還有沒日沒夜的人,周六周日工作,節(jié)假日也工作,很多會議他們都是晚上開的,這個領域像打了雞血一樣,關鍵是內生動力,這個時代是創(chuàng)造奇跡的時代,而且是自我實現夢想的時代,這樣的話大家都有內生動力,為自己干活。
接下來給大家簡單介紹一下這里的一些體會,大數據時代已經到來了,前面說了創(chuàng)業(yè)的情況,大數據如何改變產業(yè),大數據時代的到來,大數據的風口已經到了,大數據歸納為信息時代,計算機時代、互聯網、大數據時代,自己所在的單位是上海超級計算中心,前兩個時代,互聯網時代中國不占優(yōu)勢,而且是跟隨者,習總書記2014年提出來了信息化網絡安全強國戰(zhàn)略,在計算機和互聯網領域,我所在的超算中心是全國最大的計算能力的機構,計算騰空全球第一,但是我們的核心芯片用的要么就是英特爾的要么就是AMD的,我們的操作系統(tǒng)也和人家沒辦法比,所以在這塊領域底層的東西我們還是用外面的東西,互聯網時代也是一樣,一系列的東西都是外國的標準,從本質上來講,我們雖然這波互聯網也好,其他的東西發(fā)展的這么快,但是我們的底層東西有欠缺性,網絡強國的戰(zhàn)略提出是非常有道理的。但是我們看看大數據時代,和國際上的時間點是差不多的,其實2012年號稱是大數據元年,中國其實2013年的時候大數據可能前面專家對于數據的理解更深刻,大數據時代這本書是2013年的時候看的,后來一系列的傳播數據跟隨起來了,我們在數據生產、數據消費,我們有巨大的應用場景,這兩個領域絕對是世界頂尖的,為什么說是風口,風口不到的時候做一件事情,英雄無用武之地,陳天橋是互聯網領域頂禮膜拜的英雄人物,31歲的時候做到中國首富,憑借傳奇這款游戲成為了互聯網領域的泰斗級人物,后來要做一個盛大盒子,05年的時候投資了三十億打水漂了,當時風口沒到,技術上利用的網絡帶寬,用戶體驗比較差,而且政策不允許,當時做的盒子和小米盒子百度盒子功能差不多,現在的話正常的現象,在我們家里有線電視從去年已經不用了,現在從百度盒子解決一切問題,因為有技術有政策,風口真的就到了,以前是沒有的。在下一個風口是豬都會飛起來,這是有道理的,而且大家看看時運還是能力,70后在上海,我們大部分人被時代推上去的,我們要結婚要買房子,被迫個人資產上升,這是能力還是時運,打一個問號,時運和能力是共同的,有一部分人選擇了這個行業(yè),比如說馬云,自己選擇了這個行業(yè),但是大部分人是在這個風口上,我們還是信用有了互聯網和大數據,我們在風口上把我們吹起來了。大數據技術里頭,幾個背景我們也可以看一下,技術設施的發(fā)展,2011年的時候有一款智能手機,價格一千塊錢以下,這是一個因素,智能手機價格下降了,對我們來說他們用得起移動終端,為后來的移動互聯網的發(fā)展是一個重要的因素,還有我們的流量價格也在大面積下降,那個時候如果放在五年前用彩信發(fā)短信大家還要猶豫一下,現在用流量已經不用什么錢了,極大的促進的移動互聯網的發(fā)展,還有云計算的發(fā)展,現在的互聯網云計算這個東西,就像水和電一樣,水龍頭一扭就出來了,現在所在的超算部門就是云計算,存儲在云端,還有我們的大數據也是提供這樣一些服務,還有我們的計算能力,千萬不要忘了巨大的計算能力是背后能夠主導和推動大數據真正發(fā)展的重要因素,在貴州現在做了一個天眼,就是用背后巨大的超算支持,如果在座的各位同學喜歡看美國大片的話,經??吹教煅巯到y(tǒng)在全世界范圍內抓一個人非常方便,背后有非常巨大的計算能力,云計算、大數據、超算構筑了這個時代的發(fā)展。
還有就是社交網絡,QQ,到了后來現在使用微信,但是最近一段時間,從去年開始,昨天和幾個同學一起聊天,他們說馬化騰現在一直憂慮,下一個社交媒體到底是什么東西,所以他們居安思危也是有道理的,但是無論怎么樣,我們社交網絡的信息推動了我們整個數據的發(fā)展,前面有一個專家圖形上寫的很清楚,從社交網絡里頭我們可以看到每個人的行為路徑每個人的位置信息,甚至每個人的興趣愛好,騰訊的人和我說,他們掌握了每個人的社交數據,而且是非常真實的,所有的應用場景非常真實,點對點的談話,可能有些話是含糊的,但是微信的聊天記錄和文檔是非常真實的數據,現在數據已經形成一種壟斷的趨勢,在國內BAT絕對壟斷,這個生態(tài)我們稱之為閉環(huán)的大數據生態(tài),上海現在做的大數據交易所,今年4月1號成立的,這是中國第十三個大數據交易所,最早成立的是在貴陽,交易所模式是開放的大數據生態(tài)系統(tǒng),開放的生態(tài)系統(tǒng)從我們的理解最近遇到了很多困難,待會兒還要去談這個事兒,現在的交易量很低,貴陽的大數據交易所流水交易就一兩千萬,實際交易還低于這個數字,所以這個數據未來共享還是交易還是說另外一種模式,現在可能正在探索。
最后一個結論是風口是到了,之后講幾個我理解的大數據改變產業(yè)的例子,改變產業(yè)肯定是一個工業(yè)互聯網和工業(yè)4.0,甚至我們叫智能制造2025,如果各位同學可以關注,最近在整個產業(yè)鏈生態(tài)里頭,從國家發(fā)改委、工信部,以及上海,工業(yè)互聯網將有巨大的投入,這個領域做工業(yè)制造、工業(yè)大數據有很多潛力,原來講的例子就是現在工業(yè)互聯網里頭的智能制造,其實是個性化需求的一種制造模式,定制的模式,家具衣服都可以定制。
第二,改變了經濟發(fā)展模式,提供了一種新的模式,像共享經濟,各位在座有沒有用過映客的,絕對就是共享,共享你的生活共享你的顏值,有人報道,未來五年中國會形成一千多位網紅,網紅年收入會超過一千萬,網紅很奇怪我也很奇怪,我看過映客,里面有一些人就是靠著網上和大家聊天,把自己打扮的很漂亮,通過這種共享居然一天也能有一萬塊錢的收入,很奇怪,有七八萬人關注她,告訴大家眼睛在哪整的,雙眼皮在哪割的,這個互聯網林子大了什么鳥都有,而且這些鳥都有消費能力,構建了這樣一個互聯網消費群體。
第三個改變了政府的治理模式,最近大家也有體會,最近我們上海在做數據開放的過程當中,只要推動數據開放,政府是一個open的,未來在公權和私權的界定方面,從大數據數據開放和隱私界定是一個契機,在我們這樣一個國家,以前有點忽略,領導叫我們干什么就干什么,政府叫我們干什么就干什么,現在這個時代可能有一些更多的想法,為什么要這么做,這么做的依據是什么,政府必須把數據開放出來,數據開放過程當中現在遇到的困難和障礙都存在,現在政府數據不停開放,但是最后有效資本也不是特別多,問題就是我開放出來的數據,萬一數據有高手整合一下,導致我無意識泄露了秘密,誰來給我免責,這是很大的問題,我們一直呼吁第三方機構,一直探討這個問題,怎么樣確權,書記的第三方評估免責,這些都是現在存在的困難。
改革的一些具體產業(yè)的應用案例,這是精準營銷的案例,線上線下都有,其實很簡單的描述就是最開始把個人的情況收集起來,描述標簽畫像,下一步把我們可能需要的產品,在我們可能的情形下,給我們進行推送,這就是精準營銷,無非就是現在數據量大了,這個過程當中實際上把供給端和需求端對接,政府是喜歡做這個事兒的,在廣義貨幣不增加的情況下,增加貨幣的流通量,大家可以想像,我們的通貨膨脹不增加,但是貨幣流動增加,經濟活躍度就會增加。
第二個案例就是醫(yī)療健康,基因大數據,未來有巨大的應用場景,基因大數據分三游,上游是測序儀器,第二個是測序的服務提供商,第三個是測序服務的應用市場?,F在國內數的出來的做基因測序基本上60%—70%都是華大出來的,上個月的15號有一次基因大數據的活動,做演講的嘉賓里面有三位居然都是華大出來的,有一支團隊是2013年華大出來的,經過兩年多的創(chuàng)業(yè),現在估值六十億,因為有一些好的算法,還有巨大的存儲,而且不僅僅做測序服務,還有一定的測序提供商的部分,因為市場大了以后,現在投入也非常大,我做了一個簡單的梳理,在測試提供商這塊,中國現在有150多價測序服務商,這就導致了市場有無序競爭,野蠻生長也是對的,到后面逐步規(guī)范。應用市場看兩個方面,一個是管生一個是管死,管生就是嬰幼兒懷孕期間的產前篩查,準確率還是比較高的,而且某種程度上測男測女比較準,管死就是靶向治療,說簡單也簡單,不增加藥物的成分,只不過是第一時間更快速的發(fā)現病人腫瘤患者的靶點,第一時間發(fā)現了,沒有增加藥,只不過快速發(fā)現靶點,因為基因測序時間比較短。這是BAT在健康大數據的布局,騰訊主要做線下部分和互聯網對接,對接的是線下的醫(yī)生集團,做互聯網醫(yī)生,阿里主要是和藥品監(jiān)管合作,這個平臺可以監(jiān)管所有藥品的生產流通消費,百度醫(yī)生基于自己的搜索引擎和百度貼吧做的一些工作。
金融領域非常好,今年四月份,螞蟻金服的估值已經四千億了,相當于交通銀行A股的市值,生態(tài)里頭以大數據為基礎的信用體系是最基礎的最核心的東西,還有大數據平臺,阿里自己做了一個大數據平臺,在開源的基礎上做了,構建了自己的信用體系,芝麻信用,大量的數據背后幾秒鐘可以授權,非常方便,而且壞賬率極低,支付寶顛覆的是銀聯之間的轉帳,支付寶轉帳不需要收費,銀聯提出了挑戰(zhàn),征信其實是把我們的信用卡體系顛覆了,余額寶最早的時候顛覆了銀行的借貸體系,這塊東西對金融行業(yè)是一個巨大的顛覆。我們聯盟里面有一家企業(yè)是聚信立,做個人征信的,數據來源有六個板塊,一個板塊運營商的數據,個人通信數據,還有一個就是我們的電商消費數據,還有網銀的消費數據,還有個人學歷數據,還有公積金和社保數據,最大的力量在于互聯網爬蟲技術,這就導致了現在是目前來說,個人征信,給P2P平臺和銀行的中小貸機構用的,所以提供數據,這樣的平臺日訪問量已經超過了十二萬,一個月大概流水能夠達到七八百萬,對于一個只有九十人左右的團隊來說已經非常優(yōu)秀了,現在可以實現自我營收了,他們目前最大的成本就是九十幾個人的用人成本,有三分之一是技術人員,專門做互聯網爬蟲的,還有一款各位感興趣,是企信寶。
車輛大數據,因為有了定位就有行車軌跡,應用場景在于特斯拉推出的幾款應用,可以自動召喚功能,我在這里現在可以啟動app,特斯拉在遙遠的地方無人自動駕駛開過來了,我看到這個消息以后,我一直很激動,小時候看動畫片佐羅,一吹口哨馬就過來了,現在實現了這種功能,把我們兒時的夢一個一個實現,而且在我們有生之年都看得到。
還有一個大的應用就是保險市場,這個市場非常大,而且我觀察下來,所有的垂直行業(yè)大數據應用,最終想要快速變現,都必須和金融對接,和保險對接是毫無疑問的,包括傳統(tǒng)是按年結算的,但是車輛大數據保險可以按日結算,如果今天出差,接下來不開車,車停在車庫里,不需要給保險公司付費,這個模式蠻好的,但是最大的問題就是每天的行車路徑要給保險公司上交,這個問題在于保險公司要有誠信意識,要有社會職業(yè)道德,不允許把我的數據用于其他用途。還有一個金融犯罪,現在我們有一些詐騙分子,現在水平很高,因為有大數據人才在里面,用一些看似非常平常的注冊,我們一注冊,可能用用戶名和密碼注冊,我們懶,我們都用一個用戶名和密碼,把用戶名和密碼調過去,就在電商網站去試,一萬個人當中只要有一個人試出來了,就監(jiān)控這個人,可能數據庫里面有幾十萬個人,試出來都是準的,然后監(jiān)控網民的帳戶如果沒有異常就不采取措施,當出現網銀有巨大金額轉帳的話,時機就來了,現在賬戶上出現了異動,第一時間就打個電話給你,哪個銀行最近剛剛轉帳一千萬,我們懷疑這和洗錢有關,我一開始不相信,如果說這個人本身內心當中也有虛的,一千萬有點問題,然后這個錢就麻煩了,就是博傻,從里面看時機,一年里面做一單,休息五年都沒問題了。
最后介紹一下上海大數據的主要做法和情況,大概五位一體,交易所、聯盟、基地、基金、研究員,目的已經做到了交易所,今年4月1號交易所在靜安成立,還有我們大數據聯盟同一天成立的,最近在楊浦又成立了大數據新基地,現在上海有兩個大數據基地,有一個交易所一個聯盟,還有幾支基金,靜安和楊浦都有政府的引導基金,今年下半年成立大數據研究院,現在上海通過SODA大賽,把政府數據拿出來給創(chuàng)業(yè)團隊用一用,今年發(fā)布了第二期SODA大賽的數據集,主題是城市安全,如果在座的同學有興趣參加這樣一次大賽,倒蠻有意義的,去年的大賽吸引了六百個團隊,將近五千個人參加,最近有十個團隊勝出,前三個團隊項目都被產投給跟進了,馬上就有風投進去了,今年可能比去年做的還要好,如果在座的感興趣的話可以參與一下。還有一個大賽是昨天剛剛發(fā)布的,大數據聯盟和市北高新共同打造的人工智能BOT,一等獎有兩位,獎金八十萬。大家感興趣可以做這方面的嘗試,決賽的時候由愛奇藝直播的,賽題昨天已經發(fā)布了,在圖像當中做人工識別,復賽是在行車記錄儀上有一組數據,怎么判斷交通數據,還有一個題目是超市里頭貨架上計算商品的有效性和哪些商品應該及時進行倉儲跟蹤和更換。如果大家參加的話,可以告訴我一下,這是我們聯盟的微信號,如果感興趣可以掃一下,謝謝大家!

|