“大(da)數據”似乎在一夜之間闖(chuang)入了(le)任何一個(ge)關于互聯網未來的(de)討論(lun),成(cheng)為一個(ge)炙手可熱無所不包的(de)概念。但(dan)它是(shi)否(fou)真如許(xu)多IT行家們(men)所言(yan),將成(cheng)為信息技術(shu)領(ling)域又(you)一片蘊藏無限(xian)潛能的(de)處女地?還是(shi)只是(shi)軟硬件巨頭們(men)為了(le)賣出更多產品而吹出的(de)一個(ge)美麗泡沫?
正在大連舉行的2013夏季達(da)沃斯開辟專(zhuan)場(chang),以(yi)“大數據概念是否(fou)被過度炒作”為題,請四位(wei)嘉(jia)賓分(fen)成正反兩方,展開一場(chang)激辯(bian)。穿梭(suo)于(yu)各場(chang)彬彬有(you)禮的“清(qing)談會(hui)”之間(jian)的聽者(zhe)們,步入這場(chang)辯(bian)論時,無不感(gan)到意外之喜,目(mu)擊到一場(chang)有(you)趣又(you)有(you)料的意見交鋒。
持正(zheng)方(fang)觀點(dian),即“大數據已被過度炒作”觀點(dian)的,出人意料地,是四位(wei)(wei)嘉賓中(zhong)更年輕、更接(jie)近“技(ji)(ji)術(shu)宅男”的兩(liang)位(wei)(wei),其中(zhong)一(yi)位(wei)(wei)是美(mei)國(guo)Kaggle公司(si)總裁兼首席科(ke)學(xue)家JeremyHoward,另一(yi)位(wei)(wei)是加納MPedigree網絡(luo)公司(si)總裁Bright Simons。持反(fan)方(fang)觀點(dian),為大技(ji)(ji)術(shu)時(shi)代的到來歡呼的,一(yi)位(wei)(wei)是北京大學(xue)光華管(guan)理(li)學(xue)院新媒體營銷研(yan)究中(zhong)心副主任蘇萌,另一(yi)位(wei)(wei)是日本政治(zhi)家、內閣成員山本一(yi)太。
在辯論之前,主持(chi)人先(xian)作了一次現場(chang)調查,同意(yi)“大數據是過度炒作”的(de)聽(ting)眾(zhong)稍占上風(feng),占比54.5%。聽(ting)眾(zhong)被告(gao)知,在辯論結束(shu)后還會再來一輪投票,四位(wei)嘉賓的(de)任務就是盡可能留住支(zhi)持(chi)者,讓(rang)對方(fang)陣營倒(dao)戈。
辯論(lun)開始(shi),正方嘉(jia)賓、科學家(jia)Howard起身走近(jin)聽(ting)眾席,一句話亮明觀(guan)點(dian):數(shu)據(ju)不在多,而在怎(zen)么用(yong)。他提(ti)出“一臺電腦論(lun)”,即科學家(jia)們研(yan)究(jiu)所需的數(shu)據(ju),最好用(yong)一臺電腦就能(neng)裝下,否則數(shu)據(ju)處理會過于(yu)繁(fan)瑣,無助于(yu)解決問題。他結合自身經驗說,隨(sui)著數(shu)據(ju)量的增大(da),研(yan)究(jiu)的準確性一開始(shi)會隨(sui)之上升(sheng),但很快就會趨平。
“舉個例(li)子(zi),如(ru)果(guo)我們(men)把(ba)所有《星球大戰(zhan)》鐵桿(gan)粉絲(si)的(de)數據拿來研(yan)究,就一定能準確地判(pan)斷出他們(men)中誰會喜(xi)歡(huan)《魔戒》嗎?我們(men)發(fa)現并非如(ru)此。”
反方嘉賓、北大(da)(da)的(de)蘇萌(meng)教授起身應戰(zhan)。他請大(da)(da)家原諒,“為了更流(liu)暢地表達觀點,我還是(shi)用中文”,引來(lai)聽眾理解的(de)笑聲。他說(shuo),大(da)(da)數據(ju)剛(gang)剛(gang)露出冰山一(yi)(yi)角,在金融、零(ling)售等領域的(de)運用上,還遠(yuan)未(wei)釋放它的(de)潛能(neng)。這(zhe)有三個原因(yin):一(yi)(yi)是(shi)因(yin)為不同機構間的(de)數據(ju)還未(wei)真(zhen)正(zheng)流(liu)動起來(lai),目前還只(zhi)是(shi)數據(ju)“孤島(dao)”;二是(shi)完(wan)整的(de)生態產業鏈還未(wei)形成(cheng),盡管通過行為數據(ju)分析已能(neng)夠分辨出一(yi)(yi)個消費者的(de)喜好(hao),但從供應到(dao)購買的(de)鏈條(tiao)還沒建成(cheng);三是(shi)因(yin)為數據(ju)分析人才仍(reng)然極度(du)匱(kui)乏。
他(ta)說,15年前,很多人(ren)認為互(hu)聯(lian)網是泡(pao)沫(mo),今天(tian)證(zheng)明互(hu)聯(lian)網沒被高(gao)估,5年前,很多人(ren)認為電子商務是泡(pao)沫(mo),但今天(tian)中國已經有3億人(ren)的(de)電商市場,我們還有什(shen)么理由(you)說大數據(ju)只是泡(pao)沫(mo)呢?聽眾席上點頭頻頻,現實顯然(ran)頗具說服力(li)。
正方(fang)嘉賓,來(lai)自非洲加納的(de)Simons急于扳回(hui)局面,拋出(chu)一(yi)個引人思(si)索(suo)的(de)問(wen)(wen)題:“請(qing)問(wen)(wen),我們現在(zai)真的(de)有什么問(wen)(wen)題,是(shi)靠大(da)數據(ju)才能解決(jue),而(er)靠現在(zai)技術(shu)解決(jue)不了的(de)?”
他(ta)(ta)(ta)(ta)說,大數據不僅(jin)分散了人們的注意(yi)力,甚至是(shi)“危險(xian)”的,因(yin)為(wei)(wei)海量(liang)數據意(yi)味著決(jue)策制定將更加“集權化”,而科學本身是(shi)應當(dang)以(yi)人為(wei)(wei)本,強調(diao)自主性的。他(ta)(ta)(ta)(ta)以(yi)多年前他(ta)(ta)(ta)(ta)在一(yi)家英國銀行開(kai)戶(hu)的經(jing)歷作為(wei)(wei)例(li)子:一(yi)開(kai)始他(ta)(ta)(ta)(ta)與銀行客戶(hu)經(jing)理(li)面對面聊天,對方認為(wei)(wei)他(ta)(ta)(ta)(ta)完全符合(he)開(kai)戶(hu)條(tiao)件,可當(dang)把他(ta)(ta)(ta)(ta)的所(suo)有信息輸入電(dian)腦(nao)之后,電(dian)腦(nao)卻拒絕了他(ta)(ta)(ta)(ta)的開(kai)戶(hu)申(shen)請,而他(ta)(ta)(ta)(ta)至今不知道自己為(wei)(wei)什么(me)被拒。
“大數(shu)據意(yi)味著人們將不再(zai)運用自己的智慧、問(wen)(wen)真正該問(wen)(wen)的問(wen)(wen)題,”Simons說(shuo)。“最后我想說(shuo),小(xiao)才是美。”
聽(ting)眾們顯(xian)然(ran)有所觸(chu)動,天平似乎又重新傾(qing)斜。
最后出場的是反方辯手、日(ri)本內閣大(da)臣山本一太。曾是搖滾音(yin)樂人的他(ta)十(shi)分(fen)懂得調動氣氛,鄭重宣(xuan)稱,由于強(qiang)敵當前(qian),所以也決定臨時變更計劃,改用(yong)日(ri)語(yu),再度引(yin)來笑聲。他(ta)為(wei)支(zhi)持(chi)大(da)數據(ju)拿(na)出的“殺手锏”是——東京申奧(ao)成功的“奧(ao)秘”。他(ta)說(shuo),日(ri)本民(min)眾(zhong)最初對申辦奧(ao)運的支(zhi)持(chi)率只有不(bu)到(dao)60%,但日(ri)本政府成功利用(yong)社交(jiao)媒體(ti)和數據(ju)分(fen)析,向公(gong)眾(zhong)傳遞支(zhi)持(chi)申奧(ao)的訊息,最終將支(zhi)持(chi)率提升(sheng)到(dao)80%以上(shang)。另外(wai),在自然災(zai)害(hai)頻(pin)發(fa)(fa)的日(ri)本,大(da)數據(ju)也早已在防災(zai)減災(zai)上(shang)發(fa)(fa)揮作用(yong)。
兩輪交(jiao)鋒下來,賽(sai)程過半,雙方(fang)似(si)乎勢(shi)均力(li)敵。主(zhu)持人接(jie)著請聽眾來挑戰雙方(fang)辯手。
一位聽眾挑戰正方,說,你們認為大數(shu)據(ju)過于(yu)龐雜紛繁,反(fan)而解決(jue)不了問題,那是不是說,當處理(li)數(shu)據(ju)的計算工具變(bian)得(de)(de)足夠(gou)好時,大數(shu)據(ju)就會變(bian)得(de)(de)有用?
![](/res/201606/15/20160615_1615599_11-1_797430_140493_0.jpg)
一位插畫師在辯論現場所作,用圖文方式概括了正反兩方觀點
科(ke)學(xue)家(jia)Howard重復了“一臺電腦論(lun)(lun)”,強調(diao)數據不是越多(duo)越好(hao),而是恰到好(hao)處才好(hao),但似(si)乎(hu)沒能拿出更有說服力的論(lun)(lun)據。
一位聽眾(zhong)挑戰反方(fang),問:眼下的大數據熱,是由真實的需求驅動的嗎(ma)?還(huan)是IT企業的噱頭?決策(ce)制定真的要靠(kao)大數據嗎(ma)?
蘇萌教授(shou)一語中的(雖然似乎有些偷換概念):“不靠數據(ju),難道靠直覺嗎?”
一位(wei)聽眾再次挑(tiao)戰反方:幾(ji)年前愛沙尼(ni)亞遭(zao)到黑客攻(gong)擊,由于(yu)該國政府部門(men)和(he)私營部門(men)的數據(ju)集中存放,網絡(luo)攻(gong)擊導(dao)致該國幾(ji)乎全面癱(tan)瘓,這個事件(jian)是不(bu)是說明,大(da)數據(ju)會(hui)讓網絡(luo)安全變得更加脆弱?
山本回答:的確如此,但各國都已(yi)高度(du)重視(shi)網絡安全,技術進步也會讓這個問題(ti)找到(dao)答案。
蘇萌最后總結道:所有新(xin)鮮事物都(dou)需要一(yi)定的泡(pao)沫,才能(neng)吸引到更多的投資和關注,最終才能(neng)讓(rang)真正好(hao)的東西沉淀下來。
辯論(lun)結束,主持(chi)人再度請現場(chang)聽眾(zhong)投票,反方成功(gong)逆轉,支(zhi)持(chi)率上升(sheng)到(dao)57.1%。蘇萌與山本興奮(fen)地擊掌歡呼。
這場短短的(de)(de)(de)(de)交鋒,顯(xian)然只(zhi)是(shi)大(da)(da)(da)數據之爭的(de)(de)(de)(de)一個微小縮影,也無(wu)法給(gei)出是(shi)或非的(de)(de)(de)(de)答(da)案,但足以激發聽眾的(de)(de)(de)(de)思考。正如(ru)Howard在發表“失敗感言”時(shi)所說,“我們并非反(fan)(fan)對數據,只(zhi)是(shi)反(fan)(fan)對大(da)(da)(da)而(er)無(wu)當的(de)(de)(de)(de)數據,數據本身(shen)當然非常重要”。人類已(yi)(yi)經(jing)并將繼續產生(sheng)日益龐大(da)(da)(da)的(de)(de)(de)(de)數據,或許不(bu)論我們接受(shou)與否,大(da)(da)(da)數據時(shi)代都(dou)已(yi)(yi)到來。如(ru)何利用(yong)它造福人類,才是(shi)最為(wei)關鍵的(de)(de)(de)(de)問題。