大知識
大數(shù)據(jù)能為人類帶來大知識,即通過對海量數(shù)據(jù)進(jìn)行分析,以一種前所未有的方式獲得深刻洞見。例如,2009年甲型H1N1流感爆發(fā)時,與習(xí)慣性滯后的官方數(shù)據(jù)相比,谷歌成為一個更有效、更及時的指示標(biāo)。他們通過分析5 000萬條美國人最頻繁檢索的詞條,例如“哪些是治療咳嗽和發(fā)熱的藥物”,建立了4.5億個數(shù)學(xué)模型,并與美國疾控中心在2003~2008年季節(jié)性流感傳播時期的數(shù)據(jù)進(jìn)行比較,提前兩周預(yù)測出流感的爆發(fā)時間和傳播路徑。這種工作方式不需要分發(fā)口腔試紙和聯(lián)系醫(yī)院,它是建立在大數(shù)據(jù)的基礎(chǔ)之上的。基于這樣的技術(shù)理念和數(shù)據(jù)儲備,下一次流感來襲時,世界將擁有一種更好的預(yù)測工具預(yù)防流感的傳播。
人們通過大數(shù)據(jù)獲得的知識更快速、更準(zhǔn)確、更便捷,而這些在傳統(tǒng)的數(shù)據(jù)利用思維和技術(shù)的基礎(chǔ)上是難以完成的。例如,個人收入對于銀行放貸、社會保障等機構(gòu)而言是一項關(guān)鍵數(shù)據(jù)。然而,收入又是一個比較敏感的話題,要調(diào)查個人收入,不僅過程煩瑣、成本較高,而且還存在瞞報的可能。著名征信機構(gòu)益百利有一項服務(wù),即通過分析信用卡歷史記錄和美國國稅局的匿名稅收數(shù)據(jù),對個人的收入狀況進(jìn)行較為精準(zhǔn)的預(yù)測,其預(yù)測結(jié)果售價不足1美元,而通過傳統(tǒng)的辦法證明一個人的收入狀況要花費10美元左右。
大數(shù)據(jù)使得組織決策將越來越依賴于數(shù)據(jù)和分析,而非經(jīng)驗和直覺。邁克爾·劉易斯于2003年出版的《點球成金》中講述了棒球統(tǒng)計學(xué)的一個真實案例。該書的主角比利·比恩是一家棒球隊的總經(jīng)理,他在一位統(tǒng)計學(xué)家的幫助下,盡可能地將球員能力數(shù)據(jù)化,并以此作為衡量球員能力的唯一標(biāo)準(zhǔn),而非基于主觀經(jīng)驗的判斷。通過這套計算機程序和數(shù)學(xué)模型,比利以有限的預(yù)算尋找那些被價值低估的球員,實現(xiàn)了最高的“投入產(chǎn)出比”,創(chuàng)下了美國職業(yè)棒球大聯(lián)盟百年歷史上的連勝20場的空前紀(jì)錄。與那位統(tǒng)計學(xué)家相比,專業(yè)棒球星探們在挑選球員方面的精準(zhǔn)程度相形見絀。
大價值
我們的日常生活會因為無處不在的大數(shù)據(jù)應(yīng)用更加智能便捷。搜索引擎可以為關(guān)聯(lián)網(wǎng)站排序;智能輸入法能為用戶創(chuàng)建個性化詞典;豆瓣網(wǎng)為我們推薦想要看的電影和圖書;微信自動推送好友信息,幫助我們建立朋友圈;電子郵箱自動過濾含有某些關(guān)鍵詞的垃圾郵件;相親網(wǎng)站通過計算用戶的性格、教育背景、職業(yè)等匹配程度,提高男女配對成功的概率。