正文

【新版自序】數(shù)據(jù)可以治國(guó),還可以強(qiáng)國(guó)

大數(shù)據(jù)(3.0升級(jí)版 精裝) 作者:涂子沛


今年春節(jié)期間,出版社告訴我,作為中國(guó)大數(shù)據(jù)領(lǐng)域的開(kāi)山之作,《大數(shù)據(jù)》很受歡迎,他們希望滿足市場(chǎng)的需求,推出第三個(gè)版本,囑咐我寫(xiě)點(diǎn)東西。

之所以受到歡迎,可能是因?yàn)楠?dú)樹(shù)一幟。一提到大數(shù)據(jù),很多人的第一反應(yīng),是數(shù)據(jù)在商業(yè)領(lǐng)域中的作用,所津津樂(lè)道的,也是精準(zhǔn)營(yíng)銷(xiāo),即通過(guò)數(shù)據(jù)分析增強(qiáng)對(duì)用戶的洞察、擴(kuò)大營(yíng)銷(xiāo)收入。但本書(shū)所強(qiáng)調(diào)的,卻是“數(shù)據(jù)不僅可以治國(guó),還可以強(qiáng)國(guó)”。

數(shù)據(jù)治國(guó),是指要憑借對(duì)數(shù)據(jù)的有效收集、處理和分析來(lái)治理國(guó)家,決定國(guó)家的大政方針和具體政策。

從定義看,數(shù)據(jù)是對(duì)客觀世界進(jìn)行量化和記錄的結(jié)果。量化,是人類(lèi)進(jìn)行科學(xué)研究最根本的手段,就此而言,數(shù)據(jù)治國(guó)也可以理解為“用定量分析、實(shí)證研究的科學(xué)方法來(lái)治理國(guó)家”。此外,數(shù)據(jù)表示的是過(guò)去,關(guān)注、表達(dá)的卻是未來(lái)。數(shù)據(jù)之中蘊(yùn)藏著社會(huì)發(fā)展的規(guī)律,“數(shù)據(jù)治國(guó)”的提法,也暗含著“人類(lèi)可以更好地把握未來(lái)”之意。

回顧人類(lèi)的歷史,任何一個(gè)國(guó)家的治理,都需要參照數(shù)據(jù),但由于信息技術(shù)的進(jìn)步、記錄手段的普及,物理世界的狀態(tài)、個(gè)人的社會(huì)行為得到了前所未有的記錄,這種記錄的粒度越來(lái)越細(xì)、維度越來(lái)越多、頻度越來(lái)越密,形成了“大數(shù)據(jù)”。今天的數(shù)據(jù)治國(guó),含義遠(yuǎn)遠(yuǎn)超出了“參照數(shù)據(jù)”。

例如,當(dāng)前國(guó)人關(guān)心的頭號(hào)問(wèn)題,莫過(guò)于空氣質(zhì)量。要解決好這個(gè)問(wèn)題,從環(huán)境的監(jiān)測(cè)、傳感器的安裝,到空氣標(biāo)準(zhǔn)的設(shè)立、污染原因的分析,再到高污染、高能耗、低產(chǎn)值傳統(tǒng)產(chǎn)業(yè)的轉(zhuǎn)型,和智能電網(wǎng)、智能電表的使用和普及,整個(gè)治理鏈條都貫穿了數(shù)據(jù)。又例如交通擁堵,如今很多城市,立交橋高達(dá)三四層、地鐵線也在快速擴(kuò)張,卻趕不上車(chē)輛增加的速度,在資源增長(zhǎng)、空間有限的情況下,唯一的出路,是用好大數(shù)據(jù),對(duì)城市的狀態(tài)進(jìn)行實(shí)時(shí)的分析和預(yù)測(cè),不斷優(yōu)化現(xiàn)有資源的使用情況。還有當(dāng)下智慧城市的建設(shè),大數(shù)據(jù)的作用可謂重中之重。

今天的政府,無(wú)論是東方、西方,都有人在不斷嘗試,試圖把“憑借數(shù)據(jù)來(lái)治理社會(huì)”的模式推到極致。本書(shū)第七章“全國(guó)隱私風(fēng)波”重點(diǎn)闡述了十幾年前美國(guó)各方力量圍繞“萬(wàn)維信息觸角計(jì)劃”(TIA)產(chǎn)生的糾結(jié)和較量。2002年,在國(guó)防部長(zhǎng)拉姆斯菲爾德、海軍中將波因德克斯特的主導(dǎo)下,美國(guó)國(guó)防部高級(jí)項(xiàng)目研究所(DARPA)試圖建立一個(gè)超級(jí)數(shù)據(jù)庫(kù),把全社會(huì)每一個(gè)人的基本資料、信用卡交易信息、醫(yī)療保險(xiǎn)記錄、出入境記錄、航空和酒店信息、電子郵件、電話記錄、網(wǎng)絡(luò)搜索記錄等等數(shù)據(jù)都整合到一起,然后通過(guò)數(shù)據(jù)挖掘和監(jiān)控,在大量的信息當(dāng)中發(fā)現(xiàn)“信號(hào)”,實(shí)現(xiàn)有效的社會(huì)治理和管控。這個(gè)計(jì)劃,因?yàn)榭赡芮址腹竦碾[私,在美國(guó)國(guó)會(huì)不斷受阻,但美國(guó)國(guó)防部卻屢次變換名目、暗中推動(dòng)項(xiàng)目進(jìn)展。這段歷史,堪稱(chēng)2013年“斯諾登事件”的前傳,因?yàn)楹髞?lái)大面積曝光,最終震驚世界。

西方不亮東方亮。這期間,新加坡的國(guó)防部長(zhǎng)Peter Ho在美國(guó)訪問(wèn),他獲知萬(wàn)維信息觸角計(jì)劃之后,大為贊賞。不久后,該計(jì)劃在美國(guó)觸礁流產(chǎn),波因德克斯特被迫辭職,新加坡卻重金引進(jìn)了這個(gè)項(xiàng)目組的一批人員,并聘波因德克斯特為國(guó)防部顧問(wèn),視為上賓。在波因德克斯特的指導(dǎo)下,新加坡快速建立了一套萬(wàn)維信息觸角,命名為“風(fēng)險(xiǎn)評(píng)估和全景掃描”(RAHS)。

RAHS最初的目的,是通過(guò)全社會(huì)的數(shù)據(jù)聯(lián)通和挖掘,在錯(cuò)綜復(fù)雜的社會(huì)現(xiàn)象中發(fā)現(xiàn)恐怖襲擊、流行病疫情等突發(fā)事件的“信號(hào)”,達(dá)到未雨綢繆、有效治理的目的。之后,由于行之有效,新加坡政府將系統(tǒng)不斷擴(kuò)大,推廣到經(jīng)濟(jì)、文化、社會(huì)管理的種種領(lǐng)域。房屋管理局用它來(lái)了解人們對(duì)于住房體系的批評(píng)和期待,人口部門(mén)通過(guò)它掌握大眾的生育態(tài)度變化,旅游部門(mén)用它來(lái)預(yù)測(cè)各地游客數(shù)量的周期,食品部門(mén)通過(guò)它決策是否應(yīng)該減少對(duì)進(jìn)口食品的依賴等等。從這個(gè)角度說(shuō),新加坡是數(shù)據(jù)治國(guó)的一個(gè)實(shí)驗(yàn)室,它不僅將大數(shù)據(jù)用于情報(bào)和反恐,還用于構(gòu)建和諧社會(huì)。

在中國(guó),特別要強(qiáng)調(diào)的是,數(shù)據(jù)治國(guó)不是“數(shù)字治國(guó)”。一些官員一談起轄區(qū)人口面積、GDP增長(zhǎng)幅度、項(xiàng)目投資多少、惠及領(lǐng)域若干、利稅增加幾何都有“數(shù)”在胸,還特別喜歡用“三項(xiàng)原則”、“五個(gè)重點(diǎn)”、“八項(xiàng)規(guī)定”等等數(shù)字范式對(duì)工作進(jìn)行總結(jié),各項(xiàng)工作的考核也都與數(shù)據(jù)掛鉤,大有唯“數(shù)據(jù)”盛行之勢(shì)。這不是不好,但這些都是孤立的、靜態(tài)的數(shù)字,并不是“數(shù)據(jù)治國(guó)”的真義。大數(shù)據(jù)時(shí)代,數(shù)據(jù)治國(guó)更關(guān)注的是動(dòng)態(tài)的數(shù)據(jù)、系統(tǒng)化的數(shù)據(jù),以不間斷“流”的形式存在的、成片的、活的數(shù)據(jù),它們應(yīng)該成為公共決策的資源為政府和社會(huì)所廣泛使用。歸根結(jié)底,公共決策最重要的依據(jù)將是系統(tǒng)的、成片的、動(dòng)態(tài)的數(shù)據(jù)流,而不是個(gè)人經(jīng)驗(yàn)或長(zhǎng)官意志,過(guò)去深入群眾、實(shí)地考察的工作方法雖仍然有效,但對(duì)社會(huì)治理而言,系統(tǒng)采集的數(shù)據(jù)、科學(xué)分析的結(jié)果更為重要。

我認(rèn)為,數(shù)據(jù)不僅可以治國(guó),還可以強(qiáng)國(guó)。其中的原因,是因?yàn)閿?shù)據(jù)正在成為各行各業(yè)最重要的創(chuàng)新資源。

以農(nóng)業(yè)為例,來(lái)自天氣、土壤和農(nóng)作物的數(shù)據(jù),可以實(shí)現(xiàn)自動(dòng)化的灌溉、防治蟲(chóng)災(zāi)、決定如何種植和收割、節(jié)省水利資源、提高單位產(chǎn)量;在教育領(lǐng)域,以大數(shù)據(jù)為基礎(chǔ)的在線智能學(xué)習(xí)平臺(tái)(MOOC),可以突破教室的限制,讓成千上萬(wàn)的學(xué)生同時(shí)得到個(gè)性化的教學(xué)和輔導(dǎo);再以醫(yī)療領(lǐng)域?yàn)槔?,IBM公司的Watson系統(tǒng)可以快速地檢索幾百萬(wàn)名患者的病例、最新的醫(yī)療研究報(bào)告和成果,做出更快、更準(zhǔn)確的診斷;工業(yè)領(lǐng)域更不待言,汽車(chē)、飛機(jī)正在被大數(shù)據(jù)改造,成為無(wú)人駕駛汽車(chē)、無(wú)人駕駛飛機(jī);還有金融領(lǐng)域,利用電商平臺(tái)的交易數(shù)據(jù),“阿里小貸”可以在幾分鐘之內(nèi)判斷企業(yè)的信用,為近百萬(wàn)小微企業(yè)發(fā)放貸款。今年年初,阿里巴巴又推出了基于個(gè)體消費(fèi)者的“芝麻信用”,用的創(chuàng)新資源還是數(shù)據(jù)。一百年前的美國(guó),用了幾十年的時(shí)間才建立全民信用體系。因?yàn)閾碛袩o(wú)處不在的充沛數(shù)據(jù),今天中國(guó)的全民信用體系可能在更短的時(shí)間內(nèi)、以更低的成本就可以建立起來(lái)。

毫不夸張地說(shuō),基于數(shù)據(jù)的創(chuàng)新將帶動(dòng)人類(lèi)社會(huì)的各個(gè)領(lǐng)域都實(shí)現(xiàn)巨大的飛躍,這種飛躍是前人難以想象的。今天的年輕人面臨的創(chuàng)新機(jī)會(huì)要遠(yuǎn)遠(yuǎn)多于前幾代人,因?yàn)樗麄儞碛腥祟?lèi)有史以來(lái)最偉大的創(chuàng)新資源:數(shù)據(jù)。

和其他的創(chuàng)新資源相比,數(shù)據(jù)之所以偉大,是因?yàn)樗粫?huì)被它所激發(fā)的思想和創(chuàng)新所消耗,它可以重復(fù)使用,可以同時(shí)被無(wú)數(shù)人使用,此數(shù)據(jù)和彼數(shù)據(jù)整合,還可以產(chǎn)生新的價(jià)值和效用。在空間的拓展中和時(shí)間的延伸中,數(shù)據(jù)的能量將在人類(lèi)社會(huì)層層放大,數(shù)據(jù)的不斷積累是資源和知識(shí)的持續(xù)增加。

但要成就數(shù)據(jù)的“偉大”,還有個(gè)前提,這就是數(shù)據(jù)的開(kāi)放。正是出于這個(gè)原因,本書(shū)用了相當(dāng)?shù)钠鶃?lái)討論“開(kāi)放數(shù)據(jù)”。

對(duì)于“開(kāi)放數(shù)據(jù)”,中國(guó)社會(huì)目前還存在不少誤解。一是將開(kāi)放等同于公開(kāi),其實(shí)開(kāi)放和公開(kāi)是兩個(gè)完全不同的概念。公開(kāi)是信息層面的,是一條一條的;開(kāi)放是數(shù)據(jù)庫(kù)資源層面的,是一片一片的。開(kāi)放數(shù)據(jù),指的是將原始的數(shù)據(jù)及其相關(guān)的元數(shù)據(jù)以可以下載的電子格式讓第三方自由使用。開(kāi)放也不一定代表免費(fèi),因?yàn)殚_(kāi)放是有成本的,企業(yè)可以以收費(fèi)的形式開(kāi)放數(shù)據(jù)。開(kāi)放也可以有層次、有范圍,針對(duì)某個(gè)特定的組織和群體開(kāi)放,不一定面對(duì)全體社會(huì)大眾。

開(kāi)放數(shù)據(jù)之于當(dāng)下中國(guó)社會(huì)的意義,在于推動(dòng)知識(shí)經(jīng)濟(jì)和網(wǎng)絡(luò)經(jīng)濟(jì)的發(fā)展,在于促進(jìn)中國(guó)經(jīng)濟(jì)由粗放向精細(xì)、從“制造”向“創(chuàng)造”的轉(zhuǎn)型升級(jí),在于釋放社會(huì)生產(chǎn)力、催生創(chuàng)新。通過(guò)開(kāi)放更多的數(shù)據(jù),讓創(chuàng)新的資源自由地流動(dòng),李克強(qiáng)總理提出的“大眾創(chuàng)業(yè),萬(wàn)眾創(chuàng)新”才能更快、更好地在中國(guó)大地形成燎原之勢(shì)。

大眾創(chuàng)新、創(chuàng)業(yè)的趨勢(shì),也可以在美國(guó)社會(huì)的發(fā)展過(guò)程中觀察到。根據(jù)美國(guó)科學(xué)基金會(huì)(NSF)的數(shù)據(jù),1981年,大公司(超過(guò)25000人)的研發(fā)投入占全美研發(fā)投入的70%,可謂主導(dǎo)了美國(guó)的創(chuàng)新;到2007年,大公司的研發(fā)投入仍然在上升,但格局卻發(fā)生了改變,盡管絕對(duì)數(shù)量增長(zhǎng)了4倍,其占全美研發(fā)投入的比例卻下降到35%。同期,1000人以下小公司的研發(fā)投入增長(zhǎng)了50倍,其占全美的比例從1981年的4%上升到2007年的24%。這些數(shù)據(jù)表明,研發(fā)和創(chuàng)新呈現(xiàn)分散化,在向小公司和個(gè)人轉(zhuǎn)移,其中最根本的原因,就是知識(shí)、信息特別是數(shù)據(jù)資源的深度開(kāi)放,不再受大公司、大組織的壟斷,不再是精英階層的專(zhuān)利。

文化靠沉淀,文明靠創(chuàng)新。創(chuàng)新,才是一個(gè)國(guó)家持續(xù)發(fā)展、不斷邁向強(qiáng)大的真正動(dòng)力。今天的中國(guó),創(chuàng)新已經(jīng)成為共識(shí)。就此而言,數(shù)據(jù)強(qiáng)國(guó)我們正在路上。

記得《大數(shù)據(jù)》首版上市,是2012年7月。當(dāng)時(shí)我在美國(guó),半年多之后,美國(guó)才出版了第一本有影響力的專(zhuān)著《大數(shù)據(jù)時(shí)代》,比中國(guó)晚了整整半年。撫今追昔,我感嘆不已,新的思想和觀念在全球自由地流動(dòng),在奔涌的浪潮之中,我也從美國(guó)硅谷回到了中國(guó)的杭州。

除了增補(bǔ)自序、重要的專(zhuān)欄文章以及我在第一屆世界互聯(lián)網(wǎng)大會(huì)上的演講等,本版還增加了索引。一本好書(shū)不能沒(méi)有索引,這是我一直的觀點(diǎn)。幾經(jīng)曲折,《大數(shù)據(jù)》第三版終于加上了索引,除了出版社的支持,還要感謝馮啟娜、趙瀚林、陳競(jìng)芬等志愿者,因?yàn)樗麄兊膮f(xié)助,這個(gè)心愿得以達(dá)成。

涂子沛

2015年3月22日于杭州


上一章目錄下一章

Copyright ? 讀書(shū)網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)