蘋果公司在iPhone手機上應用的一項語音控制功能Siri就是多樣化數(shù)據(jù)處理的代表。用戶可以通過語音、文字輸入等方式與Siri對話交流,并調用手機自帶的各項應用,讀短信、詢問天氣、設置鬧鐘、安排日程,乃至搜尋餐廳、電影院等生活信息,收看相關評論,甚至直接訂位、訂票,Siri則會依據(jù)用戶默認的家庭地址或是所在位置判斷、過濾搜尋的結果。為了讓Siri足夠聰明,蘋果公司引入了谷歌、維基百科等外部數(shù)據(jù)源。在語音識別和語音合成方面,未來版本的Siri或許可以讓我們聽到中國各地的方言,比如四川話、湖南話和河南話。
多樣化的數(shù)據(jù)來源正是大數(shù)據(jù)的威力所在。例如,交通狀況與其他領域的數(shù)據(jù)都存在較強的關聯(lián)性。研究發(fā)現(xiàn),可以從供水系統(tǒng)數(shù)據(jù)中發(fā)現(xiàn)早晨洗澡的高峰時段,加上一個偏移量(通常是40~45分鐘)就能估算出交通早高峰時段;同樣可以從電網(wǎng)數(shù)據(jù)中統(tǒng)計出傍晚辦公樓集中關燈的時間,加上偏移量估算出晚上的堵車時段。
快速度
在數(shù)據(jù)處理速度方面,有一個著名的“1秒定律”,即要在秒級時間范圍內(nèi)給出分析結果,超出這個時間,數(shù)據(jù)就失去價值了。
例如,IBM有一則廣告,講的是“1秒,能做什么”?1秒,能檢測出臺灣的鐵道故障并發(fā)布預警;也能發(fā)現(xiàn)得克薩斯州的電力中斷,避免電網(wǎng)癱瘓;還能幫助一家全球性金融公司鎖定行業(yè)欺詐,保障客戶利益。
在商業(yè)領域,“快”也早已貫穿企業(yè)運營、管理和決策智能化的每一個環(huán)節(jié)。形形色色描述“快”的新興詞匯出現(xiàn)在商業(yè)數(shù)據(jù)語境里,例如實時、快如閃電、光速、念動的瞬間、價值送達時間。
英特爾中國研究院首席工程師吳甘沙認為,快速度是大數(shù)據(jù)處理技術和傳統(tǒng)的數(shù)據(jù)挖掘技術最大的區(qū)別。大數(shù)據(jù)是一種以實時數(shù)據(jù)處理、實時結果導向為特征的解決方案,它的“快”有兩個層面。一是數(shù)據(jù)產(chǎn)生得快。有的數(shù)據(jù)是爆發(fā)式產(chǎn)生,例如,歐洲核子研究中心的大型強子對撞機在工作狀態(tài)下每秒產(chǎn)生PB級的數(shù)據(jù);有的數(shù)據(jù)是涓涓細流式產(chǎn)生,但是由于用戶眾多,短時間內(nèi)產(chǎn)生的數(shù)據(jù)量依然非常龐大,例如,點擊流、日志、射頻識別數(shù)據(jù)、GPS(全球定位系統(tǒng))位置信息。二是數(shù)據(jù)處理得快。正如水處理系統(tǒng)可以從水庫調出水進行處理,也可以處理直接對涌進來的新水流。大數(shù)據(jù)也有批處理(“靜止數(shù)據(jù)”轉變?yōu)椤罢褂脭?shù)據(jù)”)和流處理(“動態(tài)數(shù)據(jù)”轉變?yōu)椤罢褂脭?shù)據(jù)”)兩種范式,以實現(xiàn)快速的數(shù)據(jù)處理。