未來數(shù)據(jù)到底有多重要?IBM(微博)新任CEO羅睿蘭(Ginni Rometty)的觀點讓人印象深刻 。她說,數(shù)據(jù)將是下一個大的自然資源,將會區(qū)分每個行業(yè)的勝者與輸家。
大數(shù)據(jù)走紅
關(guān)于什么是“大數(shù)據(jù)”,現(xiàn)在還沒有標準的定義。維基百科上有人對大數(shù)據(jù)作了如下描述:數(shù)據(jù)增長如此之快,以至于難以使用現(xiàn)有的數(shù)據(jù)庫管理工具來駕馭,困難存在于數(shù)據(jù)的獲取,存儲,搜索,共享,分析和可視化等方面。
“通俗地說,大數(shù)據(jù)其實是一種在互聯(lián)網(wǎng)時代或信息時代的企業(yè)現(xiàn)象?!敝袊浖W(wǎng)、海比研究總經(jīng)理曹開彬告訴新浪科技,在這樣的時代,任何一個企業(yè),尤其是大型企業(yè)和互聯(lián)網(wǎng)企業(yè),會在經(jīng)營過程中產(chǎn)生大量的、各種各樣的數(shù)據(jù)。它有幾個典型特征:數(shù)據(jù)量大、數(shù)據(jù)類型復(fù)雜、處理速度要快。
所謂數(shù)據(jù)量大,是指數(shù)據(jù)不再以幾個GB和幾個TB為單位來衡量,而是以PB(1000個T)、EB(一百萬個T)或ZB(10億個T)為計量單位;數(shù)量類型復(fù)雜,是因為它的來源復(fù)雜,從結(jié)構(gòu)化數(shù)據(jù)到非結(jié)構(gòu)化數(shù)據(jù);處理速度要快,則是指數(shù)據(jù)的分析和使用需要在極短的時間內(nèi)完成,甚至實時使用。
曹開彬說,這導(dǎo)致現(xiàn)有的數(shù)據(jù)倉庫和商業(yè)智能等數(shù)據(jù)處理和分析技術(shù)無法應(yīng)對這種情況,但是企業(yè)要對它進行快速處理與分析的需求又很大,因此,大數(shù)據(jù)才會變得這樣火。
資深I(lǐng)T人士謝文對于大數(shù)據(jù)有另外的看法。在他看來,大數(shù)據(jù)并不是新概念,而是在物理學(xué),生物學(xué)等科學(xué)領(lǐng)域早已存在的理論,只不過此前沒有有效的手段獲取大數(shù)據(jù)。
他認為,Web2.0時代,大數(shù)據(jù)應(yīng)該是以人為核心,以人的關(guān)系為基礎(chǔ)作信息生產(chǎn)、交換,從而產(chǎn)生的巨大信息爆炸。同時,大數(shù)據(jù)將產(chǎn)生比現(xiàn)在更有價值的商業(yè)模式,是不能用現(xiàn)有技術(shù)進行處理的。
背后價值
那么,大數(shù)據(jù)到底能給企業(yè)帶來什么價值呢?本質(zhì)上說,大數(shù)據(jù)本身沒有太多價值,基于大數(shù)據(jù)的處理和分析才能為企業(yè)帶來的巨大的增值價值。
曹開彬認為,大數(shù)據(jù)里面包含企業(yè)運營的各種信息,如果能對它們進行及時有效充分地整理和分析,才可以很好地、迅速地幫助企業(yè)進行業(yè)務(wù)決策,響應(yīng)客戶需求,提升競爭力。
兩個月前,剛剛以大數(shù)據(jù)概念在納斯達克(微博)上市的美國公司Splunk可以讓我們很容易的理解這一點。
Splunk提供一款可運行于各種平臺的IT數(shù)據(jù)、日志分析軟件,可以讓IT運維人員以類似谷歌搜索關(guān)鍵詞的方式,快速搜索并查看任何IT設(shè)備運行過程中產(chǎn)生的信息。
一個簡單的場景是,當IT設(shè)備出現(xiàn)異常時,IT運維人員只需要搜索關(guān)鍵詞“Error”,系統(tǒng)便會列出包含“Error”的機器運行日志,并以非常好的圖形化方式展現(xiàn)出來。IT運維人員可以據(jù)此判斷出是異常出現(xiàn)的具體時間,具體設(shè)備,并分析故障原因。
顯然,與以前憑借經(jīng)驗進行故障判斷相比,數(shù)據(jù)分析提供了更精準的信息,而這便是大數(shù)據(jù)的魅力所在。那么,企業(yè)該如何抓住大數(shù)據(jù)帶來的機遇呢?
Teradata大中華區(qū)首席執(zhí)行官辛兒倫對新浪科技表示,隨著大數(shù)據(jù)時代的到來,企業(yè)應(yīng)該在內(nèi)部培養(yǎng)三種能力。第一,整合企業(yè)數(shù)據(jù)的能力;第二,探索數(shù)據(jù)背后價值和制定精確行動綱領(lǐng)的能力;第三,進行精確快速實時行動的能力。
“如果企業(yè)在信息治理上培養(yǎng)出這三種能力,對未來大數(shù)據(jù)時代的駕馭能力會增強,對面臨到的挑戰(zhàn)會降到最低。”辛兒倫表示。
廠商布局
辛兒倫所在的Teradata公司是一家智能分析解決方案廠商,主要為企業(yè)和政府機構(gòu)做數(shù)據(jù)整合,分析,探索、挖掘數(shù)據(jù)背后的價值。最近兩年,Teradata通過收購將業(yè)務(wù)從結(jié)構(gòu)化數(shù)據(jù)延伸到非結(jié)構(gòu)化、大數(shù)據(jù)領(lǐng)域。
2011年,Teradata先后收購了云計算軟件公司Aprimo及高級分析和管理各種非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域的Aster Data公司。今年5月8日,Aprimo收購了基于云的數(shù)字營銷歐洲領(lǐng)導(dǎo)廠商eCircle,進一步加強并拓展了Teradata大數(shù)據(jù)市場的業(yè)務(wù)。
與Teradata一樣看好的大數(shù)據(jù)的還有IBM、甲骨文、惠普(微博)、EMC、微軟等傳統(tǒng)IT廠商,他們也在通過自主研發(fā)或者收購的方式進入大數(shù)據(jù)領(lǐng)域。
IBM在過去五年里,已經(jīng)斥資超過140億美元進行了20多筆與數(shù)據(jù)分析相關(guān)的收購交易。甲骨文這家以結(jié)構(gòu)化數(shù)據(jù)庫起家的IT公司,推出了大數(shù)據(jù)機及智能分析解決方案。
去年8月,惠普以100億美元收購英國軟件公司Autonomy,其實也是為了擴大商業(yè)分析軟件的市場份額。Autonomy通過獨有的算法可以提取出非結(jié)構(gòu)化信息中的含義。
在美國硅谷,Splunk只是大數(shù)據(jù)領(lǐng)域的一家企業(yè)而已,仍有多家創(chuàng)業(yè)公司已經(jīng)聚焦在大數(shù)據(jù)領(lǐng)域,并且獲得風(fēng)險投資的注資。
電子發(fā)燒友App


























































評論