人工智能時代,數(shù)據(jù)是關(guān)鍵。但是,擁有大量數(shù)據(jù)的公司會在人工智能時代變得更加強大嗎?近日,A16Z合伙人Benedict Evans近日在其博客上發(fā)表了一篇文章,對這個問題進行了回答。他認為,普遍情況下,人工智能只會讓大公司更適合成為大公司。人工智能是否具備贏家通吃效應(yīng),還要看情況。原題為“Does AI make strong tech companies stronger?”希望能夠為你帶來啟發(fā)。
機器學習,可能是當今所有的技術(shù)中最重要的。
由于機器學習的基礎(chǔ)是數(shù)據(jù)——大量的數(shù)據(jù)——所以人們經(jīng)常聽到這樣的說法,即已經(jīng)擁有大量數(shù)據(jù)的公司會變得更加強大。
這有一定道理,但只是在小范圍內(nèi)可以這樣說。與此同時,我們也能看到,機器學習會帶來能力擴散,整個過程中,它帶來的去中心化和集中化一樣多。
首先,機器學習是關(guān)于數(shù)據(jù)的。這意味著什么?
由于機器學習的學術(shù)氛圍,幾乎所有的基礎(chǔ)技術(shù)突破,在發(fā)現(xiàn)之后都會立即發(fā)表出版。每個人都能讀到關(guān)于這些突破的論文,甚至有代碼,可以復(fù)現(xiàn)這一突破。
在過去,軟件工程師想要創(chuàng)建一個系統(tǒng)來識別某些東西,他們要寫邏輯步驟(“規(guī)則”)。
為了識別圖片中的貓,你需要寫一些規(guī)則來識別貓的輪廓、皮毛、腿、眼睛、尖耳朵等等,然后把它們打包在一起,希望它能起作用。
問題在于,盡管這在理論上可行,但在實踐中,就相當于試圖制造一匹機械馬,它所需要的復(fù)雜性邏輯是不切實際的。我們無法描述我們識別貓的所有邏輯步驟。
使用機器學習,你只需要給統(tǒng)計引擎提供例子(很多例子),這個引擎會生成一個模型來區(qū)分這些例子中的不同之處。
你給它100000張貼有“貓”標簽的照片和100000張貼有“不是貓”標簽的照片,機器就能找出區(qū)別。
機器學習,用從數(shù)據(jù)中自動確定的模式代替了手寫的邏輯步驟。對于一些非常廣泛的問題,它的效果更好。一些簡單的應(yīng)用是在計算機視覺、語言和語音方面,但它的用例要廣泛得多。
你需要多少數(shù)據(jù)是不斷變化的:有一些研究路徑,可以讓機器學習處理小得多的數(shù)據(jù)集。但現(xiàn)在,還是數(shù)據(jù)越多越好。
因此,問題是:如果用機器學習讓做新的重要的事情,而且機器學習需要越多數(shù)據(jù)越好,這是否意味著那些已經(jīng)很大并且擁有大量數(shù)據(jù)的公司會變得更強大?贏家通吃效應(yīng)有多嚴重?
不難想象,會有一個良性循環(huán),來強化贏家的主導(dǎo)地位:
更多數(shù)據(jù)=更精確的模型=更好的產(chǎn)品=更多用戶=更多數(shù)據(jù)。
基于此,得出像“谷歌/ Facebook /亞馬遜擁有大量數(shù)據(jù)”或者“中國擁有大量數(shù)據(jù)”,將會在人工智能領(lǐng)域占據(jù)上風的觀點,會變得很容易。
好吧,也可以這樣說。
首先,雖然機器學習需要大量的數(shù)據(jù),但是你使用的數(shù)據(jù)要非常適合你試圖解決的問題。
通用電氣有大量來自燃氣渦輪機的遙測數(shù)據(jù),谷歌有大量搜索數(shù)據(jù),美國運通有大量信用卡欺詐數(shù)據(jù)。
但你不能用渦輪機數(shù)據(jù)來訓(xùn)練模型,去發(fā)現(xiàn)欺詐交易,也不能用網(wǎng)絡(luò)搜索數(shù)據(jù)訓(xùn)練模型去發(fā)現(xiàn)即將失效的燃氣渦輪機。
也就是說,機器學習是一種可推廣的技術(shù)——你可以將其用于欺詐檢測或面部識別——但是你用它構(gòu)建的應(yīng)用程序并不具備可推廣性。
你訓(xùn)練的每一個模型只能做一件事。
這與之前的自動化浪潮非常相似:就像洗衣機只能洗衣服,不能洗碗做飯,象棋程序不能交稅一樣,機器學習翻譯系統(tǒng)也不能識別貓。
你構(gòu)建的應(yīng)用程序和你需要的數(shù)據(jù)集,都與你試圖解決的任務(wù)強相關(guān)(盡管這也是一個不斷變化的目標,有研究試圖讓機器學習模型在不同的數(shù)據(jù)集之間更容易遷移)。
這意味著機器學習的實現(xiàn)的分布將會非常廣泛。
谷歌不會“擁有所有的數(shù)據(jù)”——谷歌會擁有所有的谷歌數(shù)據(jù)。谷歌給出更相關(guān)的搜索結(jié)果,通用電氣將會有更好的渦輪機遙測技術(shù),沃達豐將會有更好的呼叫模式分析和網(wǎng)絡(luò)規(guī)劃,這些都是不同公司建立的不同東西。
谷歌會越來越擅長成為谷歌,但這并不意味著它在其他方面也做得越來越好。
接下來,人們可能會爭辯說,這只是意味著每個行業(yè)中的大公司變得更加強大——沃達豐、通用電氣和美國運通都擁有它們做的任何事情的“所有數(shù)據(jù)”,從而形成了抵御競爭對手的護城河。
但是在這個方面,情況又變得更加復(fù)雜,會有各種有趣的問題涌現(xiàn)。比如誰擁有數(shù)據(jù),數(shù)據(jù)有多獨特,數(shù)據(jù)在什么層面上是獨一無二的,以及聚合和分析數(shù)據(jù)的正確位置在哪里。
所以:作為一家工業(yè)公司,你會保留自己的數(shù)據(jù)并建立機器學習系統(tǒng)來分析它嗎(或者付錢給承包商來幫你這樣做)?
你會從供應(yīng)商那里購買用其他人的數(shù)據(jù)訓(xùn)練的成品嗎?你是將你的數(shù)據(jù)融入其中,還是用你的數(shù)據(jù)進行訓(xùn)練?供應(yīng)商是否需要你的數(shù)據(jù),或者它們已經(jīng)有足夠的數(shù)據(jù)了?
對于不同的業(yè)務(wù)部門、不同的行業(yè)和不同的用例,答案會有所不同。
從另一個角度來說,如果你正在創(chuàng)建一家公司來用機器學習解決現(xiàn)實世界的問題,那么有兩個基本的數(shù)據(jù)問題:
你如何獲得第一批數(shù)據(jù)來訓(xùn)練你的模型去獲得第一個客戶?你需要多少數(shù)據(jù)?
當然,第二個問題可以分解成許多問題:
是用相對較少且相當容易獲得的的數(shù)據(jù)來解決問題?(但許多競爭對手可以獲得) 。
還是你需要更多的、難以獲得的數(shù)據(jù)去解決問題?
如果是這樣的話,是否存在一種網(wǎng)絡(luò)效應(yīng)可以從中受益?一個贏家將獲得所有的數(shù)據(jù)?
產(chǎn)品是隨著更多的數(shù)據(jù)無限期地變得更好,還是存在一個S曲線?
這要看情況。
有些數(shù)據(jù),是企業(yè)或產(chǎn)品所獨有的,或者具有很強的專有優(yōu)勢。 通用電氣公司的渦輪機遙測技術(shù)在分析勞斯萊斯的渦輪機方面,可能沒有多大用處。當然,如果有用的話,他們也不會分享。
這可能是一個創(chuàng)辦公司的機會,也是許多大公司的技術(shù)部門和承包商設(shè)計項目的地方。
一些數(shù)據(jù),可以應(yīng)用于許多公司甚至許多行業(yè)中的用例。
比如,“這個電話有些奇怪”,可能在所有信用卡公司中都有用?!邦櫩吐犉饋砗苌鷼狻?,可能適用于任何設(shè)立有呼叫中心的企業(yè)。
基于此,誕生了許多創(chuàng)業(yè)公司,以解決許多公司或不同行業(yè)的共性問題,并且這里的數(shù)據(jù)具有網(wǎng)絡(luò)效應(yīng)。
但是也有這樣的情況,即在某個時間點之后,供應(yīng)商甚至不需要每個更多的數(shù)據(jù)了,因為產(chǎn)品已經(jīng)開始工作了。
實際上,隨著機器學習擴散到幾乎所有領(lǐng)域,可以從很多創(chuàng)業(yè)公司種看到這些情況。我們(A16Z)的投資的公司Everlaw開發(fā)了一個法律發(fā)現(xiàn)軟件:如果你起訴某人,他們給你一卡車的文件,這對你有幫助。
使用機器學習,他們能夠?qū)σ话偃f封電子郵件進行情感分析,但不需要根據(jù)你的案件數(shù)據(jù)對模型進行訓(xùn)練,因為情感識別模型的訓(xùn)練數(shù)據(jù),不需要來自這個特定的訴訟(或任何訴訟)。
另一家公司Drishti使用計算機視覺技術(shù)來檢測和分析生產(chǎn)線,其中一些模型是根據(jù)你的數(shù)據(jù)訓(xùn)練出來的,另一些根本不是針對于你的業(yè)務(wù),而是跨行業(yè)工作的。
還有一些極端情況。最近,我與一家大型車輛制造商的內(nèi)部人士進行了交談,這家制造商正在利用機器學習技術(shù)來開發(fā)更精確的爆胎檢測器。
這是基于大量輪胎的數(shù)據(jù)訓(xùn)練出來的模型。但很明顯,獲得這些數(shù)據(jù)并不難。所以,這只能是一個功能,而不是算是護城河。
我早些時候說過,機器學習創(chuàng)業(yè)公司需要回答兩個問題:
你是如何獲得數(shù)據(jù)的?你需要多少數(shù)據(jù)?
但是這些只是技術(shù)層面的問題,你還需要問自己:
如何進入市場?你的目標市場是什么?你正在解決的問題對你的客戶有多有價值?等等。
也就是說,很快將不會有任何“人工智能”創(chuàng)業(yè)公司,它們將是工業(yè)流程分析公司、法律平臺公司或銷售優(yōu)化公司。
事實上,機器學習的普及并不意味著谷歌變得更強大,而是意味著各種各樣的創(chuàng)業(yè)公司,能夠比以前更快地利用這一前沿技術(shù)來構(gòu)建一個應(yīng)用,解決一個問題。
這讓我想到了我在其他地方用過的一個比喻:我們應(yīng)該將機器學習與SQL進行比較。
它是構(gòu)建新的重要的事情的基石,在未來將成為一切的一部分。如果你不使用它,而你的競爭對手會使用它,你就會落后。
一些人將基于此創(chuàng)建全新的公司,沃爾瑪?shù)囊徊糠殖晒σ蛩兀褪鞘褂脭?shù)據(jù)庫更有效地管理庫存和物流。
但是今天,如果你創(chuàng)辦了一家零售公司,并說“……我們將使用數(shù)據(jù)庫”,這不會讓你變得不同或有趣,因為SQL成為了一切的一部分,然后它就在話語體系中消失了。
機器學習也會如此。
-
人工智能
+關(guān)注
關(guān)注
1818文章
50123瀏覽量
265617
原文標題:A16Z合伙人:人工智能領(lǐng)域是否存在“贏家通吃”效應(yīng)?
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
開發(fā)智能體配置-內(nèi)容合規(guī)
自然智能與人工智能融合如何重塑芯片設(shè)計
嵌入式系統(tǒng)中的人工智能
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!
迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學習課程參考2025版(大模型篇)
CYW20829是否能夠同時通過BT/BLE連接最多3臺設(shè)備?
超聲波清洗機是否能夠清洗特殊材料或器件?
人工智能領(lǐng)域是否能夠贏家通吃?
評論