在新智元AI WORLD 2018世界人工智能峰會上,中國萬向控股有限公司副董事長兼執(zhí)行董事肖風分享了他對AI、數(shù)據(jù)隱私保護和區(qū)塊鏈的獨到看法。 肖風認為,區(qū)塊鏈加上加密算法是一對絕配。未來三到五年內,一個去中心化的分布式AI平臺或將出現(xiàn),數(shù)據(jù)帶來的問題將能夠解決。
9月20日,在新智元AI WORLD 2018世界人工智能峰會上,中國萬向控股有限公司副董事長兼執(zhí)行董事肖風分享了他對AI、數(shù)據(jù)隱私保護和區(qū)塊鏈的獨到看法。
肖風認為,隨著AI迎來第三次高潮,技術對數(shù)據(jù)愈發(fā)依賴,帶來了人們對數(shù)據(jù)估值的重新發(fā)現(xiàn)。
區(qū)塊鏈加上加密算法是一對絕配?;ヂ?lián)網是“信息機器”,區(qū)塊鏈是“事實機器”。區(qū)塊鏈加上加密算法將會給AI帶來一片新的天地,它們的結合將滿足AI對數(shù)據(jù)的需求,數(shù)據(jù)隱私會得到保護,數(shù)據(jù)資產會得到確權,數(shù)據(jù)共享會得到激勵,數(shù)據(jù)計算會得以開放,數(shù)據(jù)治理會得以有序。
未來三到五年內,一個去中心化的分布式AI平臺或將出現(xiàn)。
以下是肖風在新智元AI WORLD 2018世界人工智能峰會上的演講實錄:《AI、數(shù)據(jù)隱私保護與區(qū)塊鏈》。
分布式的AI平臺將解決數(shù)據(jù)帶來的問題
肖風:很榮幸有這樣一個機會在人工智能大會上進行分享。我自己過去五年在區(qū)塊鏈這個領域當中做研究、投資和應用推廣,既然來到這里,我還是想談一談和區(qū)塊鏈有關系的一些話題,當然,首先它也是和人工智能有關系。
人工智能和區(qū)塊鏈兩個話題碰在一起,數(shù)據(jù)的產權意識、價值以及數(shù)據(jù)隱私保護意識的覺醒和AI的發(fā)展是密不可分的,或者可以說是AI帶來的。

隨著2016年人工智能第三次浪潮起來,人們突然發(fā)現(xiàn)原來數(shù)據(jù)有這么大的作用,數(shù)據(jù)能夠創(chuàng)造這么大的價值,人們自然要問:我的數(shù)據(jù)在哪里?我的數(shù)據(jù)得到妥善的保護了嗎?商業(yè)機構用我們的數(shù)據(jù)創(chuàng)造了價值,這些價值難道和我一點關系都沒有嗎?

有關數(shù)據(jù)的隱私保護、數(shù)據(jù)的價值分享和數(shù)據(jù)的共享,我總結了一下,最熱門的有這樣幾個方向:
首先是數(shù)據(jù)的產權確認。在座的各位可能都有很多數(shù)據(jù)遺留在互聯(lián)網上,這些數(shù)據(jù)是屬于我們的,還是屬于互聯(lián)網平臺的?或者是屬于我們和互聯(lián)網平臺共同擁有的?怎樣確認我們遺留在互聯(lián)網和其它平臺產生的數(shù)據(jù)?比如醫(yī)療平臺上你的基因數(shù)據(jù)、病歷數(shù)據(jù),怎么確定數(shù)據(jù)的主權是屬于你還是屬于誰?
第二個方向是數(shù)據(jù)的隱私保護。大家可能不想把某些數(shù)據(jù)這么直白地、這么公開地在互聯(lián)網上被傳播甚至被買賣,所以我們要討論數(shù)據(jù)的隱私保護。
再就是數(shù)據(jù)的協(xié)同計算。數(shù)據(jù)如果不被使用根本就不會有價值,但現(xiàn)在我們可能沒有任何一個單一的平臺能夠擁有多維的、多元的數(shù)據(jù)滿足人工智能算法的需求。電商平臺可能有電商的數(shù)據(jù),社交平臺可能有社交關系的數(shù)據(jù),但如果這些數(shù)據(jù)能夠協(xié)同計算,那么對AI來說一定是功莫大焉。
但沒有人愿意在現(xiàn)在的互聯(lián)網的環(huán)境下把自己的數(shù)據(jù)交出去,因為交出去就等于斷送,別人不可能拍著胸脯保證說這些數(shù)據(jù)我絕對不會偷看,絕對不會傳播出去。即使有這種主觀的善良的意愿,技術上也不一定能夠做到,無法保證數(shù)據(jù)得到妥善的保管。那么怎樣在既打消這種不信任的念頭,同時又能夠讓這么多維、多元、多層次的數(shù)據(jù)在一起協(xié)同計算,共同共享,得出具有更大社會福利的AI成果呢?這確實也是一個話題。
第四是數(shù)據(jù)的價值分享。既然這些數(shù)據(jù)創(chuàng)造了很大的商業(yè)價值,我是不是應該從中得到我應該得到的那一份?現(xiàn)有的互聯(lián)網架構下沒有人給你。當然,互聯(lián)網平臺也用另外一種方式稍微返還了一部分利益,比如免費使用,這是因為要收集你的數(shù)據(jù),你可以得到一些免費的使用,也許這是一種價值間接的體現(xiàn)。但有沒有什么更直接的體現(xiàn),能夠激發(fā)大家愿意貢獻更多的數(shù)據(jù)來幫助AI達到更好的結果?激勵機制是數(shù)據(jù)共享或協(xié)同計算必須要建立的,沒有很好的激勵機制我們就很難相信,或者很難想像別人會平白無故地把隱私數(shù)據(jù)貢獻出去,讓某個科學家或讓某個商業(yè)機構依據(jù)這些數(shù)據(jù)來訓練機器、優(yōu)化算法,得到一些結果。
今天很多人工智能學家都在談怎么用數(shù)據(jù)。這些問題是AI的發(fā)展帶來的,但AI本身不能解決這些問題。如果這些問題不得到解決,那么對AI來說是一個巨大的缺陷,尤其是如果我們不能用一個很好的激勵機制去激勵那些數(shù)據(jù)的持有人把自己的數(shù)據(jù)貢獻出來,這對人工智能的發(fā)展來說也是一個巨大的缺陷。
舉個例子,科學家如何征求1萬個特殊病的案例?可以去找醫(yī)院,這也是很困難的事情。但如果用區(qū)塊鏈技術,用一個分布式的AI平臺,并不需要找中間商,可以用你的智能合約加上隱私保護的算法,加上基于數(shù)字貨幣的激勵機制,那些互不認識的1萬個陌生人就會愿意把自己的病歷資料貢獻給這個平臺,讓某個科學家計算出來結果,然后智能合約會保證你能得到事先承諾給你的回報,并且你的所有數(shù)據(jù)能夠得到很好的隱私保護。
如果能夠做到這樣一個分布式的AI平臺,可以想像AI技術、AI行業(yè)會和今天討論的不一樣了。今天所有人工智能學家討論的都是基于中心化的機制、中心化的數(shù)據(jù)平臺去訓練AI算法,得到一些結果。其實這是一方面,另一方面就是能不能用分布式、去中心化的AI平臺把中心化平臺無法提供,或者不能提供的數(shù)據(jù)都搜羅出來,然后達成我們想要達到的研究目的?

有很多密碼學家在這方面做了很多努力,并且有了很好的成果。
首先,哈希函數(shù)。哈希函數(shù)能夠證明一串數(shù)字或者一本書是不是被篡改過,不管是一段話還是一本書,這么多的內容哈希以后,得到的哈希值是一樣大小的;但如果一本書當中改變了其中的一個標點符號,最后得到新的哈希值和原來就會有巨大的不同,所以能夠證明后來的東西是不是被篡改過。哈希函數(shù)可以得到很好的保證,不需要寫保證書,也不需要簽合同,只要檢查兩個信息的哈希值是不是一樣,就知道數(shù)據(jù)是不是被篡改過。
非對稱加密。所謂的公鑰、私鑰的非對稱加密算法,能夠保證數(shù)據(jù)的安全、完整和匿名,某種程度上也能夠對數(shù)據(jù)的產權進行確認,因為區(qū)塊鏈上面唯一的產權確認的依據(jù)就是擁有這個數(shù)字或者密碼學帳戶的私鑰,擁有了私鑰,就擁有了帳戶里面的所有價值物和數(shù)據(jù)。
零知識證明。這種加密算法能夠在把數(shù)據(jù)加密之后,在密文的狀態(tài)下讓第三方驗證者驗證數(shù)據(jù)的真實,或者狀態(tài)是否真的存在。
同態(tài)加密也是一樣,數(shù)據(jù)加密之后,在密文的狀態(tài)下,第三方仍然可以就這些數(shù)據(jù)進行某種程度上的分析和處理,最后由擁有密鑰的人從這里得到想要得到的結果。也許這個密鑰持有者并不是數(shù)據(jù)的所有者,因此也不會碰到原始的數(shù)據(jù),或者說不會碰到明文的數(shù)據(jù)。
最后是安全多方計算。就是有一組互不信任的陌生人,比如前面講到的某種特殊病的患者。這樣一組互不信任的參與方,數(shù)據(jù)擁有者可以把自己的數(shù)據(jù)在加密以后貢獻出來,讓別人來做協(xié)同計算,最后大家可以共享計算的結果。數(shù)據(jù)永遠都不會離開本地,永遠無法推導出所有的原始數(shù)據(jù)。
其實密碼學算法已經存在很長時間了,但是被用來做數(shù)據(jù)的隱私保護和隱私保護之后的數(shù)據(jù)協(xié)同計算是最近兩年蓬勃發(fā)展的一個事實。

但是光有加密算法并不能夠完整地達到幫助AI更好地利用這些數(shù)據(jù)的目的。比如數(shù)據(jù)確權方面需要借助其它的技術,數(shù)據(jù)的真實性方面哈希函數(shù)可以證明是否被篡改過,但只有哈希函數(shù)并不能夠使得數(shù)據(jù)真的不可撤銷、不可篡改和可追溯。
第三,數(shù)據(jù)真正要有價值就必須把數(shù)據(jù)資產化,數(shù)據(jù)沒有被資產化就無法就數(shù)據(jù)進行交易,無法給數(shù)據(jù)確定價值,也無法收到貢獻數(shù)據(jù)以后應該得到的回報。數(shù)據(jù)資產化是數(shù)據(jù)交易的基礎,但是數(shù)據(jù)資產化的基礎是數(shù)據(jù)的確權。
數(shù)據(jù)存儲。尤其是去中心化計算,或者所謂的點對點、分布式、邊緣以及多方協(xié)同計算這樣的情形,如何建立一套激勵機制,讓那些無關但擁有某方面的數(shù)據(jù)的人交出這些數(shù)據(jù)。這時需要建立一套價值分配和激勵機制,讓他們愿意把數(shù)據(jù)貢獻出來,這種價值分配機制和激勵機制密碼學算法也不能解決。

什么新的系統(tǒng)加上密碼學算法才能解決呢?有人說互聯(lián)網能夠解決,但互聯(lián)網不能解決前面的幾個熱點問題。
首先技術上,我們不能相信一個互聯(lián)網平臺確實能夠確保數(shù)據(jù)的安全和數(shù)據(jù)的隱私。前段時間我們有看到新聞,一家著名的連鎖酒店,幾億的住客數(shù)據(jù)被盜取。今天的新聞好像是泄露數(shù)據(jù)的人被抓到了,公安部門說他沒有能夠完成交易,數(shù)據(jù)沒有被賣出去。所以技術上并不能夠證明互聯(lián)網平臺能夠做到保證這些數(shù)據(jù)的安全和隱私。
第二,在利益上,大家都在用這些數(shù)據(jù)賺錢,沒有人在意數(shù)據(jù)的隱私保護或者產權歸誰。
第三,意愿方面,互聯(lián)網平臺希望掌握數(shù)據(jù)的主權,而數(shù)據(jù)的擁有者希望數(shù)據(jù)的主動權掌握在自己手里,使用數(shù)據(jù)就應該得到許可,分配使用數(shù)據(jù)獲得利益的一部分。
最后,在管理上。這幾天也有新聞報道,一家非常著名的物流公司的一個工程師無意當中把一個數(shù)據(jù)庫刪掉了,導致這家很大的物流公司整個停擺了590分鐘,整個系統(tǒng)才得以恢復。
因此,密碼學算法不能解決這些問題,互聯(lián)網技術也一樣不能解決。

誰能解決呢?區(qū)塊鏈是可以解決的,因為區(qū)塊鏈和互聯(lián)網有很大的不同。有人說區(qū)塊鏈是第二代互聯(lián)網,我覺得不是,區(qū)塊鏈和互聯(lián)網有巨大的區(qū)別,主要是這幾個方面:
互聯(lián)網剛出來的時候,美國的媒體把互聯(lián)網叫做“信息機器”。確實,互聯(lián)網使得信息的產生、交流、傳遞成本極低,低到邊際成本是零,傳遞速度極快,信息的獲取也極端方便。區(qū)塊鏈被人們叫做事實機器,因為它的分布式數(shù)據(jù)庫的特點,區(qū)塊鏈的數(shù)據(jù)庫上面任何數(shù)據(jù)只能添加,不能撤除,不能篡改。因此數(shù)據(jù)一旦登記到區(qū)塊鏈上面,我們完全不需要擔心是不是被改過,所以叫做事實機器。一個事實機器顯然更有利于AI。
第二,互聯(lián)網是一種中心化的信任機制,你必須相信互聯(lián)網平臺,說你的數(shù)據(jù)在我這里是得到妥善保護的,我是不會隨便碰你的數(shù)據(jù)的。但是到現(xiàn)在為止幾乎沒有人敢徹底相信任何一個互聯(lián)網平臺不偷看你的數(shù)據(jù),或者你的數(shù)據(jù)能夠在那里得到妥善的保護。區(qū)塊鏈是一個去中心化的信任機制,不需要信任任何人、任何機構、任何組織,只需要信任這套數(shù)學算法,這套數(shù)學算法不會偷窺你的數(shù)據(jù),也不會擅自利用你的數(shù)據(jù)。靠著一條共識算法來建立的分布式信任機制,顯然要比一個中心化的互聯(lián)網機制好得多。
第三就是激勵相容。數(shù)據(jù)的擁有方、算法的提供方、算力的提供方和AI的需求方在區(qū)塊鏈上面完全能夠做到激勵相容,每個人各得其所,不會有激勵不相容的現(xiàn)象發(fā)生。所以在激勵機制上區(qū)塊鏈和互聯(lián)網有巨大的不同,互聯(lián)網平臺是多方參與的,但是我們無法在互聯(lián)網平臺建立很好的激勵相容機制,區(qū)塊鏈上面可以建立這樣的激勵機制。
第四,互聯(lián)網上的應用叫做App,區(qū)塊鏈上的應用叫做Dapp,D就是“去中心化”(Decentralized)。App和Dapp的最大區(qū)別是什么?比如說,如果你用出版社加上新華社的渠道來出版一本書,那么你可能得到這本書售價的10%,那是你的版稅。但如果通過互聯(lián)網平臺,比如騰訊的閱文平臺,出版任何的讀物,收入的25%要歸平臺。這意味著作者本人可以得到這本著作所有收入的75%。但在區(qū)塊鏈上面的Dapp上出版這樣的讀物和著作,所有的收入100%歸你,沒有任何人會在中間抽取你的費用。這是一個去中心化的商業(yè)模式,我們把它叫做分布式商業(yè)。
第五,互聯(lián)網在利益上希望數(shù)據(jù)獨享,所以在現(xiàn)有的技術狀況下很難看到不同的互聯(lián)網平臺會把數(shù)據(jù)共享出來,這實際上妨礙了AI的進一步發(fā)展。但是在區(qū)塊鏈上面是數(shù)據(jù)共享的,因為所謂分布式數(shù)據(jù)庫之上的分布式記帳系統(tǒng)本來就是一個共享記帳系統(tǒng),帳本系統(tǒng)本來就是相關參與方在一個數(shù)據(jù)庫當中記錄大家相關的所有數(shù)據(jù),可以同步給所有的參與方。
最后,區(qū)塊鏈上面跑的是數(shù)字貨幣,數(shù)據(jù)要達成交易交換,或者用來激勵數(shù)據(jù)的所有者或者提供者,算法的提供者或者算力的提供者。互聯(lián)網的環(huán)境中可以用微信和支付寶,但這是另外一套系統(tǒng),把數(shù)據(jù)提供之后仍然可以懷疑是不是能夠得到事先承諾的價值和利益。但是區(qū)塊鏈上面不需要擔心這個,任何一個需求的發(fā)起方建立智能合約,數(shù)字貨幣寫在智能合約里面,也把數(shù)據(jù)交給這個智能合約,運算結束以后智能化合約會自動觸發(fā)一個支付流程,所有人會依據(jù)事先約定好的計算機程序分配所得利益,所以它是可編程的智能貨幣。數(shù)字貨幣本身就是一段計算機程序,而不是一串數(shù)字。
這些是互聯(lián)網和區(qū)塊鏈很大的區(qū)別,可以看到區(qū)塊鏈加上加密算法可能是一對絕配。區(qū)塊鏈的鏈式數(shù)據(jù)庫可以保證數(shù)據(jù)的真實性。區(qū)塊鏈作為事實機器,它和互聯(lián)網這種信息機器最大的不同是,任何數(shù)據(jù)在區(qū)塊鏈上面不可能被“雙花”,所謂“雙花”就是數(shù)據(jù)可以不經許可,沒有成本,隨便復制。

我們把區(qū)塊鏈叫做價值互聯(lián)網。我們在區(qū)塊鏈上面發(fā)送比特幣,如果像發(fā)送郵件一樣,一個比特幣可以發(fā)給一萬個人,本地還保存這樣的郵件,這個世界就亂了。區(qū)塊鏈技術有一套機制防止雙花,當你宣稱你要利用區(qū)塊鏈寄送一個比特幣給別人,這個系統(tǒng)會保證你的比特幣一定會被減掉,而且你的比特幣只能給你指定的那個人得到,不可能像郵件那樣一千個人、一萬個人都能得到。防止雙花,數(shù)據(jù)才能成為資產。如果像互聯(lián)網上面信息可以這樣無成本、不經許可、隨便擴散,這種時候數(shù)據(jù)不可能成為資產。
再就是點對點的交易系統(tǒng)。區(qū)塊鏈就是一個點對點的交易系統(tǒng)。這種機制可以防止數(shù)據(jù)壟斷,每個人擁有自己的數(shù)據(jù),可以參與交易。
去中心化的信任機制保障了數(shù)據(jù)的安全,前面我們已經講過了。
智能可編程貨幣帶來數(shù)據(jù)協(xié)作新的激勵機制,加上前面講的加密算法是一對絕配。

最后,簡單總結一下區(qū)塊鏈和加密算法的發(fā)展趨勢。
現(xiàn)在有越來越多大學的密碼學家開始加入到區(qū)塊鏈的創(chuàng)業(yè)團隊當中,我在今年上半年就已經碰到過好幾個斯坦福、MIT、馬里蘭大學和伯克利大學的密碼學家,大家紛紛加入到了區(qū)塊鏈行業(yè),投身到數(shù)據(jù)的隱私保護和數(shù)據(jù)的協(xié)同計算。
通過這些密碼學家我們了解到,密碼學界研究方向正在發(fā)生巨大的轉變,明年的美國密碼學年會和歐洲密碼學年會目前為止接到的論文和議題有一半是安全多方計算MPC。數(shù)據(jù)隱私保護成為了最熱門、最重要的話題,我所發(fā)起的PlatON區(qū)塊鏈項目就是致力于用加密算法加上區(qū)塊鏈技術解決數(shù)據(jù)多方安全計算的問題。我們已經在工程上實現(xiàn)了兩方安全計算,明年中會實現(xiàn)三方的安全計算,之后多方安全計算就不遠了。
區(qū)塊鏈加上加密算法將會給AI帶來一片新的天地,滿足AI對數(shù)據(jù)的需求,數(shù)據(jù)隱私會得到保護,數(shù)據(jù)資產會得到確權,數(shù)據(jù)共享會得到激勵,數(shù)據(jù)計算會得以開放,數(shù)據(jù)治理會得以有序??梢云诖轿迥曛螅粋€去中心化的分布式AI平臺會出現(xiàn),不再需要依靠中心化的機構,也不再需要中心化機構的數(shù)據(jù)。一個科學家可以在這樣的平臺上面發(fā)布自己的需求征集數(shù)據(jù)所有者,征集算法所有者,征集算力所有者,完成自己的一項科學研究。三到五年以內分布式的AI平臺應該會出現(xiàn)。
-
數(shù)據(jù)
+關注
關注
8文章
7324瀏覽量
94286 -
AI
+關注
關注
91文章
39083瀏覽量
299636 -
區(qū)塊鏈
+關注
關注
112文章
15576瀏覽量
110790
原文標題:肖風:為什么說區(qū)塊鏈將給AI帶來新天地
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
平衡創(chuàng)新與倫理:AI時代的隱私保護和算法公平
區(qū)塊鏈如何改變AI
什么是區(qū)塊鏈 區(qū)塊鏈有什么用
區(qū)塊鏈不是泡沫 馬云或將創(chuàng)造新的神話
區(qū)塊鏈軟件開發(fā)公司談未來區(qū)塊鏈的主要應用方向
區(qū)塊鏈對我們的生活有什么影響
區(qū)塊鏈落地智慧城市應用領域
區(qū)塊鏈技術的新用途有哪些
區(qū)塊鏈在非金融行業(yè)的應用
基于區(qū)塊鏈的物聯(lián)網
基于區(qū)塊鏈的個人隱私保護機制
區(qū)塊鏈隱私保護平臺Sero超零協(xié)議介紹
AI、數(shù)據(jù)隱私保護與區(qū)塊鏈
評論