12月27日,蘋(píng)果公司終于不再遮遮掩掩,發(fā)布了自己的首份人工智能研究報(bào)告。業(yè)內(nèi)人士稱(chēng),這對(duì)蘋(píng)果將來(lái)推廣自己的人工智能應(yīng)用大有裨益。蘋(píng)果本月初曾表示,將發(fā)布自己的人工智能研究報(bào)告。不到一個(gè)月的時(shí)間,蘋(píng)果就兌現(xiàn)了承諾。近日,蘋(píng)果發(fā)布了第一份關(guān)于人工智能的學(xué)術(shù)論文。
于于22日發(fā)布其首篇關(guān)于機(jī)器學(xué)習(xí)的研究論文,詳細(xì)描述了如何通過(guò)電腦合成圖像訓(xùn)練算法的識(shí)別能力。論文中解釋道,與現(xiàn)實(shí)生活中直接抓取的圖像相比,電腦合成圖像已經(jīng)包含標(biāo)記和注釋。在訓(xùn)練計(jì)算機(jī)人工神經(jīng)網(wǎng)絡(luò)算法時(shí),省去了大量人力,程序員無(wú)需再一一告訴計(jì)算機(jī),圖中顯示的每一樣?xùn)|西是什么。不過(guò),電腦合成圖像相比真實(shí)世界缺乏真實(shí)感也是顯而易見(jiàn)的,論文中為此專(zhuān)門(mén)提出了一種叫做“模擬+無(wú)監(jiān)督學(xué)習(xí)”的方法。蘋(píng)果還改進(jìn)了現(xiàn)有的生成對(duì)抗網(wǎng)絡(luò)模型,使生成的圖片變得更加逼真。蘋(píng)果高調(diào)發(fā)聲進(jìn)軍人工智能領(lǐng)域,繼而迅速公布研究成果,足以見(jiàn)得它興趣濃厚,雄心勃勃。
這篇報(bào)告的第一作者是蘋(píng)果研究員阿希什·什里瓦斯特瓦(Ashish Shrivastava),擁有馬里蘭大學(xué)帕克分校計(jì)算機(jī)視覺(jué)博士學(xué)位。有業(yè)內(nèi)人士稱(chēng),對(duì)于蘋(píng)果而言,此次公開(kāi)其首份人工智能研究報(bào)告也是一大進(jìn)步。多年來(lái),蘋(píng)果對(duì)其在人工智能領(lǐng)域的研究一直守口如瓶,這遭到了人工智能研究社區(qū)的批評(píng)。同時(shí),這也影響了蘋(píng)果招募人工智能人才。
那么蘋(píng)果進(jìn)軍人工智能領(lǐng)域的過(guò)程到底經(jīng)歷了什么?
外界一直認(rèn)為蘋(píng)果在人工智能領(lǐng)域比較低調(diào),其技術(shù)也落后于Google、微軟等公司。
其實(shí)蘋(píng)果有著寫(xiě)滿(mǎn)兩頁(yè)紙的機(jī)器學(xué)習(xí)應(yīng)用,部分已經(jīng)投入使用,其他的還在討論中。而這些應(yīng)用的背后則是這6年來(lái)蘋(píng)果已悄無(wú)聲息收購(gòu)了15家人工智能公司,包括:語(yǔ)音識(shí)別、自然語(yǔ)言處理、圖像識(shí)別、人臉識(shí)別、動(dòng)作捕捉、機(jī)器學(xué)習(xí)等方向的創(chuàng)新型技術(shù)公司。
有個(gè)有趣的現(xiàn)象是,蘋(píng)果每收購(gòu)一個(gè)AI公司后,均不會(huì)對(duì)外公布收購(gòu)目的和發(fā)展計(jì)劃,而且會(huì)立即關(guān)閉被收購(gòu)公司的產(chǎn)品和服務(wù)。
語(yǔ)音、語(yǔ)義識(shí)別
Siri語(yǔ)音助手
Siri無(wú)疑是蘋(píng)果最為重要的語(yǔ)音產(chǎn)品,2010年以2億美金的價(jià)格購(gòu)入無(wú)疑是一筆非常劃算的買(mǎi)賣(mài),之后蘋(píng)果在語(yǔ)音識(shí)別和NLP方向的收購(gòu)舉措均基于Siri而展開(kāi)。
Novauris語(yǔ)音識(shí)別
2014年4月,蘋(píng)果收購(gòu)的Novauris是一家自動(dòng)化語(yǔ)音識(shí)別技術(shù)公司,Novauris是由Nuance旗下的Dragon Systems創(chuàng)始人創(chuàng)辦,而Nuance曾是Siri的基礎(chǔ)語(yǔ)音技術(shù)提供商。他們的核心產(chǎn)品是基于服務(wù)器的可擴(kuò)展語(yǔ)音識(shí)別系統(tǒng)NovaSystem,特點(diǎn)是能夠同時(shí)處理多個(gè)語(yǔ)音訪(fǎng)問(wèn)請(qǐng)求。雖然蘋(píng)果拒絕透露如何使用Novauris團(tuán)隊(duì),但從Siri和Nuance的合作關(guān)系來(lái)看,蘋(píng)果此項(xiàng)收購(gòu)意在擺脫對(duì)Nuance的依賴(lài),利用Novauris團(tuán)隊(duì)開(kāi)發(fā)自己的語(yǔ)音技術(shù)。
VocalIQ人機(jī)對(duì)話(huà)
一直以來(lái),Siri只能識(shí)別最基本的指令,無(wú)法做出匹配度較高的回答,這導(dǎo)致它成為一款?yuàn)蕵?lè)屬性的娛樂(lè)產(chǎn)品。2015年10月,蘋(píng)果通過(guò)收購(gòu)VocalIQ予以解決此項(xiàng)問(wèn)題。VocalIQ能夠利用深度學(xué)習(xí)來(lái)理解語(yǔ)言的環(huán)境,從而使得人機(jī)對(duì)話(huà)變得更加自然。開(kāi)發(fā)者在Siri中嵌入VocalIQ的人工智能技術(shù)后,利用這個(gè)平臺(tái)來(lái)儲(chǔ)存和學(xué)習(xí)用戶(hù)的交流信息,實(shí)現(xiàn)準(zhǔn)確識(shí)別用戶(hù)的指令并提供更加智能的對(duì)話(huà)。
機(jī)器學(xué)習(xí)
蘋(píng)果曾提到他們利用AI技術(shù)試水一些微功能:如識(shí)別陌生來(lái)電;檢測(cè)用戶(hù)的運(yùn)動(dòng)狀態(tài);手機(jī)解鎖后列出最可能使用的應(yīng)用;自動(dòng)顯示附近標(biāo)記的酒店;日程表安排;興趣新聞推薦等等。這些看似簡(jiǎn)單的功能其實(shí)全部被置人到機(jī)器學(xué)習(xí)系統(tǒng)中,為此蘋(píng)果通過(guò)收購(gòu)多家以興趣推薦和習(xí)慣預(yù)測(cè)為研究方向的機(jī)器學(xué)習(xí)公司,用于提高自身的數(shù)據(jù)挖掘?qū)嵙Α?/p>
Turi機(jī)器學(xué)習(xí)平臺(tái)
2016年8月,蘋(píng)果斥資2億美元收購(gòu)機(jī)器學(xué)習(xí)公司Turi。目前Turi已推出了GraphLabCreate、Turi機(jī)器學(xué)習(xí)平臺(tái)、TuriDistributed和TuriPredictive Services等產(chǎn)品,這些產(chǎn)品主要用于開(kāi)發(fā)推薦引擎、情緒分析、欺詐探測(cè)等解決方案。
Cue數(shù)據(jù)挖掘
2013年10月,蘋(píng)果以4000萬(wàn)美金收購(gòu)被稱(chēng)為“云數(shù)據(jù)的搜索引擎”的Cue,Cue可以從用戶(hù)郵件、聯(lián)系人、臉書(shū)、推特、LinkedIn、Reddit、Dropbox、印象筆記、Tumblr中收集數(shù)據(jù),通過(guò)處理所有數(shù)據(jù)并通過(guò)機(jī)器學(xué)習(xí)算法找出用戶(hù)需要的信息,從而進(jìn)行整理:如提供日歷提醒、通知與某人約會(huì)、會(huì)面餐館推薦等。據(jù)悉,Cue將會(huì)整合到Siri中。
Matcha視頻推薦
2013年8月,蘋(píng)果約以1000—1500萬(wàn)美金(雙方未對(duì)外公布明確交易價(jià)格)收購(gòu)Matcha,其產(chǎn)品可從Netflix、iTunes、Hulu以及Amazon Prime等流媒體網(wǎng)站上抓取內(nèi)容,根據(jù)興趣焦點(diǎn)推薦合適的信息給用戶(hù)。蘋(píng)果收購(gòu)Matcha主要就是為了獲得視頻推薦算法。下線(xiàn)之前,Matcha的iOS應(yīng)用在App Store娛樂(lè)類(lèi)別軟件暢銷(xiāo)榜前15名,用戶(hù)增長(zhǎng)率非常快。
Semetric音樂(lè)數(shù)據(jù)挖掘
2015年1月,蘋(píng)果以5000萬(wàn)美金收購(gòu)Semetric公司,該公司在2008年推出了Musicmetric服務(wù),主要業(yè)務(wù)是提供與音樂(lè)下載和流播放有關(guān)的數(shù)據(jù)分析服務(wù),利用機(jī)器學(xué)習(xí)幫助客戶(hù)分析社交媒體中音樂(lè)愛(ài)好者喜歡哪些歌手和歌曲,從而給出相關(guān)音樂(lè)推薦。完成收購(gòu)后,蘋(píng)果將其整合在iTunes音樂(lè)中。除音樂(lè)外,Semetric在游戲、電視、電影和圖書(shū)方面的數(shù)據(jù)分析服務(wù)也有著一定的積累,這將有助于增強(qiáng)蘋(píng)果對(duì)旗下各類(lèi)數(shù)字產(chǎn)品的數(shù)據(jù)挖掘。
Spotsetter地圖社交個(gè)性化推薦
Spotsetter是基于Google地圖的社交搜索引擎,于2014年6月被蘋(píng)果收購(gòu),其通過(guò)分析用戶(hù)的社交圈數(shù)據(jù),為用戶(hù)提供個(gè)性化的地點(diǎn)(如旅游地點(diǎn)和餐館)推薦服務(wù),致力于解決所謂的“where to go”問(wèn)題。蘋(píng)果的收購(gòu)目的不外乎其推薦算法與蘋(píng)果Maps整合的前景。
WiFiSlam機(jī)器學(xué)習(xí)與模式識(shí)別
2013年3月,蘋(píng)果以2000萬(wàn)美元收購(gòu)室內(nèi)導(dǎo)航服務(wù)商WiFiSlam,該公司的優(yōu)勢(shì)在于機(jī)器學(xué)習(xí)和模式識(shí)別技術(shù),可對(duì)設(shè)備上各種傳感器收集的數(shù)據(jù)進(jìn)行相關(guān)性繪圖,并且與WiFi三角定位的數(shù)據(jù)相結(jié)合,用于繪制準(zhǔn)確的室內(nèi)地圖,蘋(píng)果將其算法應(yīng)用在地圖中。
Topsy 社交數(shù)據(jù)挖掘
2013年,蘋(píng)果以2億美金收購(gòu)Topsy,該公司的產(chǎn)品能夠幫助用戶(hù)從Twitter以及其他社交媒體數(shù)據(jù)中提取關(guān)鍵信息,包括關(guān)鍵字追蹤器以及判斷社交媒體中用戶(hù)對(duì)某個(gè)話(huà)題的反應(yīng)態(tài)度。
計(jì)算機(jī)視覺(jué)
蘋(píng)果官方提到,他們的人臉識(shí)別和視頻檢測(cè)技術(shù)已經(jīng)開(kāi)始應(yīng)用在相機(jī)等產(chǎn)品當(dāng)中,與此同時(shí),消息人稱(chēng)蘋(píng)果為研發(fā)VR/AR產(chǎn)品收購(gòu)了多家專(zhuān)注于計(jì)算機(jī)視覺(jué)的公司。
Perceptio圖像識(shí)別
2015年10月,蘋(píng)果收購(gòu)圖像識(shí)別公司Perceptio,該公司的產(chǎn)品是開(kāi)發(fā)智能手機(jī)端的人工智能圖像分類(lèi)系統(tǒng),該系統(tǒng)的最大優(yōu)勢(shì)是無(wú)需大量外部數(shù)據(jù)進(jìn)行分類(lèi)。這符合蘋(píng)果的隱私保護(hù)策略,對(duì)用戶(hù)數(shù)據(jù)的利用最小化,并將盡可能多的技術(shù)放在手機(jī)端,而非云端。
Metaio計(jì)算機(jī)視覺(jué)
2015年5月蘋(píng)果收購(gòu)Metaio,Metaio專(zhuān)注于計(jì)算機(jī)視覺(jué)和增強(qiáng)現(xiàn)實(shí)的技術(shù)公司,其在計(jì)算機(jī)視覺(jué)尤其是人臉識(shí)別方向有著十幾年的研發(fā)經(jīng)驗(yàn)。
Polar Rose人臉識(shí)別
2011年12月,蘋(píng)果以2900萬(wàn)美元收購(gòu)瑞典人臉識(shí)別廠(chǎng)商Polar Rose。Polar Rose曾推出多個(gè)產(chǎn)品,包括針對(duì)網(wǎng)絡(luò)服務(wù)的面部識(shí)別技術(shù)FaceCloud,以及為手機(jī)添加功能性的FaceLib。其臉部識(shí)別軟件,通過(guò)臉部識(shí)別Polar Rose可以為用戶(hù)自動(dòng)圈出照片中的人臉。
Emollient 人臉識(shí)別
2016年1月Emollient被蘋(píng)果收入囊中,其可以通過(guò)臉部識(shí)別技術(shù)分析人類(lèi)的表情,從而判斷人的情緒。醫(yī)生也可以用他們公司的技術(shù)了解病人的表情是否痛苦,也可將這項(xiàng)技術(shù)應(yīng)用在監(jiān)視器,查看是否有“表情可疑”的人正在商品前面徘徊等等。
Flyby Media 計(jì)算機(jī)視覺(jué)
今年年初,蘋(píng)果悄悄買(mǎi)下Flyby Media,F(xiàn)lyby Media擁有尖端的計(jì)算機(jī)視覺(jué)技術(shù),此外其慣性傳感、同時(shí)定位和導(dǎo)航空間感知技術(shù)也深受蘋(píng)果喜愛(ài)。Flyby media曾與谷歌合作,利用計(jì)算機(jī)視覺(jué)技術(shù)幫助谷歌開(kāi)發(fā)Project Tango。Flyby Media可幫助系統(tǒng)看到和繪制其周?chē)h(huán)境地圖,對(duì)于無(wú)人駕駛汽車(chē)和增強(qiáng)現(xiàn)實(shí)技術(shù)來(lái)說(shuō)都必不可少。
人工智能這么火,蘋(píng)果怎么可能錯(cuò)過(guò)這個(gè)機(jī)會(huì),勢(shì)必會(huì)在人工智能領(lǐng)域占領(lǐng)一席之地!
評(píng)論