資料介紹
整理 | 彎月 責(zé)編 | 鄭麗媛
出品 | CSDN(ID:CSDNnews)
根據(jù)最新的研究結(jié)果,訓(xùn)練一個(gè)普通的 AI 模型消耗的能源相當(dāng)于五輛汽車(chē)一生排放的碳總量,而 BERT 模型的碳排放量約為 1400 磅二氧化碳,這相當(dāng)于一個(gè)人來(lái)回坐飛機(jī)橫穿美國(guó)。為何 AI 模型會(huì)如此費(fèi)電,它們與傳統(tǒng)的數(shù)據(jù)中心計(jì)算有何不同?
訓(xùn)練效率低下
傳統(tǒng)數(shù)據(jù)中心負(fù)責(zé)處理的工作包括視頻流,電子郵件和社交媒體。AI 所需的計(jì)算量則更多,因?yàn)樗枰x取大量的數(shù)據(jù)、持續(xù)學(xué)習(xí),直到完成訓(xùn)練。
與人類(lèi)的學(xué)習(xí)方式相比,AI 的訓(xùn)練效率非常低下。現(xiàn)代 AI 使用人工神經(jīng)網(wǎng)絡(luò),這是模擬人腦神經(jīng)元的數(shù)學(xué)計(jì)算。每?jī)蓚€(gè)相鄰神經(jīng)元的連接強(qiáng)度都是神經(jīng)網(wǎng)絡(luò)上的一個(gè)參數(shù),名叫權(quán)重。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練則需要從隨機(jī)權(quán)重開(kāi)始,一遍遍地運(yùn)行和調(diào)整參數(shù),直到輸出與正確答案一致為止。
常見(jiàn)的一種訓(xùn)練語(yǔ)言神經(jīng)網(wǎng)絡(luò)的方法是,從維基百科和新聞媒體網(wǎng)站下載大量文本,然后把一些詞語(yǔ)遮擋起來(lái),并要求 AI 猜測(cè)被遮擋起來(lái)的詞語(yǔ)。剛開(kāi)始的時(shí)候,AI 會(huì)全部搞錯(cuò),但是,經(jīng)過(guò)不斷地調(diào)整后,AI 會(huì)逐漸學(xué)習(xí)數(shù)據(jù)中的模式,最終整個(gè)神經(jīng)網(wǎng)絡(luò)都會(huì)變得非常準(zhǔn)確。
相信你聽(tīng)說(shuō)過(guò) BERT 模型,基于變換器的雙向編碼器表示技術(shù)(Bidirectional Encoder Representations from Transformers,簡(jiǎn)稱(chēng) BERT),這是一項(xiàng)由 Google 提出的自然語(yǔ)言處理(NLP)的預(yù)訓(xùn)練技術(shù)。該模型使用了來(lái)自維基百科和其他文章的 33 億個(gè)單詞,而且在整個(gè)訓(xùn)練期間,BERT 讀取了該數(shù)據(jù)集 40 次。相比之下,一個(gè) 5 歲的孩子學(xué)說(shuō)話只需要聽(tīng)到 4500 萬(wàn)個(gè)單詞,比 BERT 少3000倍。
尋找最佳結(jié)構(gòu)
語(yǔ)言模型構(gòu)建成本如此之高的原因之一在于,在開(kāi)發(fā)模型期間,上述訓(xùn)練過(guò)程需要反復(fù)多次。因?yàn)檠芯咳藛T需要將神經(jīng)網(wǎng)絡(luò)調(diào)整到最優(yōu),即確定神經(jīng)元的個(gè)數(shù)、神經(jīng)元之間的連接數(shù)以及各個(gè)權(quán)重。他們需要反復(fù)嘗試很多組合,才能提高神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確度。相比之下,人類(lèi)的大腦不需要尋找最佳結(jié)構(gòu),經(jīng)過(guò)幾億年的進(jìn)化,人類(lèi)大腦已具備這種結(jié)構(gòu)。
隨著各大公司和學(xué)術(shù)界在 AI 領(lǐng)域的競(jìng)爭(zhēng)愈演愈烈,不斷提高技術(shù)水平的壓力也越來(lái)越大。在自動(dòng)翻譯等難度巨大的任務(wù)中,如果能將準(zhǔn)確度提高 1%,也將被視為重大的進(jìn)步,可以作為宣傳產(chǎn)品的籌碼。然而,為了獲得這 1% 的提升,研究人員需要嘗試成千上萬(wàn)的結(jié)構(gòu)來(lái)訓(xùn)練模型,直到找到最佳模型。
隨著模型不斷發(fā)展,模型的復(fù)雜度逐年攀高。另一款與 BERT 類(lèi)似的最新語(yǔ)言模型 GPT-2,其神經(jīng)網(wǎng)絡(luò)包含 15 億個(gè)權(quán)重。而 GPT-3 由于其高精度,引起了業(yè)界的轟動(dòng),但其權(quán)重高達(dá) 1750 億個(gè)。
此外,AI 模型的訓(xùn)練需要在專(zhuān)用硬件(例如圖形處理器)上進(jìn)行,這些硬件的功耗普遍高于傳統(tǒng) CPU。如果你的筆記本電腦加載了優(yōu)質(zhì)的顯卡,可以玩很多高端游戲,那么你肯定會(huì)注意到這臺(tái)機(jī)器產(chǎn)生的熱量也比普通電腦高很多。
所有這些都表明,開(kāi)發(fā)先進(jìn)的 AI 模型需要大量的碳排放量。除非我們能夠利用百分百可再生能源,否則真的懷疑 AI 的進(jìn)步與減少溫室氣體排放以及減緩氣候變化,孰重孰輕?是否真的可以功過(guò)相抵?
最后,開(kāi)發(fā) AI 的耗資如此巨大,能夠承擔(dān)得起各項(xiàng)費(fèi)用的公司與機(jī)構(gòu)實(shí)在少之又少,最終究竟應(yīng)該開(kāi)發(fā)哪種模型的決定權(quán)無(wú)疑也落到了這群人的手中。
AI 模型訓(xùn)練應(yīng)該適可而止
本文并不是要否定人工智能研究的未來(lái),只不過(guò)在訓(xùn)練 AI 模型的時(shí)候,我們需要采用更高效的方法,而且應(yīng)該做到適可而止。
隨著 AI 模型訓(xùn)練方法的效率提升,相信訓(xùn)練的成本也會(huì)下降。同時(shí),我們需要在訓(xùn)練模型的成本和使用模型的成本之間權(quán)衡取舍。例如,在 AI 模型準(zhǔn)確度到達(dá)一定高度后,每提升 1% 都需要付出巨大的精力,而實(shí)際得到的收益卻很少。不追求極致,更多地使用“適可而止”的模型,不僅可以降低碳排放量,而且也能為我們帶來(lái)更大獲益。
參考鏈接:https://levelup.gitconnected.com/test-driven-development-is-overrated-ad9f0491c11d
- 探索新潮流 — AI服務(wù)器引領(lǐng)數(shù)據(jù)中心的發(fā)展 363次下載
- 生成式AI對(duì)智能家居的影響 17次下載
- AI遇冷?2023從融資再看AI“芯”賽道? 2次下載
- ChatGPT:AI模型框架研究 9次下載
- 人工智能AI對(duì)碳中和的影響及發(fā)展導(dǎo)向.zip
- 【嵌入式AI入門(mén)日記】將 AI 模型移植到 RT-Thread 上(1)
- 從Buffer加載AI模型
- 基于終身機(jī)器學(xué)習(xí)的主題挖掘評(píng)分和評(píng)論推薦模型 42次下載
- AI概論:教師手冊(cè)(第1篇)活用創(chuàng)新模板學(xué) AI 0次下載
- AI概論:(Part_A)與AI智慧交流(教程) 0次下載
- HFSS 5個(gè)天線仿真實(shí)例模型資料免費(fèi)下載 224次下載
- 如何使用Python編寫(xiě)一個(gè)國(guó)際象棋AI程序 15次下載
- AI商業(yè)化需要思考那三個(gè)問(wèn)題? 5次下載
- BLE低功耗藍(lán)牙模塊為何如此受歡迎? 18次下載
- 為了解決變排量壓縮機(jī)
- AI大模型與小模型的優(yōu)缺點(diǎn) 3130次閱讀
- 如何用C++創(chuàng)建簡(jiǎn)單的生成式AI模型 953次閱讀
- AI大模型的發(fā)展歷程和應(yīng)用前景 1279次閱讀
- 生成式AI與神經(jīng)網(wǎng)絡(luò)模型的區(qū)別和聯(lián)系 871次閱讀
- 淺談AI模型在漂移檢測(cè)中的應(yīng)用 884次閱讀
- AI大模型網(wǎng)絡(luò)如何搭建 2608次閱讀
- ChatGPT背后的大模型技術(shù) 1499次閱讀
- AI愛(ài)克斯開(kāi)發(fā)板上使用OpenVINO加速YOLOv8目標(biāo)檢測(cè)模型 1282次閱讀
- 什么是預(yù)訓(xùn)練AI模型? 1082次閱讀
- 在AI愛(ài)克斯開(kāi)發(fā)板上用OpenVINO?加速YOLOv8目標(biāo)檢測(cè)模型 1358次閱讀
- 將數(shù)據(jù)預(yù)處理嵌入AI模型的常見(jiàn)技巧 1322次閱讀
- Buffer加載AI模型的步驟 2626次閱讀
- 過(guò)于謙虛好學(xué)的蘋(píng)果不配果粉的信仰 3145次閱讀
- 系統(tǒng)級(jí)ESD保護(hù)為什么重要?怎樣提高ESD保護(hù)的測(cè)試模型和戰(zhàn)略? 8172次閱讀
- 從狹義AI邁向廣義AI之路還要挑戰(zhàn)的5個(gè)方面詳細(xì)資料概述 3101次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1491次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 95次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說(shuō)明
- 4.28 MB | 18次下載 | 4 積分
- 5開(kāi)關(guān)電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費(fèi)
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于單片機(jī)和 SG3525的程控開(kāi)關(guān)電源設(shè)計(jì)
- 0.23 MB | 4次下載 | 免費(fèi)
- 8基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專(zhuān)業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537793次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論