chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出1.6萬億參數(shù)的人工智能語言模型,打破GPT-3記錄

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-01-18 17:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

古諺道:“熟讀唐詩三百首,不會作詩也會吟?!?這句話放在目前的人工智能語言模型中也非常適用。

此前,OpenAI 的研究人員開發(fā)出 “GPT-3”,這是一個(gè)由 1750 億個(gè)參數(shù)組成的 AI 語言模型,堪稱有史以來訓(xùn)練過的最大的語言模型,可以進(jìn)行原始類比、生成配方、甚至完成基本代碼編寫。

如今,這一記錄被打破了。近日,谷歌研究人員開發(fā)出一個(gè)新的語言模型,它包含了超過 1.6 萬億個(gè)參數(shù),這是迄今為止最大規(guī)模的人工智能語言模型,比之前谷歌開發(fā)的語言模型 T5-XXL 的規(guī)模大了 4 倍。

6735ad0e-584e-11eb-8b86-12bb97331649.png

參數(shù)是機(jī)器學(xué)習(xí)算法的關(guān)鍵所在,它們是從歷史訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到的模型的一部分。一般而言,在語言領(lǐng)域中參數(shù)的數(shù)量和復(fù)雜度之間的相關(guān)性非常好。這一點(diǎn)類似于 GPU晶體管的數(shù)量,在同樣的制程工藝下,晶體管越多其算力便越強(qiáng),而語言模型包含的參數(shù)愈多就愈接近人類自然語言。

正如研究人員在一篇論文中指出的那樣,大規(guī)模的訓(xùn)練是通向強(qiáng)大模型的有效途徑,在大數(shù)據(jù)集和參數(shù)計(jì)數(shù)的支持下,簡單的體系結(jié)構(gòu)遠(yuǎn)遠(yuǎn)超過了更復(fù)雜的算法。但是,有效的大規(guī)模培訓(xùn)在計(jì)算上非常密集。這就是為什么研究人員熱衷于他們所說的 “開關(guān)變壓器”,這是一種 “稀疏激活” 技術(shù),它只使用模型權(quán)重的一個(gè)子集或者在模型中轉(zhuǎn)換輸入數(shù)據(jù)的參數(shù)。

“開關(guān)變壓器” 是早在 90 年代初首次提出的一種人工智能模型范例,大體意思是將多個(gè)專家或?qū)iT處理不同任務(wù)的模型放在一個(gè)更大的模型中,并有一個(gè) “門控網(wǎng)絡(luò)” 來選擇為任何給定數(shù)據(jù)咨詢哪些專家。

在一項(xiàng)實(shí)驗(yàn)中,研究人員使用 32 個(gè) TPU 內(nèi)核對幾個(gè)不同的 “開關(guān)變壓器” 模型進(jìn)行了預(yù)訓(xùn)練,這些 TPU 內(nèi)核位于一個(gè)從 Reddit、Wikipedia 和其他網(wǎng)絡(luò)資源中搜集的 750GB 大小的文本數(shù)據(jù)語料庫中,任務(wù)則是讓這些模型預(yù)測段落中 15% 的單詞被遮住的缺失單詞,以及其他挑戰(zhàn),比如檢索文本來回答一系列越來越難的問題。

研究人員稱,包含了 1.6 萬億參數(shù)和 2048 名專家的模型 Switch-C 顯示 “完全沒有訓(xùn)練不穩(wěn)定性”。然而,在桑福德問答數(shù)據(jù)集的基準(zhǔn)測試中,Switch-C 的得分居然比僅包含 3950 億個(gè)參數(shù)和 64 名專家的模型 Switch-XXL 還要低一點(diǎn),對此,研究人員認(rèn)為是因?yàn)槲⒄{(diào)質(zhì)量、計(jì)算要求和參數(shù)數(shù)量之間的不透明關(guān)系所致。

在這種情況下,“開關(guān)變壓器” 導(dǎo)致了一些下游任務(wù)的收益。例如,研究人員稱在使用相同數(shù)量的計(jì)算資源的情況下,它可以使訓(xùn)練前的加速速度提高 7 倍以上。他們還證明 “稀疏激活” 技術(shù)可以用來創(chuàng)建更小、更密集的模型,這些模型可以對任務(wù)進(jìn)行微調(diào),其質(zhì)量增益為大型模型的 30%。

對此他們表示:雖然這項(xiàng)工作主要集中在超大模型上,但我們也發(fā)現(xiàn)只有兩名專家的模型可以提高性能,同時(shí)很容易適應(yīng)通用 GPU 或 TPU 的內(nèi)存限制。另外,通過將稀疏模型提取為稠密模型,可以實(shí)現(xiàn) 10 到 100 倍的壓縮率,同時(shí)獲得專家模型約 30% 的質(zhì)量增益。

在另一個(gè)測試中,“開關(guān)變壓器” 模型被訓(xùn)練在 100 多種不同語言之間進(jìn)行翻譯,研究人員觀察到 101 種語言的 “普遍改善”,91% 的語言受益于比基線模型快 4 倍以上的速度。未來,研究人員還計(jì)劃將 “開關(guān)變壓器” 應(yīng)用于新的領(lǐng)域,比如圖像和文本。他們認(rèn)為,模型稀疏性可以賦予優(yōu)勢,在一系列不同的媒體以及多模態(tài)模型。

美中不足的是,研究人員的工作沒有考慮到這些語言模型在現(xiàn)實(shí)世界中的影響,比如模型通常會放大一些公開數(shù)據(jù)中的偏見。對此,OpenAI 公司指出,這可能導(dǎo)致在女性代詞附近放置 “淘氣”;而在 “恐怖主義” 等詞附近放置 “伊斯蘭” 等。根據(jù)米德爾伯里國際研究所的說法,這種偏見可能被惡意行為者利用,通過散布錯(cuò)誤信息、造謠和謊言來煽動不和。

而路透社也曾報(bào)道稱,谷歌的研究人員現(xiàn)在被要求在研究人臉和情緒分析以及種族分類等話題之前,先咨詢法律、政策和公關(guān)團(tuán)隊(duì),性別或政治派別。

綜上所述,盡管谷歌訓(xùn)練的 1.6 萬億參數(shù)的人工智能語言模型還沒辦法做到真正意義上的人工智能,存在一些不足之處需要完善和優(yōu)化,但隨著在摩爾定律下電子設(shè)備算力的不斷提升,近些年 AI 語言模型參數(shù)量級呈指數(shù)倍發(fā)展,相信在不久的將來,或許真的會出現(xiàn)一個(gè)無限接近熟讀人類歷史所有文明記錄的超級模型,能夠和人類完全實(shí)現(xiàn)自然語言交流,不妨讓我們好好期待一下吧!

原文標(biāo)題:GPT-3記錄被打破!谷歌推出1.6萬億參數(shù)的人工智能語言模型

文章出處:【微信公眾號:DeepTech深科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6241

    瀏覽量

    110011
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49536

    瀏覽量

    259350

原文標(biāo)題:GPT-3記錄被打破!谷歌推出1.6萬億參數(shù)的人工智能語言模型

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    應(yīng)用場景。從數(shù)據(jù)采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實(shí)訓(xùn),讓你深度體驗(yàn)AI技術(shù)的魅力 。 四、九門課程全覆蓋,滿足多元學(xué)習(xí)需求 對于高校教學(xué)或者技術(shù)學(xué)習(xí)來說,課程覆蓋的廣度
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    應(yīng)用場景。從數(shù)據(jù)采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實(shí)訓(xùn),讓你深度體驗(yàn)AI技術(shù)的魅力 。 四、九門課程全覆蓋,滿足多元學(xué)習(xí)需求 對于高校教學(xué)或者技術(shù)學(xué)習(xí)來說,課程覆蓋的廣度
    發(fā)表于 08-07 14:23

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    人工智能技術(shù)的現(xiàn)狀與未來發(fā)展趨勢

    人工智能技術(shù)的現(xiàn)狀與未來發(fā)展趨勢 ? ? 近年來,人工智能(AI)技術(shù)迅猛發(fā)展,深刻影響著各行各業(yè)。從計(jì)算機(jī)視覺到自然語言處理,從自動駕駛到醫(yī)療診斷,AI的應(yīng)用場景不斷擴(kuò)展,推動社會向智能
    的頭像 發(fā)表于 07-16 15:01 ?870次閱讀

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能模型重塑教育與社會發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時(shí)代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的
    發(fā)表于 07-04 11:10

    如何借助大語言模型打造人工智能生態(tài)系統(tǒng)

    、硬件需求以及所涉及的財(cái)務(wù)影響這三者之間的內(nèi)在聯(lián)系。我們將深入探究現(xiàn)實(shí)中大語言模型的發(fā)展趨勢,并共同探討如何借助規(guī)模更小、效能更高的模型,打造一個(gè)更具可持續(xù)性的人工智能生態(tài)系統(tǒng)。
    的頭像 發(fā)表于 04-27 09:19 ?818次閱讀
    如何借助大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>打造<b class='flag-5'>人工智能</b>生態(tài)系統(tǒng)

    OpenAI即將推出GPT-5模型

    先進(jìn)技術(shù),其中包括備受矚目的o3工具。通過整合這些技術(shù),GPT-5模型將實(shí)現(xiàn)更加強(qiáng)大的功能和性能。 值得一提的是,GPT-5模型將被廣泛應(yīng)用
    的頭像 發(fā)表于 02-13 11:21 ?823次閱讀

    人工智能模型年度發(fā)展趨勢報(bào)告

    2024年12月的中央經(jīng)濟(jì)工作會議明確把開展“人工智能+”行動作為2025年要抓好的重點(diǎn)任務(wù)。當(dāng)前,以大模型為代表的人工智能正快速演進(jìn),激發(fā)全球科技之變、產(chǎn)業(yè)之變、時(shí)代之變,人工智能發(fā)
    的頭像 發(fā)表于 02-13 10:57 ?1297次閱讀
    <b class='flag-5'>人工智能</b>大<b class='flag-5'>模型</b>年度發(fā)展趨勢報(bào)告

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    與未來,涵蓋如基于行為的人工智能、生物啟發(fā)的進(jìn)化人工智能及認(rèn)知機(jī)器人技術(shù)的發(fā)展。這一歷史背景為隨后的大模型驅(qū)動的具身智能討論奠定了基礎(chǔ),隨著人工智能
    發(fā)表于 12-28 21:12

    Banana Pi 攜手 ArmSoM 推出人工智能加速 RK3576 CM5 計(jì)算模塊

    的機(jī)器學(xué)習(xí)和人工智能 (ML 和 AI) 工作負(fù)載,以及 Arm Mali G52-MC3 圖形處理器和支持 H.264/H.265/MJPEG 編碼和 H.265/H.265/VP9/AVI1/AVS2
    發(fā)表于 12-11 18:38

    語言模型開發(fā)語言是什么

    人工智能領(lǐng)域,大語言模型(Large Language Models, LLMs)背后,離不開高效的開發(fā)語言和工具的支持。下面,AI部落小編為您介紹大
    的頭像 發(fā)表于 12-04 11:44 ?948次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    、連接主義和深度學(xué)習(xí)等不同的階段。目前,人工智能已經(jīng)廣泛應(yīng)用于各種領(lǐng)域,如自然語言處理、計(jì)算機(jī)視覺、智能推薦等。 嵌入式系統(tǒng)和人工智能在許多方面都存在密切的關(guān)聯(lián)性。首先,嵌入式系統(tǒng)可
    發(fā)表于 11-14 16:39

    LLM技術(shù)對人工智能發(fā)展的影響

    隨著人工智能技術(shù)的飛速發(fā)展,大型語言模型(LLM)技術(shù)已經(jīng)成為推動AI領(lǐng)域進(jìn)步的關(guān)鍵力量。LLM技術(shù)通過深度學(xué)習(xí)和自然語言處理技術(shù),使得機(jī)器能夠理解和生成自然
    的頭像 發(fā)表于 11-08 09:28 ?2256次閱讀

    Llama 3GPT-4 比較

    隨著人工智能技術(shù)的飛速發(fā)展,我們見證了一代又一代的AI模型不斷突破界限,為各行各業(yè)帶來革命性的變化。在這場技術(shù)競賽中,Llama 3GPT-4作為兩個(gè)備受矚目的
    的頭像 發(fā)表于 10-27 14:17 ?1502次閱讀