chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Meta推出Llama 2 免費開放商業(yè)和研究機構(gòu)使用

IEEE電氣電子工程師 ? 來源:IEEE電氣電子工程師 ? 2023-08-02 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,Meta推出了Llama 2,這是一個新的大型語言模型,參數(shù)高達700億。新的生成型人工智能系統(tǒng)代表了OpenAI的變化,但是幾乎沒有分享包括GPT-3/3.5和GPT-4在內(nèi)的大多數(shù)人工智能模型的細(xì)節(jié)。根據(jù)維基百科的數(shù)據(jù),Llama 2的發(fā)布包含了ChatGPT 3.5的40%的參數(shù),其中包括與微軟的重要合作。Redmond也不僅僅是一個名義上的合作伙伴,他最近宣布支持Azure和Windows中的Llama 2。與此同時,高通公司現(xiàn)在表示,它將與Llama 2一起加入LLM競爭,并公布了將Llama 2帶入智能手機中的計劃。

Meta方面在微軟的Inspire合作伙伴大會上宣布,將與包括微軟在內(nèi)的主要云計算服務(wù)提供商合作,推出新一代開源大模型Llama 2,并將該模型免費開放給商業(yè)和研究機構(gòu)使用。

這樣的發(fā)展意味著,無論來源如何,開源人工智能模型的能力和覆蓋范圍都將大幅擴大。

Llama 2: Fine-tuned and Ready to Chat

Perplexity.ai提供了一個令人印象深刻的多個Llama 2模型的免費在線演示。它的結(jié)果與包括ChatGPT和谷歌Bard在內(nèi)的當(dāng)今頂級聊天機器人具有競爭力。Llama 2快速生成干凈、自然的文本,盡管不太可能非常出彩,但易于閱讀和理解。Llama 2還可以生成通常理解的事實、生成代碼和求解數(shù)學(xué)方程。

與所有LLM一樣,Llama 2偶爾會產(chǎn)生不正確或不可用的答案,但Meta介紹Llama的論文聲稱,它在學(xué)術(shù)基準(zhǔn)方面與OpenAI的GPT 3.5不相上下,如MMLU(衡量LLM在57門STEM科目中的知識)和GSM8K(衡量LLM對數(shù)學(xué)的理解)。

Meta的研究人員部分是通過純粹的模型大小實現(xiàn)的 —— 但這只是故事的一半。根據(jù)Meta的論文,Llama 2使用了有監(jiān)督的微調(diào)、帶有人類反饋的強化學(xué)習(xí)和一種名為Ghost Attention(GAtt)的新技術(shù),該技術(shù)“能夠在多個回合中進行對話控制”。更簡單地說,GAtt幫助Llama在被要求在特定約束下工作時產(chǎn)生所需的結(jié)果,就像被要求“扮演”歷史人物時可能發(fā)生的那樣,或者在諸如架構(gòu)之類的特定主題的上下文中產(chǎn)生響應(yīng)。

25266d8c-3108-11ee-9e74-dac502259ad0.png

META

這些技術(shù)有助于Llama 2提供各種型號,相對于其尺寸,具有可靠的基準(zhǔn)性能。最大的模型Llama 2 70B(有700億個參數(shù))在所有基準(zhǔn)測試中表現(xiàn)最好,但Meta也提供Llama 27 B和Llama 13 B。

參數(shù)較少的變體性能不如Llama 2 70B,但它們足夠緊湊,可以在功能較弱的設(shè)備(如智能手機)上本地運行。領(lǐng)先的智能手機片上系統(tǒng)(SoC)生產(chǎn)商高通公司宣布與Meta合作,“從2024年開始”讓Llama 2在高通公司支持的智能手機上本地運行”。

高通公司營銷傳播專家Rodrigo Caruso Neves do Amaral表示:“我們能夠使用我們的軟件工具來編譯和優(yōu)化模型,特別是在我們的Hexagon處理器上運行。無論是對運行這些型號的公司,還是對有時必須為訪問這些應(yīng)用程序付費的消費者,在設(shè)備上運行所節(jié)省的能量都會產(chǎn)生巨大影響?!?/p>

Open Source Fits Where Closed Models Can’t

在智能手機上離線運行大型語言模型是封閉的人工智能模型(如OpenAI的GPT 3.5和谷歌的PaLM2)無法處理的。這不一定是由于技術(shù)限制(據(jù)推測,OpenAI和谷歌可以提供一種適合智能手機的模型),而是哲學(xué)上的分歧。OpenAI和谷歌提供LLM作為API。訪問API需要互聯(lián)網(wǎng)連接,客戶將根據(jù)使用情況收費。

相比之下,Llama 2的發(fā)布表示允許無限、免費的商業(yè)和學(xué)術(shù)使用。該許可并不符合開源計劃制定的所有標(biāo)準(zhǔn),因為該許可包括一項條款,要求允許將Llama 2用于“月活躍用戶超過7億”的“產(chǎn)品或服務(wù)”。然而,該條款僅適用于Meta最大的競爭對手,如OpenAI和谷歌。Meta的Llama 2模型已經(jīng)出現(xiàn)在HuggingFace的Open LLM排行榜上,截至7月24日星期一收盤,“Llama-2-70b-chat-hf”的延遲和吞吐量基準(zhǔn)排名第三。(截至發(fā)稿時,目前的頂級模型Stability AI的FreeWilly2實際上已經(jīng)基于Llama 2,但FreeWilly22使用不同的數(shù)據(jù)集對模型進行了微調(diào)。)

Srinivas認(rèn)為Llama 2的開源許可證是一個力量倍增器,為開發(fā)者和研究人員提供了一個根據(jù)他們的特定需求調(diào)整模型的機會?!耙粋€人可以啟動Llama 2的分支,專注于量化,另一個人可以開啟另一個Llama的分支關(guān)注于低階微調(diào),……其他人則可以將更大的模型提煉成更小的模型,從而加速進展?!?/p>

事實證明,這對瞄準(zhǔn)邊緣設(shè)備(如智能手機)的開發(fā)人員來說尤其重要。考慮到型號的大小,Llama 2 70B表現(xiàn)出色并不令人驚訝。但Llama 2的較小型號相對于其型號大小也排名良好。在Open LLM排行榜上,大多數(shù)表現(xiàn)優(yōu)于Llama 2的小型模型本身都是基于Meta之前的模型Llama。這表明,隨著開源社區(qū)的開發(fā)人員將他們的才能應(yīng)用到Llama 2中,Llama 2將在排行榜上名列前茅。

Srinivas說:“我認(rèn)為Llama 2 7B和Llama 2 13B已經(jīng)很令人興奮了……這只是一個開始。Meta推出了它,現(xiàn)在人們可以改進它。可以構(gòu)建其他框架和其他工程層,這賦予了每個人更多的權(quán)力。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1814

    文章

    49967

    瀏覽量

    263648
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3692

    瀏覽量

    51948
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1241

    瀏覽量

    9887

原文標(biāo)題:Meta推出Llama 2 免費開放商業(yè)和研究機構(gòu)使用

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Meta的AI慢性病,靠Manus能治嗎?

    Meta
    腦極體
    發(fā)布于 :2026年01月08日 16:58:02

    Keysight與新加坡研究機構(gòu)合作推進量子計算研究

    Keysight Technologies近日宣布,已與新加坡科技研究局、新加坡國立大學(xué)量子技術(shù)中心及南洋理工大學(xué)達成一項為期五年的合作協(xié)議,共同推進量子比特的設(shè)計、測量與控制研究,目的是應(yīng)對量子計算發(fā)展中的技術(shù)挑戰(zhàn)。
    的頭像 發(fā)表于 12-30 17:19 ?491次閱讀

    NVIDIA 推出 Nemotron 3 系列開放模型

    token 數(shù)。 ● Nemotron 通過先進的強化學(xué)習(xí)技術(shù)以及大規(guī)模并行多環(huán)境后訓(xùn)練,實現(xiàn)了卓越的準(zhǔn)確率。 ● NVIDIA 率先推出整套前沿的開放模型、訓(xùn)練數(shù)據(jù)集及強化學(xué)習(xí)環(huán)境與
    的頭像 發(fā)表于 12-16 09:27 ?523次閱讀
    NVIDIA <b class='flag-5'>推出</b> Nemotron 3 系列<b class='flag-5'>開放</b>模型

    NVIDIA Spectrum-X 以太網(wǎng)交換機助力 Meta 和 Oracle 加速網(wǎng)絡(luò)性能

    Facebook 開放交換系統(tǒng)平臺。 Oracle 采用 Spectrum-X 以太網(wǎng)交換機構(gòu)建十億瓦級(Giga-Scale)AI 超級計算機。 NVIDIA 宣布 Meta 和 Oracle 將升級為
    的頭像 發(fā)表于 10-14 10:26 ?1602次閱讀
    NVIDIA Spectrum-X 以太網(wǎng)交換機助力 <b class='flag-5'>Meta</b> 和 Oracle 加速網(wǎng)絡(luò)性能

    Meta重磅入局人形機器人,目標(biāo)打造“機器人界的安卓系統(tǒng)”

    在人工智能與虛擬現(xiàn)實領(lǐng)域深耕多年的Meta,正式將目光投向了人形機器人這一新興賽道。與特斯拉、波士頓動力等公司聚焦硬件研發(fā)不同,Meta選擇了一條差異化路徑:不做硬件制造商,而是打造開放的軟件平臺。
    的頭像 發(fā)表于 09-28 17:37 ?583次閱讀

    今日看點丨Meta 正式推出全新一代智能眼鏡;三星首次將光掩模生產(chǎn)外包

    Meta 正式推出全新一代智能眼鏡 Meta 正式推出全新一代智能眼鏡「Meta Ray-Ban Display」,并同步亮相創(chuàng)新交互設(shè)備「
    發(fā)表于 09-18 11:00 ?1387次閱讀

    蔚來榮獲國際權(quán)威機構(gòu)CAM獎項

    近日,國際權(quán)威研究機構(gòu)CAM德國汽車管理中心(Center of Automotive Management)公布其2025年度汽車創(chuàng)新研究暨汽車創(chuàng)新獎(AutomotiveINNOVATIONS Studies/Award 2025)的評選結(jié)果。
    的頭像 發(fā)表于 07-24 17:04 ?847次閱讀

    使用 NPU 插件對量化的 Llama 3.1 8b 模型進行推理時出現(xiàn)“從 __Int64 轉(zhuǎn)換為無符號 int 的錯誤”,怎么解決?

    安裝了 OpenVINO? GenAI 2024.4。 使用以下命令量化 Llama 3.1 8B 模型: optimum-cli export openvino -m meta-llama
    發(fā)表于 06-25 07:20

    續(xù)航翻倍+3K錄制,Meta最新AI運動眼鏡亮相

    (電子發(fā)燒友網(wǎng)綜合報道)6月20日,與全球知名眼鏡品牌依視路(EssilorLuxottica)合作,推出了一款全新的智能眼鏡——Oakley Meta HSTN。這款眼鏡起售價為399美元(約合
    的頭像 發(fā)表于 06-23 02:20 ?3685次閱讀
    續(xù)航翻倍+3K錄制,<b class='flag-5'>Meta</b>最新AI運動眼鏡亮相

    今日看點丨臺積電、Intel合資運營代工業(yè)務(wù);韓國計劃向當(dāng)?shù)仄囆袠I(yè)注入3萬億韓元援助

    1. Meta 發(fā)布人工智能新模型系列 Llama 4 ,首次采用“混合專家”架構(gòu) ? 當(dāng)?shù)貢r間周六(4月5日),美國科技巨頭Meta推出了其最強大的開源人工智能(AI)模型
    發(fā)表于 04-07 11:26 ?608次閱讀

    無法在OVMS上運行來自Meta的大型語言模型 (LLM),為什么?

    無法在 OVMS 上運行來自 Meta 的大型語言模型 (LLM),例如 LLaMa2。 從 OVMS GitHub* 存儲庫運行 llama_chat Python* Demo 時遇到錯誤。
    發(fā)表于 03-05 08:07

    國家超算互聯(lián)網(wǎng)免費開放3個月DeepSeek API接口

    2月11日晚,國家超算互聯(lián)網(wǎng)平臺正式推出“AI生態(tài)伙伴加速計劃”,旨在推動AI技術(shù)的快速發(fā)展與應(yīng)用。作為該計劃的重要組成部分,平臺決定免費開放DeepSeek API接口3個月,為AI
    的頭像 發(fā)表于 02-13 15:21 ?1188次閱讀

    Meta AI推出Brain2Qwerty:非侵入性大腦信號轉(zhuǎn)文本系統(tǒng)

    。 Brain2Qwerty系統(tǒng)主要依賴于非侵入性的技術(shù)手段來捕捉和解析大腦活動。具體而言,它結(jié)合了腦電圖(EEG)和腦磁圖(MEG)這兩種先進的神經(jīng)科學(xué)工具,以精確記錄志愿者在思考過程中的大腦信號。 在研究過程中,Meta A
    的頭像 發(fā)表于 02-11 13:37 ?983次閱讀

    Meta與UNESCO合作推動多語言AI發(fā)展

    Meta最近宣布了一項與聯(lián)合國教科文組織(UNESCO)合作的全新計劃——語言技術(shù)伙伴計劃。該計劃旨在收集多種語言的語音錄音和文字記錄,以推動未來開放可用的人工智能(AI)技術(shù)的發(fā)展,特別關(guān)注那些
    的頭像 發(fā)表于 02-08 11:04 ?973次閱讀

    Meta組建四大專研小組,深入探索DeepSeek模型

    近日,據(jù)報道,臉書母公司Meta為了提升其大模型Llama的性能,專門成立了四個研究小組,深入探索量化巨頭幻方量化旗下的國產(chǎn)大模型DeepSeek的工作原理。 據(jù)悉,Meta組建的這四
    的頭像 發(fā)表于 02-05 14:02 ?777次閱讀