chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開源大模型到底開源什么?源碼在哪呢?

OSC開源社區(qū) ? 來(lái)源:睡前機(jī)器學(xué)習(xí) ? 2023-04-11 09:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ChatGPT出來(lái)以后很多人都在說(shuō)開源,認(rèn)為只要OpenAI大發(fā)善心或者哪個(gè)高超的黑客黑進(jìn)服務(wù)器,把ChatGPT的源碼發(fā)出來(lái)放到網(wǎng)上,那么到不了第二天天亮,全世界就會(huì)人手一個(gè)ChatGPT。

這是一種常見(jiàn)的誤解。

開源字面意思是公開源代碼,過(guò)去我們通常是指公開某款軟件項(xiàng)目的源代碼。知名的譬如說(shuō)Linux操作系統(tǒng),準(zhǔn)確來(lái)說(shuō)是操作系統(tǒng)內(nèi)核,我們拿到Linux的源碼,只要搭建好相應(yīng)的編譯環(huán)境,就能在本地編譯一套一模一樣的操作系統(tǒng)內(nèi)核。

當(dāng)然,實(shí)際會(huì)復(fù)雜一點(diǎn),同一套源碼用不同方法編譯,運(yùn)行效率、資源占用等都可能不同。這里姑且不再細(xì)摳,總之,過(guò)去軟件開源給我們的印象就是,甭管什么閬苑仙葩,只要一開源就能人手一份,而且很快還會(huì)有各種換皮魔改,同人逼死官方。往好了說(shuō),這叫開源帶來(lái)澎湃力量。

但大語(yǔ)言模型的“開源”完全不是這么一回事。先別管OpenAI現(xiàn)在名叫鈕鈷祿氏·CloseAI,就算哪天良心發(fā)現(xiàn),真的要找回自己做一個(gè)名副其實(shí)的OpenAI,洗心革面把GPT-4給開源了。先別著急著高興,對(duì)于99%的人來(lái)說(shuō),GPT-4的源碼毫無(wú)意義,對(duì)于剩下的1%里的99%,可能也就蹭一些研究論文。只有最后剩下的1%里的1%才會(huì)有真正幫助,不過(guò),也只是有幫助,但不算很大。

為什么?原因不復(fù)雜,因?yàn)榇笳Z(yǔ)言模型的所謂開源,實(shí)際上是有三個(gè)對(duì)象。源碼只是其中之一。我不是針對(duì)誰(shuí),在座各位即使拿到了源碼,剩下能做的也就只有點(diǎn)贊鼓掌。

人工智能三要素,算法、算力和數(shù)據(jù)。也有人管最后叫算據(jù),不太確定這倆詞是不是互通??傊搅肆Υ箫w磚的大語(yǔ)言模型時(shí)代,這三要素就成了算法、高算力和大數(shù)據(jù)。只有同時(shí)滿足這三大要素,你才有可能最終得到一款和ChatGPT類似效果拔群的模型。

那么,源碼在哪呢?在算法。算法的核心部分主要包括有模型結(jié)構(gòu)和訓(xùn)練方法,這兩部分都有對(duì)應(yīng)的源碼。哪天OpenAI公開源碼,我們應(yīng)該就能看到的也就是模型結(jié)構(gòu)和訓(xùn)練方法兩部分。

當(dāng)然,這只是核心部分。一款人工智能產(chǎn)品,尤其是大型人工智能產(chǎn)品,還會(huì)有許多工程問(wèn)題需要解決,除了核心還需要其它配套部件。別看到“配套部件”就覺(jué)得沒(méi)什么。之前同樣是OpenAI,配套部件大概占九成。所以,別管它Open不Open吧,我們能看到的都是冰山一角。

拿到源碼之后,真正的挑戰(zhàn)才剛開始。接下來(lái)才是這個(gè)世界絕大多數(shù)人、研究機(jī)構(gòu)和企業(yè)注定無(wú)法邁過(guò)的門檻:高算力和大數(shù)據(jù)。

高算力已經(jīng)說(shuō)了很多了,門檻很高,但從全世界范圍來(lái)說(shuō),總歸有一些企業(yè)擠擠還是有的。不過(guò),大數(shù)據(jù)就未必了。

數(shù)據(jù)非常重要。無(wú)論是人工智能時(shí)代,還是人工智障時(shí)代,擴(kuò)大數(shù)據(jù)的規(guī)模、提高數(shù)據(jù)的質(zhì)量,通常都能顯著提高模型的最終表現(xiàn)。以前我們經(jīng)常自嘲,說(shuō)人工智能就是投入多少人工就產(chǎn)出多少智能,人工做什么呢?就是標(biāo)數(shù)據(jù)。

千萬(wàn)不要小看了標(biāo)數(shù)據(jù),這玩意費(fèi)人、費(fèi)錢,關(guān)鍵還費(fèi)時(shí)間。搞一個(gè)大模型已經(jīng)十分不易,搞一個(gè)能喂飽大模型的數(shù)據(jù)集更為困難。OpenAI這種光啟動(dòng)資金就10億刀的富二代企業(yè),標(biāo)數(shù)據(jù)照樣也得想辦法省錢,后來(lái)還出了一條新聞。

這里插個(gè)的陰謀論,ChatGPT的免費(fèi)用,換個(gè)角度看沒(méi)準(zhǔn)就成了我們給OpenAI免費(fèi)標(biāo)數(shù)據(jù)。有沒(méi)有依據(jù)?有。OpenAI官方明著說(shuō)了,你和ChatGPT的交互數(shù)據(jù)可能用于模型訓(xùn)練,要知道那可是一億多的用戶,那得生產(chǎn)多少高質(zhì)量的人工標(biāo)注數(shù)據(jù)。技術(shù)領(lǐng)先優(yōu)勢(shì)可以追趕,數(shù)據(jù)領(lǐng)先優(yōu)勢(shì)則就未必了。

好了,假設(shè)你七星聚頂,三大要素都湊齊了,接下來(lái)是不是就能煉出ChatGPT了呢?前面我們說(shuō)過(guò),“你才有可能最終得到一款和ChatGPT類似效果拔群的模型”。為什么是有可能?因?yàn)槟P陀?xùn)練和編譯源碼不太一樣,里面還包含一些難以言說(shuō)的玄學(xué)因素。我一直對(duì)Bard的表現(xiàn)耿耿于懷,百思不得其解,我懷疑谷歌可能就是栽倒在玄學(xué)因素上面。

那么,現(xiàn)在很多研究者在呼吁的開源,到底是要開源什么呢?開源模型,具體來(lái)說(shuō),是開源訓(xùn)練好的模型參數(shù)。模型參數(shù)拿到手,基本上就能完整復(fù)現(xiàn)能力了。當(dāng)然,這還是對(duì)于大企業(yè)、大機(jī)構(gòu)來(lái)說(shuō),運(yùn)行大語(yǔ)言模型雖然消耗的算力遠(yuǎn)不如訓(xùn)練,但也不是單卡就能負(fù)擔(dān)的。

何況,行話說(shuō)的“單卡運(yùn)行”,通常是指60G顯存往上。哥們那些打游戲的所謂高端顯卡,在這還沒(méi)夠上起步價(jià)。

最后多說(shuō)兩句開源。開源很重要,人工智能能有今天的進(jìn)步,開源功不可沒(méi)。人工智能的研究成果大概有幾種,首先就是論文。學(xué)術(shù)論文是要錢的,但是在人工智能領(lǐng)域,很多作者都免費(fèi)公開了論文。當(dāng)然,有些是論文,有些是名叫論文的文宣資料,通常倒數(shù)第三或者第四部分會(huì)放一些表格,表?yè)P(yáng)一下這次搞的模型在什么什么任務(wù)上面效果拔群,洋氣一點(diǎn),叫SOTA。

然后是源碼。源碼不是必選項(xiàng),有些研究者只發(fā)論文不發(fā)源碼,有一種原因是舍不得,覺(jué)得辛辛苦苦憋出來(lái)的成果不愿意簡(jiǎn)簡(jiǎn)單單就交給別人,當(dāng)然也有可能覺(jué)得寫得太爛丟不起人,或者在論文里吹太過(guò)了,擔(dān)心別人復(fù)效不了質(zhì)疑。

還有就是模型。前面說(shuō)過(guò),模型這玩意距離能力復(fù)現(xiàn)就一步之遙,有很多人愛(ài)開源模型,也有很多人不愛(ài)開源模型,原因和上面差不多,還有一種是大公司大機(jī)構(gòu)才敢用,官方辭令很多,譬如“出于社會(huì)責(zé)任考慮”,或者“安全倫理存在巨大風(fēng)險(xiǎn)”等等。

谷歌在21年就搞出了大語(yǔ)言模型LaMDA,說(shuō)技術(shù)過(guò)于先進(jìn)不便展示,害得我對(duì)著論文流了好多口水?,F(xiàn)在出來(lái)個(gè)Bard,還不如不展示。

這里為咱們的中文開源大語(yǔ)言模型打個(gè)Call吧,能講中文還開源的大語(yǔ)言模型真的不多,清華放出來(lái)的ChatGLM-6B應(yīng)該是佼佼者,而是真·單卡就能運(yùn)行。這里說(shuō)的是消費(fèi)級(jí)顯卡。

最后就是開源數(shù)據(jù)集了,這項(xiàng)工作很重要,但也很容易被圈外忽視?,F(xiàn)在中文大語(yǔ)言模型缺的東西很多,抱怨的也很多,還有一票人天天平替這個(gè)平替那個(gè),實(shí)在不知道怎么想。不過(guò),講屁話沒(méi)有用,已經(jīng)有一些開源項(xiàng)目開始做起來(lái),這都是星星之火。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Linux操作系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    54

    瀏覽量

    11793
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10113
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1598

    瀏覽量

    10297

原文標(biāo)題:開源大模型到底開源什么?

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    地平線正式開源HoloBrain VLA基座模型

    2月13日,地平線正式宣布其HoloBrain-0基座模型及框架全面開源。本次開源不僅包括HoloBrain-0核心算法,地平線同步開放完整基礎(chǔ)設(shè)施RoboOrchard。作為地平線機(jī)器人實(shí)驗(yàn)室
    的頭像 發(fā)表于 02-26 10:05 ?324次閱讀
    地平線正式<b class='flag-5'>開源</b>HoloBrain VLA基座<b class='flag-5'>模型</b>

    “明牌”對(duì)局,自變量開源模型超越pi0

    “明牌”對(duì)局,自變量開源模型超越pi0
    的頭像 發(fā)表于 01-10 12:00 ?5604次閱讀
    “明牌”對(duì)局,自變量<b class='flag-5'>開源</b><b class='flag-5'>模型</b>超越pi0

    C-小智開源版,可二次開發(fā)(WIN32)#小智AI #開源 #二次開發(fā)

    開源
    不太正經(jīng)的攻城獅
    發(fā)布于 :2026年01月04日 19:31:14

    0.7元/百萬(wàn)token碾壓競(jìng)品! 小米新開源模型,卷出AI普惠關(guān)鍵密碼

    的 Qwen-3均為當(dāng)前國(guó)產(chǎn)大模型中的代表性產(chǎn)品。在與DeepSeek V3.2、千問(wèn)Qwen-3對(duì)比當(dāng)中,小米開源模型到底有哪些優(yōu)勢(shì)和應(yīng)用價(jià)值?本文進(jìn)行詳細(xì)
    的頭像 發(fā)表于 12-21 07:52 ?1.1w次閱讀
    0.7元/百萬(wàn)token碾壓競(jìng)品! 小米新<b class='flag-5'>開源</b>大<b class='flag-5'>模型</b>,卷出AI普惠關(guān)鍵密碼

    進(jìn)迭時(shí)空 debug upstream | 取之于開源,貢獻(xiàn)于開源

    。Debug相關(guān)軟件項(xiàng)目概覽RISC-V調(diào)試所涉及的核心開源軟件主要包括GDB和OpenOCD。GDB(GNUDebugger)是GNU項(xiàng)目下的功能強(qiáng)大的源碼級(jí)調(diào)
    的頭像 發(fā)表于 11-17 09:33 ?5475次閱讀
    進(jìn)迭時(shí)空 debug upstream | 取之于<b class='flag-5'>開源</b>,貢獻(xiàn)于<b class='flag-5'>開源</b>

    NVIDIA開源Audio2Face模型及SDK

    NVIDIA 現(xiàn)已開源 Audio2Face 模型與 SDK,讓所有游戲和 3D 應(yīng)用開發(fā)者都可以構(gòu)建并部署帶有先進(jìn)動(dòng)畫的高精度角色。NVIDIA 開源 Audio2Face 的訓(xùn)練框架,任何人都可以針對(duì)特定用例對(duì)現(xiàn)有
    的頭像 發(fā)表于 10-21 11:11 ?833次閱讀
    NVIDIA<b class='flag-5'>開源</b>Audio2Face<b class='flag-5'>模型</b>及SDK

    開源鴻蒙MNN AI應(yīng)用開發(fā)與MNN移植經(jīng)驗(yàn)

    本期內(nèi)容由AI Model SIG提供,介紹了在開源鴻蒙中,利用MNN開源框架開發(fā)AI應(yīng)用以及基于MNN源碼編譯與Har包封裝的方法。
    的頭像 發(fā)表于 09-04 11:31 ?4596次閱讀
    <b class='flag-5'>開源</b>鴻蒙MNN AI應(yīng)用開發(fā)與MNN移植經(jīng)驗(yàn)

    【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】3、開源大語(yǔ)言模型部署

    1、ollama平臺(tái)搭建 ollama可以快速地部署開源模型,網(wǎng)址為https://ollama.com, 試用該平臺(tái),可以在多平臺(tái)上部署 Deepseek-R1, Qwen3, Llama
    發(fā)表于 07-19 15:45

    瑞金醫(yī)院攜手華為開源RuiPath病理模型

    近日,由上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院(以下簡(jiǎn)稱“瑞金醫(yī)院”)主辦、華為技術(shù)有限公司協(xié)辦的“瑞金醫(yī)院RuiPath病理模型開源及成果發(fā)布會(huì)”在上海舉行。瑞金醫(yī)院聯(lián)合華為開源RuiPath病理
    的頭像 發(fā)表于 07-02 14:57 ?1006次閱讀

    華為正式開源盤古7B稠密和72B混合專家模型

    [中國(guó),深圳,2025年6月30日] 今日,華為正式宣布開源盤古70億參數(shù)的稠密模型、盤古Pro MoE 720億參數(shù)的混合專家模型和基于昇騰的模型推理技術(shù)。 此舉是華為踐行昇騰生態(tài)戰(zhàn)
    的頭像 發(fā)表于 06-30 11:19 ?1343次閱讀

    上新:小米首個(gè)推理大模型開源 馬斯克:下周推出Grok 3.5

    似乎國(guó)內(nèi)外AI競(jìng)爭(zhēng)日趨白熱化,就在阿里巴巴發(fā)布Qwen3(通義千問(wèn)3)之后,引發(fā)業(yè)界廣泛關(guān)注;很多大廠在跟進(jìn),大模型不斷上新: 阿里巴巴開源新一代通義千問(wèn)模型Qwen3 4月29日凌晨4點(diǎn),阿里巴巴
    的頭像 發(fā)表于 04-30 16:08 ?1346次閱讀

    請(qǐng)問(wèn)下,openharmony支持哪一款龍芯的開發(fā)板?有沒(méi)有開源的龍芯的openharmony源碼?

    想買個(gè)2k0300的開發(fā)板學(xué)習(xí)龍芯和openharmony,愣是沒(méi)有看到提供openharmony源碼的,也沒(méi)與看到開源的代碼。gitee上,openharmony的龍芯sig倉(cāng)庫(kù)也是關(guān)閉的,有沒(méi)有人知道現(xiàn)在是什么情況?
    發(fā)表于 04-26 13:06

    NVIDIA Isaac GR00T N1開源人形機(jī)器人基礎(chǔ)模型+開源物理引擎Newton加速機(jī)器人開發(fā)

    NVIDIA Isaac GR00T N1開源人形機(jī)器人基礎(chǔ)模型+開源物理引擎Newton加速機(jī)器人開發(fā)
    的頭像 發(fā)表于 03-20 16:56 ?1736次閱讀

    英偉達(dá)GROOT N1 全球首個(gè)開源人形機(jī)器人基礎(chǔ)模型

    英偉達(dá)GROOT N1 全球首個(gè)開源人形機(jī)器人基礎(chǔ)大模型
    的頭像 發(fā)表于 03-20 11:05 ?2155次閱讀