欧美久久精品99这里只有精品,亚洲AV希岛爱理在线观看

大型語言模型(llm)是一種人工智能(AI)，在大量文本和代碼數(shù)據(jù)集上進(jìn)行訓(xùn)練。它們可以用于各種任務(wù)，包括生成文本、翻譯語言和編寫不同類型的創(chuàng)意內(nèi)容。

今年開始，人們對(duì)開源LLM越來越感興趣。這些模型是在開源許可下發(fā)布的，這意味著任何人都可以使用、修改和分發(fā)它們。這使得研究人員、開發(fā)人員和企業(yè)都可以嘗試LLM，并為它們開發(fā)新的應(yīng)用程序。使用開源llm有很多好處。首先它們通常比專業(yè)的LLM更價(jià)便宜。并且它們更加透明，這意味著研究人員可以研究它們是如何工作的以及它們是如何做出決定的。最主要的是它們更加靈活，可以針對(duì)不同的任務(wù)進(jìn)行定制。

本文總結(jié)了當(dāng)前可用的開源llm的全部（幾乎全部）列表，以及有關(guān)其許可選項(xiàng)和源代碼存儲(chǔ)庫(kù)的信息，希望對(duì)你有所幫助。

▎SAIL 7B
基于LLaMa的搜索增強(qiáng)
參數(shù)：7B
許可類型：GPL-3.0
發(fā)布日期：2023年5月
論文：SAIL — Search Augmented Instruction Learning

▎Guanaco
采用高效微調(diào)方法QLoRA發(fā)布的LLM模型
參數(shù)：65B
許可類型：MIT
發(fā)布日期：2023年5月
論文：QLoRA — Efficient Finetuning of Quantized LLMs

▎RMKV
與transformer的LLM性能相當(dāng)?shù)腞NN模型
參數(shù)：100M–14B
許可類型：Apache 2.0
發(fā)布日期：2023年5月
論文：Scaling RNN to 1.5B and Reach Transformer LM Performance

▎MPT-7B
MosaicML的基礎(chǔ)系列模型
參數(shù)：7B
許可類型：Apache 2.0
發(fā)布日期：2023年5月
論文：MPT-7B — A New Standard for Open-Source, Commercially Usable LLMs

▎OpenLLaMa
在RedPajama數(shù)據(jù)集上訓(xùn)練的Meta AI的LLaMA 7B的另一個(gè)開源復(fù)制。
參數(shù)：3,7B
許可類型：Apache 2.0
發(fā)布日期：2023年5月
論文：Meet OpenLLaMA — An Open-Source Reproduction of Meta AI’s LLaMA Large Language Model

▎RedPajama-INCITE
基于RedPajama數(shù)據(jù)集上訓(xùn)練的指令調(diào)整和聊天Pythia模型。
參數(shù)：3B, 7B
許可類型：Apache 2.0
發(fā)布日期：2023年5月
論文：RedPajama-INCITE family of models including base, instruction-tuned & chat models

▎h2oGPT
H2O的微調(diào)框架和文檔問答功能的聊天機(jī)器人UI
參數(shù)：12B,30B
許可類型：Apache 2.0
發(fā)布日期：2023年5月
論文：Building the World’s Best Open-Source Large Language Model：H2O.ai’s Journey

▎FastChat-T5
通過微調(diào)Flan-t5-xl對(duì)從ShareGPT收集的用戶共享對(duì)話進(jìn)行訓(xùn)練的聊天機(jī)器人
參數(shù)：3B
許可類型：Apache 2.0
發(fā)布日期：2023年4月
論文：FastChat-T5 — our compact and commercial-friendly chatbot!

▎GPT4All
用于訓(xùn)練和部署強(qiáng)大的定制llm的完整工具系統(tǒng)
參數(shù)：7–13B
許可類型：MIT
發(fā)布日期：2023年4月
論文：GPT4All：An ecosystem of open-source on-edge large language models.

▎MiniGPT-4
基于BLIP-2和Vicuna LLM的Visual LLM模型
參數(shù)：13B
許可類型：BSD-3-Clause
發(fā)布日期：2023年4月
論文：MiniGPT-4 — Enhancing Vision-Language Understanding withAdvanced Large Language Models

▎StableLM
StableLM的LLM模型系列
參數(shù)：7B
許可類型：CC BY-NC-SA-4.0
發(fā)布日期：2023年4月
論文：Stability AI Launches the First of its StableLM Suite of Language Models

▎BloomZ
通過多任務(wù)微調(diào)實(shí)現(xiàn)跨語言泛化
參數(shù)：176B
許可類型：Apache 2.0
發(fā)布日期：2023年4月
論文：Cross-lingual Generalization through Multitask Finetuning

▎Dolly
Pythia 12B LLM在Databricks ML平臺(tái)上訓(xùn)練的模型
參數(shù)：12B
許可類型：Apache 2.0
發(fā)布日期：2023年4月
論文：Free Dolly — Introducing the World’s First Truly Open Instruction-Tuned LLM

▎Baize Chatbot
基于LLaMa的開源聊天模型
參數(shù)：30B
許可類型：GPL-3.0 license
發(fā)布日期：2023年4月
論文：Baize — An Open-Source Chat Model with Parameter-Efficient Tuning on Self-Chat Data

▎ColossalChat
由ColossalAI開源發(fā)布的一個(gè)完整的RLHF流程訓(xùn)練的模型
參數(shù)：N/A
許可類型：Apache 2.0
發(fā)布日期：2023年4月
論文：ColossalChat — An Open-Source Solution for Cloning ChatGPT With a Complete RLHF Pipeline

▎Lit LLaMa
來自Lightning AI的LLaMA的開源實(shí)現(xiàn)
參數(shù)：13B
許可類型：Apache 2.0
發(fā)布日期：2023年4月
論文：Why We’re Building Lit-LLaMA

▎Cerebras-GPT
開放的，計(jì)算效率高的，大型語言模型
參數(shù)：111M-13B
許可類型：Apache 2.0
發(fā)布日期：2023年3月
論文：Cerebras-GPT — Open Compute-Optimal Language ModelsTrained on the Cerebras Wafer-Scale Cluster

▎Open Flamingo
Deepmind的Flamingo模型的開源實(shí)現(xiàn)
參數(shù)：9B
許可類型：MIT License
發(fā)布日期：2023年3月
論文：Openflamingo — An Open-source Framework For Training Vision-language Models With In-context Learning

▎Chat GLM
使用開放式雙語(中英文)雙向密集預(yù)訓(xùn)練模型
參數(shù)：6B-130B
許可類型：Apache 2.0
發(fā)布日期：2023年3月
論文：GLM-130B：An Open Bilingual Pre-trained Model

▎DLite
通過微調(diào)Alpaca數(shù)據(jù)集上最小的GPT-2模型
參數(shù)：124M
許可類型：Apache 2.0
發(fā)布日期：2023年3月
論文：Introducing DLite, a Lightweight ChatGPT-Like Model Based on Dolly

▎Alpaca 7B
描述：斯坦福大學(xué)發(fā)布的指令遵循LLaMA模型
參數(shù)：7B
許可類型：Apache 2.0
發(fā)布日期：2023年3月
論文：Alpaca — A Strong, Replicable Instruction-Following Model

▎Flan UL2
在預(yù)訓(xùn)練的UL2檢查點(diǎn)上訓(xùn)練Flan 20B模型。
參數(shù)：20B
許可類型：MIT License
發(fā)布日期：2023年3月
論文：A New Open Source Flan 20B with UL2

▎Flan-T5
T5在各種數(shù)據(jù)集上的指令微調(diào)，提高預(yù)訓(xùn)練語言模型的可用性
參數(shù)：60M–11B
許可類型：Apache 2.0
發(fā)布日期：2023年2月
論文：Scaling Instruction-Finetuned Language Models

總結(jié)

最后再補(bǔ)充2個(gè)剛剛發(fā)布的模型，一個(gè)是llama-2，這個(gè)我們文章也在前幾天介紹了微調(diào)和使用的方法。另外一個(gè)就是昨天剛看到的新聞，stabilityai發(fā)布的 FreeWilly2，它是在 Llama2 70B 上微調(diào)的結(jié)果，目前在open_llm_leaderboard上排第一。開源大型語言模型正在迅速發(fā)展，開源社區(qū)發(fā)布了許多模型。這些模型為開發(fā)人員、研究人員和愛好者提供了一個(gè)非常大機(jī)會(huì)，可以在沒有專有系統(tǒng)的情況下試驗(yàn)尖端的語言技術(shù)。隨著越來越多的組織和個(gè)人為這些模型的發(fā)展做出貢獻(xiàn)，我們可以期待看到更強(qiáng)大、更容易使用和更創(chuàng)新的語言模型，它們將塑造自然語言處理的未來。

作者：Manikanth

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

語言

語言

+關(guān)注

關(guān)注
1

文章
97

瀏覽量
24833
開源

開源

+關(guān)注

關(guān)注
3

文章
4203

瀏覽量
46110
模型

模型

+關(guān)注

關(guān)注
1

文章
3751

瀏覽量
52093

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

2023年發(fā)布的25個(gè)開源大型語言模型總結(jié)

評(píng)論