chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一套開源的大型語言模型(LLM)—— StableLM

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2023-04-24 10:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Stability AI 是 Stable Diffusion 圖像生成工具背后的公司,如今他們不再局限于開發(fā)圖像 / 視頻生成方面的 AI,于今天正式發(fā)布了一套開源的大型語言模型(LLM)—— StableLM,首次涉足目前由 OpenAI、Meta 和 Google 等科技公司主導的語言模型領域。

StableLM 跟 ChatGPT、Bard 這些一樣,被設計用來生成文本和代碼。它是通過使用開源數(shù)據(jù)集 the Pile 訓練而來的,這個數(shù)據(jù)集包含的數(shù)據(jù)來源就有維基百科、Stack Exchange 和 PubMed。不過,Stability AI 在 the Pile 的基礎上進行了擴展,所使用的數(shù)據(jù)集大小是標準 the Pile 的 3 倍。

Stability AI 現(xiàn)在已經(jīng)將這個 StableLM 模型發(fā)布到了 GitHub 上,開發(fā)者可以使用或經(jīng)過調整后再使用。StableLM 模型還處于 Alpha 階段,它的參數(shù)也比較少,只有 30 億和 70 億個參數(shù),之后他們還會推出有 150 億到 650 億參數(shù)的模型。

e9cfbea8-df9c-11ed-bfe3-dac502259ad0.png

對于 AI 可能會產生的風險,Stability AI 也給出了提醒:

對于任何沒有額外微調和強化學習的預訓練大型語言模型來說,用戶得到的回應質量可能參差不齊,并且可能包括冒犯性的語言和觀點。這有望隨著規(guī)模、更好的數(shù)據(jù)、社區(qū)反饋和優(yōu)化而得到改善。

e9ff4f24-df9c-11ed-bfe3-dac502259ad0.jpg

除了將代碼托管在 GitHub 上,Stability AI 還在 Hugging Face 上發(fā)布了一個演示版本,經(jīng)過測試 StableLM 會說中文,但只會一點點(回復內容對應不上,語句也不通順)。

ea1836ba-df9c-11ed-bfe3-dac502259ad0.png

在 Stable Diffusion 發(fā)布后,Stability AI 遭到了很多藝術家的投訴和起訴,指控它通過使用網(wǎng)絡抓取的受版權保護的圖像開發(fā) AI 圖像生成工具,侵犯了藝術家們的權利。在之前的糾紛還沒解決的情況下,如今推出 StableLM 不知道是否還會引發(fā)更多的訴訟。

Stability AI 在去年 10 月融資了 1 億美元,公司估值也超過了 10 億美元。但 AI 是一個投入非常高,可能短期也很難產生收益的領域,也不知道這 1 億美金現(xiàn)在還剩多少,為了在這個領域持續(xù)發(fā)展,Stability AI 會不會繼續(xù)融資,亦或是投入某個大型公司的懷抱呢?

項目地址:https://github.com/Stability-AI/StableLM

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語言模型
    +關注

    關注

    0

    文章

    570

    瀏覽量

    11255
  • 數(shù)據(jù)集

    關注

    4

    文章

    1230

    瀏覽量

    26047
  • GitHub
    +關注

    關注

    3

    文章

    484

    瀏覽量

    18425
  • LLM
    LLM
    +關注

    關注

    1

    文章

    340

    瀏覽量

    1257

原文標題:AI作畫鼻祖Stability AI推出大型語言模型,會一點點中文

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    廣和通發(fā)布端側情感對話大模型FiboEmo-LLM

    9月,廣和通正式發(fā)布自主研發(fā)的端側情感對話大模型FiboEmo-LLM。該模型專注于情感計算與自然語言交互融合,致力于為AI玩具、智能陪伴設備等終端場景提供“情感理解-情感響應”
    的頭像 發(fā)表于 09-26 13:37 ?1606次閱讀

    米爾RK3576部署端側多模態(tài)多輪對話,6TOPS算力驅動30億參數(shù)LLM

    加載 → 圖片預處理 → 用戶交互 → 推理輸出”的核心流程,支持圖文體的多模態(tài)對話,適配多輪問答、視覺問答等典型場景。 具體運行機制可拆解為以下步驟:1. 模型初始化首先加載大語言模型
    發(fā)表于 09-05 17:25

    3萬字長文!深度解析大語言模型LLM原理

    我們正在參加全球電子成就獎的評選,歡迎大家?guī)臀覀兺镀薄x謝支持本文轉自:騰訊技術工程作者:royceshao大語言模型LLM的精妙之處在于很好地利用數(shù)學解決了工業(yè)場景的問題,筆者基于過往工程經(jīng)驗
    的頭像 發(fā)表于 09-02 13:34 ?3090次閱讀
    3萬字長文!深度解析大<b class='flag-5'>語言</b><b class='flag-5'>模型</b><b class='flag-5'>LLM</b>原理

    如何在NVIDIA Blackwell GPU上優(yōu)化DeepSeek R1吞吐量

    開源 DeepSeek R1 模型的創(chuàng)新架構包含多頭潛在注意力機制 (MLA) 和大型稀疏混合專家模型 (MoE),其顯著提升了大語言
    的頭像 發(fā)表于 08-12 15:19 ?3821次閱讀
    如何在NVIDIA Blackwell GPU上優(yōu)化DeepSeek R1吞吐量

    如何在魔搭社區(qū)使用TensorRT-LLM加速優(yōu)化Qwen3系列模型推理部署

    TensorRT-LLM 作為 NVIDIA 專為 LLM 推理部署加速優(yōu)化的開源庫,可幫助開發(fā)者快速利用最新 LLM 完成應用原型驗證與產品部署。
    的頭像 發(fā)表于 07-04 14:38 ?1758次閱讀

    小白學大模型:從零實現(xiàn) LLM語言模型

    在當今人工智能領域,大型語言模型LLM)的開發(fā)已經(jīng)成為個熱門話題。這些模型通過學習大量的文本
    的頭像 發(fā)表于 04-30 18:34 ?1066次閱讀
    小白學大<b class='flag-5'>模型</b>:從零實現(xiàn) <b class='flag-5'>LLM</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>

    詳解 LLM 推理模型的現(xiàn)狀

    2025年,如何提升大型語言模型LLM)的推理能力成了最熱門的話題之,大量優(yōu)化推理能力的新策略開始出現(xiàn),包括擴展推理時間計算、運用強化學
    的頭像 發(fā)表于 04-03 12:09 ?1249次閱讀
    詳解 <b class='flag-5'>LLM</b> 推理<b class='flag-5'>模型</b>的現(xiàn)狀

    新品 | Module LLM Kit,離線大語言模型推理模塊套裝

    推理與數(shù)據(jù)交互需求。ModuleLLM是款集成化的離線大語言模型(LLM)推理模塊,專為需要高效、智能交互的終端設備設計。Module13.2LLMMate模塊
    的頭像 發(fā)表于 03-28 18:49 ?895次閱讀
    新品 | Module <b class='flag-5'>LLM</b> Kit,離線大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>推理模塊套裝

    無法在OVMS上運行來自Meta的大型語言模型LLM),為什么?

    無法在 OVMS 上運行來自 Meta 的大型語言模型LLM),例如 LLaMa2。 從 OVMS GitHub* 存儲庫運行 llama_chat Python* Demo 時
    發(fā)表于 03-05 08:07

    語言模型在軍事應用中的安全性考量

    大型語言模型LLM)(如 ChatGPT、Claude 和 Meta AI)的出現(xiàn)是迄今為止人工智能領域最重大的進步。這項新技術也帶來了新風險。眾所周知的例子包括偏見、幻覺、知識產權
    的頭像 發(fā)表于 02-09 10:30 ?760次閱讀

    新品| LLM630 Compute Kit,AI 大語言模型推理開發(fā)平臺

    LLM630LLM推理,視覺識別,可開發(fā),靈活擴展···LLM630ComputeKit是款AI大語言模型推理開發(fā)平臺,專為邊緣計算和智能
    的頭像 發(fā)表于 01-17 18:48 ?1205次閱讀
    新品| <b class='flag-5'>LLM</b>630 Compute Kit,AI 大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>推理開發(fā)平臺

    如何使用Java語言快速開發(fā)一套智慧工地系統(tǒng)(源碼)

    使用Java語言快速開發(fā)一套智慧工地系統(tǒng),可以遵循以下步驟和策略: 1、確定系統(tǒng)架構 微服務架構:采用Spring Cloud構建微服務,每個服務負責個特定的功能模塊,如安全監(jiān)控、人員管理等,提高
    的頭像 發(fā)表于 01-09 17:39 ?1017次閱讀

    小白學大模型:構建LLM的關鍵步驟

    隨著大規(guī)模語言模型LLM)在性能、成本和應用前景上的快速發(fā)展,越來越多的團隊開始探索如何自主訓練LLM模型。然而,是否從零開始訓練
    的頭像 發(fā)表于 01-09 12:12 ?1556次閱讀
    小白學大<b class='flag-5'>模型</b>:構建<b class='flag-5'>LLM</b>的關鍵步驟

    在NVIDIA TensorRT-LLM中啟用ReDrafter的些變化

    Recurrent Drafting (簡稱 ReDrafter) 是蘋果公司為大語言模型 (LLM) 推理開發(fā)并開源種新型推測解碼技術
    的頭像 發(fā)表于 12-25 17:31 ?1240次閱讀
    在NVIDIA TensorRT-<b class='flag-5'>LLM</b>中啟用ReDrafter的<b class='flag-5'>一</b>些變化

    NaVILA:加州大學與英偉達聯(lián)合發(fā)布新型視覺語言模型

    (VLM)是種具備多模態(tài)生成能力的先進AI模型。它能夠智能地處理文本、圖像以及視頻等多種提示,并通過復雜的推理過程,實現(xiàn)對這些信息的準確理解和應用。NaVILA正是基于這原理,通過將大型
    的頭像 發(fā)表于 12-13 10:51 ?960次閱讀