英偉達(dá)公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,這個(gè)AI大模型是源自 Meta 公司的 Llama-3.1-70B大模型,基于使用了神經(jīng)架構(gòu)搜索(NAS)方法,推理速度比原70B大模型提升2.2倍,具備更準(zhǔn)確和更高效的運(yùn)算效率;能夠大幅降低運(yùn)行成本。
通過NAS技術(shù)微調(diào);大幅降低了內(nèi)存消耗、計(jì)算復(fù)雜性;Llama-3.1-Nemotron-51B AI 模型在單個(gè)H100 GPU上的表現(xiàn)非常優(yōu)秀,在推理過程中可以在單個(gè) GPU 上運(yùn)行 4 倍以上的工作負(fù)載。這使得單片H100 GPU即可處理更大型的推理任務(wù);這無疑是顯著的降低了訓(xùn)練成本。這為AI提供了高效、經(jīng)濟(jì)的方案。
-
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4015瀏覽量
96806 -
AI大模型
+關(guān)注
關(guān)注
0文章
391瀏覽量
892
發(fā)布評(píng)論請(qǐng)先 登錄
使用 NPU 插件對(duì)量化的 Llama 3.1 8b 模型進(jìn)行推理時(shí)出現(xiàn)“從 __Int64 轉(zhuǎn)換為無符號(hào) int 的錯(cuò)誤”,怎么解決?
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
英偉達(dá)Cosmos-Reason1 模型深度解讀
NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)

K1 AI CPU基于llama.cpp與Ollama的大模型部署實(shí)踐

IBM在watsonx.ai平臺(tái)推出DeepSeek R1蒸餾模型
在算力魔方上本地部署Phi-4模型

英偉達(dá)發(fā)布Nemotron-CC大型AI訓(xùn)練數(shù)據(jù)庫
NVIDIA推出開放式Llama Nemotron系列模型
英偉達(dá)發(fā)布Cosmos世界基礎(chǔ)模型
Meta重磅發(fā)布Llama 3.3 70B:開源AI模型的新里程碑

評(píng)論