騰訊發(fā)布開源MoE大語言模型Hunyuan-Large

近日，騰訊公司宣布成功推出業(yè)界領先的開源MoE(Mixture of Experts，專家混合)大語言模型——Hunyuan-Large。這款模型不僅在參數(shù)量上刷新了業(yè)界紀錄，更在效果上展現(xiàn)出了卓越的性能，標志著騰訊在自然語言處理領域邁出了重要的一步。

據(jù)了解，Hunyuan-Large的總參數(shù)量高達389B(即3890億)，這一數(shù)字遠超當前許多主流的大語言模型。而其激活參數(shù)也達到了驚人的52B(即520億)，這意味著模型在處理復雜任務時能夠展現(xiàn)出更強的學習能力和泛化性能。

除了參數(shù)量上的優(yōu)勢，Hunyuan-Large在訓練數(shù)據(jù)上也下足了功夫。據(jù)悉，該模型訓練時所使用的token數(shù)量達到了7T(即7萬億)，這確保了模型能夠充分學習到語言的多樣性和復雜性。同時，Hunyuan-Large還支持最大上下文長度為256K的文本輸入，這一特性使得模型在處理長文本或?qū)υ拡鼍皶r能夠更準確地捕捉上下文信息，從而生成更加連貫和自然的回復。

騰訊此次推出的Hunyuan-Large大語言模型，不僅展示了其在人工智能領域的深厚技術(shù)積累，也為整個自然語言處理領域的發(fā)展注入了新的活力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

人工智能

人工智能

+關注

關注
1813

文章
49694

瀏覽量
261069
騰訊

騰訊

+關注

關注
7

文章
1682

瀏覽量
50763
語言模型

語言模型

+關注

關注
0

文章
570

瀏覽量
11246
自然語言

自然語言

+關注

關注
1

文章
292

瀏覽量
13906

科技綠洲
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 羅氏線圈電流傳感器的工作原理、結(jié)構(gòu)特點及應用
Hot 羅氏線圈電流傳感器的工作原理及特點

New ?ADC122S655 雙通道12位同步采樣模數(shù)轉(zhuǎn)換器技術(shù)文檔總結(jié)
New ?ADC122S625 雙通道12位同步采樣模數(shù)轉(zhuǎn)換器技術(shù)規(guī)格總結(jié)

精選推薦
更多

文章

資料

帖子

硬核聯(lián)動|合眾恒躍攜手RK3562，以中國芯賦能板卡新生態(tài)

合眾恒躍
23小時前

1947 閱讀

瑞薩RA系列MCU中的DMAC和DTC關鍵特性對比

瑞薩嵌入式小百科
1天前

1453 閱讀

高低溫環(huán)境試驗的詳細介紹：嵌入式核心板/開發(fā)板/工控機如何經(jīng)受考驗？

飛凌嵌入式
1天前

1518 閱讀

瑞薩RA系列MCU中的DTC模塊框圖分析

瑞薩嵌入式小百科
1天前

1564 閱讀

手把手帶你玩轉(zhuǎn)智能模型——RT-Thread×富瀚微FH8626V300L初級智能案例實戰(zhàn) | 技術(shù)集結(jié)

RT-Thread官方賬號
1天前

1500 閱讀

從實驗室到工廠，模型部署中幾個重要問題

Hx
407KB

1積分

0下載

DRV8711調(diào)試詳細數(shù)據(jù)分析說明

0.62 MB

免費

148下載

WeDPR即時可用場景式隱私保護高效解決方案

陳麗
0.16 MB

免費

0下載

PatrickStar分布式深度學習訓練工具

賈小龍
0.81 MB

2積分

1下載

PCBbot:一種完全由PCB制成的智能機器狗

生龍活虎3
0.12 MB

2積分

1下載

【CIE全國RISC-V創(chuàng)新應用大賽】MUSE PI PRO 測評

jf_04803658
1天前

359 閱讀

【飛凌OK153-S開發(fā)板評測】系統(tǒng)實時性及codesys測試

jf_66795068
1天前

586 閱讀

NVMe高速傳輸之擺脫XDMA設計49：主要功能測試結(jié)果與分析1

xianuser2012
1天前

687 閱讀

【實測分享】智能顯示模塊圖片亂碼 / 模糊？用聯(lián)發(fā)科 MTK 芯片方案避坑！

jf_19001085
2天前

646 閱讀

5V供電情況下JFET前級放大電路怎么實現(xiàn)，JFET能不能先將信號放大到2-3mv,然后在用單運放進行1000倍左右放大？

jf_99500721
2天前

987 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

騰訊發(fā)布開源MoE大語言模型Hunyuan-Large

評論