完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>
標簽 > llm
在人工智能領(lǐng)域,LLM代表“大型語言模型”。在人工智能(AI)領(lǐng)域自然語言處理(NLP)是一個快速進展的領(lǐng)域。NLP中最重要是大語言模型(LLM)。大語言模型(英文:Large Language Model,縮寫LLM),也稱大型語言模型,是一種基于機器學習和自然語言處理技術(shù)的模型。
文章:337個 瀏覽:1185次 帖子:3個
TensorRT-LLM的大規(guī)模專家并行架構(gòu)設(shè)計
之前文章已介紹引入大規(guī)模 EP 的初衷,本篇將繼續(xù)深入介紹 TensorRT-LLM 的大規(guī)模專家并行架構(gòu)設(shè)計與創(chuàng)新實現(xiàn)。
6TOPS算力驅(qū)動30億參數(shù)LLM,米爾RK3576部署端側(cè)多模態(tài)多輪對話
關(guān)鍵詞:瑞芯微RK3576、NPU(神經(jīng)網(wǎng)絡處理器)、端側(cè)小語言模型(SLM)、多模態(tài)LLM、邊緣AI部署、開發(fā)板當GPT-4o用毫秒級響應處理圖文混合...
DeepSeek R1 MTP在TensorRT-LLM中的實現(xiàn)與優(yōu)化
TensorRT-LLM 在 NVIDIA Blackwell GPU 上創(chuàng)下了 DeepSeek-R1 推理性能的世界紀錄,Multi-Token P...
在之前的技術(shù)博客中,我們介紹了低延遲[1] 和高吞吐[2] 場景的優(yōu)化方法。對于生產(chǎn)部署,用戶還關(guān)心在滿足特定延遲約束的情況下,每個 GPU 的吞吐表現(xiàn)...
RK3568自制底板狂丟包?教你5分鐘用Delayline一鍵復活網(wǎng)口
在使用飛凌嵌入式RK3568核心板搭配自制底板時,由于PCB走線與參考設(shè)計存在差異,常導致RGMII接口時序異常,進而出現(xiàn)網(wǎng)口不通或頻繁丟包的情況。本文...
NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀錄
本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在...
使用NVIDIA Triton和TensorRT-LLM部署TTS應用的最佳實踐
針對基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張...
LM Studio使用NVIDIA技術(shù)加速LLM性能
隨著 AI 使用場景不斷擴展(從文檔摘要到定制化軟件代理),開發(fā)者和技術(shù)愛好者正在尋求以更 快、更靈活的方式來運行大語言模型(LLM)。
在當今人工智能領(lǐng)域,大型語言模型(LLM)的開發(fā)已經(jīng)成為一個熱門話題。這些模型通過學習大量的文本數(shù)據(jù),能夠生成自然語言文本,完成各種復雜的任務,如寫作、...
樹莓派秒變編程助手:Ollama+Continue的簡易搭建教程!
以下是如何在RaspberryPi上運行大型語言模型(LLM)的方法。本文的目標是找出在RaspberryPi上運行LLM是否是ChatGPT和GitH...
2025-03-27 標簽:Raspberry Pi樹莓派LLM 414 0
基于DBFP與DB-Attn的算法硬件協(xié)同優(yōu)化方案
本文討論了LLM推理過程對計算資源需求急劇攀升的背景下,現(xiàn)有量化和剪枝技術(shù)、新數(shù)據(jù)格式存在的不足,提出動態(tài)塊浮點數(shù)(DBFP)及其配套算法-硬件協(xié)同框架...
內(nèi)部業(yè)務支撐&前瞻技術(shù)布局 One4All下一代生成式推薦系統(tǒng)
作者:京東零售 申磊 自LLM在自然語言處理等領(lǐng)域取得了矚目成就之后,學術(shù)界積極探索生成式模型對搜廣推系統(tǒng)的增強或改進方式[1],現(xiàn)有工作大體可以分為兩...
推薦系統(tǒng)的主要任務在于根據(jù)用戶的過往行為預測其潛在興趣點,并據(jù)此推薦相應的商品。在傳統(tǒng)的推薦系統(tǒng)中,當處理用戶請求時,會觸發(fā)多個召回模塊,例如熱門商品召...
2025-03-05 標簽:NVIDIA模型推薦系統(tǒng) 1.2k 0
用PaddleNLP在4060單卡上實踐大模型預訓練技術(shù)
作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 之前我們分享了《從零開始訓練一個大語言模型需要投資多少錢》,其中高昂的預訓練費用讓許多對大模型預訓練技術(shù)感興趣...
2025-02-19 標簽:數(shù)據(jù)集大模型LLM 1.8k 0
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
電機控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無刷電機 | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機 | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進電機 | SPWM | 充電樁 | IPM | 機器視覺 | 無人機 | 三菱電機 | ST |
伺服電機 | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |