完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 大模型
以大模型作為基礎(chǔ)模型支撐AI產(chǎn)業(yè)應(yīng)用邏輯已經(jīng)被證明實(shí)用性,AI大模型為AI落地應(yīng)用提供了一種通用化的解決方案;各自各樣參數(shù)不一、面向不同行業(yè)、面向不同任務(wù)的“大模型”也陸續(xù)發(fā)布,大模型已經(jīng)成為整個(gè)AI 界追逐的寵兒,AI大模型有效果好、泛化性強(qiáng)、研發(fā)流程標(biāo)準(zhǔn)化程度高等特點(diǎn)。
文章:2922個(gè) 瀏覽:3706次 帖子:18個(gè)
圖解大模型訓(xùn)練之:Megatron源碼解讀2,模型并行
前文說過,用Megatron做分布式訓(xùn)練的開源大模型有很多,我們選用的是THUDM開源的CodeGeeX(代碼生成式大模型,類比于openAI Code...
圖解大模型系列之:Megatron源碼解讀1,分布式環(huán)境初始化
使用Megatron來訓(xùn)練gpt類大模型的項(xiàng)目有很多。在這個(gè)系列里,我選擇了由THUDM開發(fā)的CodeGeeX項(xiàng)目,它是gpt在代碼生成方向上的應(yīng)用,對...
基于Transformer做大模型預(yù)訓(xùn)練基本的并行范式
在之前的內(nèi)容中,我們已經(jīng)介紹過流水線并行、數(shù)據(jù)并行(DP,DDP和ZeRO)。 今天我們將要介紹最重要,也是目前基于Transformer做大模型預(yù)訓(xùn)練...
2023-05-31 標(biāo)簽:數(shù)據(jù)API模型 3253 0
AI大模型如何推動(dòng)服務(wù)器產(chǎn)業(yè)鏈需求
GPT-4 相比 GPT-3.5 具有四方面的能力提升:1) GPT-4 具有一定的多模態(tài)能力,能夠進(jìn)行圖文結(jié)合輸入的分析。
GTC 2023:短視頻多模態(tài)超大模型的場景應(yīng)用
快手科技圍繞提高模型計(jì)算效率和可部署開展技術(shù)攻關(guān),沉淀了一套通用的混合并行訓(xùn)練、壓縮、推理整體解決方案。
一個(gè)給NLP領(lǐng)域帶來革新的預(yù)訓(xùn)練語言大模型Bert
之前的文章和大家詳細(xì)的介紹了靜態(tài)的詞向量表示word2vec理論加實(shí)戰(zhàn),但是word2vec存在一個(gè)很大的問題,由于是靜態(tài)詞向量所以無法表示一詞多義,對...
2023-02-28 標(biāo)簽:GPTELMOSTransformer 7.9萬 0
與傳統(tǒng)機(jī)器學(xué)習(xí)相比,深度學(xué)習(xí)是從數(shù)據(jù)中學(xué)習(xí),而大模型則是通過使用大量的模型來訓(xùn)練數(shù)據(jù)。深度學(xué)習(xí)可以處理任何類型的數(shù)據(jù),例如圖片、文本等等;但是這些數(shù)據(jù)很...
2023-02-16 標(biāo)簽:人工智能模型機(jī)器學(xué)習(xí) 2290 0
有了Fine-tune-CoT方法,小模型也能做推理,完美逆襲大模型
如果給語言模型生成一些 prompting,它還向人們展示了其解決復(fù)雜任務(wù)的能力。標(biāo)準(zhǔn) prompting 方法,即為使用少樣本的問答對或零樣本的指令的...
隨著BERT、GPT等預(yù)訓(xùn)練模型取得成功,預(yù)訓(xùn)-微調(diào)范式已經(jīng)被運(yùn)用在自然語言處理、計(jì)算機(jī)視覺、多模態(tài)語言模型等多種場景,越來越多的預(yù)訓(xùn)練模型取得了優(yōu)異的效果。
如何充分挖掘預(yù)訓(xùn)練視覺-語言基礎(chǔ)大模型的更好零樣本學(xué)習(xí)能力
因此,合適的prompt對于模型的效果至關(guān)重要。大量研究表明,prompt的微小差別,可能會(huì)造成效果的巨大差異。研究者們就如何設(shè)計(jì)prompt做出了各種...
2022-10-19 標(biāo)簽:模型數(shù)據(jù)集Clip 1674 0
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺 | 無人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |