chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型引發(fā)技術(shù)變革, AI芯片公司面臨新挑戰(zhàn)

智能計(jì)算芯世界 ? 來(lái)源:機(jī)器之心 ? 2023-05-04 09:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ChatGPT 在全球范圍內(nèi)掀起了一場(chǎng)技術(shù)革命與商業(yè)浪潮,AI 市場(chǎng)也迎來(lái)了前所未有的機(jī)遇與增量。

當(dāng)前,AI 基礎(chǔ)設(shè)施的算力、算法呈現(xiàn)新 “摩爾定律”:相同算力下能訓(xùn)練生產(chǎn)更優(yōu)質(zhì)的模型,同時(shí)最先進(jìn)的 AI 模型約每幾個(gè)月算力需求就會(huì)擴(kuò)大一倍。

14d12908-e8b6-11ed-ab56-dac502259ad0.png

根據(jù)斯坦福大學(xué)和麥肯錫聯(lián)合發(fā)布的《2019 人工智能指數(shù)報(bào)告》,2012 年之前最先進(jìn) AI 模型計(jì)算量每?jī)赡攴槐叮?012 年之后計(jì)算量每 3.4 個(gè)月翻一番,從 2012 年到 2020 年 3 月已增長(zhǎng) 30 萬(wàn)倍。

伴隨著大模型的快速迭代,其對(duì)算力的要求也不斷提高,而算力的核心就是人工智能芯片。因此,如何在新趨勢(shì)、新挑戰(zhàn)下快速響應(yīng)客戶需求,推出切實(shí)可用的軟硬件解決方案,成為了擺在國(guó)內(nèi) AI 芯片企業(yè)面前的首要課題。

擁抱變化,聚焦提升產(chǎn)品力

ChatGPT 及大模型技術(shù)大會(huì)上,昆侖芯科技研發(fā)總監(jiān)王志鵬表示:“作為一家芯片公司,需要對(duì)市場(chǎng)的需求和變化非常敏感,才能使硬件產(chǎn)品始終精準(zhǔn)匹配主流需求?!?/p>

大模型對(duì)計(jì)算的要求主要體現(xiàn)在三個(gè)方面,一是算力,二是互聯(lián),三是成本。就大模型而言,昆侖芯科技在產(chǎn)品定義上已經(jīng)做出布局 —— 相較第一代產(chǎn)品,昆侖芯 2 代 AI 芯片可大幅優(yōu)化算力、互聯(lián)和高性能,而在研的下一代產(chǎn)品則將提供更佳的性能體驗(yàn)。

昆侖芯科技成立于 2021 年,前身為百度智能芯片及架構(gòu)部。在實(shí)際業(yè)務(wù)場(chǎng)景中深耕 AI 加速領(lǐng)域已逾 10 年,專注打造擁有強(qiáng)大通用性、易用性和高性能的通用人工智能芯片。

在持續(xù)推進(jìn)核心技術(shù)攻關(guān)的同時(shí),昆侖芯科技緊密關(guān)注科技前沿,精準(zhǔn)匹配市場(chǎng)需求。目前,公司已實(shí)現(xiàn)兩代通用 AI 芯片的量產(chǎn)及落地應(yīng)用,在互聯(lián)網(wǎng)、智慧金融、智慧交通等領(lǐng)域已規(guī)模部署數(shù)萬(wàn)片。

14eff248-e8b6-11ed-ab56-dac502259ad0.png

昆侖芯在大模型場(chǎng)景的規(guī)模落地實(shí)踐

“來(lái)自真實(shí)場(chǎng)景” 一直是昆侖芯科技最獨(dú)特的身份標(biāo)簽,也是其規(guī)模部署數(shù)萬(wàn)片、在行業(yè)內(nèi) “領(lǐng)跑落地” 的核心優(yōu)勢(shì)所在。

王志鵬認(rèn)為,只有基于真實(shí)業(yè)務(wù)場(chǎng)景中的數(shù)據(jù)進(jìn)行端到端優(yōu)化,才能順利推進(jìn)大模型落地。

目前市場(chǎng)上主流的大模型以 Transformer 架構(gòu)為主,包含 Encoder 和 Decoder。Encoder 主要被應(yīng)用于各類 NLP 的判別類任務(wù);而 Decoder 更多被應(yīng)用于翻譯、圖文生成等場(chǎng)景,最近出圈的 ChatGPT 就是典型代表。

針對(duì)大模型,昆侖芯持續(xù)打磨部署優(yōu)化方案,領(lǐng)跑產(chǎn)業(yè)落地。昆侖芯已將大模型的 Transformer 相關(guān)優(yōu)化技術(shù)沉淀為重要基建,優(yōu)化后的性能比原有方案提升 5 倍以上,壓縮顯存 30% 以上。

以文生圖大模型為例,昆侖芯已跑通一條端到端優(yōu)化、規(guī)模落地之路。

AI 繪畫(huà)模型的推理算力及顯存需求隨圖像分辨率增大而指數(shù)級(jí)增加,同時(shí),圖像生成需要循環(huán)采樣數(shù)十次,產(chǎn)業(yè)落地動(dòng)輒需要高昂成本的部署集群,嚴(yán)重阻礙了 AIGC 模型大規(guī)模商業(yè)化落地。

2022 年第四季度,昆侖芯聯(lián)合客戶,基于飛槳 PaddlePaddle 發(fā)起了端到端聯(lián)合優(yōu)化項(xiàng)目。在 2-3 周內(nèi),項(xiàng)目組快速完成端到端優(yōu)化,最終實(shí)現(xiàn)輸入文本后 2 秒出圖的優(yōu)化效果,性能提升近 8 倍。

目前,昆侖芯 AI 加速卡 R200 已在該客戶的大模型場(chǎng)景完成規(guī)模部署,性能數(shù)據(jù)全面超越同系列主流推理卡:

基于昆侖芯 AI 加速卡 R200 高效運(yùn)算與推理能力,綜合優(yōu)化方案,在 dpm-25steps 算法下,利用昆侖芯 AI 加速卡 R200,生成 1024*1024 圖像時(shí)的推理速度為 10.89 iters/s,相比同能力的主流推理卡快 20%。

昆侖芯 AI 加速卡 R200 擁有 32G GDDR6 顯存,為大規(guī)模參數(shù)提供更大的存儲(chǔ)容量、更高帶寬的內(nèi)存訪問(wèn)、更穩(wěn)定的性能,生成更高分辨率的圖片,為用戶提供高性價(jià)比服務(wù)。

與此同時(shí),面向當(dāng)前市場(chǎng)需求迫切的大模型場(chǎng)景,據(jù)悉昆侖芯科技即將推出一款加速器組解決方案。

該加速器組搭載第二代昆侖芯 AI 芯片,是 AI 基礎(chǔ)設(shè)施的重要組成部分,為 AI IAAS 平臺(tái)、 AI PAAS 平臺(tái)提供堅(jiān)實(shí)算力支撐。該產(chǎn)品可提供更為集約的 AI 算力,具備分布式集群部署能力,支持彈性 RDMA 網(wǎng)絡(luò),對(duì)比傳統(tǒng)網(wǎng)絡(luò)通信時(shí)延降低 2~3 倍。該產(chǎn)品可明顯提高并行加速比,訓(xùn)推一體化助力提高資源利用率,極大提升模型開(kāi)發(fā)迭代效率。

攜手上層伙伴共拓 AI 芯生態(tài)

ChatGPT 及大模型技術(shù)大會(huì)上,與會(huì)者提問(wèn):在生態(tài)建設(shè)方面,國(guó)內(nèi) AI 芯片產(chǎn)業(yè)面臨的客觀情況是什么?

這也是昆侖芯科技經(jīng)常被客戶提及的現(xiàn)實(shí)問(wèn)題。

昆侖芯科技在努力進(jìn)一步擴(kuò)大生態(tài)影響力:首先要深刻理解客戶的使用習(xí)慣,滿足客戶需求,踏踏實(shí)實(shí)把軟硬件從產(chǎn)品和技術(shù)上做到位。隨著產(chǎn)品的規(guī)模部署,客戶越來(lái)越多,生態(tài)也就自然而然建立起來(lái)了。與此同時(shí),產(chǎn)品也會(huì)因此得到更好的打磨,進(jìn)入良性循環(huán)。

在昆侖芯科技看來(lái),AI 芯片看似是一個(gè)硬件,但其本質(zhì)則是一款軟件產(chǎn)品。這也證明了軟件棧、生態(tài)對(duì)于 AI 芯片發(fā)展的關(guān)鍵作用。

目前,昆侖芯已實(shí)現(xiàn)對(duì)飛槳的原生適配,并完成了 III 級(jí)兼容性測(cè)試,訓(xùn)練與推理性能可以滿足用戶的應(yīng)用需求。從底層 AI 算力組件、AI 服務(wù)器,到操作系統(tǒng),再到昆侖芯 SDK,昆侖芯和飛槳攜手完成了一套端到端的 AI 計(jì)算系統(tǒng)解決方案,并致力于打造一個(gè)全棧式軟硬一體的 AI 生態(tài)。

為進(jìn)一步完善軟件生態(tài),昆侖芯已與多款通用處理器、操作系統(tǒng)、主流框架完成端到端適配,實(shí)現(xiàn)了軟硬件解決方案的技術(shù)棧,為客戶提供開(kāi)箱即用的 AI 芯片產(chǎn)品。

15015312-e8b6-11ed-ab56-dac502259ad0.png

昆侖芯軟件棧

結(jié)語(yǔ)

談及大模型趨勢(shì)下 AI 芯片公司面對(duì)的變化,王志鵬說(shuō)道: “必須快速調(diào)整心態(tài),并擁抱大模型帶來(lái)的變化?!?/p>

而這也剛好印證了昆侖芯科技 “突破創(chuàng)新” 的公司文化:面對(duì)瞬息萬(wàn)變的外部環(huán)境,突破創(chuàng)新是適應(yīng)行業(yè)的唯一方式。

面對(duì)復(fù)雜多變的市場(chǎng)環(huán)境以及新場(chǎng)景新應(yīng)用對(duì)研發(fā)和落地的重重挑戰(zhàn),國(guó)內(nèi) AI 芯片公司如何出圈?

集十余年 AI 加速領(lǐng)域的技術(shù)積淀,曾任百度智能芯片及架構(gòu)部首席架構(gòu)師、現(xiàn)任昆侖芯科技 CEO 歐陽(yáng)劍認(rèn)為,“AI 芯片公司應(yīng)抓住場(chǎng)景和技術(shù)創(chuàng)新‘雙驅(qū)動(dòng)’模式,驅(qū)動(dòng)架構(gòu)優(yōu)化升級(jí)與軟硬件產(chǎn)品迭代,這是持續(xù)保持競(jìng)爭(zhēng)力的關(guān)鍵。”

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34998

    瀏覽量

    278689
  • 智能芯片
    +關(guān)注

    關(guān)注

    0

    文章

    141

    瀏覽量

    25845
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1589

    瀏覽量

    9030

原文標(biāo)題:大模型引發(fā)技術(shù)變革, AI芯片公司面臨新挑戰(zhàn)

文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI?時(shí)代來(lái)襲,手機(jī)芯片面臨哪些新挑戰(zhàn)?

    邊緣AI、生成式AI(GenAI)以及下一代通信技術(shù)正為本已面臨高性能與低功耗壓力的手機(jī)帶來(lái)更多計(jì)算負(fù)載。領(lǐng)先的智能手機(jī)廠商正努力應(yīng)對(duì)本地化生成式A
    的頭像 發(fā)表于 06-10 08:34 ?424次閱讀
    <b class='flag-5'>AI</b>?時(shí)代來(lái)襲,手機(jī)<b class='flag-5'>芯片面臨</b>哪些新<b class='flag-5'>挑戰(zhàn)</b>?

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    科正將AI能力體系化并賦能終端生態(tài)。 大會(huì)上,聯(lián)發(fā)科定義了“智能體化用戶體驗(yàn)”的五大特征:主動(dòng)及時(shí)、知你懂你、互動(dòng)協(xié)作、學(xué)習(xí)進(jìn)化和專屬隱私信息守護(hù)。這五大特征需要跨越從芯片、模型、應(yīng)用、終端乃至整個(gè)
    發(fā)表于 04-13 19:52

    模型原生操作系統(tǒng):機(jī)遇、挑戰(zhàn)與展望 CCCF精選

    本文立足人工智能時(shí)代用戶、應(yīng)用和系統(tǒng)的需求,分析“外掛式模型”演進(jìn)路徑下的操作系統(tǒng)發(fā)展困局,提出通過(guò)“模型-系統(tǒng)-芯片”的全棧協(xié)同設(shè)計(jì)來(lái)構(gòu)建模型原生操作系統(tǒng),并進(jìn)一步探討了
    的頭像 發(fā)表于 03-14 17:46 ?494次閱讀
    <b class='flag-5'>模型</b>原生操作系統(tǒng):機(jī)遇、<b class='flag-5'>挑戰(zhàn)</b>與展望  CCCF精選

    SPEA創(chuàng)新實(shí)踐:AI芯片混合信號(hào)測(cè)試儀

    引發(fā)變革,各行業(yè)對(duì)更強(qiáng)大、更高效的AI芯片的需求持續(xù)攀升。AI算法的日益復(fù)雜,市場(chǎng)對(duì)AI運(yùn)行速
    的頭像 發(fā)表于 01-03 11:44 ?818次閱讀
    SPEA創(chuàng)新實(shí)踐:<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>混合信號(hào)測(cè)試儀

    AMD MI300X AI芯片面臨挑戰(zhàn)

    近日,據(jù)芯片顧問(wèn)機(jī)構(gòu)Semianalysis經(jīng)過(guò)5個(gè)月的深入調(diào)查后指出,AMD最新推出的“MI300X”AI芯片在軟件缺陷和性能表現(xiàn)上未能達(dá)到預(yù)期,因此在挑戰(zhàn)NVIDIA市場(chǎng)領(lǐng)導(dǎo)地位方
    的頭像 發(fā)表于 12-25 10:57 ?766次閱讀

    【「大模型啟示錄」閱讀體驗(yàn)】對(duì)大模型更深入的認(rèn)知

    的平衡,解釋得清清楚楚,讓我這個(gè)非專業(yè)人士也能明白大模型在實(shí)際應(yīng)用中面臨挑戰(zhàn)和限制,也對(duì)這些模型的復(fù)雜性和挑戰(zhàn)有了更深的理解。 而且,書(shū)
    發(fā)表于 12-20 15:46

    Cadence如何應(yīng)對(duì)AI芯片設(shè)計(jì)挑戰(zhàn)

    生成式 AI 引領(lǐng)智能革命成為產(chǎn)業(yè)升級(jí)的核心動(dòng)力并點(diǎn)燃了“百模大戰(zhàn)”。多樣化的大模型應(yīng)用激增對(duì)高性能AI 芯片的需求,促使行業(yè)在摩爾定律放緩的背景下,加速推進(jìn) 2.5D、3D 及 3.
    的頭像 發(fā)表于 12-14 15:27 ?1313次閱讀

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.49】大模型啟示錄:一本AI應(yīng)用百科全書(shū)

    一次大模型變革中,完全不缺態(tài)度,只缺認(rèn)知與落地的經(jīng)驗(yàn)。 在過(guò)去的兩年中,我們看到了全球太多的巨頭和普通中小企業(yè),進(jìn)入All in AI的投資周期。有的已經(jīng)開(kāi)始落地到具體的生產(chǎn)流程,例如企業(yè)內(nèi)部客服、優(yōu)化
    發(fā)表于 10-28 15:34

    億鑄科技熊大鵬探討AI大算力芯片挑戰(zhàn)與解決策略

    在SEMiBAY2024《HBM與存儲(chǔ)器技術(shù)與應(yīng)用論壇》上,億鑄科技的創(chuàng)始人、董事長(zhǎng)兼CEO熊大鵬博士發(fā)表了題為《超越極限:大算力芯片技術(shù)挑戰(zhàn)與解決之道》的演講,深入剖析了
    的頭像 發(fā)表于 10-25 11:52 ?900次閱讀

    AI如何助力EDA應(yīng)對(duì)挑戰(zhàn)

    探究當(dāng)今產(chǎn)業(yè)背景和科技潮流中半導(dǎo)體產(chǎn)業(yè)所面臨挑戰(zhàn)變革時(shí),不難發(fā)現(xiàn),一個(gè)至關(guān)重要的轉(zhuǎn)折點(diǎn)已經(jīng)發(fā)生——人工智能(AI)的崛起正以前所未有的力量,對(duì)電子設(shè)計(jì)自動(dòng)化(EDA)乃至整個(gè)半導(dǎo)體
    的頭像 發(fā)表于 10-17 10:21 ?1067次閱讀
    <b class='flag-5'>AI</b>如何助力EDA應(yīng)對(duì)<b class='flag-5'>挑戰(zhàn)</b>

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    計(jì)算的結(jié)合 我深刻體會(huì)到高性能計(jì)算(HPC)在AI for Science中的重要性。傳統(tǒng)的科學(xué)計(jì)算往往面臨計(jì)算量大、計(jì)算時(shí)間長(zhǎng)等問(wèn)題,而AI技術(shù)的引入可以顯著提高計(jì)算效率。同時(shí),HP
    發(fā)表于 10-14 09:16

    當(dāng)前主流的大模型對(duì)于底層推理芯片提出了哪些挑戰(zhàn)

    隨著大模型時(shí)代的到來(lái),AI算力逐漸變成重要的戰(zhàn)略資源,對(duì)現(xiàn)有AI芯片也提出了前所未有的挑戰(zhàn):大算力的需求、高吞吐量與低延時(shí)、高效內(nèi)存管理、能
    的頭像 發(fā)表于 09-24 16:57 ?1172次閱讀

    Meta發(fā)布Imagine Yourself AI模型,重塑個(gè)性化圖像生成未來(lái)

    Meta公司近日在人工智能領(lǐng)域邁出了重要一步,隆重推出了其創(chuàng)新之作——“Imagine Yourself”AI模型,這一突破性技術(shù)為個(gè)性化圖像生成領(lǐng)域帶來(lái)了前所未有的
    的頭像 發(fā)表于 08-26 10:59 ?988次閱讀

    億鑄科技談大算力芯片面臨技術(shù)挑戰(zhàn)和解決策略

    隨著人工智能技術(shù)的飛速發(fā)展,算力已成為推動(dòng)產(chǎn)業(yè)變革的關(guān)鍵力量,但大模型的快速發(fā)展,參數(shù)的爆發(fā),對(duì)于算力需求也提出了更高的要求,帶來(lái)了全新的挑戰(zhàn)。那大算力
    的頭像 發(fā)表于 08-07 10:03 ?1201次閱讀

    AI模型與傳統(tǒng)AI的區(qū)別

    AI模型(如LLM,即大型語(yǔ)言模型)與傳統(tǒng)AI在多個(gè)方面存在顯著的區(qū)別。以下將從技術(shù)層面、應(yīng)用場(chǎng)景、性能表現(xiàn)、計(jì)算資源和成本、以及發(fā)展趨勢(shì)
    的頭像 發(fā)表于 07-15 11:37 ?5728次閱讀