chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

vLLM Meetup上海站成功舉辦

沐曦MetaX ? 來源:vLLM ? 2025-08-27 13:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:vLLM

2025年8月23日,vLLM Meetup上海站成功舉辦?;顒訁R聚技術(shù)專家、社區(qū)開發(fā)者及行業(yè)用戶,圍繞vLLM(一種用于大型語言模型的高性能推理引擎)的技術(shù)進(jìn)展、生態(tài)建設(shè)及應(yīng)用展開深度探討。會議涵蓋社區(qū)貢獻(xiàn)指南、分布式推理架構(gòu)、多模態(tài)模型集成等前沿議題,現(xiàn)場互動熱烈,并提出每年舉辦vLLM Con大會的倡議,為AI推理領(lǐng)域的技術(shù)落地注入新動能。

本次Meetup由沐曦與紅帽公司聯(lián)合主辦,紅帽作為全球開源社區(qū)vLLM的重要貢獻(xiàn)者,長期參與上游協(xié)作并分享實(shí)踐經(jīng)驗(yàn),推動社區(qū)發(fā)展;沐曦則結(jié)合國產(chǎn)硬件優(yōu)勢,積極探索vLLM在本土計算平臺上的適配與應(yīng)用。沐曦開源生態(tài)總監(jiān)章津楠與紅帽亞太CTO辦公室首席架構(gòu)師張家駒共同開場,對到場嘉賓及觀眾表示歡迎?;顒釉O(shè)置五大核心議題,并穿插開發(fā)者提問環(huán)節(jié),最終以沐曦聯(lián)合創(chuàng)始人、CTO兼首席軟件架構(gòu)師楊建博士的開源生態(tài)趨勢分享及書籍簽贈環(huán)節(jié)收尾,現(xiàn)場氣氛活躍。

活動核心環(huán)節(jié)圍繞五大技術(shù)方向展開,專家團(tuán)隊(duì)通過案例解析與方案演示,系統(tǒng)呈現(xiàn)vLLM在社區(qū)生態(tài)、分布式架構(gòu)、多模態(tài)集成等領(lǐng)域的創(chuàng)新實(shí)踐。

在題為《vLLM: Building, Testing and Contributing》演講中, vLLM社區(qū)貢獻(xiàn)者、Red Hat資深專家Daniele Trifirò深入剖析了vLLM社區(qū)的發(fā)展現(xiàn)狀,為愛好者及開發(fā)者提供了系統(tǒng)性指南。他詳細(xì)闡述了項(xiàng)目構(gòu)建流程、關(guān)鍵測試規(guī)范,并指導(dǎo)開發(fā)者如何高效貢獻(xiàn)代碼。通過豐富的代碼實(shí)例、實(shí)踐案例及參考鏈接,演講極大降低了初學(xué)者入門門檻,獲得現(xiàn)場開發(fā)者高度認(rèn)可。

在《Disaggregated P/D for Wide EP》主題分享中,vLLM社區(qū)貢獻(xiàn)者、Red Hat技術(shù)專家Nicolò Lucchesi重點(diǎn)介紹了利用llm-d實(shí)現(xiàn)vLLM分布式推理的方案,核心目標(biāo)是通過預(yù)填充/解碼(P/D)解耦與寬專家并行(EP)擴(kuò)展大模型推理能力,尤其針對長上下文和混合專家(MoE)模型場景,關(guān)鍵技術(shù)方案包括P/D解耦部署、通過NIXL實(shí)現(xiàn)高效KV Cache傳輸、支持預(yù)填充(P)與解碼(D)階段采用不同TP并行度、將MoE模型中的專家分布至不同GPU等實(shí)現(xiàn)細(xì)節(jié)。

百度高級產(chǎn)品經(jīng)理王凱在《ERNIE 4.5 + vLLM: Multimodal Model Integration》演講中,系統(tǒng)解析了百度ERNIE 4.5多模態(tài)模型與vLLM的集成實(shí)踐。內(nèi)容涵蓋ERNIE 4.5 的特性、與 vLLM 集成的原因以及 vLLM 為 ERNIE 4.5 模型提供的全面支持,包括密集模型、MoE 模型和用于加速生成的MTP。同時還介紹了正在進(jìn)行的開發(fā)工作,例如專家并行性負(fù)載均衡和視覺-語言支持。

Mooncake核心開發(fā)者蘇金陽在《Mooncake x LMCache 性能優(yōu)化分享》的主題分享中重點(diǎn)介紹了 Mooncake(特別是其傳輸引擎和存儲)與 LMCache 的集成,以在 vLLM 中實(shí)現(xiàn)高性能 KV Cache 重用。LMCache 被認(rèn)為是用于 KV Cache 管理(卸載、重用、P/D 分離、RAG 緩存)的流行 vLLM 社區(qū)擴(kuò)展。此次集成旨在提高數(shù)據(jù)分發(fā)效率和整體系統(tǒng)性能。

沐曦vLLM推理引擎專家張廉潔在《vLLM-metax: Bridging CUDA to MetaX MACA》演講中,詳細(xì)介紹了vLLM-metax 如何通過 cu-bridge 在 MACA 上實(shí)現(xiàn)接近零成本的 CUDA 執(zhí)行,允許在不修改源代碼的情況下進(jìn)行原生編譯。同時還解釋了在 vLLM 中使用插件架構(gòu)支持 MetaX 的方式,概述了修補(bǔ)方法(patch補(bǔ)丁和文件替換)和限制。演講還公布了2025年路線圖。

提問環(huán)節(jié)中,開發(fā)者圍繞社區(qū)貢獻(xiàn)規(guī)范、分布式推理落地、國產(chǎn)硬件支持等議題提出建議,嘉賓以技術(shù)細(xì)節(jié)回應(yīng),討論貫穿全場。

本次活動彩蛋,沐曦聯(lián)合創(chuàng)始人、CTO兼首席軟件架構(gòu)師楊建博士驚喜亮相現(xiàn)場,他不僅生動分享了沐曦在開源生態(tài)和vLLM推理技術(shù)的最新趨勢,還熱情地為獲得《沐曦異構(gòu)并行計算軟件?!窌男疫\(yùn)觀眾親筆簽名留念。

本次Meetup不僅展示了vLLM在分布式推理、多模態(tài)集成及硬件適配領(lǐng)域的最新成果,更通過技術(shù)交流與生態(tài)合作,為AI推理引擎的規(guī)?;瘧?yīng)用提供了實(shí)踐范本。行業(yè)專家與開發(fā)者的深度互動,進(jìn)一步強(qiáng)化了vLLM在開源社區(qū)的技術(shù)影響力,為下一代AI基礎(chǔ)設(shè)施的研發(fā)奠定基礎(chǔ)。

關(guān)于沐曦

沐曦致力于自主研發(fā)全棧高性能GPU芯片及計算平臺,為智算、通用計算、云渲染等前沿領(lǐng)域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟(jì)發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    462

    文章

    53166

    瀏覽量

    453558
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3874

    瀏覽量

    45185
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3609

    瀏覽量

    51417

原文標(biāo)題:vLLM Meetup上海站圓滿落幕

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AGIROS開源社區(qū)Meetup上海圓滿落幕,RT-Thread睿賽德分享核心技術(shù)賦能機(jī)器人開發(fā)|新聞速遞

    2025年9月20日,AGIROS開源社區(qū)Meetup上海順利舉辦。RT-Thread睿賽德AI負(fù)責(zé)人葉昌博士受邀出席,帶來“從異構(gòu)通信到虛擬化技術(shù):RT-Thread助力機(jī)器人敏捷、可持續(xù)開發(fā)
    的頭像 發(fā)表于 09-22 21:25 ?291次閱讀
    AGIROS開源社區(qū)<b class='flag-5'>Meetup</b><b class='flag-5'>上海</b><b class='flag-5'>站</b>圓滿落幕,RT-Thread睿賽德分享核心技術(shù)賦能機(jī)器人開發(fā)|新聞速遞

    2025 NVIDIA創(chuàng)業(yè)企業(yè)展示北京成功舉辦

    近日,2025 NVIDIA 創(chuàng)業(yè)企業(yè)展示——北京(AI 智能體與物理 AI 出海專場)在北京量子銀座集智會議中心舉辦。
    的頭像 發(fā)表于 09-16 10:43 ?686次閱讀

    匯川技術(shù)匯英行動人才雙選日蘇州成功舉辦

    金秋九月,匯聚英才。 匯英行動人才雙選日·蘇州于9月6日在匯川技術(shù)蘇州總部大廈成功舉辦
    的頭像 發(fā)表于 09-11 17:12 ?846次閱讀

    2025紫光同創(chuàng)FPGA技術(shù)研討會成都成功舉辦

    近日,“2025紫光同創(chuàng)FPGA技術(shù)研討會”成都成功舉辦,來自通信、工業(yè)、圖像視頻、消費(fèi)、汽車等領(lǐng)域近200名專業(yè)觀眾參會交流,現(xiàn)場座無虛席,氣氛熱烈。自此,本年度紫光同創(chuàng)線下研討會系列活動圓滿收官!
    的頭像 發(fā)表于 09-08 17:26 ?771次閱讀

    格羅方德2025年度技術(shù)峰會北美成功舉辦

    格羅方德2025年度技術(shù)峰會(GlobalFoundries Technology Summit 2025, GTS 2025)北美于8月28日在美國加利福尼亞州圣克拉拉市成功舉辦。
    的頭像 發(fā)表于 09-03 17:29 ?635次閱讀

    開放原子園區(qū)行重慶成功舉辦

    8月29日,開放原子“園區(qū)行”(重慶)在渝州賓館成功舉辦,活動以“共建智能汽車操作系統(tǒng)開源生態(tài)”為主題,匯聚政府機(jī)構(gòu)、高校及科研院所、OEM廠商、汽車軟件開發(fā)企業(yè)、芯片企業(yè)、開源社區(qū)的近100位代表,共探開源模式如何破解智能汽
    的頭像 發(fā)表于 09-01 18:10 ?739次閱讀

    2025開放原子園區(qū)行上海成功舉辦

    近日,以“開源賦能智能,協(xié)同創(chuàng)新共筑AI未來”為主題的開放原子“園區(qū)行”(上海)在上海市徐匯區(qū)成功舉辦。本次活動由開放原子開源基金會與
    的頭像 發(fā)表于 07-07 18:12 ?723次閱讀

    2025開放原子校源行廣東海洋大學(xué)活動成功舉辦

    近日,由開放原子開源基金會主辦,廣東海洋大學(xué)和北京中軟國際教育科技股份有限公司承辦的“開放原子校源行”(廣東海洋大學(xué))活動成功舉辦。
    的頭像 發(fā)表于 06-30 10:02 ?476次閱讀

    2025開放原子校源行太原成功舉辦

    近日,開放原子“校源行”(太原)在中北大學(xué)成功舉辦。工業(yè)和信息化部信息技術(shù)發(fā)展司、山西省工信廳、山西省教育廳,以及地方工信部門、高校、頭部科技企業(yè)代表等600余人共話開源生態(tài),推進(jìn)開源教育。
    的頭像 發(fā)表于 06-28 17:44 ?905次閱讀

    Wolfspeed助力捷豹TCS車隊(duì)FE上海成功衛(wèi)冕

    !從第一回合遭遇低谷,到第二回合成功衛(wèi)冕,捷豹 TCS 車隊(duì)逆風(fēng)翻盤!“KIWI”組合上海兩年兩冠,續(xù)寫傳奇!
    的頭像 發(fā)表于 06-06 09:12 ?569次閱讀

    2025年開放原子校源行清華大學(xué)成功舉辦

    近日,由開放原子開源基金會、清華大學(xué)計算機(jī)科學(xué)與技術(shù)系、清華大學(xué)軟件學(xué)院主辦的開放原子“校源行”(清華)在清華大學(xué)成功舉辦。
    的頭像 發(fā)表于 04-22 16:46 ?607次閱讀

    開放原子園區(qū)行太原成功舉辦

    近日,由開放原子開源基金會、山西省工業(yè)和信息化廳、山西轉(zhuǎn)型綜合改革示范區(qū)管委會聯(lián)合主辦的開放原子“園區(qū)行”(太原)活動在太原市同昌創(chuàng)業(yè)園成功舉辦。
    的頭像 發(fā)表于 04-02 16:54 ?661次閱讀

    2025芯來RISC-V技術(shù)研討會蘇州成功舉辦

    近日,2025芯來RISC-V技術(shù)研討會@蘇州活動成功舉辦。此次蘇州研討由芯來科技與勞特巴赫中國聯(lián)合主辦,同時也感謝上海開放處理器產(chǎn)業(yè)創(chuàng)
    的頭像 發(fā)表于 03-26 11:50 ?908次閱讀

    索尼新品品鑒會上海成功舉辦

    近日,索尼攜手《家庭影院技術(shù)》雜志成功舉辦了“把影院帶回家,索尼家用投影P9(VPL-XW8100)新品品鑒會”全國巡展的上海。來自華東地區(qū)眾多行業(yè)人士和影音愛好者,共同見證了索尼“
    的頭像 發(fā)表于 12-19 15:20 ?791次閱讀

    vLLM項(xiàng)目加入PyTorch生態(tài)系統(tǒng),引領(lǐng)LLM推理新紀(jì)元

    近日,vLLM項(xiàng)目宣布正式成為PyTorch生態(tài)系統(tǒng)的一部分,標(biāo)志著該項(xiàng)目與PyTorch的合作進(jìn)入了一個全新的階段。本文將從以下幾個方面進(jìn)行介紹,特別提醒:安裝方案在第四個部分,可選擇性閱讀
    的頭像 發(fā)表于 12-18 17:06 ?1262次閱讀
    <b class='flag-5'>vLLM</b>項(xiàng)目加入PyTorch生態(tài)系統(tǒng),引領(lǐng)LLM推理新紀(jì)元