11月13日,百度世界2025大會(huì)在北京國(guó)家會(huì)議中心二期舉辦?;顒?dòng)期間,格靈深瞳與百度進(jìn)行深入交流,并圍繞VLM、AI Infra、應(yīng)用場(chǎng)景等話題展開(kāi)全面分享。
現(xiàn)場(chǎng),格靈深瞳與百度共同探討了視覺(jué)算法、VLM、應(yīng)用場(chǎng)景等AI重點(diǎn)方向,深度交流彼此的思考與實(shí)踐,并展望未來(lái)的合作發(fā)展空間。
在分論壇和公開(kāi)課環(huán)節(jié),格靈深瞳聚焦全開(kāi)源多模態(tài)大模型、超融合產(chǎn)品與算力市場(chǎng)、金融視覺(jué)任務(wù)、AI開(kāi)發(fā)平臺(tái)四大話題,全面分享技術(shù)創(chuàng)新和行業(yè)應(yīng)用。
VLM全開(kāi)源:Open Source,Open Innovation
在分論壇環(huán)節(jié),格靈深瞳靈感實(shí)驗(yàn)室負(fù)責(zé)人馮子勇分享《LLaVA-OneVision-1.5:揭秘商用級(jí)別VLM構(gòu)建流程》主題演講,介紹多模態(tài)大模型LLaVA-OneVision-1.5全開(kāi)源背后的技術(shù)細(xì)節(jié)。
區(qū)別于一般開(kāi)源模型僅開(kāi)源模型權(quán)重和部分代碼,LLaVA-OneVision-1.5實(shí)現(xiàn)了訓(xùn)練數(shù)據(jù)、代碼和模型權(quán)重的全鏈路開(kāi)源,并且效果優(yōu)于同等規(guī)模Qwen2.5-VL。在創(chuàng)新性上,團(tuán)隊(duì)對(duì)“視覺(jué)編碼器+投影層+大語(yǔ)言模型”的LLaVA架構(gòu)進(jìn)行模塊升級(jí):視覺(jué)編碼器從CLIP替換為格靈深瞳自研Glint-ViT v1.5(RICE),大語(yǔ)言模型從Qwen2替換為Qwen3。同時(shí),基于高效的訓(xùn)練框架和多模態(tài)數(shù)據(jù)拼接,模型可在一周內(nèi)完成訓(xùn)練,單次成本不超過(guò)10萬(wàn)元。
超融合產(chǎn)品與算力市場(chǎng):扎根實(shí)際業(yè)務(wù)場(chǎng)景
在分論壇圓桌環(huán)節(jié),格靈深瞳產(chǎn)品負(fù)責(zé)人陳天博圍繞“AI推理時(shí)代,重塑算力格局”主題,分享來(lái)自一線的超融合硬件產(chǎn)品應(yīng)用和算力市場(chǎng)觀察。
隨著模型能力逐步深入業(yè)務(wù)流程,硬件產(chǎn)品和算力需求迎來(lái)新變化。行業(yè)用戶(hù)聚焦實(shí)際業(yè)務(wù)場(chǎng)景和規(guī)模,重視高并發(fā)場(chǎng)景下計(jì)算平臺(tái)的穩(wěn)定和性能提升。同時(shí),行業(yè)專(zhuān)家的市場(chǎng)角色更加突出,持續(xù)進(jìn)化的端到端產(chǎn)品服務(wù)能力成為關(guān)鍵。格靈深瞳超融合一體機(jī)基于全國(guó)產(chǎn)底座,可確保從硬件到應(yīng)用的安全自主可控,滿足行業(yè)用戶(hù)的產(chǎn)品落地需求。
金融視覺(jué)進(jìn)化:大模型時(shí)代的“火眼金睛”煉成術(shù)
在“AI提效大玩家”主題公開(kāi)課,格靈深瞳副總裁羅楷分享《不靠巨量數(shù)據(jù),如何煉就AI的“火眼金睛”?》,介紹金融視覺(jué)任務(wù)的進(jìn)化之路。
相較于過(guò)去的CNN范式,大模型時(shí)代的視覺(jué)任務(wù)在數(shù)據(jù)、模型訓(xùn)練與推理、工程化、產(chǎn)品設(shè)計(jì)等方面,都發(fā)生了明顯變化。格靈深瞳通過(guò)原始數(shù)據(jù)和訓(xùn)練數(shù)據(jù)生成、基于Glint-MVT視覺(jué)模型基座提高訓(xùn)練效率、優(yōu)化邊緣端與中心端多種推理方式、Infra能力保障算力資源高效利用等方式,“組合拳”破題,解決如何在有限資源下,更多釋放大模型的產(chǎn)品價(jià)值,讓計(jì)算機(jī)更好地看懂世界。
模型生產(chǎn)平臺(tái)化:讓開(kāi)發(fā)者變身“六邊形戰(zhàn)士”
在“AI產(chǎn)業(yè)大變革”主題公開(kāi)課,格靈深瞳研發(fā)副總裁閆梓禎分享《視覺(jué)智能應(yīng)用高效落地秘籍》,介紹Glint Lab一站式AI開(kāi)放平臺(tái)的功能亮點(diǎn)。
針對(duì)AI定制化開(kāi)發(fā)過(guò)程中的痛點(diǎn),Glint Lab一體化開(kāi)發(fā)平臺(tái)功能覆蓋算法模型生產(chǎn)全流程。僅需按照平臺(tái)引導(dǎo),一位開(kāi)發(fā)者可以完成數(shù)據(jù)的采集、處理、標(biāo)注和模型的訓(xùn)練、發(fā)布、部署,輕松上手6項(xiàng)角色任務(wù),實(shí)現(xiàn)端到端的項(xiàng)目開(kāi)發(fā)閉環(huán),解決數(shù)據(jù)、模型、部署終端割裂的問(wèn)題。在自研邊緣終端的基礎(chǔ)上,平臺(tái)可適配市場(chǎng)主流終端設(shè)備,讓開(kāi)放的算法能力賦能不同行業(yè)智能化變革。
未來(lái),格靈深瞳將持續(xù)深耕視覺(jué)算法與多模態(tài)大模型,構(gòu)建“模型算法-產(chǎn)品方案-AI服務(wù)”的端到端能力。通過(guò)技術(shù)產(chǎn)品在多元場(chǎng)景下的深化應(yīng)用,助力AI賦能千行百業(yè)。
-
百度
+關(guān)注
關(guān)注
9文章
2373瀏覽量
94494 -
格靈深瞳
+關(guān)注
關(guān)注
1文章
88瀏覽量
5913
原文標(biāo)題:四大話題、有趣有料,格靈深瞳的“環(huán)游記” | 百度世界2025
文章出處:【微信號(hào):shentongzhineng,微信公眾號(hào):格靈深瞳】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
格靈深瞳入選多家媒體2025年度榜單
格靈深瞳亮相摩爾線程首屆MUSA開(kāi)發(fā)者大會(huì)
格靈深瞳受邀參加光合組織2025人工智能創(chuàng)新大會(huì)
格靈深瞳榮獲量子位2025人工智能年度領(lǐng)航企業(yè)
格靈深瞳受邀參加百度世界2025大會(huì)
格靈深瞳邀您相約百度世界2025大會(huì)
格靈深瞳亮相2025華為北京商業(yè)伙伴大會(huì)
格靈深瞳視覺(jué)基礎(chǔ)模型Glint-MVT的發(fā)展脈絡(luò)
格靈深瞳精彩亮相百度世界2025大會(huì)
評(píng)論