chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

中國科大攜手云知聲斬獲ACM MM 2024競賽多項(xiàng)榮譽(yù)

云知聲 ? 來源:云知聲 ? 2024-11-21 14:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,第32屆ACM國際多媒體會(huì)議在澳大利亞墨爾本圓滿落幕。由中國科學(xué)技術(shù)大學(xué)自動(dòng)化系於俊老師帶隊(duì)的中國科學(xué)技術(shù)大學(xué)與云知聲共同組建的USTC-IAT-United團(tuán)隊(duì)在不同挑戰(zhàn)賽道上累計(jì)榮獲5項(xiàng)冠軍、2項(xiàng)亞軍,技術(shù)實(shí)力再獲國際頂會(huì)認(rèn)可。

ACM MM(ACM International Conference on Multimedia)作為計(jì)算機(jī)圖形學(xué)與多媒體領(lǐng)域的頂級國際會(huì)議,不僅被中國計(jì)算機(jī)學(xué)會(huì)(CCF)評定為A類國際學(xué)術(shù)會(huì)議,更以其卓越的學(xué)術(shù)影響力和社會(huì)認(rèn)可度而聞名。該會(huì)議攜手全球領(lǐng)先的學(xué)術(shù)機(jī)構(gòu)和知名企業(yè),舉辦了一系列挑戰(zhàn)性賽事,成功吸引了全球眾多科研團(tuán)隊(duì)和創(chuàng)新型企業(yè)的踴躍參與。

在這場全球頂尖智慧團(tuán)隊(duì)間的激烈角逐中,聯(lián)合團(tuán)隊(duì)表現(xiàn)出色,在多個(gè)挑戰(zhàn)賽道上奪得5項(xiàng)冠軍、2項(xiàng)亞軍,其研究成果廣泛涉及微動(dòng)作分析、微表情檢測與分析、人機(jī)交互與對話、多模態(tài)群體行為分析以及視覺空間關(guān)系描述和深度偽造檢測等前沿領(lǐng)域。具體獲獎(jiǎng)情況如下:

1微動(dòng)作分析挑戰(zhàn)

微動(dòng)作相比于普通動(dòng)作,更能展現(xiàn)人物在日常交流中的心理情緒,帶來更豐富的語義信息,對這些微動(dòng)作進(jìn)行精準(zhǔn)檢測對于多模態(tài)理解至關(guān)重要。然而,微動(dòng)作通常持續(xù)時(shí)間短,且多種微動(dòng)作可能同時(shí)出現(xiàn),因而檢測需要更多畫面幀的輸入來實(shí)現(xiàn)精細(xì)捕捉,這將導(dǎo)致巨大的顯存負(fù)擔(dān)和訓(xùn)練代價(jià)。

為應(yīng)對這些挑戰(zhàn),團(tuán)隊(duì)提出了3D-SENet Adapter,其能夠高效聚合時(shí)空信息,實(shí)現(xiàn)端到端的在線視頻特征學(xué)習(xí)。此外,團(tuán)隊(duì)發(fā)現(xiàn)結(jié)合背景信息可顯著提升對小尺度微動(dòng)作的檢測效果,為此,團(tuán)隊(duì)開發(fā)了交叉注意力聚合檢測頭,該模塊集成特征金字塔中的多尺度特征,顯著提升視頻幀中微動(dòng)作的檢測精度。該方法相比基線模型極大提升了檢測精度,并在兩個(gè)賽道上分別取得了冠軍與亞軍的成績,并且以論文形式在 ACM MM 會(huì)議上發(fā)表了研究成果。

2微表情挑戰(zhàn)

微表情作為一種面部表情,與宏表情相對應(yīng),通常持續(xù)時(shí)間短,強(qiáng)度較低。同時(shí)微表情在現(xiàn)實(shí)中有著廣泛的應(yīng)用,如醫(yī)療、刑事偵察等。MEGC挑戰(zhàn)賽的CCS (Cross-Cultural Spotting)賽道致力于選拔出通用性廣泛、穩(wěn)定性強(qiáng)的微表情識(shí)別方法,以推動(dòng)該領(lǐng)域技術(shù)的發(fā)展與應(yīng)用。

面對CCS賽道提出的挑戰(zhàn),團(tuán)隊(duì)選擇使用基于光流的方法進(jìn)行微表情識(shí)別,對每個(gè)視頻抽取其光流特征,進(jìn)而通過光流特征定位微表情發(fā)生的起始時(shí)間和結(jié)束時(shí)間。在生成微表情區(qū)間之后,采用邊界校準(zhǔn)方案,通過判斷評估邊界的變化程度來決定壓縮或延展邊界,使得產(chǎn)生的微表情區(qū)間邊界更加準(zhǔn)確。此外,團(tuán)隊(duì)采用特定的特征增強(qiáng)方案,主要通過LANet增強(qiáng)特征的表達(dá)能力和魯棒性。最終團(tuán)隊(duì)在排行榜上取得了冠軍,研究成果也以論文形式于 ACM MM 會(huì)議上發(fā)表。

3微表情挑戰(zhàn)

在以往微表情研究中,檢測和識(shí)別任務(wù)相對分離,存在很大的局限性。因此MEGC挑戰(zhàn)賽的STR (Spot-then-Recognize)賽道提出了 “先檢測后識(shí)別”的任務(wù)來整合兩個(gè)環(huán)節(jié),進(jìn)而提升微表情分析的準(zhǔn)確性和實(shí)用性。

針對STR賽道提出的挑戰(zhàn),團(tuán)隊(duì)整合VideoMAE V2框架、時(shí)間信息適配器(TIA)及多尺度特征融合檢測頭,以提升微表情定位與識(shí)別性能。主要采用 VideoMAE V2作為特征提取骨干網(wǎng)絡(luò),結(jié)合TIA增強(qiáng)視頻特征提取能力,尤其是在處理微表情任務(wù)時(shí)。TIA通過引入時(shí)間深度卷積層,捕捉相鄰幀的局部時(shí)間上下文,豐富當(dāng)前時(shí)間步的表示。同時(shí),構(gòu)建多尺度圖像金字塔,通過分類和回歸分支組成的檢測頭,融合不同尺度的特征,使得模型能夠同時(shí)捕捉從寬泛動(dòng)作到細(xì)微變化的全范圍動(dòng)態(tài),進(jìn)而顯著提高微表情識(shí)別的準(zhǔn)確性。

團(tuán)隊(duì)方案在 STRS(Overall)評分中達(dá)到SOTA 的結(jié)果,并獲得冠軍,研究成果在ACM MM會(huì)議上進(jìn)行發(fā)表。這一成果不僅驗(yàn)證了團(tuán)隊(duì)方法的有效性,也為微表情識(shí)別技術(shù)的進(jìn)一步發(fā)展提供了方向。

4多模態(tài)群體行為分析挑戰(zhàn)

在多人對話和人機(jī)交互領(lǐng)域,對人類的參與程度的評估至關(guān)重要。MultiMediate挑戰(zhàn)賽中的Multi-domain engagment estimation賽道中旨在解決當(dāng)前人工調(diào)解者的能力受限于行為感知和分析方面的進(jìn)展不足,進(jìn)而推動(dòng)和衡量在多領(lǐng)域參與度估計(jì)這一關(guān)鍵社會(huì)行為感知與分析任務(wù)上的進(jìn)展。

為應(yīng)對這些挑戰(zhàn),團(tuán)隊(duì)深入探索Seq2seq模型在不同時(shí)間窗口下的潛力,并提出了一種雙流AI-BiLSTM模型,該模型能夠?qū)R并交互對話者特征,以實(shí)現(xiàn)更準(zhǔn)確的參與度估計(jì)。通過從視覺(CLIP)、文本(XLM-RoBERTa)和語音(w2v-bert-2.0)中提取特征,能夠更全面地理解和預(yù)測對話者的參與度。在建模過程中,團(tuán)隊(duì)參考了ALbef和VL-BERT的設(shè)計(jì),最終選擇了基于AI-BiLSTM的建模方法。在推理時(shí),AI-BiLSTM在多人對話場景中的Concordance Correlation Coefficient (CCC)提升了8%,相較于第二名領(lǐng)先了10%,方案在ACM MM競賽中得到了驗(yàn)證,并以明顯的優(yōu)勢奪得了冠軍。不僅展示了團(tuán)隊(duì)在人工智能領(lǐng)域的技術(shù)實(shí)力,也為未來的人機(jī)交互和對話系統(tǒng)的發(fā)展提供了新的可能性。

5深度偽造檢測挑戰(zhàn)

Deepfakes挑戰(zhàn)賽通過視聽級檢測任務(wù),幫助區(qū)分真實(shí)視頻和深度偽造視頻,阻止深度偽造視頻在網(wǎng)絡(luò)上的傳播,保護(hù)信息的真實(shí)性和可靠性。在Deepfakes任務(wù)中,細(xì)粒度感知和跨模態(tài)交互能力的提升至關(guān)重要。

為解決Deepfakes提出的挑戰(zhàn),團(tuán)隊(duì)提出了一種創(chuàng)新的局部全局交互模塊(AV-LG模塊),顯著增強(qiáng)了模型的檢測性能。該模塊由局部區(qū)域內(nèi)自我注意、全局區(qū)域間自我注意和局部全局交互組成。為了消除視頻偽造檢測中傾向于將真實(shí)樣本預(yù)測為假樣本的偏差,團(tuán)隊(duì)適當(dāng)增加了真實(shí)樣本的誤差權(quán)重。此外,團(tuán)隊(duì)發(fā)現(xiàn)理解視頻語義對于視頻偽造檢測并非必要,因此通過傅里葉變換將采樣幀轉(zhuǎn)換為頻域,進(jìn)一步提高了模型性能。通過這些技術(shù)的應(yīng)用,不僅展示了團(tuán)隊(duì)在視頻偽造檢測領(lǐng)域的技術(shù)實(shí)力,也為未來的Deepfakes檢測技術(shù)提供了新的可能性。最終獲得本賽道冠軍,研究成果通過論文的形式在 ACM MM 會(huì)議上呈現(xiàn)。

6視覺空間關(guān)系描述挑戰(zhàn)

Visual Spatial Description(VSD)挑戰(zhàn)旨在解決視覺空間語義理解領(lǐng)域的相關(guān)問題,即通過讓模型和系統(tǒng)生成準(zhǔn)確的文本描述句子,來描述輸入圖像中兩個(gè)給定目標(biāo)對象之間的空間關(guān)系,進(jìn)而推動(dòng)計(jì)算機(jī)視覺和自然語言處理領(lǐng)域在空間關(guān)系理解與描述方面的研究進(jìn)展。這有助于人機(jī)交互場景下智能設(shè)備理解用戶意圖,提升用戶體驗(yàn)。

針對VSD提出的挑戰(zhàn),團(tuán)隊(duì)?wèi)?yīng)用 Retrieval Augmented Generation (RAG)技術(shù)來指導(dǎo)多模態(tài)大型語言模型 (MLLM)完成 VSD 任務(wù),并利用正負(fù)樣本解決幻覺問題,進(jìn)一步微調(diào)MLLM以增強(qiáng)語義理解和整體模型效能。該方案在VSD任務(wù)中的空間關(guān)系分類和視覺語言描述任務(wù)中都表現(xiàn)出更高的準(zhǔn)確性和更少的幻覺錯(cuò)誤,取得了令人滿意的結(jié)果。同時(shí),團(tuán)隊(duì)深入研究VSD與VSRC數(shù)據(jù)樣本不平衡問題,運(yùn)用樣本級加權(quán)損失和重采樣等策略,提高模型對低頻對象關(guān)系的學(xué)習(xí)能力,確保了其在復(fù)雜數(shù)據(jù)環(huán)境下能夠高效處理。這些策略為更高級的視覺空間描述任務(wù)鋪平了道路,為計(jì)算機(jī)視覺和自然語言處理領(lǐng)域的未來研究和實(shí)際實(shí)現(xiàn)提供了有價(jià)值的見解。團(tuán)隊(duì)以論文形式在 ACM MM會(huì)議上發(fā)表了研究成果并取得了亞軍。

此次斬獲5冠2亞,既是云知聲與中國科學(xué)技術(shù)大學(xué)緊密合作、持續(xù)探索人工智能賽道的成果,同時(shí)也是云知聲AGI技術(shù)架構(gòu)實(shí)力的有力證明。

作為國內(nèi)AGI技術(shù)產(chǎn)業(yè)化的先行者,云知聲依托其全棧AGI技術(shù)與產(chǎn)業(yè)布局,持續(xù)推動(dòng)千行百業(yè)的智慧化升級。2023年5月,云知聲發(fā)布山海大模型(UniGPT)以來,持續(xù)保持高速迭代,在 OpenCompass、SuperCLUE、MedBench、SuperBench、MMMU 等多項(xiàng)通用、醫(yī)療及多模態(tài)大模型權(quán)威評測中屢創(chuàng)佳績,通用能力穩(wěn)居國內(nèi)大模型第一梯隊(duì),醫(yī)療大模型能力持續(xù)保持領(lǐng)先優(yōu)勢。以通用大模型為基座,云知聲構(gòu)建起一個(gè)覆蓋醫(yī)療、交通、座艙等多場景在內(nèi)的智能體矩陣,并逐步完成 “助手→同事→專家” 的自我演進(jìn),為智慧生活、智慧醫(yī)療、智慧交通等業(yè)務(wù)提供高效的產(chǎn)品化支撐,推動(dòng)“U+X”戰(zhàn)略落實(shí),持續(xù)踐行 “以通用人工智能(AGI),創(chuàng)建互聯(lián)直覺的世界”的使命。

與中國科技大學(xué)的多模態(tài)技術(shù)合作,是云知聲多模態(tài)智能體演進(jìn)的重要組成部分。今年8月,云知聲推出山海多模態(tài)大模型,通過整合跨模態(tài)信息,實(shí)現(xiàn)實(shí)時(shí)多模態(tài)擬人交互體驗(yàn),進(jìn)一步夯實(shí)了云知聲AGI技術(shù)底座,推動(dòng)山海大模型在各領(lǐng)域的廣泛應(yīng)用。

展望未來,云知聲將繼續(xù)攜手中國科學(xué)技術(shù)大學(xué)等頂尖高校,共同加強(qiáng)人工智能基礎(chǔ)理論探索與關(guān)鍵技術(shù)突破。我們將積極擴(kuò)展AGI技術(shù)的應(yīng)用場景,為智慧物聯(lián)、智慧醫(yī)療等關(guān)鍵領(lǐng)域提供更為全面和深入的人工智能解決方案,致力通過人工智能技術(shù),為各行各業(yè)帶來革命性進(jìn)步,實(shí)現(xiàn)以AGI賦能千行百業(yè)的宏偉藍(lán)圖。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7786

    瀏覽量

    92954
  • 人工智能
    +關(guān)注

    關(guān)注

    1814

    文章

    49955

    瀏覽量

    263596
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    299

    瀏覽量

    9264

原文標(biāo)題:中國科大&云知聲聯(lián)合團(tuán)隊(duì)斬獲ACM MM 2024競賽5冠2亞

文章出處:【微信號(hào):云知聲,微信公眾號(hào):云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    CEO黃偉斬獲2025年度創(chuàng)業(yè)家殊榮

    近日,由創(chuàng)業(yè)黑馬主辦的“第17屆創(chuàng)業(yè)家年會(huì)”圓滿落幕,備受業(yè)界關(guān)注的《2025年度創(chuàng)業(yè)家》榜單同步揭曉。CEO黃偉博士憑借在通用人工智能(AGI)領(lǐng)域的前瞻布局與產(chǎn)業(yè)化深耕,成功斬獲
    的頭像 發(fā)表于 01-07 18:16 ?1628次閱讀

    斬獲2025格隆匯金格獎(jiǎng)年度卓越創(chuàng)新力IPO大獎(jiǎng)

    12月22日,格隆匯“金格獎(jiǎng)”年度卓越公司評選結(jié)果公布,(股票代碼:09678.HK)憑借上市以來在通用人工智能(AGI)領(lǐng)域的持續(xù)創(chuàng)新與顯著成果,成功斬獲“年度卓越創(chuàng)新力IPO
    的頭像 發(fā)表于 01-06 16:50 ?581次閱讀

    2025年長電科技斬獲多項(xiàng)權(quán)威榮譽(yù)

    2025年,長電科技在品牌、ESG、人才等領(lǐng)域斬獲多項(xiàng)權(quán)威榮譽(yù)。每一份獎(jiǎng)項(xiàng),都映照著我們對卓越、責(zé)任與可持續(xù)未來的堅(jiān)守。
    的頭像 發(fā)表于 12-31 14:01 ?293次閱讀

    與申能達(dá)簽署戰(zhàn)略合作協(xié)議

    日前,智能科技股份有限公司(以下簡稱“”)股票代碼:09678.HK)與廣西申能達(dá)智
    的頭像 發(fā)表于 10-11 09:12 ?596次閱讀

    攜手TCL空調(diào)煥新智能家電體驗(yàn)

    “空調(diào)開24度,新風(fēng)打開”——?jiǎng)偞蛲昊@球的小濤對著客廳遠(yuǎn)處的TCL空調(diào)發(fā)出指令,而空調(diào)無需聯(lián)網(wǎng)仍精準(zhǔn)執(zhí)行操作。這一離線狀態(tài)下的智能響應(yīng)場景,正是TCL空調(diào)與聯(lián)手研發(fā)的“基于端協(xié)
    的頭像 發(fā)表于 08-25 13:53 ?1063次閱讀

    在港交所成功上市

    近日,智能科技股份有限公司(以下簡稱“”)于香港聯(lián)合交易所主板掛牌上市,股份代號(hào):0
    的頭像 發(fā)表于 07-03 17:41 ?982次閱讀

    AGI龍頭企業(yè)港股上市,市值達(dá)147億港元

    為147.44億港元。 ? 圖:創(chuàng)始人董事長CEO黃偉博士在現(xiàn)場致辭表示:從今天起,我們將以香港為支點(diǎn),將中國AGI產(chǎn)品帶向全世界——用更敏捷的創(chuàng)新、更好的商業(yè)化和更開放的心胸,
    的頭像 發(fā)表于 06-30 11:44 ?3015次閱讀
    AGI龍頭企業(yè)<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>港股上市,市值達(dá)147億港元

    攜手南寧軌道打造智慧生活新范本

    報(bào)事報(bào)修系統(tǒng)基于獸牙智能體平臺(tái),定制開發(fā)了專屬智能體。系統(tǒng)全面覆蓋公共報(bào)修、家政服務(wù)、知識(shí)問答、投訴建議四大應(yīng)用場景,真正實(shí)現(xiàn)了“語音下單—自動(dòng)派單—實(shí)時(shí)反饋”的全流程閉環(huán)服務(wù)。
    的頭像 發(fā)表于 06-09 14:48 ?1038次閱讀

    再度登頂MedBench榜單

    近日,中文醫(yī)療大模型權(quán)威評測平臺(tái)MedBench公布最新自測榜單結(jié)果,基于山海大模型打造的醫(yī)療行業(yè)專用大模型(UniGPT-Med-U1)以綜合得分93.1的成績強(qiáng)勢衛(wèi)冕冠軍之位。尤為矚目
    的頭像 發(fā)表于 05-20 10:12 ?728次閱讀

    2024年蘑菇車聯(lián)斬獲多項(xiàng)海內(nèi)外重量級榮譽(yù)

    #p#副標(biāo)題#e#2024年以來,蘑菇車聯(lián)(MOGO.AI)憑借在人工智能、智能交通、智慧城市領(lǐng)域的技術(shù)創(chuàng)新與實(shí)踐成果,斬獲多項(xiàng)海內(nèi)外重量級榮譽(yù),贏得北京市科學(xué)技術(shù)委員會(huì)、
    的頭像 發(fā)表于 05-16 17:57 ?837次閱讀

    黃偉榮膺2024年度感動(dòng)海淀文明人物

    近日,領(lǐng)潮向善丨2024“感動(dòng)海淀”年度文明人物(集體)頒獎(jiǎng)典禮在中關(guān)村展示中心頤和廳盛大舉行。智能科技股份有限公司(以下簡稱“
    的頭像 發(fā)表于 05-13 14:30 ?769次閱讀

    斬獲中國AIGC產(chǎn)業(yè)雙項(xiàng)大獎(jiǎng)

    4月16日,由量子位主辦的中國AIGC產(chǎn)業(yè)峰會(huì)「萬物皆可AI」在北京盛大召開。憑借其在AI技術(shù)領(lǐng)域的深厚積淀及創(chuàng)新產(chǎn)品“獸牙AI Agent”的卓越表現(xiàn),一舉
    的頭像 發(fā)表于 04-21 14:13 ?797次閱讀

    與宜興大數(shù)據(jù)公司簽署合作協(xié)議

    近日,江蘇科技有限公司(簡稱“”)與宜興市大數(shù)據(jù)發(fā)展有限公司(簡稱“大數(shù)據(jù)公司”)簽
    的頭像 發(fā)表于 04-10 11:49 ?785次閱讀

    榮獲南京市鼓樓高新區(qū)突出貢獻(xiàn)企業(yè)獎(jiǎng)

    新春伊始,萬象更新,迎來了振奮人心的“開門紅”!2月10日,在南京市鼓樓高新區(qū)“2025年推進(jìn)產(chǎn)業(yè)高質(zhì)量發(fā)展優(yōu)化營商環(huán)境大會(huì)”上,江蘇
    的頭像 發(fā)表于 02-14 09:21 ?820次閱讀

    榮登2024數(shù)字技術(shù)創(chuàng)新企業(yè)TOP20榜單

    近日,朋湖網(wǎng)聯(lián)合機(jī)器人開放社區(qū)發(fā)布了“2024年度科技產(chǎn)業(yè)系列榜單”, 憑借其在AI技術(shù)創(chuàng)新與產(chǎn)業(yè)化應(yīng)用領(lǐng)域的卓越成就,榮登 “2024
    的頭像 發(fā)表于 01-23 09:11 ?920次閱讀