chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

愛奇藝技術(shù)總監(jiān):奇觀識別方案從云遷移到端的探索和實踐

電子設(shè)計 ? 來源:電子設(shè)計 ? 作者:電子設(shè)計 ? 2020-12-08 23:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近年來,各類短視頻、視頻應(yīng)用如雨后春筍般涌現(xiàn), “AI+ 視頻"的模式也是近期的熱點方向。

奇觀是愛奇藝原創(chuàng)推出的 AI 創(chuàng)新應(yīng)用產(chǎn)品,它融合了多模態(tài)人物識別、卡通角色識別、臺詞實體抽取、BGM 識別等 AI 技術(shù),支持用戶在觀影過程中識別視頻中的明星人物、卡通角色、背景音樂和臺詞梗等視頻內(nèi)信息。

為了進(jìn)一步了解愛奇藝在“AI+ 視頻”方向上的探索,在 QCon 上海站前夕,InfoQ 有幸采訪了愛奇藝技術(shù)總監(jiān)朱俊敏,聽他分享愛奇藝奇觀如何融合了多模態(tài)人物識別、卡通角色識別、BGM 識別、臺詞實體抽取等多種 AI 技術(shù)來挖掘視頻的周邊內(nèi)容。

愛奇藝在“AI+ 視頻”上的探索

作為視頻平臺,愛奇藝一直致力于人工智能與視頻、娛樂產(chǎn)業(yè)的結(jié)合,并陸續(xù)推出了針對內(nèi)容創(chuàng)作、用戶推薦等方面的智能產(chǎn)品。奇觀 是愛奇藝原創(chuàng)推出的 AI 創(chuàng)新應(yīng)用產(chǎn)品,截至今年 7 月,奇觀功能累計使用量已超 20 億次。

據(jù)愛奇藝技術(shù)總監(jiān)朱俊敏介紹,作為一款融合了多模態(tài)人物識別、卡通角色識別、臺詞實體抽取、BGM 識別等 AI 技術(shù)的產(chǎn)品,奇觀的萌芽需求來源于用戶。當(dāng)時愛奇藝在分析用戶的彈幕時發(fā)現(xiàn),有一定比例的用戶都在詢問“當(dāng)前的演員是誰?”, “背景音樂是啥?” 等跟視頻強(qiáng)相關(guān)的問題。原來用戶獲取該類問題的答案路徑是通過愛奇藝搜索或者百度搜索,但是效果并不是很好,造成這一結(jié)果的原因主要有兩方面:一方面是因為用戶需要打破原來沉浸式的觀影體驗;另一方面在于搜索無法做到海量內(nèi)容實時索引,內(nèi)容熱播的時候一般是無法搜索到用戶想要的結(jié)果的。

為了解決上述問題,愛奇藝于 2019 年首先在 TV 端進(jìn)行了一些嘗試。用戶在觀影時(當(dāng)時的名字叫 AI 雷達(dá)),可以通過遙控上鍵識別視頻中的明星,奇觀產(chǎn)品推出后得到用戶的一致好評,功能滲透率超出團(tuán)隊的預(yù)期。

后來,研發(fā)團(tuán)隊又將該功能擴(kuò)展到移動端,通過雙指雙擊的簡單手勢觸達(dá)更多的用戶群體,滿足用戶了解內(nèi)容背后知識的需求。識別能力也逐漸從原來的明星識別, 擴(kuò)展到背景音樂識別,臺詞實體知識,卡通角色識別等。

對紛繁復(fù)雜的明星、背景音樂、卡通角色等元素的精準(zhǔn)識別并不是件容易事。就拿多模態(tài)人物識別來說,愛奇藝針對視頻中人物身份識別的難點進(jìn)行了全方位的優(yōu)化改進(jìn),利用人臉質(zhì)量模型顯著減低了誤檢、差臉的干擾,綜合利用人臉、人頭、人體、聲紋等多維度特征信息,通過局部加全局聚類的方式,對視頻中的人物進(jìn)行識別,大幅度提高了識別精度和召回。同時,團(tuán)隊還提供人臉的多維度屬性標(biāo)簽,如年齡、男女、顏值等,并將屬性標(biāo)簽和人臉識別模型進(jìn)行整合,在保證精度的情況下,顯著降低資源開銷、提高資源利用效率。目前線上模型包含 10+ 個屬性,相較于工業(yè)界的其他模型更加全面。愛奇藝人臉識別與屬性模型十五合一,一個模型可以同時識別身份屬性,且各項屬性的識別精度也比較高。目前線上奇觀服務(wù)的明星識別準(zhǔn)確率達(dá) 99.5%。

多模態(tài)人物識別技術(shù)的技術(shù)實現(xiàn)框圖如下:

朱俊敏坦言,為了達(dá)到 99.5% 的明星識別準(zhǔn)確率,算法團(tuán)隊付出了諸多努力。首先,他們分別訓(xùn)練了人臉、人頭、人體和聲紋特征的提取模型。再在人臉的幀級特征上增加了一個 NetVLAD 模塊,將幀級特征轉(zhuǎn)換成視頻維度的特征,這樣可以充分利用幀級人臉信息,提高特征的表達(dá)能力。在特征融合層,為了充分利用多模態(tài)特征,并且降低了噪聲的干擾,團(tuán)隊還創(chuàng)新性地提出了 Multi-model Attention 模塊來自適應(yīng)地對各個模態(tài)分配不同的權(quán)重,并基于這些權(quán)重來進(jìn)行多模態(tài)特征的融合,顯著提高了算法的魯棒性,大幅度提高了視頻人物識別的精度。

下面的表格是研發(fā)團(tuán)隊從人臉特征開始逐漸增加多模態(tài)特征信息、NetVLAD 和 MMA 模塊的精度收益情況,從表中可以得出,隨著多模態(tài)信息的增加,愛奇藝的人臉識別精度穩(wěn)定提升,這充分驗證了愛奇藝多模態(tài)人物識別方法的有效性。

這樣一項識別準(zhǔn)確度高、廣受好評的產(chǎn)品,其實它的研發(fā)周期并沒有十分漫長。朱俊敏表示,多年來,愛奇藝在 NLP、聲音和視覺的 AI 能力方面有深厚的積累,得益于愛奇藝長期對算法團(tuán)隊的投入,當(dāng)決定做奇觀產(chǎn)品時,大部分的算法和基礎(chǔ)設(shè)施已經(jīng)比較成熟。團(tuán)隊只需從用戶需求出發(fā),根據(jù)實際場景對算法和方案進(jìn)行策略調(diào)整,快速實現(xiàn)產(chǎn)品化。朱俊敏稱:

如果將奇觀比喻為一棟房子,多模態(tài)人物識別、卡通角色識別、BGM 識別等 AI 技術(shù)就是地基。正是因為對 AI 長期的投入,有堅實的地基以支撐愛奇藝蓋出更漂亮的房子。

識別方案如何從云遷移到端

從奇觀萌生開始,研發(fā)團(tuán)隊就決定采用純云端的識別方案,之所以會做出這樣的決定,朱俊敏介紹,主要是考慮到算法的復(fù)雜度,在客戶端既要播放視頻(需要處理解碼和上屏),又要處理 AI 算法,芯片性能可能跟不上,而且手機(jī)的散熱和電池問題也會比較突出,所以奇觀一開始定方案的時候是采用純云端的識別方案。

后來,隨著算法的優(yōu)化和解耦,以人物識別為例,實現(xiàn)檢測和識別的解耦,而且人臉檢測的算法做到足夠輕量級,實現(xiàn) CPU 可流暢推理。團(tuán)隊開始尋求實現(xiàn)云 + 端的模式, 把算法解耦,檢測部署在端上,識別部署在云端。這樣做的好處是:一方面,在端上做檢測,可以過濾很多無人物的情況,減少網(wǎng)絡(luò)傳輸和云端識別的計算資源浪費;另一方面,端上做檢測,在用戶交互體驗可以更優(yōu),實現(xiàn)人物區(qū)域可跟蹤。

端上的識別方案不是云端方案的簡單復(fù)刻,朱俊敏提到,在實現(xiàn)“云 + 端”的過程中,其難點主要在于兩方面:一方面是芯片的適配,原來云端 GPU 的算法,考慮到客戶端上 GPU 的參差不齊,需要把算法改造成 CPU 推理模式。另一方面,算法模型遷移到客戶端,需要考慮到客戶端本身的限制,不能顯著增加整體 app 安裝包的大小。所以為了適配客戶端,算法本身需要做 CPU 遷移,并通過蒸餾壓縮模型大小,同時還需要客戶端的工程師配合集成相應(yīng)的算法 runtime,同時建立模型動態(tài)加載的機(jī)制,盡可能地減少客戶端的包的大小。

“云 + 端”模式將更快普及和應(yīng)用

隨著 5G 的逐步發(fā)展,朱俊敏認(rèn)為,“云 + 端”這種模式會得到更快的普及和應(yīng)用。5G 將作為一種全新的網(wǎng)絡(luò)架構(gòu),提供 10Gbps 以上的峰值速率、更佳的移動性能、毫秒級時延和超高密度連接。而且客戶端的性能越來越強(qiáng),前面提到的云 + 端難點將不再是問題。這樣可以給算法部署和應(yīng)用更多的靈活性,業(yè)務(wù)可以根據(jù)自己場景和用戶體驗來決定是否將更多的算法部署到客戶端。

而且 5G 網(wǎng)絡(luò)的特性,決定其更加去中心化,需要在網(wǎng)絡(luò)邊緣部署小規(guī)?;蛘弑銛y式數(shù)據(jù)中心,進(jìn)行終端請求的本地化處理,也就是人們所說的邊緣計算,將來的服務(wù)可能會進(jìn)一步從“云 + 端”過度到“云 + 邊 + 端”的模式上。

除了在“云 + 端”模式上繼續(xù)發(fā)力外,奇觀下一步的重點會繼續(xù)擴(kuò)展識別的品類。比如:動植物的百科實體類識別;電子產(chǎn)品和汽車等標(biāo)準(zhǔn)品的識別;以及各類穿著垂類商品的識別。另一方面會繼續(xù)優(yōu)化現(xiàn)有的識別體驗,提高整體有結(jié)果率,目標(biāo)是實現(xiàn)應(yīng)有盡有的識別。

因為身處在內(nèi)容行業(yè),朱俊敏還表示,他會繼續(xù)關(guān)注 AI 在聲音和視覺上的算法創(chuàng)新,探索交互方面的新場景,未來,希望看到 AI 在內(nèi)容創(chuàng)意和創(chuàng)作方面也能發(fā)揮上賦能提效的作用。

嘉賓介紹:

朱俊敏,愛奇藝技術(shù)總監(jiān)。上海交通大學(xué)碩士,擁有 3 篇美國專利, 8 篇中國專利。2015 年加入愛奇藝,負(fù)責(zé) AI 產(chǎn)品落地和創(chuàng)新應(yīng)用開發(fā),先后孵化了 HomeAI(智能語音交互平臺), 奇觀(智能識別平臺),逗芽(表情生產(chǎn)和分發(fā)平臺) 等創(chuàng)新應(yīng)用。

本文轉(zhuǎn)自 公眾號:AI前線 ,作者李冬梅,點擊閱讀原文

審核編輯:符乾江
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249647
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122805
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何將項目IAR遷移到Embedded Studio

    本文描述如何將IAR EWARM項目遷移到SEGGER Embedded Studio(簡稱SES)中。
    的頭像 發(fā)表于 02-25 17:11 ?600次閱讀
    如何將項目<b class='flag-5'>從</b>IAR<b class='flag-5'>遷移到</b>Embedded Studio

    INA219遷移到INA232

    電子發(fā)燒友網(wǎng)站提供《INA219遷移到INA232.pdf》資料免費下載
    發(fā)表于 11-14 14:17 ?1次下載
    <b class='flag-5'>從</b>INA219<b class='flag-5'>遷移到</b>INA232

    USCI模塊遷移到eUSCI模塊

    電子發(fā)燒友網(wǎng)站提供《USCI模塊遷移到eUSCI模塊.pdf》資料免費下載
    發(fā)表于 10-18 10:39 ?0次下載
    <b class='flag-5'>從</b>USCI模塊<b class='flag-5'>遷移到</b>eUSCI模塊

    TMS320VC5509遷移到TMS320VC5509A

    電子發(fā)燒友網(wǎng)站提供《TMS320VC5509遷移到TMS320VC5509A.pdf》資料免費下載
    發(fā)表于 10-17 10:38 ?0次下載
    <b class='flag-5'>從</b>TMS320VC5509<b class='flag-5'>遷移到</b>TMS320VC5509A

    TMS320C64x遷移到TMS320C64x+

    電子發(fā)燒友網(wǎng)站提供《TMS320C64x遷移到TMS320C64x+.pdf》資料免費下載
    發(fā)表于 10-16 10:26 ?0次下載
    <b class='flag-5'>從</b>TMS320C64x<b class='flag-5'>遷移到</b>TMS320C64x+

    OMAP3530遷移到AM37x

    電子發(fā)燒友網(wǎng)站提供《OMAP3530遷移到AM37x.pdf》資料免費下載
    發(fā)表于 10-14 11:39 ?0次下載
    <b class='flag-5'>從</b>OMAP3530<b class='flag-5'>遷移到</b>AM37x

    TMS320DM6467遷移到TMS320DM6467T

    電子發(fā)燒友網(wǎng)站提供《TMS320DM6467遷移到TMS320DM6467T.pdf》資料免費下載
    發(fā)表于 10-14 11:30 ?0次下載
    <b class='flag-5'>從</b>TMS320DM6467<b class='flag-5'>遷移到</b>TMS320DM6467T

    TMS320DM6446 594MHz遷移到810MHz

    電子發(fā)燒友網(wǎng)站提供《TMS320DM6446 594MHz遷移到810MHz.pdf》資料免費下載
    發(fā)表于 10-14 11:18 ?0次下載
    <b class='flag-5'>從</b>TMS320DM6446 594MHz<b class='flag-5'>遷移到</b>810MHz

    TMS320C6455遷移到TMS320C6474

    電子發(fā)燒友網(wǎng)站提供《TMS320C6455遷移到TMS320C6474.pdf》資料免費下載
    發(fā)表于 10-14 09:20 ?0次下載
    <b class='flag-5'>從</b>TMS320C6455<b class='flag-5'>遷移到</b>TMS320C6474

    TMS320C5515遷移到TMS320C5517

    電子發(fā)燒友網(wǎng)站提供《TMS320C5515遷移到TMS320C5517.pdf》資料免費下載
    發(fā)表于 10-12 10:40 ?0次下載
    <b class='flag-5'>從</b>TMS320C5515<b class='flag-5'>遷移到</b>TMS320C5517

    OMAP3530遷移到AM35x

    電子發(fā)燒友網(wǎng)站提供《OMAP3530遷移到AM35x.pdf》資料免費下載
    發(fā)表于 10-12 09:26 ?0次下載
    <b class='flag-5'>從</b>OMAP3530<b class='flag-5'>遷移到</b>AM35x

    IT資源遷移到服務(wù)器的關(guān)鍵因素

    隨著計算技術(shù)的不斷成熟和普及,越來越多的企業(yè)選擇將他們的IT資源遷移到服務(wù)器上。這種轉(zhuǎn)變不僅可以降低成本、提高靈活性,還可以提升安全性和效率。本文將深入探討將IT資源
    的頭像 發(fā)表于 09-18 11:21 ?594次閱讀

    華納:企業(yè)遷移到云端的主要原因是什么?

    企業(yè)遷移到云端的主要原因是什么?原因不止一個。削減成本通常被認(rèn)為是主要原因——但盡管通過遷移降低成本無疑是一種誘人的可能性,但創(chuàng)新潛力才是更大的獎勵。計算通過支持企業(yè)創(chuàng)新而產(chǎn)生的價
    的頭像 發(fā)表于 09-14 17:38 ?530次閱讀

    遷移到基于Arm STM32的MSPMO指南

    電子發(fā)燒友網(wǎng)站提供《遷移到基于Arm STM32的MSPMO指南.pdf》資料免費下載
    發(fā)表于 09-07 11:17 ?0次下載
    <b class='flag-5'>從</b><b class='flag-5'>遷移到</b>基于Arm STM32的MSPMO指南

    龍智Atlassian ITSM解決方案遷移解決方案詳解:高速ITSM實施+遷移服務(wù)

    隨著計算技術(shù)的不斷成熟與普及,企業(yè)對于高效、靈活的IT服務(wù)管理(ITSM)與無縫的遷移解決方案的需求日益增長。如何有效管理復(fù)雜的IT環(huán)境,加速業(yè)務(wù)上
    的頭像 發(fā)表于 09-04 09:41 ?552次閱讀
    龍智Atlassian ITSM解決<b class='flag-5'>方案</b>、<b class='flag-5'>云</b><b class='flag-5'>遷移解決方案</b>詳解:高速ITSM實施+<b class='flag-5'>端</b>到<b class='flag-5'>端</b>的<b class='flag-5'>云</b><b class='flag-5'>遷移</b>服務(wù)