chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何降低開發(fā)門檻助力音視頻創(chuàng)新玩法

華為麒麟 ? 來源:華為麒麟 ? 作者:華為麒麟 ? 2021-09-28 10:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

9月16日,華為多媒體管線服務(AV Pipeline Kit)技術直播正式開啟。華為多媒體管線服務產(chǎn)品經(jīng)理Michelle、華為多媒體技術專家Salvatore、華為計算機視覺算法專家Ting、和華為AI技術專家Eric相聚直播間,深度解析了AV Pipeline Kit的技術要點和應用場景,助力廣大音視頻開發(fā)者以更輕松更高效的方式,為用戶提供新玩法,新交互。

緣起:音視頻開發(fā)面臨諸多挑戰(zhàn),麒麟?yún)f(xié)同各團隊力量推AV Pipeline Kit

隨著寬帶提速,5G 普及,AI技術應用,用戶對網(wǎng)絡視頻的內(nèi)容、互動性、播放速度和清晰度的要求越來越高。相應的,多媒體開發(fā)呈現(xiàn)出實時化和智能化的趨勢,開發(fā)者在開發(fā)與管理過程中,面臨更高的技術門檻、更多的開發(fā)工作量等諸多挑戰(zhàn)。

其一,開發(fā)難度進一步加大,開發(fā)成本更高。很多視頻+AI的開發(fā),需要在傳統(tǒng)管線中加入AI處理技術,這涉及到諸多數(shù)據(jù)處理能力,對于開發(fā)者來說技術門檻很高。

其二,端側(cè)實時化的智能視頻開發(fā)可能會遇到算力和功耗的限制。以端側(cè)超分為例,手機端算力比較受限,而視頻逐幀的超分實時處理對時延和功耗的要求是極高的。此外,視頻解碼后的數(shù)據(jù)要拿去做超分,就涉及到數(shù)據(jù)在不同IP之間的流轉(zhuǎn)和拷貝,會影響功耗,導致手機發(fā)燙。

以上諸多痛點,阻礙了開發(fā)者創(chuàng)新的腳步。為此,麒麟團隊整合了各個部門的能力,包括多媒體團隊、NPU團隊以及算法團隊,在今年7月份推出了華為多媒體管線服務(AV Pipeline Kit)。AV Pipeline Kit是一個面向安卓開發(fā)者的多媒體開放能力體系,它包含一個輕量級的多媒體開發(fā)框架和一系列高性能的音視頻處理插件,幫助開發(fā)者們降低開發(fā)難度,讓開發(fā)者們可以通過自定義流水線編排,將多種高性能插件快速集成到應用中,輕松實現(xiàn)更加豐富的多媒體功能。

輕量化設計:“拼樂高”式的流水線編排,助力開發(fā)者高效開發(fā)

在AV Pipeline Kit多媒體開發(fā)框架中,包含了多個預置的流水線編排,即一些現(xiàn)成的開箱即用的業(yè)務場景,被封裝成了接口供直接調(diào)用;同時也支持自定義流水線編排,將不同插件按不同的連接關系串聯(lián)起來形成新的業(yè)務場景。

如何簡單理解流水線編排的過程呢?以視頻超分為例,按照插件之間的處理順序來看,首先是一個音視頻的解封裝過程,然后會經(jīng)歷音視頻的解碼,而后解碼視頻幀會進行視頻超分處理,最后進行送顯。從輸入到輸出,可以看成是一個流水線的過程。

談及流水線編排的設計思路,華為多媒體技術專家Salvator表示,首先是對業(yè)務進行抽象,然后把它分割成子過程,對子過程再進行一個抽象,實現(xiàn)具體的插件,最后再把插件用Pipeline的方式拼接起來。這樣的好處一方面是便于統(tǒng)一管理,另一方面提高了復用度。

這個過程可以簡單理解為拼樂高,一個個插件就是一個個不同形狀的樂高片,開發(fā)者的業(yè)務就像搭樂高一樣,不同的開發(fā)者可以從插件庫里選擇需要的插件,拼成想要的業(yè)務場景。AV Pipeline Kit定義了一套插件標準接口,開發(fā)者只需要繼承這個接口類,并實現(xiàn)初始化和數(shù)據(jù)處理相關的邏輯即可,無需考慮并發(fā)、線程同步、狀態(tài)轉(zhuǎn)移、buffer池管理、多實例等問題,這些已經(jīng)全部由框架層實現(xiàn)好了。

突破:視頻超分,最高3倍超分效果背后的技術優(yōu)勢

所謂“超分”,可以理解為在視頻播放過程中進行智能識別與銳度優(yōu)化,從而讓視頻看起來比原本更清晰、明麗。在大型影視和游戲制作中,超分是一種非常關鍵的技術。想要在端側(cè)在線場景中,幫助開發(fā)者獲得實時化、高性能、低功耗的超分,就需要從AI技術到硬件資源調(diào)用的一系列優(yōu)化。

據(jù)華為計算機視覺算法專家Ting介紹,AV Pipeline Kit提供傳統(tǒng)的GPU超分方案和AI超分方案兩種,以達到性能和功耗的平衡。“比如我們檢測到在麒麟高端芯片上,就會優(yōu)先采用NPU的AI超分算法,最高可實現(xiàn)3倍的超分效果。如果沒有NPU的硬件,我們就會選擇GPU方案做超分處理,效果可能會有一些下降,但性能上是滿足了實時性要求的?!?/p>

為了幫助開發(fā)者便捷獲取真實可用的逐幀超分能力,實現(xiàn)超分不卡頓的體驗,AV Pipeline Kit首先在機器視覺算法上進行了一系列技術突破。比如,在AI模型結(jié)構上應用了卷積神經(jīng)網(wǎng)絡,提升了復雜真實場景的超分效果;在數(shù)據(jù)工程方面,用一系列方法還原了多媒體數(shù)據(jù)的構造過程,提升網(wǎng)絡的優(yōu)化結(jié)果;在端側(cè)模型壓縮方面,進行了新的網(wǎng)絡小型化探索,確保超分效果可以在端側(cè)場景中被很好地執(zhí)行。

其次,為了兼顧高性能與低功耗,AV Pipeline Kit和華為 HiAI Foundation之間也有不少配合。據(jù)華為AI技術專家Eric介紹,華為HiAI Foundation作為NPU使能的基礎平臺,能夠快速將原始模型轉(zhuǎn)換成華為Davinci Model,并通過Davinci Model的調(diào)優(yōu)技術,優(yōu)化模型結(jié)構,充分發(fā)揮NPU硬件單元的算力,令模型算子以更低功耗在手機端側(cè)高效運轉(zhuǎn)。

在超分業(yè)務中,內(nèi)存DDR的頻繁讀寫對性能和功耗都是很大的挑戰(zhàn)。HiAI Foudation算子庫在優(yōu)化模型執(zhí)行時,重點對算力和帶寬利用做了平衡,在滿足業(yè)務要求的算力情況下,盡可能的減少對于內(nèi)存的反復讀寫,更多的利用內(nèi)部buffer和cache,極大地提供了性能,降低了功耗。

在一系列的技術突破之后,用戶可以獲得更好的畫質(zhì)體驗,視頻平臺可以節(jié)省帶寬和服務器資源,開發(fā)者則能夠高效集成業(yè)務,降低工作量。

突破:聲音事件檢測,為實現(xiàn)98%識別率攻克的技術難題

對于開發(fā)者來說,聲音事件檢測是相對比較復雜的技術,需要豐富的技術資源與開發(fā)經(jīng)驗。AV Pipeline Kit將這些功能以文件配置的形式直接帶給開發(fā)者,且經(jīng)過麒麟團隊的長期深耕,聲音檢測事件插件可以確保聲音識別的準確與穩(wěn)定。

目前,AV Pipeline Kit聲音事件檢測目前已經(jīng)可以支持日常使用的13種聲音,包括無障礙功能、健康檢測、輔助安全駕駛、安全防盜、事故報警防剮蹭、停車啟動安全等豐富的場景。經(jīng)過研發(fā)團隊的深度優(yōu)化和組合驗證,當前識別準確率平均在98%以上,無論從聲音事件類別還是識別性能上來看,都屬于業(yè)界領先。

據(jù)華為計算機視覺算法專家Ting介紹,團隊主要聚焦在兩個點上做突破,確保了聲音識別的準確及穩(wěn)定性。一是解決了不同聲音事件的時間片段的長短。不同聲音事件長短不同,比如孩子的哭聲以及寵物叫聲,貓叫狗叫是瞬發(fā)型的,而哭是一個持續(xù)性的動作,所以他們的事件片段,時間片和長短是不一樣的,聲音事件檢測插件在設計網(wǎng)絡的時候,參考了Inception網(wǎng)絡,計算多個不同大小的卷積,這樣感受野就不同,進而提出的特征就更加具有針對性,特征空間更加豐富。

二是易混淆類別頻譜的區(qū)分。有一些聲音事件的混淆度比較高,比如在某些情況下小孩的哭聲和貓叫聲相當接近,無論是人區(qū)分以及轉(zhuǎn)化為頻譜信息之后去查看,都很容易混淆。聲音事件檢測插件引入技術注意力機制,對易混淆的類別做一個區(qū)分。

面向未來:

深挖視頻播放、編輯場景,為開發(fā)者提供創(chuàng)新能力

最后,華為多媒體技術專家Salvatore表示,AV Pipeline Kit后續(xù)會繼續(xù)完善框架和插件,重點關注如視頻播放、視頻編輯等對性能要求比較高,對功耗比較敏感的場景,包括考慮預置錄制和編輯業(yè)務,以及與人像拍攝美化相關的插件能力。

未來,麒麟團隊將持續(xù)投入核心技術,突破技術難點,簡化底層開發(fā)繁瑣流程和難點,降低智能化視頻開發(fā)的門檻,助力音視頻開發(fā)者技術創(chuàng)新,在激烈的競爭角逐中取勝。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DDR
    DDR
    +關注

    關注

    11

    文章

    740

    瀏覽量

    68065
  • 帶寬
    +關注

    關注

    3

    文章

    1006

    瀏覽量

    42788
  • 服務器
    +關注

    關注

    13

    文章

    10003

    瀏覽量

    90169
  • AI
    AI
    +關注

    關注

    88

    文章

    37065

    瀏覽量

    290366
  • AV
    AV
    +關注

    關注

    2

    文章

    269

    瀏覽量

    45063

原文標題:如何降低開發(fā)門檻,助力音視頻創(chuàng)新玩法?AV Pipeline Kit深度技術解析

文章出處:【微信號:Huawei_Kirin,微信公眾號:華為麒麟】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    音視頻開發(fā)全棧解析

    Media Kit 讓開發(fā)者可以調(diào)用系統(tǒng)的音視頻能力,涵蓋播放、錄制、錄屏、元數(shù)據(jù)提取與轉(zhuǎn)碼六大核心功能模塊,支撐系統(tǒng)應用與第三方應用在視頻播放、內(nèi)容創(chuàng)作、教學錄屏、直播互動等典型場景下的音視
    的頭像 發(fā)表于 09-18 14:42 ?350次閱讀
    <b class='flag-5'>音視頻</b><b class='flag-5'>開發(fā)</b>全棧解析

    千視電子受邀亮相2025音視頻產(chǎn)業(yè)鏈研討會,引領全鏈路音視頻IP化新趨勢

    2025年8月22日,由中國電子音響行業(yè)協(xié)會和湖南省工業(yè)和信息化廳聯(lián)合主辦的“2025音視頻產(chǎn)業(yè)鏈發(fā)展研討暨對接會”在長沙舉行?;顒訁R聚音視頻產(chǎn)業(yè)鏈上下游企業(yè),以及長沙市相關政府領導與行業(yè)
    的頭像 發(fā)表于 08-27 11:33 ?754次閱讀
    千視電子受邀亮相2025<b class='flag-5'>音視頻</b>產(chǎn)業(yè)鏈研討會,引領全鏈路<b class='flag-5'>音視頻</b>IP化新趨勢

    泰芯半導體推出星閃音視頻無線SOC芯片TXW828

    ,以技術創(chuàng)新突破行業(yè)邊界,為智能終端設備帶來革命性音視頻處理方案,標志著無線音視頻傳輸正式邁入“超高速、低時延、高可靠”的新紀元。
    的頭像 發(fā)表于 06-20 15:51 ?1957次閱讀

    中國音視頻產(chǎn)業(yè)邁向高質(zhì)量發(fā)展

    隨著超高清先鋒計劃的逐步推進,截至2024年底,中國音視頻產(chǎn)業(yè)規(guī)模超5萬億,包括個人消費電子、家庭影音娛樂、行業(yè)多媒體應用及車載視聽產(chǎn)業(yè)和相關衍生應用等行業(yè)企業(yè)超過百萬家,音視頻產(chǎn)業(yè)已經(jīng)成為國家數(shù)字經(jīng)濟發(fā)展的重要支柱。
    的頭像 發(fā)表于 04-24 11:10 ?924次閱讀

    音視頻一體化解決方案

    隨著數(shù)字化轉(zhuǎn)型加速,音視頻技術在各行業(yè)深度應用,傳統(tǒng)音視頻分散式管理系統(tǒng)面臨多源異構設備接入困難、數(shù)據(jù)孤島林立、運維復雜、協(xié)作效率低下等挑戰(zhàn),各行業(yè)對信息技術的需求逐漸從單一化向集成化、系統(tǒng)化轉(zhuǎn)變
    的頭像 發(fā)表于 04-24 09:14 ?709次閱讀

    2025年6月2日起,印度尼西亞對音視頻產(chǎn)品實施強制SNI認證!

    印度尼西亞/強制實施音視頻產(chǎn)品SNI認證2025年6月2日正式生效2024年11月13日,印度尼西亞工業(yè)部(MoI)頒布了第75號工業(yè)部條例《關于強制實施音視頻產(chǎn)品國家標準
    的頭像 發(fā)表于 03-14 17:37 ?2044次閱讀
    2025年6月2日起,印度尼西亞對<b class='flag-5'>音視頻</b>產(chǎn)品實施強制SNI認證!

    實用調(diào)試技能:全志T113-i 音視頻測試

    前言:音視頻功能是現(xiàn)代嵌入式系統(tǒng)中的核心應用之一,尤其在全志T113-i開發(fā)板中,其豐富的音視頻接口為開發(fā)者提供了強大的開發(fā)能力。本篇文章將
    的頭像 發(fā)表于 03-06 08:31 ?2016次閱讀
    實用調(diào)試技能:全志T113-i <b class='flag-5'>音視頻</b>測試

    RCA接口音視頻傳輸?shù)脑?/a>

    RCA接口音視頻傳輸?shù)脑碇饕谀M信號的傳輸方式。以下是對其傳輸原理的介紹: 一、RCA接口的基本結(jié)構 RCA接口,又稱AV接口或蓮花插座,其結(jié)構包括一個圓形的插頭和一個相應的插座。插頭上通常
    的頭像 發(fā)表于 02-17 15:36 ?1896次閱讀

    RK628H:高端音視頻處理與傳輸芯片詳解

    RK628H是一款集高清音視頻處理與傳輸功能于一體的高端芯片,專為滿足現(xiàn)代多媒體設備對高分辨率、高幀率視頻以及高質(zhì)量音頻的需求而設計。其強大的音視頻處理能力和多樣化的輸入輸出接口,使得RK628H在
    的頭像 發(fā)表于 02-10 17:56 ?1794次閱讀

    艾為電子助力閃極科技發(fā)布音視頻AI眼鏡

    日前,閃極科技發(fā)布 “閃極 A1 拍拍鏡”。這是一款音視頻AI眼鏡,搭載國產(chǎn)紫光展銳去蜂窩平臺,內(nèi)置1600萬索尼高清攝像頭。旅行、日常,輕觸鏡腿即可拍照攝像,解放雙手,所見即拍,無感出行。
    的頭像 發(fā)表于 01-06 10:49 ?1097次閱讀
    艾為電子<b class='flag-5'>助力</b>閃極科技發(fā)布<b class='flag-5'>音視頻</b>AI眼鏡

    國科微榮獲音視頻領域關鍵技術突破一等獎

    近日,第五屆“馬欄山杯”國際音視頻算法大賽-2024音視頻領域關鍵技術突破獎揭曉,國科微8K超高清視頻系列芯片憑借優(yōu)異的產(chǎn)品性能及示范性應用獲評一等獎。
    的頭像 發(fā)表于 12-26 15:11 ?771次閱讀

    音視頻“春晚”Pick的電視!海信激光電視又獲新獎!

    12月11日,2024年中國音視頻大會(AVF)在北京盛大開幕,作為音視頻領域最具影響力的行業(yè)盛會,會議對2024年度的創(chuàng)新產(chǎn)品和技術進行了隆重表彰。 在此次大會上,海信的三款創(chuàng)新產(chǎn)品
    的頭像 發(fā)表于 12-16 14:46 ?1105次閱讀
    <b class='flag-5'>音視頻</b>“春晚”Pick的電視!海信激光電視又獲新獎!

    AMS-WE100P無線延長器:讓高清音視頻傳輸無界限

    在追求高效與便捷的今天,高清音視頻的無縫傳輸已成為我們?nèi)粘I詈凸ぷ髦胁豢苫蛉钡囊徊糠?。深圳市程達科技有限公司憑借其創(chuàng)新技術和深厚底蘊,推出了AMS-WE100P無線延長器,這款設備以其卓越的性能和廣泛的應用場景,正逐步成為高清音視頻
    的頭像 發(fā)表于 11-28 10:07 ?806次閱讀

    AMS-HE200:HDMI音視頻網(wǎng)絡延長器,開啟傳輸新時代

    傳輸領域的領軍企業(yè),憑借其強大的技術實力和創(chuàng)新能力,推出了全新的AMS-HE200 HDMI音視頻網(wǎng)絡延長器,旨在為用戶帶來更加高效、穩(wěn)定、便捷的傳輸體驗。 一、產(chǎn)品亮點? AMS-HE200作為一款高性能的HDMI音視頻網(wǎng)絡延
    的頭像 發(fā)表于 11-27 10:04 ?852次閱讀
    AMS-HE200:HDMI<b class='flag-5'>音視頻</b>網(wǎng)絡延長器,開啟傳輸新時代

    Amoonsky創(chuàng)新音視頻連接技術:全新推出AMS-HE200 HDMI網(wǎng)線延長器

    簡介: 在不斷向高清多媒體體驗邁進的世界中,強大的音視頻連接需求變得前所未有的重要。AMS-HE200,Amoonsky開創(chuàng)性的HDMI網(wǎng)線延長器,成為重新定義音視頻網(wǎng)絡格局的解決方案。這款創(chuàng)新
    的頭像 發(fā)表于 10-24 16:09 ?721次閱讀
    Amoonsky<b class='flag-5'>創(chuàng)新</b><b class='flag-5'>音視頻</b>連接技術:全新推出AMS-HE200 HDMI網(wǎng)線延長器