chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淘寶直播窄帶高清技術(shù),音視頻技術(shù)趨勢探討

LiveVideoStack ? 來源:LiveVideoStack ? 2020-09-08 14:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文來自阿里巴巴淘系技術(shù)部 高級算法專家王立波在LiveVideoStackCon 2020線上峰會的分享,從直播背景、直播痛點分析、窄帶高清、云視頻技術(shù)趨勢幾方面詳細(xì)介紹了如何在確保用戶體驗QOS不變的前提下,實現(xiàn)淘寶直播的技術(shù)架構(gòu)升級和成本大幅縮減。

本次分享內(nèi)容主要分為五個部分,首先是全民直播大時代的背景介紹,第二是直播痛點分析,第三是淘寶直播窄帶高清技術(shù),第四是音視頻技術(shù)趨勢探討,最后是在線互動。 1 背景-全民直播大時代

在疫情的影響下,直播從傳統(tǒng)的秀場應(yīng)用逐漸滲透到行業(yè)的各個領(lǐng)域。包括在線課堂,旅游,政企,房車銷售等等,可以說是全民直播時代已經(jīng)到來。

在這樣的一個大背景下,過去一年淘寶直播得以快速發(fā)展。2019年,淘寶直播擁有了4億+的年度用戶規(guī)模,有100萬+年度主播入駐,2000億+年度直播成交以及4000萬+直播商品。春節(jié)期間,釘釘在線課堂更是有350萬+的教師主播,為1.2億+中小學(xué)生提供了在線課程服務(wù)。 2 直播痛點分析

在這么大的一個業(yè)務(wù)體量下,我們將會面對非常多的難點與挑戰(zhàn)??偟膩碚f,包含以下三個部分,首先是成本,包括帶寬、存儲和轉(zhuǎn)碼三個方面。其次是用戶體驗,例如畫質(zhì),音質(zhì),秒開、卡頓和延時。最后是效率方面,例如開播的效率、審核的效率和理解分發(fā)的效率。接下來我們就來看一下淘寶在成本和體驗優(yōu)化方面做了哪些工作。 3 淘寶直播窄帶高清技術(shù) 3.1 淘寶直播窄帶高清

淘寶直播有三大核心技術(shù),第一大核心技術(shù)是端上窄帶高清。我們采用HEVC編碼實現(xiàn)了720p,25fps,800kbps的壓縮,并且PSNR> 43db/VMAF>90。端上窄帶高清技術(shù)主要應(yīng)用有三個方面:第一是音視頻增強(qiáng),采用基于AI的圖像增強(qiáng)、美顏和語音增強(qiáng)來提高生產(chǎn)質(zhì)量。第二是感知處理,采用信源信道聯(lián)合自適應(yīng)編碼。第三是S265編碼器,S265編碼器是業(yè)界領(lǐng)先的HEVC編碼器。 第二大核心技術(shù)是零轉(zhuǎn)碼系統(tǒng),我們實現(xiàn)了端到端原始流生產(chǎn)的和播放,成功的解決了兩個核心的痛點問題:不同網(wǎng)絡(luò)速度的兼容和不同播放設(shè)備的兼容,后者主要通過高性能解碼器實現(xiàn)iOS,Android和H5三端的100%解碼。 第三大核心技術(shù)是低延時技術(shù),我們實現(xiàn)了端到端秒級延時。主要依靠兩個技術(shù),一個是基于RTC的實時直播系統(tǒng),第二個是S265低延時編碼技術(shù)。 3.2 淘寶直播系統(tǒng)架構(gòu)

如圖所示淘寶直播的系統(tǒng)架構(gòu),從生產(chǎn)側(cè)來看,有采集、增強(qiáng)、感知處理、S265編碼四個環(huán)節(jié)。云端我們有邊緣的接入,有中心接入、切片錄制和CDN分發(fā)以及邊緣分發(fā)。在播放端有擁塞控制、解碼、渲染和顯示。除此之外,在云端還有內(nèi)容審核,質(zhì)量監(jiān)控,內(nèi)容理解和智能分發(fā)。 3.3 端上窄帶高清

生產(chǎn)側(cè)的第一個環(huán)節(jié)是圖像增強(qiáng),為了提升主觀質(zhì)量,我們引入了圖像增強(qiáng)技術(shù),對編碼前的視頻做去噪、去抖、紋理增強(qiáng)以及美顏、美型的功能。除此以外,在后處理部分,我們還引入了適時超分和HDR技術(shù)來提高觀看質(zhì)量。在美顏、美型以及圖像處理等方面,我們引入了GPU的技術(shù),包括內(nèi)存帶寬優(yōu)化、shader優(yōu)化、Pipeline優(yōu)化等等以減少GPU的開銷。

針對音質(zhì)的優(yōu)化,我們采用了智能降噪技術(shù)。無論是在STO還是PESQ的指標(biāo)上都顯著高于傳統(tǒng)WebRTC算法,在性能和包大小方面也都可以實現(xiàn)普通設(shè)備的覆蓋。下面播放的三段音頻,分別是原始音頻、RTC降噪和阿里降噪音頻。原始音頻我們可以明顯聽到馬路上車呼嘯而過的聲音非常強(qiáng)烈。RTC降噪音頻中降噪產(chǎn)生了一定的效果,但是汽車飛馳而過的呼嘯聲還是非常明顯。而在阿里降噪音頻中,我們可以聽到汽車呼嘯而過的聲音已經(jīng)基本消失。

生產(chǎn)的第二個環(huán)節(jié)是感知處理。我們采用信源信道聯(lián)合自適應(yīng)編碼技術(shù)。感知處理分為5個方面,首先是ROI區(qū)域的感知,我們基于PixelAI人臉檢測加商品檢測,對ROI區(qū)域進(jìn)行提取和重點編碼。第二是場景的感知,不同的場景適合不同的編碼參數(shù),我們通過對場景進(jìn)行分類,對于不同的場景賦予不同的編碼參數(shù)來提高壓縮質(zhì)量。第三個是智能碼控CARC,我們采用機(jī)器學(xué)習(xí)的碼率控制,對簡單場景賦予較低的碼率,對復(fù)雜的場景賦予較高的碼率來實現(xiàn)對帶寬的節(jié)省。第四個是網(wǎng)絡(luò)帶寬的感知,在網(wǎng)絡(luò)比較好的時候,我們會采用比較高的碼率來實現(xiàn)畫質(zhì)的提升,在網(wǎng)絡(luò)不太好的時候,會降低碼率,避免發(fā)生帶寬擁塞,由于cdn采用峰值收費,峰谷時間段還可以采用不同碼率策略。最后是設(shè)備算力的感知,不同的設(shè)備擁有不同的算力,我們可以實時檢測設(shè)備的算力情況及時調(diào)整編碼的檔次,以此來實現(xiàn)對算力和質(zhì)量的平衡。

生產(chǎn)的第三個環(huán)節(jié)是編碼,這又要講到我們核心的S265編碼器,得益于S265編碼器的編碼壓縮技術(shù),我們實現(xiàn)了淘寶直播的720p、800kbs、25fps編碼,相比于業(yè)界常見的720p 1600kbps 節(jié)省了50%的帶寬。釘釘?shù)脑诰€課堂我們更是把碼率壓縮到了200kbs,并實現(xiàn)了43db以上的質(zhì)量。S265是淘寶和阿里云共同發(fā)起的HEVC編碼器,目前已經(jīng)實現(xiàn)集團(tuán)內(nèi)部的開源,并落地在點播、直播會議等各個場景中。相比起業(yè)界優(yōu)秀的HEVC編碼器,S265在PSNR指標(biāo)上有比較大的優(yōu)勢。首先在編碼工具提升方面,我們做了大量工作,實現(xiàn)了HierarchyB、GPB、Bi-Search、Longterm、RDOQ、AdaptGOP等編碼工具,并且對這些工具進(jìn)行了大量的算法和速度優(yōu)化。我們還設(shè)計了50多種快速算法,比如說Deblock的優(yōu)化,編碼速度對比X265有1倍以上的提速。在工程上的優(yōu)化,我們做了浮點轉(zhuǎn)定點、位寬的縮減、SIMD的優(yōu)化、冗余去除、訪存效率提升及循環(huán)展開等等來提升我們的編碼速度。在框架方面,我們還做了線程調(diào)度優(yōu)化等等。在碼率控制方面,我們對幀級別碼控和塊級別碼控分別進(jìn)行了優(yōu)化,并且對2pass編碼進(jìn)行了原創(chuàng)性的優(yōu)化來提高2pass編碼的質(zhì)量。在塊級別碼控中,我們設(shè)計了新的CUTree和AQ算法。

下面來看一下S265的幾個典型優(yōu)化,首先是CU劃分決策,我們把CU劃分決策模塊分成兩個步驟,一是紋理強(qiáng)度決策,通過計算CU的紋理梯度來判別平坦塊和復(fù)雜塊,如果是平坦塊就直接退出,如果是復(fù)雜塊就繼續(xù)向下劃分。第一步可以解決大部分塊劃分的決策問題,但是對于模棱兩可的塊,則需要依靠CNN模型來輔助劃分。我們使用了一個5層網(wǎng)絡(luò)的小模型把決策的準(zhǔn)確度從72%提升到了96%;這個成果我們跟清華大學(xué)劉老師合作發(fā)表了一篇論文,在DCC會議上展示。

第二個方面的優(yōu)化是運動搜索方面的優(yōu)化。運動搜索是從參考幀尋找最佳匹配塊的過程,包含整像素搜索和分像素搜索,分像素需要做7抽頭或8抽頭插值濾波,計算量大;整像素搜索已經(jīng)有比較多的快速算法,比如菱形搜索、六邊形搜索及分層搜索,但分像素搜索一直沒有什么好的方法。比如在圖中矩形的整像素周圍,分布著60個分像素點,如果要對分像素點進(jìn)行全部搜索的話,需要60次,經(jīng)過優(yōu)化之后一般需要搜4個、8個或16個點,但搜索次數(shù)還是比較多的。我們采用一個二元二次誤差平面方程,用9個整像素點的預(yù)測誤差來求解方程的5個系數(shù),再對方程求偏導(dǎo),可得到最佳分像素點的位置。只需對這個最佳分像素點計算1個1/4差值,就可以完成我們的搜索過程。這個技術(shù)在編碼器的整個提速有12%,但bd-PSNR只有-0.016db。這些成果在VCIP 2016上可以看到。

第三個是我們的碼率控制。ABR是較適合直播的一種碼率控制方法。但HM中基于

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 直播
    +關(guān)注

    關(guān)注

    1

    文章

    266

    瀏覽量

    22869
  • 窄帶
    +關(guān)注

    關(guān)注

    0

    文章

    19

    瀏覽量

    12978
  • 高清技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    16

    瀏覽量

    14714

原文標(biāo)題:淘寶直播窄帶高清技術(shù)

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    從 “卡脖子” 到 “自主可控”,音視頻分布式系統(tǒng)國產(chǎn)化實踐之路

    在當(dāng)前全球音視頻芯片市場格局中,國外企業(yè)長期占據(jù)主導(dǎo)地位,核心技術(shù)與核心器件的壟斷的局面,曾是國內(nèi)音視頻行業(yè)發(fā)展的重要制約因素。近年來,隨著國際形勢的深刻變化,國外對我國芯片行業(yè)的技術(shù)
    的頭像 發(fā)表于 03-02 11:18 ?56次閱讀
    從 “卡脖子” 到 “自主可控”,<b class='flag-5'>音視頻</b>分布式系統(tǒng)國產(chǎn)化實踐之路

    高清混合轉(zhuǎn)換器:模塊化技術(shù)重塑音視頻信號轉(zhuǎn)換行業(yè)格局

    近日,一款全新的高清混合轉(zhuǎn)換器在成都某產(chǎn)品發(fā)布中心正式亮相。作為國內(nèi)首款采用模塊化、插卡式設(shè)計的高清數(shù)?;旌限D(zhuǎn)換器,該產(chǎn)品的推出在音視頻行業(yè)引發(fā)廣泛關(guān)注,其創(chuàng)新設(shè)計打破了傳統(tǒng)信號轉(zhuǎn)換器的固有模式,為
    的頭像 發(fā)表于 02-11 11:09 ?247次閱讀
    <b class='flag-5'>高清</b>混合轉(zhuǎn)換器:模塊化<b class='flag-5'>技術(shù)</b>重塑<b class='flag-5'>音視頻</b>信號轉(zhuǎn)換行業(yè)格局

    HT1001EK音視頻編碼器——高清傳輸.穩(wěn)定無憂,全場景音視頻解決方案

    一、精簡版產(chǎn)品宣傳單頁文案(適合線下派發(fā)/線上傳播) 標(biāo)題:HT1001EK音視頻編碼器——高清傳輸·穩(wěn)定無憂,全場景音視頻解決方案 ? 核心亮點:4K輸入+1080P輸出,海思芯片7x24
    發(fā)表于 12-30 15:26

    洲明科技榮獲2025年度音視頻行業(yè)品牌評選九項大獎

    2025年12月20日,由DAV數(shù)字音視工程網(wǎng)與《數(shù)字音視工程》雜志聯(lián)合主辦的第17屆音視頻行業(yè)品牌評選結(jié)果正式揭曉。
    的頭像 發(fā)表于 12-28 11:45 ?671次閱讀

    打破國外壟斷!自主分布式音視頻方案筑牢行業(yè)安全根基

    在當(dāng)前的全球音視頻芯片市場中,國外公司一直占據(jù)著主導(dǎo)地位,然而,近年來國外對中國芯片行業(yè)的打壓讓國內(nèi)音視頻行業(yè)的發(fā)展面臨了巨大的挑戰(zhàn)。在這樣的背景下,國內(nèi)領(lǐng)先的音視頻技術(shù)企業(yè)挺身而出,
    的頭像 發(fā)表于 12-19 11:28 ?373次閱讀
    打破國外壟斷!自主分布式<b class='flag-5'>音視頻</b>方案筑牢行業(yè)安全根基

    三款PXIe板卡科普:解鎖專業(yè)音視頻處理的核心力量

    一、KS-PXIe638:8通道音視頻采集的“數(shù)據(jù)捕捉能手” 在航空航天測控、工業(yè)自動化等對數(shù)據(jù)采集精度要求極高的領(lǐng)域,一款穩(wěn)定高效的音視頻采集板卡至關(guān)重要,KS-PXIe638型8通道音視頻采集板
    的頭像 發(fā)表于 12-04 17:04 ?845次閱讀
    三款PXIe板卡科普:解鎖專業(yè)<b class='flag-5'>音視頻</b>處理的核心力量

    KS-PXIe638 型 8 通道音視頻采集板:高清同步采集,專業(yè)場景 “性能標(biāo)桿”

    在航空航天的數(shù)據(jù)記錄、工業(yè)測控的實時監(jiān)測、交通控制的畫面留存等專業(yè)場景中,多通道、高保真的音視頻采集是核心訴求 ——KS-PXIe638 型 8 通道音視頻采集板,依托高速 FPGA 架構(gòu),以 8
    的頭像 發(fā)表于 11-26 13:24 ?449次閱讀
    KS-PXIe638 型 8 通道<b class='flag-5'>音視頻</b>采集板:<b class='flag-5'>高清</b>同步采集,專業(yè)場景 “性能標(biāo)桿”

    音視頻編解碼封裝解封裝部件介紹

    是否有探索開源鴻蒙音視頻編解碼技術(shù)的欲望?是否對開源鴻蒙音視頻編解碼格式支持有訴求?別急——今天這份開源鴻蒙AVCodec Kit介紹文章,就是解答疑惑的指南!參考這份指南,可以使用開源鴻蒙的
    的頭像 發(fā)表于 10-31 09:15 ?500次閱讀
    <b class='flag-5'>音視頻</b>編解碼封裝解封裝部件介紹

    2025 灣芯展精彩落幕,時擎科技分享AI音視頻芯片領(lǐng)域最新成果

    其在AI音視頻芯片領(lǐng)域的技術(shù)前瞻與市場洞察,吸引了眾多與會者與行業(yè)伙伴的關(guān)注。研發(fā)副總裁深度解讀行業(yè)趨勢展會期間,時擎科技研發(fā)副總裁仇健樂先生發(fā)表了題為《從音頻消
    的頭像 發(fā)表于 10-20 17:36 ?1350次閱讀
    2025 灣芯展精彩落幕,時擎科技分享AI<b class='flag-5'>音視頻</b>芯片領(lǐng)域最新成果

    音視頻開發(fā)全棧解析

    Media Kit 讓開發(fā)者可以調(diào)用系統(tǒng)的音視頻能力,涵蓋播放、錄制、錄屏、元數(shù)據(jù)提取與轉(zhuǎn)碼六大核心功能模塊,支撐系統(tǒng)應(yīng)用與第三方應(yīng)用在視頻播放、內(nèi)容創(chuàng)作、教學(xué)錄屏、直播互動等典型場景下的音視
    的頭像 發(fā)表于 09-18 14:42 ?847次閱讀
    <b class='flag-5'>音視頻</b>開發(fā)全棧解析

    千視電子受邀亮相2025音視頻產(chǎn)業(yè)鏈研討會,引領(lǐng)全鏈路音視頻IP化新趨勢

    主管部門負(fù)責(zé)人,共同探討產(chǎn)業(yè)前沿技術(shù)、市場趨勢及合作機(jī)會,旨在推動湖南音視頻產(chǎn)業(yè)鏈高質(zhì)量發(fā)展。當(dāng)前,全球音視頻產(chǎn)業(yè)正經(jīng)歷深刻變革,正在加速邁
    的頭像 發(fā)表于 08-27 11:33 ?1348次閱讀
    千視電子受邀亮相2025<b class='flag-5'>音視頻</b>產(chǎn)業(yè)鏈研討會,引領(lǐng)全鏈路<b class='flag-5'>音視頻</b>IP化新<b class='flag-5'>趨勢</b>

    雷曼光電COB超高清顯示屏落地馬欄山音視頻實驗室

    雷曼光電憑借在Micro LED領(lǐng)域的深厚技術(shù)積累和雷曼COB超高清顯示產(chǎn)品的卓越性能,為湖南長沙馬欄山音視頻實驗室打造了核心顯示方案。
    的頭像 發(fā)表于 07-09 17:05 ?1095次閱讀

    泰芯半導(dǎo)體推出星閃音視頻無線SOC芯片TXW828

    在短距離無線通信技術(shù)加速迭代的浪潮中,珠海泰芯半導(dǎo)體有限公司全球首先發(fā)布支持星閃(NearLink)標(biāo)準(zhǔn)的音視頻無線SOC芯片——TXW828。這款集WiFi/藍(lán)牙BLE/星閃三模融合音視頻無線芯片
    的頭像 發(fā)表于 06-20 15:51 ?2758次閱讀

    中國音視頻產(chǎn)業(yè)邁向高質(zhì)量發(fā)展

    隨著超高清先鋒計劃的逐步推進(jìn),截至2024年底,中國音視頻產(chǎn)業(yè)規(guī)模超5萬億,包括個人消費電子、家庭影音娛樂、行業(yè)多媒體應(yīng)用及車載視聽產(chǎn)業(yè)和相關(guān)衍生應(yīng)用等行業(yè)企業(yè)超過百萬家,音視頻產(chǎn)業(yè)已經(jīng)成為國家數(shù)字經(jīng)濟(jì)發(fā)展的重要支柱。
    的頭像 發(fā)表于 04-24 11:10 ?1276次閱讀

    音視頻一體化解決方案

    隨著數(shù)字化轉(zhuǎn)型加速,音視頻技術(shù)在各行業(yè)深度應(yīng)用,傳統(tǒng)音視頻分散式管理系統(tǒng)面臨多源異構(gòu)設(shè)備接入困難、數(shù)據(jù)孤島林立、運維復(fù)雜、協(xié)作效率低下等挑戰(zhàn),各行業(yè)對信息技術(shù)的需求逐漸從單一化向集成化
    的頭像 發(fā)表于 04-24 09:14 ?1139次閱讀