chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

5G時(shí)代的互動(dòng)視頻——探索從平面到三維視頻信息表達(dá)的新可能

LiveVideoStack ? 來(lái)源:LiveVideoStack ? 作者:盛驍杰 ? 2020-08-10 16:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

5G時(shí)代對(duì)于視頻行業(yè)的發(fā)展和業(yè)務(wù)形態(tài)將是一個(gè)重要的助推,但5G時(shí)代帶來(lái)的改變不只是帶寬提升和延遲降低這兩個(gè)最直接的因素。本次LiveVideoStackCon 2020線上峰會(huì)我們邀請(qǐng)到了阿里巴巴高級(jí)算法專(zhuān)家盛驍杰,他將介紹在5G時(shí)代,視頻信息承載將逐步從目前的平面視頻形態(tài)過(guò)渡到信息表達(dá)更為豐富的三維視頻,而這種過(guò)渡中包含的可能性一方面需要我們充分利用5G技術(shù)本身的云、邊、端架構(gòu)帶來(lái)的技術(shù)紅利,另一方面,也需要我們對(duì)于快速發(fā)展的三維視覺(jué),AI,AR等技術(shù)進(jìn)行綜合性的創(chuàng)新運(yùn)用,使得視頻體驗(yàn)通過(guò)可互動(dòng)的三維信息表達(dá)在5G時(shí)代不斷給用戶(hù)創(chuàng)造出更多的價(jià)值。

大家好,本次我分享的主題是5G時(shí)代的互動(dòng)視頻——探索從平面到三維視頻信息表達(dá)的新可能。

本次演講的內(nèi)容將分為四個(gè)部分,分別為:什么是互動(dòng)6DoF視頻、視頻體驗(yàn)的發(fā)展和5G時(shí)代的新機(jī)遇、6DoF視頻的標(biāo)準(zhǔn)(MPEG/AVS)和對(duì)互動(dòng)6DoF視頻的未來(lái)展望。

1

什么是互動(dòng)6DoF視頻

首先通過(guò)三個(gè)演示視頻來(lái)認(rèn)識(shí)互動(dòng)6DoF視頻。第一個(gè)視頻是CBA的運(yùn)動(dòng)場(chǎng)景,它是通過(guò)相機(jī)陣列和三維重建所得到的一個(gè)互動(dòng)6DoF視頻,并且通過(guò)實(shí)際的網(wǎng)絡(luò)傳輸以及用戶(hù)終端的實(shí)時(shí)互動(dòng)所展現(xiàn)出來(lái)的一個(gè)效果。 第二個(gè)視頻也是相同的場(chǎng)景,但對(duì)原先的互動(dòng)方式進(jìn)行了一些調(diào)整和改變,在這樣的視頻中,用戶(hù)觸摸屏幕會(huì)使整體場(chǎng)景靜止,用戶(hù)可以有一個(gè)靜態(tài)場(chǎng)景下360°的對(duì)場(chǎng)景每一個(gè)瞬間進(jìn)行精細(xì)化觀看的互動(dòng)體驗(yàn),這樣的體驗(yàn)特別適合于體育等競(jìng)技性和專(zhuān)業(yè)性較強(qiáng)的場(chǎng)景。 首先,通過(guò)對(duì)這個(gè)視頻的體驗(yàn),可以感受到之前普通的平面體育點(diǎn)播和直播視頻當(dāng)中所沒(méi)有的新體驗(yàn)。 其次,在一個(gè)三維的空間中對(duì)傳統(tǒng)體育賽事的觀看方式進(jìn)行革新,使得用戶(hù)能夠自由地切換自己的視點(diǎn),觀看其感興趣的區(qū)域。通過(guò)這種方式,用戶(hù)會(huì)感覺(jué)到視頻的觀看過(guò)程通過(guò)可互動(dòng)的方式,已經(jīng)和某些游戲的體驗(yàn)有相似性。從來(lái)沒(méi)有體驗(yàn)過(guò)這種視頻的用戶(hù),在第一次體驗(yàn)之后會(huì)感覺(jué)這種體驗(yàn)很像游戲。之所以有這種感受,是因?yàn)樗渲邪?D和互動(dòng)的體驗(yàn),而普通的游戲給予用戶(hù)的正是這樣一種體驗(yàn)。這也是互動(dòng)6DoF視頻和平面視頻最大的區(qū)別, 即互動(dòng)6DoF視頻有著和平面視頻不同的三大特點(diǎn):互動(dòng)性、三維立體感和場(chǎng)景沉浸感。 互動(dòng)6DoF視頻除了應(yīng)用在體育的場(chǎng)景當(dāng)中,在綜藝場(chǎng)景中也有著廣泛的應(yīng)用前景。以上展示的是一個(gè)綜藝場(chǎng)景的效果,視頻中的整個(gè)綜藝場(chǎng)景,通過(guò)三維的建模并且通過(guò)傳輸和實(shí)時(shí)互動(dòng),使用戶(hù)產(chǎn)生很強(qiáng)的現(xiàn)場(chǎng)沉浸感和立體感體驗(yàn)效果。此外,在綜藝場(chǎng)景中它可以給予用戶(hù)一種全方位的信息接受方式。比如這個(gè)視頻演示是優(yōu)酷《這就是街舞2》決賽當(dāng)中的一段視頻,我們的交互范圍是可以覆蓋整體場(chǎng)景正面的180°,基本上可以囊括正面的所有舞蹈視角,通過(guò)這種方式的交互,用戶(hù)可以很方便的把握住舞臺(tái)的整體,體驗(yàn)到每個(gè)舞者在跳舞過(guò)程中全方位的信息。今年在優(yōu)酷的《這就是街舞3》節(jié)目中,我們會(huì)在優(yōu)酷的APP端正式上線這樣的體驗(yàn)。 這種體驗(yàn)在街舞當(dāng)中或者其他技巧類(lèi)、動(dòng)作類(lèi)的綜藝當(dāng)中都有很好的應(yīng)用前景,在整個(gè)互動(dòng)效果當(dāng)中,它的交互是非常流暢的,用戶(hù)手指的滑動(dòng)、畫(huà)面的重建和渲染都可以達(dá)到實(shí)時(shí)的效果。而且現(xiàn)在手機(jī)終端的運(yùn)算能力越來(lái)越強(qiáng),已經(jīng)可以使這樣的形態(tài)讓用戶(hù)在大部分的手機(jī)上體驗(yàn)到。 以上的三個(gè)例子是通過(guò)具體的呈現(xiàn)方式使大家對(duì)互動(dòng)6DoF視頻有一個(gè)感性的認(rèn)識(shí)。下面我們?cè)賮?lái)詳細(xì)介紹下什么是互動(dòng)6DoF視頻。

普通的平面視頻從視頻的采集、處理、編碼、傳輸、觀看的整個(gè)過(guò)程中都是單向的傳輸鏈路,所以平面視頻是一種被動(dòng)式的觀看,這是因?yàn)橛脩?hù)最終接收到的信息是完全被動(dòng)式的接收導(dǎo)演想傳遞給用戶(hù)的信息,用戶(hù)不能主動(dòng)選擇想看的部分,這是一種被動(dòng)式的觀影體驗(yàn)。并且,平面視頻每一級(jí)都是單向鏈路,就是采集完的信號(hào)會(huì)給下一級(jí)進(jìn)行視頻處理,經(jīng)過(guò)編碼模塊后進(jìn)行視頻傳輸?shù)接脩?hù)端播放,每一級(jí)都是一個(gè)向后單向傳遞的處理鏈路。 互動(dòng)6DoF視頻在平面視頻的基礎(chǔ)上引入了一種交互式的觀看方式,正如前面三個(gè)視頻的例子就具有很強(qiáng)的交互性。它的交互性來(lái)源不只是在終端得到的交互,在視頻的采集、內(nèi)容表達(dá)和編碼三個(gè)方面都和傳統(tǒng)的平面視頻有很大的區(qū)別,在這幾個(gè)模塊中都需要對(duì)用戶(hù)最終的交互形態(tài)有一個(gè)綜合性的考慮和設(shè)計(jì)。也就是說(shuō)我們需要事先考慮給用戶(hù)怎么樣的交互形態(tài)和交互范圍,然后倒推回去設(shè)計(jì)視頻的采集方案、視頻的內(nèi)容表達(dá)方案和編碼方案。所以它是一種非單向式的視頻處理鏈路,在6DoF視頻采集的時(shí)候我們就要在方案當(dāng)中充分考慮到用戶(hù)的交互行為。 這是我們的技術(shù)人員第一次通過(guò)這種6DoF交互式的觀看獲得一種手段,即他能夠通過(guò)技術(shù)去影響和改變上游視頻的傳統(tǒng)采集和表達(dá)方式。而在普通的平面視頻的觀看當(dāng)中,技術(shù)人員無(wú)法影響上游的表達(dá),只是被動(dòng)的接收上游導(dǎo)播給到的信號(hào),并把它呈現(xiàn)出來(lái)。但是互動(dòng)6DoF視頻交互式觀看給了技術(shù)人員一種有力的工具,就是可以通過(guò)提供用戶(hù)不同的交互形態(tài)去影響上游的視頻采集、表達(dá)、編碼的方案。 1.1采集

這部分我們來(lái)介紹一下互動(dòng)6DoF視頻在采集、表達(dá)和編碼方面與平面視頻的一些不同點(diǎn)。 首先在采集方面,上圖中四個(gè)例子是業(yè)界不同的公司對(duì)6DoF視頻的采集方案在不同場(chǎng)景中的應(yīng)用,從中可以看出對(duì)于不同的場(chǎng)景,6DoF技術(shù)可以去設(shè)計(jì)不同的采集方案,提供給用戶(hù)不同的體驗(yàn)。從這四張圖中也可以看出,雖然它們適用的范圍和場(chǎng)景都不一樣,但是它們都是通過(guò)相機(jī)陣列進(jìn)行采集,而不是局限于單個(gè)相機(jī)進(jìn)行采集,這也是三維視頻的一個(gè)特點(diǎn)。第一張圖中是在體育館中有一個(gè)相機(jī)陣列,第二張圖是在攝影棚中部署了更多的相機(jī)集群,第三張圖是圍繞體育場(chǎng)的一圈360度進(jìn)行拍攝,第四張圖是專(zhuān)業(yè)的物體建模采集工作室。這樣做的特點(diǎn)就是通過(guò)多相機(jī)進(jìn)行采集以后,能夠?qū)?chǎng)景進(jìn)行三維重建和表達(dá),再通過(guò)壓縮,最終傳遞給用戶(hù)一種6DoF互動(dòng)的視頻體驗(yàn)。

在之前演示的CBA場(chǎng)景當(dāng)中,我們的采集方案就是相機(jī)陣列的采集,以上的兩個(gè)圖片是在CBA廣東隊(duì)的主場(chǎng)拍到的效果,整個(gè)采集方式是通過(guò)相機(jī)陣列進(jìn)行的采集,然后進(jìn)行空間的三維重建并進(jìn)行視頻的傳輸,最后給用戶(hù)一個(gè)互動(dòng)的體驗(yàn)。 我們可以看到,6DoF視頻的采集具有幾個(gè)特點(diǎn):一是需要多相機(jī)的采集陣列;二是根據(jù)不同場(chǎng)景的應(yīng)用有一定的靈活性,針對(duì)不同的場(chǎng)景我們需要有不同的采集方案和表達(dá)方案,在用戶(hù)端也就會(huì)有不同的交互體驗(yàn)。 1.2 表達(dá)

第二個(gè)重要部分就是6DoF視頻的表達(dá)。6DoF視頻和平面視頻是完全不一樣的,現(xiàn)在常見(jiàn)的三種視頻格式分別是:立體視頻、平面視頻、VR 360視頻。立體視頻是基于雙目相機(jī)拍攝以供用戶(hù)立體觀看的表達(dá)。平面視頻就是一個(gè)2D視頻,它是一種不依賴(lài)于任何特殊觀看設(shè)備的表達(dá)。VR 360視頻給用戶(hù)提供的是一種現(xiàn)場(chǎng)沉浸式的體驗(yàn),但它往往依賴(lài)于特殊的設(shè)備,所以這三種已知的視頻表達(dá)方式,它們有各自的優(yōu)缺點(diǎn)。 6DoF視頻表達(dá)是融合了以上三個(gè)視頻表達(dá)方式的優(yōu)點(diǎn)而得到的一種新的視頻表達(dá)方式,它的“新”主要表現(xiàn)在以下幾點(diǎn): 首先,6DoF視頻和平面視頻一樣,不依賴(lài)于特殊的觀看設(shè)備。從之前的例子看出,在手機(jī)端上用戶(hù)就可以做便捷的交互。同時(shí),它也具有VR 360視頻所提供的現(xiàn)場(chǎng)沉浸感體驗(yàn)。其次,它還可以基于三維重建技術(shù)給用戶(hù)提供立體感的體驗(yàn)。所以6DoF視頻是集中了這三個(gè)視頻表達(dá)方式的特點(diǎn)最終形成它自己的特殊表達(dá),它所展現(xiàn)的形式和游戲體驗(yàn)很像,這是因?yàn)橛螒蝮w驗(yàn)也在平面顯示器上,能夠給人帶來(lái)沉浸感、交互性和立體感。 從技術(shù)層面來(lái)看,6DoF視頻有如下幾種不同的表達(dá)方式: 第一種表達(dá)方式是基于深度的表達(dá),就是對(duì)每一個(gè)拍攝的像素進(jìn)行深度的重建,我們有它的深度圖,通過(guò)紋理圖和深度圖兩兩成對(duì)的表達(dá)方式,再加上Multiview的視點(diǎn),形成一種基于深度的表達(dá)。這種表達(dá)方式的優(yōu)點(diǎn)是完全基于圖像重建的表達(dá)方式,無(wú)論是紋理圖和深度圖都可以編碼成圖像,具有成熟的視頻壓縮標(biāo)準(zhǔn)來(lái)配合,在工業(yè)化和產(chǎn)品化下的支撐具有明顯優(yōu)勢(shì),而且在基于圖像重建的效果自然性上更能讓用戶(hù)接受。 第二種表達(dá)方式是基于點(diǎn)云的表達(dá),其實(shí)它是基于圖形的重建,Point Cloud會(huì)把空間所有像素點(diǎn)的三維位置表達(dá)出來(lái),并且通過(guò)紋理的貼圖形成一個(gè)真實(shí)的三維模型。但經(jīng)過(guò)點(diǎn)云的渲染也有它特別的地方,因?yàn)槭腔贕raphic,所以它的渲染不會(huì)非常自然。其次,雖然MPEG和AVS也在探索一些基于點(diǎn)云的壓縮方案,但點(diǎn)云目前還沒(méi)有一個(gè)成熟的壓縮標(biāo)準(zhǔn)去支持,包括解碼也沒(méi)有成熟的終端硬件支持。所以總結(jié)來(lái)說(shuō),目前點(diǎn)云表達(dá)方式的優(yōu)點(diǎn)在于,由于它是一種空間完全的三維重建,所以具有最大的交互自由度,可以把空間中一個(gè)全視角的三維模型重建出來(lái),但缺點(diǎn)是它在壓縮傳輸和渲染自然性上不如深度重建。 最后一種表達(dá)方式是光場(chǎng),也是數(shù)據(jù)量最大的表達(dá)方式。它是通過(guò)密集的相機(jī)采集陣列或者光場(chǎng)相機(jī)所采集到的空間非常密集的視點(diǎn)表達(dá),可以提供完全的6DoF體驗(yàn)。因?yàn)楣鈭?chǎng)是一種非常稠密的視點(diǎn)表達(dá),所以它的數(shù)據(jù)量過(guò)大,目前還缺乏成熟的壓縮標(biāo)準(zhǔn)支持,還不具有工業(yè)成熟性。 1.3 編碼

圖中展示的內(nèi)容是基于深度圖表達(dá)的6DoF視頻編碼框架。首先是基于多相機(jī)采集的紋理圖,同時(shí)配備了和多相機(jī)采集紋理圖所對(duì)應(yīng)的深度圖,還有基于多相機(jī)采集的紋理圖和深度圖的元數(shù)據(jù)。元數(shù)據(jù)中包含了一些多相機(jī)的攝像機(jī)參數(shù)信息以及相機(jī)紋理圖和深度圖的拼接和表達(dá)的配置信息。有了多相機(jī)采集的紋理圖、深度圖和元數(shù)據(jù)以后,我們就得到了一個(gè)基于深度的完整6DoF視頻表達(dá)。 在此基礎(chǔ)上就可以通過(guò)視頻的編碼方式(比如視頻的編解碼標(biāo)準(zhǔn):AVS3、H.264、HEVC),對(duì)于前面所述的6DoF視頻表達(dá)進(jìn)行編碼之后傳到終端進(jìn)行解碼,然后基于多相機(jī)紋理圖、深度圖和元數(shù)據(jù)進(jìn)行6DoF視頻重建,也就是在終端對(duì)用戶(hù)的虛擬視點(diǎn)進(jìn)行重建,最后把重建完的圖像進(jìn)行終端渲染輸出。上述就是整個(gè)6DoF視頻編碼框架和解碼后呈現(xiàn)給用戶(hù)的方案。

2

視頻體驗(yàn)的發(fā)展和5G的新機(jī)遇

2.1 平面視頻

這部分回顧了視頻體驗(yàn)的發(fā)展過(guò)程以及解釋一下為什么說(shuō)6DoF視頻是5G時(shí)代新機(jī)遇的原因。大家對(duì)于視頻體驗(yàn)的發(fā)展,最耳熟能詳?shù)木褪瞧矫嬉曨l,視頻介質(zhì)中數(shù)量最多的也是平面視頻,平面視頻的技術(shù)發(fā)展目前還在一直向前推進(jìn)??傮w來(lái)看,平面視頻的視頻體驗(yàn)的發(fā)展主要分為三個(gè)方面: 第一方面是平面視頻分辨率的發(fā)展。平面視頻從原先的540p逐步發(fā)展到1080p甚至8k,顯示屏幕也越來(lái)越大。 第二方面是亮度和色域的發(fā)展。由中間這張圖可知,原先的色彩表達(dá)空間比較小,因?yàn)槿搜鄣恼麄€(gè)色彩感受空間是非常廣泛的,但對(duì)于SDR是怕來(lái)說(shuō),它只能表達(dá)其中的一小塊,但HDR可以表達(dá)更大的色彩空間,所以可以讓用戶(hù)感受到除了分辨率的提升以外,人眼所感受到的色彩豐富度也越來(lái)越多。 第三方面是幀率的變化。原先大部分的視頻都是25FPS或者30FPS,現(xiàn)在由于整體視頻顯示設(shè)備刷新率的增強(qiáng),比如現(xiàn)在很多手機(jī)都已經(jīng)支持120FPS的刷新率,那么視頻的幀率也需要提高,才會(huì)給用戶(hù)絲滑流暢的感受。當(dāng)前幀率的發(fā)展已經(jīng)逐步從30FPS過(guò)渡到60FPS甚至到120FPS。 配合分辨率、亮度和色域、幀率這三個(gè)方面平面視頻的技術(shù)發(fā)展,平面視頻的壓縮方法也在不斷地迭代。右圖當(dāng)中可以看到,平面視頻的壓縮標(biāo)準(zhǔn)基本上是以十年為一代往前推進(jìn)。從2003年的H.264是為1080p視頻做準(zhǔn)備的壓縮標(biāo)準(zhǔn),到2013年的H.265是為4K視頻做準(zhǔn)備的壓縮標(biāo)準(zhǔn),再到2020年的H.266也就是VVC是為8K視頻做準(zhǔn)備的。 國(guó)內(nèi)的視頻編解碼標(biāo)準(zhǔn)H.264、H.265和H.266相對(duì)的是AVS+、AVS2和AVS3,它們分別是為1080P、4K和8K分辨率準(zhǔn)備的視頻編解碼技術(shù)。 2.2 立體視頻

除了平面視頻以外,另外一種視頻的表達(dá)方式是立體視頻。立體視頻是通過(guò)雙目相機(jī)進(jìn)行拍攝,使用戶(hù)戴上眼鏡后對(duì)視頻產(chǎn)生有深度的立體感體驗(yàn)。 早在2009年,電影“阿凡達(dá)”就引入了全新的立體視頻觀影體驗(yàn),把這種視頻的方式帶到影院當(dāng)中。 立體視頻技術(shù)推動(dòng)了視頻采集、視頻制作、3D視頻壓縮標(biāo)準(zhǔn)、視頻觀看設(shè)備的全面革新,比如在視頻采集方面使用的不再是普通的相機(jī)而是雙目立體相機(jī)。 在2010年電視機(jī)廠商提出了一種新的視頻觀影體驗(yàn)——FTV(Freeview TV)也叫自由視點(diǎn)的電視。它是在立體視頻的基礎(chǔ)上進(jìn)一步的發(fā)展,用戶(hù)可以在屏幕前面,通過(guò)一定范圍的移動(dòng)看到視頻當(dāng)中的立體視頻。它不但是3D的,而且還能進(jìn)行一定自由度的移動(dòng)觀看。根據(jù)用戶(hù)的左右移動(dòng),電視機(jī)里面的內(nèi)容也會(huì)發(fā)生變化,它是根據(jù)人在電視機(jī)前的移動(dòng),通過(guò)不同的光柵信號(hào)折射使人眼看到不同的視角。 但FTV出來(lái)之后并沒(méi)有非常火,首先是基于光柵的電視成本非常的高,其次,它的體驗(yàn)方式并不是非常自然。同時(shí),它提供的自由視角也比較小,因?yàn)镕TV內(nèi)容源并不是通過(guò)相機(jī)陣列進(jìn)行采集的,而是基于普通的雙目相機(jī)采集,并對(duì)雙目相機(jī)的左右兩個(gè)視點(diǎn)進(jìn)行一定的外插值,相當(dāng)于做一些假的虛擬視點(diǎn)。但這個(gè)范圍不會(huì)特別大,因?yàn)樗炔杉乃夭木椭挥凶笥覂蓚€(gè)視點(diǎn),所以沒(méi)有辦法得到更大范圍的自由度。基于這幾點(diǎn)原因,F(xiàn)TV雖然提出一個(gè)非常好的概念,能夠讓用戶(hù)有自由視點(diǎn)的電視體驗(yàn),但是最終并未在市場(chǎng)上火起來(lái),而且在后期逐步的銷(xiāo)聲匿跡了。 2.3 VR 360視頻

VR 360視頻是在2016年火起來(lái)的,它進(jìn)一步帶來(lái)了360度沉浸式的視頻體驗(yàn),并引入了3DoF觀看體驗(yàn)。VR 360視頻的采集端通過(guò)多個(gè)魚(yú)眼相機(jī)的采集以及拼接得到一個(gè)360度的視頻,如果用戶(hù)戴上頭盔可以通過(guò)轉(zhuǎn)動(dòng)到任意角度進(jìn)行觀看。我們來(lái)解釋一下為什么說(shuō)VR 360視頻是3DoF的?右圖顯示了人在真實(shí)空間中的六個(gè)自由度的表現(xiàn),六個(gè)自由度是指在空間上有X、Y、Z這三個(gè)移動(dòng)的自由度,以及在這三個(gè)移動(dòng)自由度基礎(chǔ)上的三個(gè)旋轉(zhuǎn)的自由度,加起來(lái)一共是六個(gè)自由度,這是人在真實(shí)空間中所具有的自由度空間。3DoF視頻只有三個(gè)旋轉(zhuǎn)的自由度,沒(méi)有三個(gè)移動(dòng)的自由度。當(dāng)戴上眼罩觀看VR 360視頻時(shí),只能進(jìn)行旋轉(zhuǎn)觀看但不能移動(dòng),因?yàn)榍昂笞邉?dòng)并不影響看到的內(nèi)容,所以說(shuō)VR 360視頻是3DoF的視頻。 2.4 6DoF視頻

人對(duì)真實(shí)世界的視覺(jué)感知同時(shí)具備了沉浸感、立體感和空間感,這三者其實(shí)是統(tǒng)一的。 左下角的視頻是Facebook展示的一個(gè)立體視頻,這是通過(guò)一種基于深度的渲染技術(shù)得到的視頻,雖然用戶(hù)不需要帶任何的3D眼鏡就可以進(jìn)行觀看,但用戶(hù)同樣可以感知到非常強(qiáng)烈的3D感和沉浸感。這是因?yàn)槿藢?duì)于空間的沉浸感、立體感和空間感的感知是一起的,所以對(duì)于視頻中的內(nèi)容稍微發(fā)生變化,就感覺(jué)是3D的,而且沉浸感也會(huì)加強(qiáng)。 基于這種原理,6DoF視頻也有類(lèi)似的特點(diǎn)。6DoF視頻就是普通平面觀影設(shè)備上的一個(gè)交互式立體視頻,可以帶給用戶(hù)沉浸式的體驗(yàn),而且交互更自然。6DoF視頻就是在左下角視頻的基礎(chǔ)上發(fā)展了一大步,能夠在一個(gè)非常大的范圍之內(nèi)讓用戶(hù)體驗(yàn)交互、沉浸和3D的感覺(jué)。 6DoF視頻解決了前面提到的立體視頻、VR 360視頻遇到的兩個(gè)核心問(wèn)題:一是它的內(nèi)容。立體視頻、VR 360視頻雖然是兩種新的內(nèi)容表達(dá)方式,但在它的制作側(cè)、內(nèi)容的豐富程度是不能和平面視頻相比的,立體視頻、VR 360視頻的數(shù)量是非常少的。 二是它的交互不自然。所謂交互不自然是指在用戶(hù)側(cè),立體視頻需要用戶(hù)戴眼鏡,VR視頻需要用戶(hù)戴頭盔,這和交互的自然性是相違背的。由于這兩個(gè)原因,立體視頻和VR 360視頻始終沒(méi)有火起來(lái)。6DoF視頻在這兩點(diǎn)上具有天然的優(yōu)勢(shì),它在內(nèi)容豐富性上,無(wú)論是體育還是綜藝都有很強(qiáng)的需求。其次,在交互自然性上,用戶(hù)不需要任何的特殊設(shè)備,在手機(jī)屏幕上就能進(jìn)行交互,這極大的改善了立體視頻和VR 360視頻遇到的兩個(gè)核心難點(diǎn)。 從右邊一組圖中可以看出關(guān)于6DoF視頻在 MPEG所定義的發(fā)展趨勢(shì)。3DoF是模擬一個(gè)人坐在椅子上,只能有旋轉(zhuǎn)的自由度,不能有空間移動(dòng)的自由度。3DoF+是在三個(gè)旋轉(zhuǎn)的自由度的基礎(chǔ)上,向用戶(hù)提供了前傾、左傾、右傾、后傾等受約束的空間自由度。發(fā)展到我們目前處于的位置是Windowed 6DoF,它給了用戶(hù)一定的旋轉(zhuǎn)自由度,模擬用戶(hù)在一個(gè)窗前進(jìn)行觀看,往前往后自由度是受限的,而且旋轉(zhuǎn)自由度在某種程度上也是受限的,給用戶(hù)的感覺(jué)是在一個(gè)窗前面自由移動(dòng)看窗外變化的景色。最后是完全的6DoF,用戶(hù)在任意的六個(gè)自由度上都不會(huì)受到約束,可以任意進(jìn)行前后移動(dòng)和旋轉(zhuǎn),這是視頻體驗(yàn)的終極發(fā)展方向。

現(xiàn)在的6DoF視頻可以在移動(dòng)端打破移動(dòng)分辨率顯示的局限,原先移動(dòng)端的分辨率達(dá)到1080p以上時(shí),在移動(dòng)端人眼視場(chǎng)角的像素?cái)?shù)量已經(jīng)接近上限,分辨率再增加人眼已經(jīng)感受不到清晰度的增強(qiáng)了。但如果分辨率可以進(jìn)一步上升,比如5G可以傳4K、8K甚至16K的視頻,那么在這個(gè)基礎(chǔ)上,6DoF視頻提供了一種新的可能性,就是把空間信息量的提升轉(zhuǎn)化為交互性和自由度的提升,它為移動(dòng)端的視頻體驗(yàn)裝上一個(gè)新的引擎,能夠在5G時(shí)代沿著全新的引擎進(jìn)一步提升用戶(hù)的體驗(yàn)。 在5G時(shí)代,帶寬、解碼能力和三維重建技術(shù)這三個(gè)條件都會(huì)取得長(zhǎng)足的發(fā)展。比如5G時(shí)代的傳輸帶寬可以非常輕易的達(dá)到下行100M左右,這在4G時(shí)代是無(wú)法想象的。另外5G手機(jī)越來(lái)越多的支持8K的解碼,8K解碼讓我們有了傳輸6DoF視頻的基礎(chǔ)。最后基于AI技術(shù)的三維重建也使得基于6DoF視頻的三維重建的質(zhì)量和速度得到大幅度的提升,所以基于5G的技術(shù),6DoF視頻可以有非常好的基礎(chǔ)設(shè)施,在此基礎(chǔ)上能夠?yàn)橛脩?hù)提供更好的觀看體驗(yàn)。

3

6DoF視頻的標(biāo)準(zhǔn)

3.1 MPEG

這部分我們來(lái)介紹一下MPEG標(biāo)準(zhǔn)組是怎么對(duì)6DoF視頻的標(biāo)準(zhǔn)來(lái)進(jìn)行定義的。 這是一張最新的2020年MPEG路線圖,根據(jù)前文所提到的3DoF、3DoF+以及6DoF的發(fā)展,目前MPEG已經(jīng)完成了普通VR 360視頻標(biāo)準(zhǔn)的建設(shè),接下來(lái)它會(huì)沿著3DoF+發(fā)展,3DoF+還在建設(shè)當(dāng)中并且預(yù)計(jì)會(huì)在2021完成標(biāo)準(zhǔn)建設(shè),之后會(huì)進(jìn)入6DoF的發(fā)展階段, 6DoF的發(fā)展會(huì)分為兩個(gè)階段:Windowed 6DoF階段和完全6DoF階段,整個(gè)6DoF標(biāo)準(zhǔn)的發(fā)展會(huì)一直延續(xù)到2023年甚至更遠(yuǎn)。所以MPEG在6DoF視頻上規(guī)劃了非常長(zhǎng)的路線圖,伴隨5G網(wǎng)絡(luò)的普及而發(fā)展,一直到2023年左右才會(huì)過(guò)渡到真正的6DoF視頻標(biāo)準(zhǔn)。 3.2 AVS

現(xiàn)在國(guó)內(nèi)像阿里正在參與的AVS標(biāo)準(zhǔn)已經(jīng)在整體的6DoF標(biāo)準(zhǔn)建設(shè)上走在了MPEG的前面,我們已經(jīng)過(guò)渡到了Windowed 6DoF標(biāo)準(zhǔn),而MPEG現(xiàn)在還在建設(shè)3DoF+的標(biāo)準(zhǔn),所以說(shuō)從標(biāo)準(zhǔn)的路線圖上,我們現(xiàn)在是跑在MPEG前面。 我們來(lái)看一下AVS標(biāo)準(zhǔn)目前的進(jìn)展:首先它的標(biāo)準(zhǔn)文檔已經(jīng)形成了草案的5.0版本,并且標(biāo)準(zhǔn)組計(jì)劃在2020年底將AVS 6DoF標(biāo)準(zhǔn)推進(jìn)到FCD階段。 在標(biāo)準(zhǔn)測(cè)試用例方面,我們已經(jīng)有了六段標(biāo)準(zhǔn)的測(cè)試用例,每段包括30個(gè)以上的相機(jī)紋理圖和深度圖,所以我們的標(biāo)準(zhǔn)測(cè)試用例是比較豐富的,并且相機(jī)陣列的數(shù)目也是比較多的。其次,在參考軟件方面,我們提供了視點(diǎn)重建參考軟件,這個(gè)參考軟件目前已經(jīng)更新到VSS 3.0版本,所以基于標(biāo)準(zhǔn)測(cè)試用例和參考軟件,參與標(biāo)準(zhǔn)的一些公司和學(xué)校就能很快參與到6DoF視頻標(biāo)準(zhǔn)的實(shí)驗(yàn)、算法開(kāi)發(fā)和提案工作當(dāng)中。

4

互動(dòng)6DoF視頻的未來(lái)展望

6DoF視頻未來(lái)可提升的空間也是非常大的,它的提升空間可以分為兩個(gè)部分: 第一是基礎(chǔ)體驗(yàn)提升?;A(chǔ)體驗(yàn)提升意味著三個(gè)方面:首先是6DoF視頻時(shí)效性的提升,比如我們現(xiàn)在做6DoF視頻的點(diǎn)播,下一步可能要做6DoF視頻的直播。其次是自由度的提升,也就是從Windowed 6DoF發(fā)展到完全的6DoF。最后是清晰度的提升,用戶(hù)看到的任意視點(diǎn)的清晰度是否可以更高,比如達(dá)到1080p甚至以上。 第二是互動(dòng)體驗(yàn)的提升。這意味著6DoF視頻是有和其他周邊的技術(shù)進(jìn)行融合的可能,因?yàn)?DoF視頻本身是一個(gè)完全三維立體化的視頻,基于這個(gè)三維立體化的視頻,我們可以把原先很多的算法在三維的場(chǎng)景上進(jìn)行組合。比如AR原先是在平面的視頻上,如果它基于6DoF視頻可以有更好的AR展現(xiàn)效果,包括AI原先也是主要用在平面視頻中,在立體的空間中,AI算法能夠有更好的發(fā)揮的余地和想象空間。 首先6DoF視頻是在一個(gè)完全三維的場(chǎng)景下,在此基礎(chǔ)上,我們基于AR技術(shù)進(jìn)行數(shù)據(jù)的呈現(xiàn),整體三維場(chǎng)景中AR的貼圖,包括平面檢測(cè)都是在三維場(chǎng)景下發(fā)生的,這是普通2D視頻中的AR所不能展現(xiàn)的效果。 圖中也顯示了AI技術(shù)和6DoF的結(jié)合,在終端交互過(guò)程中可以對(duì)6DoF視頻里的人物進(jìn)行點(diǎn)擊,通過(guò)AI技術(shù)在多相機(jī)的陣列的圖像中對(duì)人進(jìn)行識(shí)別和跟蹤,相比通過(guò)單個(gè)相機(jī)進(jìn)行識(shí)別跟蹤,它的檢測(cè)率會(huì)更高。 這樣的體驗(yàn)可以使6DoF視頻在未來(lái)成為接近完全游戲化的體驗(yàn)方式,用戶(hù)在觀看一個(gè)籃球比賽時(shí)可以有很強(qiáng)的交互性、沉浸感以及和AR, AI技術(shù)的有機(jī)結(jié)合,這是對(duì)6DoF視頻未來(lái)能夠做到的體驗(yàn)上限的展望。邁入5G時(shí)代,我們對(duì)于6DoF的基礎(chǔ)體驗(yàn)和互動(dòng)體驗(yàn)的提升還有很長(zhǎng)的路要走。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 三維
    +關(guān)注

    關(guān)注

    1

    文章

    529

    瀏覽量

    29939
  • 視頻信息
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    5847
  • 5G
    5G
    +關(guān)注

    關(guān)注

    1368

    文章

    49174

    瀏覽量

    618740

原文標(biāo)題:5G時(shí)代探索互動(dòng)立體視頻信息承載的新可能

文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    探索ON Semiconductor FMS6143低功耗視頻濾波驅(qū)動(dòng)器

    探索ON Semiconductor FMS6143低功耗視頻濾波驅(qū)動(dòng)器 在電子設(shè)備不斷更新?lián)Q代,視頻技術(shù)飛速發(fā)展的今天,影像處理設(shè)備對(duì)視頻信號(hào)的質(zhì)量要求越來(lái)越高。ON Semicon
    的頭像 發(fā)表于 02-26 16:35 ?92次閱讀

    【OFDR】實(shí)時(shí)感知、動(dòng)態(tài)重構(gòu)與歷史狀態(tài)回溯!昊衡科技-三維場(chǎng)重構(gòu)軟件

    路徑映射三維螺旋路徑映射支持TCP實(shí)時(shí)數(shù)據(jù)傳輸,支持導(dǎo)入本地TXT數(shù)據(jù),對(duì)試驗(yàn)過(guò)程進(jìn)行回溯分析,方便后期數(shù)據(jù)復(fù)盤(pán)與優(yōu)化。數(shù)據(jù)回放功能界面從實(shí)時(shí)數(shù)據(jù)采集三維場(chǎng)可視化,再
    的頭像 發(fā)表于 01-29 17:40 ?1337次閱讀
    【OFDR】實(shí)時(shí)感知、動(dòng)態(tài)重構(gòu)與歷史狀態(tài)回溯!昊衡科技-<b class='flag-5'>三維</b>場(chǎng)重構(gòu)軟件

    探索TS5V330C:高性能視頻開(kāi)關(guān)的卓越之選

    探索TS5V330C:高性能視頻開(kāi)關(guān)的卓越之選 在視頻信號(hào)處理領(lǐng)域,一款優(yōu)秀的視頻開(kāi)關(guān)對(duì)于確保信號(hào)的高質(zhì)量傳輸至關(guān)重要。今天,我們就來(lái)深入了
    的頭像 發(fā)表于 01-14 15:00 ?650次閱讀

    探索LM1881視頻同步分離器:功能、應(yīng)用與設(shè)計(jì)要點(diǎn)

    的應(yīng)用。 文件下載: lm1881.pdf 一、LM1881概述 LM1881是一款專(zhuān)門(mén)用于復(fù)合視頻源中提取同步信號(hào)的集成電路,適用于NTSC、PAL和SECAM等標(biāo)準(zhǔn)負(fù)向同步視頻信號(hào),也能處理非標(biāo)準(zhǔn)、更快水平速率的
    的頭像 發(fā)表于 01-05 11:25 ?370次閱讀

    5G賦能·4K煥新:超高清直播系統(tǒng)的技術(shù)突破與場(chǎng)景革新

    當(dāng)前,直播技術(shù)已廣泛滲透各行各業(yè),成為信息傳播、場(chǎng)景互動(dòng)的重要載體。但受限于帶寬瓶頸、硬件設(shè)備性能等客觀要素,4K移動(dòng)視頻直播尚未實(shí)現(xiàn)大規(guī)模普及。隨著
    的頭像 發(fā)表于 12-23 13:52 ?662次閱讀
    <b class='flag-5'>5G</b>賦能·4K煥新:超高清直播系統(tǒng)的技術(shù)突破與場(chǎng)景革新

    5G6G:一場(chǎng)網(wǎng)絡(luò)能力的升革命

    當(dāng)我們談?wù)?b class='flag-5'>5G與6G時(shí),本質(zhì)上是在討論一場(chǎng)網(wǎng)絡(luò)能力的升革命。5G大經(jīng)典場(chǎng)景,
    的頭像 發(fā)表于 11-21 09:44 ?533次閱讀

    一文讀懂 | 三維視覺(jué)領(lǐng)域國(guó)家級(jí)制造業(yè)單項(xiàng)冠軍——先臨三維的品牌布局

    先臨三維科技股份有限公司成立于2004年,是三維視覺(jué)領(lǐng)域國(guó)家級(jí)制造業(yè)單項(xiàng)冠軍、國(guó)家專(zhuān)精特新“小巨人”企業(yè)。公司專(zhuān)注于高精度三維視覺(jué)軟、硬件的研發(fā)和應(yīng)用,致力于成為具有全球影響力的三維
    的頭像 發(fā)表于 11-11 14:55 ?712次閱讀
    一文讀懂 | <b class='flag-5'>三維</b>視覺(jué)領(lǐng)域國(guó)家級(jí)制造業(yè)單項(xiàng)冠軍——先臨<b class='flag-5'>三維</b>的品牌布局

    5G與6G“萬(wàn)物互聯(lián)““智能無(wú)界“的跨越

    行工廠設(shè)計(jì)和生產(chǎn)模擬,實(shí)現(xiàn)\"數(shù)字孿生工廠\"的虛擬預(yù)生產(chǎn) 智能城市:實(shí)現(xiàn)城市基礎(chǔ)設(shè)施的全面數(shù)字化管理,交通到能源,環(huán)境安全 技術(shù)實(shí)現(xiàn)的革新 5G:主要依賴(lài)毫米波技術(shù)、大規(guī)模
    發(fā)表于 10-10 13:59

    NVIDIA助力樞途科技突破視頻提取具身數(shù)據(jù)技術(shù)鴻溝

    技術(shù),加速了互聯(lián)網(wǎng)視頻提取具身智能模型訓(xùn)練數(shù)據(jù),實(shí)現(xiàn)了視頻三維大世界重建、任務(wù)語(yǔ)義信息理解、
    的頭像 發(fā)表于 08-30 16:11 ?1840次閱讀

    請(qǐng)幫幫我:AutoCAD三維顯示問(wèn)題,和人正常視角相背

    AutoCAD三維顯示問(wèn)題,和人正常視角相背 AutoCAD三維顯示問(wèn)題,和人正常視角相背
    發(fā)表于 08-14 09:50

    不止知識(shí),更有故事!蔡司#HandsOnMetrology抖音開(kāi)張,解鎖三維計(jì)量的無(wú)限可能

    蔡司#HandsOnMetrology抖音開(kāi)張,解鎖三維計(jì)量的無(wú)限可能
    的頭像 發(fā)表于 08-08 14:37 ?683次閱讀
    不止知識(shí),更有故事!蔡司#HandsOnMetrology抖音開(kāi)張,解鎖<b class='flag-5'>三維</b>計(jì)量的無(wú)限<b class='flag-5'>可能</b>

    熱門(mén)5G路由器參數(shù)對(duì)比,華為智選Brovi 5G CPE 5 VS SUNCOMM SDX75

    前兩天刷一篇文章,說(shuō)現(xiàn)在的5G插卡路由器越來(lái)越猛,提到了兩個(gè)型號(hào): 一個(gè)是 華為智選 Brovi 5G CPE 5 ,另一個(gè)是 SUNCOMM SDX75 。 我本來(lái)沒(méi)太當(dāng)回事,覺(jué)
    發(fā)表于 06-05 13:54

    VirtualLab:光學(xué)系統(tǒng)的三維可視化

    配置文件提供了有關(guān)傳播光的信息,而后者只顯示組件和探測(cè)器。我們將在用例的其余部分中集中關(guān)注系統(tǒng)三維視圖。 系統(tǒng):光線結(jié)果配置文件的三維視圖 三維系統(tǒng)視圖:不帶光線的系統(tǒng)可視化 選項(xiàng)
    發(fā)表于 05-30 08:45

    5G網(wǎng)絡(luò)中,信令測(cè)試儀如何幫助提升用戶(hù)體驗(yàn)?

    5G網(wǎng)絡(luò)中,信令測(cè)試儀通過(guò)全面、深入地測(cè)試和分析信令流程,為提升用戶(hù)體驗(yàn)提供了有力支持。具體來(lái)說(shuō),信令測(cè)試儀在以下幾個(gè)方面發(fā)揮著關(guān)鍵作用:一、高效診斷和優(yōu)化網(wǎng)絡(luò)性能 實(shí)時(shí)捕捉和分析信令信息: 信
    發(fā)表于 03-21 14:33

    5G網(wǎng)絡(luò)優(yōu)化中,信令測(cè)試儀如何幫助故障排查?

    針對(duì)性的優(yōu)化策略,提高網(wǎng)絡(luò)的穩(wěn)定性和性能。 綜上所述,信令測(cè)試儀在5G網(wǎng)絡(luò)優(yōu)化中發(fā)揮著不可替代的作用。它不僅能夠幫助運(yùn)人員快速識(shí)別、定位和解決信令問(wèn)題,還能提供全面的測(cè)試數(shù)據(jù)和優(yōu)化建議,為5G網(wǎng)絡(luò)
    發(fā)表于 03-20 14:18