chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計算機視覺及智能影像行業(yè)深度研究報告

新機器視覺 ? 來源:yxw ? 2019-06-17 08:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. 計算機視覺領(lǐng)跑 AI 產(chǎn)業(yè),應(yīng)用場景廣闊

1.1 什么是計算機視覺?讓機器“看懂”影像的 AI技術(shù)

計算機視覺是 AI 核心研究領(lǐng)域,目的在于讓機器具備人類的“眼力”。計算機視覺是人工智能的 分支之一,目的在于通過電子化的方式來感知和理解影像,讓計算機具備和人一樣的"眼力",能夠 識別、理解周圍的世界。人腦接受的 80%的信息來自眼睛(視覺),50%的大腦活動都與處理視覺 信息有關(guān),可見視覺在信息傳遞中的重要性和復(fù)雜性。

應(yīng)用場景廣闊,技術(shù)價值巨大。計算機視覺應(yīng)用領(lǐng)域廣闊,包括安防中的智能監(jiān)控、人臉識別,金 融中的身份驗證,零售中的商品識別,自動駕駛,文娛領(lǐng)域智能營銷、AR 特效等,技術(shù)價值巨大。

為了“看懂”世界,計算機必須具備兩大能力——感知智能和認知智能,通過兩大能力,計算機將 感知到圖像中包括哪些物體、人、物,并識別表達。

能力 1 ——感知智能:圖像中有什么

感知能力既通過方法,機器可知道影像中有什么,主要是局部像素分類及識別,如物體和人的識別、 分類、定位等。以下圖為例,計算機視覺的感知智能即為識別出圖像中包括了狗、貓、花朵、籃子、 綠葉這些物體。

從具體技術(shù)來看,視覺感知智能有 5 大核心技術(shù),分別為圖像分類、物體定位、物體識別、語義分 割、三維重建。

圖像分類:根據(jù)圖像主要內(nèi)容進行分類。此為最基本視覺任務(wù),它將一副圖像分類到一個屬 于已知的類別集合中的類別,比如將帶有貓的圖片歸屬到貓類。流行的基本方法就是用深度 卷積網(wǎng)絡(luò)(CNN)提取特征并分類,將圖片輸入網(wǎng)絡(luò)直接得到物體的類別。

物體定位:定位包含主要物體的圖像區(qū)域,以便識別區(qū)域中的物體。當一副圖像內(nèi)的不同位置 存在不同物體時那就不能簡單地將圖片分為某一類了。這時需要找出圖像中有幾類物體,準確 地標注出它們所在位置,并把物體在圖像中框出來。

語義分割:把圖像中每一個像素分到其所屬物體類別。用目標檢測方法把物體在圖像中框出來, 框一般是用矩形框,但物體一般是流線形的,為了進一步標注出物體,需要指出圖像中哪些像 素是對應(yīng)哪一類的物體——既圖像語義分割,效果如下圖所示(圖 3)。語義分割可看做分類 問題,可以借鑒分類算法把每一個像素劃分到某一類物體。

物體識別:定位并分類圖像中出現(xiàn)的所有物體。這一過程通常包括:劃出區(qū)域然后對其中的 物體進行分類。此為圖像分類、物體定位和語義分割的結(jié)合。

三維重建:由二維圖像升級到立體視覺。三維重建一般是指基于二維圖像通過圖像預(yù)處理、 點云配準與融合、生成表面等過程把真實的三維場景從二維圖像中恢復(fù)出來。

能力二——認知智能:圖像表達了什么

在圖像識別基礎(chǔ)上,機器還需知道各個局部之間關(guān)系、整體關(guān)系,即理解和推斷物體之間關(guān)聯(lián),推 測人的情緒和意圖,對整體場景判斷等,甚至進行決策。具體如下圖:

1)圖像識別:男士、女士、餐桌、酒杯、食物、鮮花、燈光

2)人物的動作、表情以及情緒:吃東西、微笑、快樂

3)圖像各部分的關(guān)聯(lián):男女注視對方、男女是情侶關(guān)系、男女在餐桌上吃飯

4)整體場景的含義:一對情侶在餐廳約會,彼此很開心

具備了感知智能和認知智能,計算機就可以像人腦一樣處理視覺信息,甚至在識別人臉、物體和場 景的準確率上超過人類,并且在此基礎(chǔ)上進行推理、決策。而這種能力洽洽是安防、自動駕駛、金 融、醫(yī)療等領(lǐng)域存在強烈需求,計算機視覺技術(shù)隨著不斷成熟將廣泛應(yīng)用于各個行業(yè)。

1.2 計算機視覺領(lǐng)跑 AI 產(chǎn)業(yè),安防領(lǐng)域應(yīng)用最深

計算機視覺是中國 AI 行業(yè)的最大組成部分,市場規(guī)模飛速增長。根據(jù)中國信通院報告數(shù)據(jù),2017 年中國人工智能市場中計算機視覺占比 37%,據(jù)艾瑞咨詢預(yù)測 2018 年計算機視覺市場規(guī)模達 120 億元。從全球來看,MarketsandMarkets報告顯示,2017 年基于人工智能的計算機視覺全球市場規(guī) 模為 23.7 億美元,預(yù)計 2023 年會達到 253.2 億美元,預(yù)測期內(nèi)復(fù)合年增長率 47.5%。

從投融資角度來看,計算機視覺最被國內(nèi)一級市場看好。據(jù)清科資本研究中心,2018 年中國計算機 視覺相關(guān)企業(yè)融資額達 158 億元,占比 25%,位居大 AI 行業(yè)第一,同時也遠超美國的 73 億元。 自動駕駛、智能機器人等 AI 方向同樣依賴計算機視覺技術(shù),所獲融資中亦有大量投入到計算機視 覺研發(fā)中。

計算機視覺應(yīng)用場景廣闊,商業(yè)化變現(xiàn)空間大。計算機視覺能極大提升機器的圖像感知能力和認知 能力,因此應(yīng)用場景十分廣闊,例如在安防影像分析、泛金融身份認證、手機和互聯(lián)網(wǎng)娛樂、批發(fā) 零售商品識別、工業(yè)制造、廣告營銷、自動駕駛、醫(yī)療影像分析等領(lǐng)域都具有巨大應(yīng)用價值。

安防領(lǐng)域:落地最快。安防是人臉識別技術(shù)最成熟的落地領(lǐng)域,也是 AI 視覺公司普遍首先切 入的細分領(lǐng)域。例如對道路卡口、車站、地鐵站、機場等的監(jiān)控視頻進行智能分析,檢測出視 頻中的人臉與黑名單庫中的影像記錄實時比對,比對成功則報警。

金融領(lǐng)域:人臉識別廣泛應(yīng)用。人臉識別在金融領(lǐng)域已出現(xiàn)多種解決方案,伴隨識別準確率上 升,遠程開戶已在互聯(lián)網(wǎng)金融行業(yè)得到廣泛應(yīng)用,人臉支付、刷臉取款等開始被各大銀行采用。

醫(yī)療影像:數(shù)據(jù)門檻高。醫(yī)療影像的數(shù)據(jù)標注門檻較高,需由專業(yè)醫(yī)師標注,且非典型病例的 標注意見較難統(tǒng)一,因此數(shù)據(jù)可得性較差。標注工作之外,醫(yī)療影像分析對數(shù)字化程度、數(shù)據(jù) 量、臨床路徑、對應(yīng)檢測量都有著苛刻的要求,

無人駕駛:技術(shù)難度大。無人駕駛涉及采集攝像頭、雷達等多種數(shù)據(jù),并根據(jù)多重數(shù)據(jù)進行車 輛、物體、道路、行人等不同識別后進行決策,計算機視覺將在環(huán)境感知(周圍有什么)和地 圖繪制(我在哪兒)中發(fā)揮重要作用。

安防行業(yè)應(yīng)用程度最深、規(guī)模最大,廣告營銷緊隨其后有望加速發(fā)展。安防影像分析是目前計算機 視覺最大的應(yīng)用,2017 年在計算機視覺市場規(guī)模占比約 67.9%。廣告營銷作為第二大應(yīng)用領(lǐng)域占 比達 18%,計算機視覺技術(shù)能夠智能挖掘影響內(nèi)容廣告位,構(gòu)建新型營銷模式,AI 營銷市場份額 或加速增長。

滲透率受數(shù)據(jù)可得性、算法難度和需求彈性影響,智能營銷、自動駕駛、智能醫(yī)療或加速發(fā)展。從 目前的落地進展來看,安防、移動互聯(lián)網(wǎng)領(lǐng)先,滲透率相對較高,醫(yī)療、無人駕駛則更多還在研發(fā) 測試階段,基本尚未商業(yè)化應(yīng)用。安防行業(yè)、移動互聯(lián)網(wǎng)由于人像數(shù)據(jù)相對易得、人臉識別需求迫 切,成為較早應(yīng)用視覺 AI 技術(shù)的行業(yè),而醫(yī)療行業(yè)則由于數(shù)據(jù)不夠系統(tǒng)化、識別專業(yè)性強,雖然有充足需 求但尚未大規(guī)模應(yīng)用。未來隨著圖像數(shù)據(jù)結(jié)構(gòu)化和技術(shù)成熟,我們認為智能營銷、自動駕駛、醫(yī)療 影像分析、動態(tài)安防等垂直市場將加速增長。

2. AI 視覺賦能大視頻行業(yè),成就智能影像黃金賽道

對于互聯(lián)網(wǎng)大文娛行業(yè)來說,我們判斷視頻+AI 是未來發(fā)展趨勢,該賽道的新興模式正快速發(fā)展, 尤其計算機視覺領(lǐng)域下智能影像生產(chǎn)賽道,原因如下:1)定位黃金賽道,5G 漸行漸近,視頻將是 未來最主要的信息傳播方式,視頻中 AI 應(yīng)用場景廣闊;2)技術(shù)上已具備可能性,AI 賦能下,視 頻廣告營銷模式將走向精準化、實時化、智能化、文娛生產(chǎn)模式走向自動化,而且這兩個賽道均是 大規(guī)模賽道具有應(yīng)用深度。

2.1 定位黃金賽道,視頻成為最主要信息載體及傳播方式

視頻呈現(xiàn)已是互聯(lián)網(wǎng)大勢所趨。過去 20 年里,互聯(lián)網(wǎng)的信息主陣地經(jīng)歷了門戶網(wǎng)站到以谷歌、百 度為代表的搜索引擎,再到Facebook、Twitter、微博、微信社交平臺的進化過程。當前隨著各類 PGC、UGC 平臺、直播、短視頻和 VR 的興起,視頻將逐漸取代圖文成為主要的互聯(lián)網(wǎng)信息表達 和傳遞方式。正如谷歌、百度將文字結(jié)構(gòu)化一樣,在一個視頻成為主要信息呈現(xiàn)方式的時代,計算 機視覺也將作為一項不可或缺的底層技術(shù),開拓諸多應(yīng)用場景,提高生產(chǎn)效率和生活便利程度。

目前 BATT 的產(chǎn)品均主要以視頻為呈現(xiàn)方式,如手百信息流(視頻占比 80%)、字節(jié)跳動(抖音 短視頻、今日頭條以短視頻為體現(xiàn)方式)、甚至阿里淘寶/天貓(加入視頻、直播等方式)等等。 我們從總時長角度來看,中短視頻已呈現(xiàn)爆發(fā)式增長。根據(jù) QM 統(tǒng)計,從 2015 年至 2019 年 4 月, 長短視頻占互聯(lián)網(wǎng)用戶總時長由 9.7%提升至 21.1%,增長超 100%,尤其短視頻,由之前僅占互聯(lián) 網(wǎng)用戶總時長 0.5%到 13.4%,呈現(xiàn)爆發(fā)式增長。此外,新聞增長也因目前新聞產(chǎn)品均以視頻信息 流分發(fā)為主??傮w上看,各大互聯(lián)網(wǎng)公司均大力開發(fā)短視頻產(chǎn)品。

2021年預(yù)計視頻流量將占據(jù)全球所有網(wǎng)絡(luò)用戶流量的82%,為計算機視覺奠定數(shù)據(jù)基礎(chǔ)。據(jù)思科 公司評估,2021 年單月上傳至網(wǎng)絡(luò)的視頻總時長將超過 500 萬年,每秒將誕生 1 百萬分鐘的網(wǎng)絡(luò) 視頻內(nèi)容,網(wǎng)絡(luò)視頻流量將占據(jù)全球所有網(wǎng)絡(luò)用戶流量的81.7%。快速增長的視頻內(nèi)容規(guī)模蘊含海 量信息,也為計算機視覺的深度學(xué)習(xí)算法進化提供了大數(shù)據(jù)支持。

5G技術(shù)加速視頻信息流增長,信息視覺化趨勢繼續(xù)強化。5G 將帶來超高速(4G 速度 100X)、低 延時(4G 延時 1/50)以及海量鏈接(連接設(shè)備超過地球人口100x)。復(fù)盤通訊技術(shù)從 2G 到 4G 的進化對傳媒內(nèi)容形態(tài)的影響,可以看出隨著 5G 時代漸行漸近,視頻會越來越成為互聯(lián)網(wǎng)主要信 息表達方式。

2.2 圖像感知智能日益成熟,為商業(yè)化落地奠定基礎(chǔ)支持

上文我們已經(jīng)論證大視頻行業(yè)是未來3-5年的黃金賽道,需求端有望持續(xù)高速增長,同時,我們認為計 算機視覺技術(shù)也日益成熟,為商業(yè)化落地奠定堅實基礎(chǔ),現(xiàn)有技術(shù)能力也已經(jīng)能夠支撐在廣告營銷、 內(nèi)容自動、安防等領(lǐng)域的應(yīng)用。

深度學(xué)習(xí)推動計算機視覺算法取得突破式發(fā)展。2012 年深度學(xué)習(xí)方法應(yīng)用于圖像識別,將 ImageNet圖像識別大賽的識別錯誤率由 25.8%降低至 16.4%,由此開啟計算機視覺算法的飛躍發(fā)展,到 2017 年圖像識別錯誤率降低至 2.25%,人臉和物體識別準確度都已超過人類,商業(yè)化已具備基礎(chǔ)技術(shù)支 持,尤其是側(cè)重于感知的圖像分類和人臉識別技術(shù)已經(jīng)在安防、身份認證和廣告營銷領(lǐng)域?qū)崿F(xiàn)商用 價值。

視頻結(jié)構(gòu)化技術(shù)將影像解析,積累海量可用數(shù)據(jù)。和文字、語音、圖片相比,視頻是信息容量最大、 信息傳遞效率最高的載體,但也正因為信息容量大、信息組織方式非線性(不像文字、代碼有標準 規(guī)則),所以也最難轉(zhuǎn)化為線性數(shù)據(jù)。而視頻結(jié)構(gòu)化技術(shù)系統(tǒng)通過圖像處理、圖像識別、內(nèi)容識別、 語義融合等技術(shù),將視頻轉(zhuǎn)化為結(jié)構(gòu)化的能被計算機處理的數(shù)據(jù),而數(shù)據(jù)就是互聯(lián)網(wǎng)時代的核心資 源,奠定大視頻行業(yè)發(fā)展基礎(chǔ)。

綜上所述,視頻已逐步成為最主要的信息載體和呈現(xiàn)方式,視頻行業(yè)必然為黃金賽道;同時算法進 化推動圖像感知智能日漸成熟,視頻結(jié)構(gòu)化技術(shù)將非線性的視頻轉(zhuǎn)化為線性數(shù)據(jù)。智能營銷商業(yè)化 也已經(jīng)落地,視頻 AI+大文娛產(chǎn)業(yè)發(fā)展前景值得期待。

3. 智能影像應(yīng)用場景:智能營銷已商業(yè)化落地,內(nèi)容審 核、影像自動生產(chǎn)起步

智能影像目前已經(jīng)商業(yè)化落地的領(lǐng)域主要是廣告營銷,即利用AI技術(shù)創(chuàng)新視頻廣告生產(chǎn)模式,精 準化場景營銷,另外影像自動化生產(chǎn)也已展開探索,下文我們將具體展開。

3.1 視覺 AI+營銷:智能植入廣告成為主賽道,直播、電商躍躍 欲試

我們可以將計算機視覺在廣告營銷領(lǐng)域的應(yīng)用簡單概述成,首先要有底層數(shù)據(jù)(視頻流量、視頻中 包含的信息)的積累、通過中層技術(shù)(如何提取信息、分析信息)的信息處理、最終落實到上層應(yīng) 用(既落地的商業(yè)模式將數(shù)據(jù)變現(xiàn)),數(shù)據(jù)層和技術(shù)層兩大驅(qū)動力的快速發(fā)展,目前文娛的垂直應(yīng) 用領(lǐng)域已涉及到植入廣告、直播營銷、文娛電商。

3.1.1 視頻廣告智能化,智能植入商業(yè)模式初具規(guī)模

商業(yè)模式——利用計算機視覺為視頻廣告增量提價的平臺生意。智能植入平臺輸出計算機視覺技術(shù), 全網(wǎng)內(nèi)容方或視頻平臺輸出視頻,二者共同創(chuàng)造出視頻內(nèi)廣告位(具體可能以圖貼、物體、熱點鏈 接、紅包等形式出現(xiàn)),供所有廣告主或代理商投放。所得廣告費收入再向內(nèi)容方或視頻平臺進行 分成。此外,智能植入平臺與傳統(tǒng) DSP、SSP 本質(zhì)區(qū)別在于,它并不是簡單的渠道方,更是技術(shù)服 務(wù)提供者,通過視覺 AI 技術(shù)在原生視頻中挖掘廣告位,并根據(jù)場景。智能植入平臺的價值不僅在 于作為渠道連接視頻流量方和廣告主,更在于供給增量廣告庫存和通過精準投放提高廣告價值。

視頻結(jié)構(gòu)化標簽為精準營銷提供豐富數(shù)據(jù)。基于對人、物的數(shù)據(jù)的深度學(xué)習(xí),計算機視覺可以進一 步分辨出場景標簽,形成自有的大數(shù)據(jù)沉淀及閉環(huán)。以極鏈科技的VideoAI視頻結(jié)構(gòu)化數(shù)據(jù)平臺為 例,依靠算法優(yōu)化和深度學(xué)習(xí),識別準確率已經(jīng)滿足商業(yè)化應(yīng)用要求,積累了龐大的視頻結(jié)構(gòu)化標 簽數(shù)據(jù)庫,明星的識別準確率已經(jīng)達到 99.6%,物體識別準確率 99%,場景識別準確率 99.4%,品 牌識別準確率 98.8%。

更進一步,通過視頻結(jié)構(gòu)化技術(shù)掃描海量視頻,對人物、物體、場景進行標簽化處理,對明星進行 標簽化場景化標注,一方面效果廣告主實時投放時可以更多匹配植入食品類廣告,提升營銷精準度; 另一方面也可以為品牌廣告主提供明星信息,尋找更合適的代言人,將明星與商品精準結(jié)合。

此外,從替代角度來看,在線長視頻平臺付費率加速提升,廣告形式變化為必然趨勢。我們從另一 維度去驗證產(chǎn)業(yè)發(fā)展軌跡,以季度末公布的付費會員數(shù)量和該季度移動端MAU的比率定義為付費 滲透率,愛奇藝、騰訊視頻的付費滲透率目前在15%左右,相比 Netflix 40%的滲透率,趨勢必然 提升。用戶成為會員后即可跳過貼片廣告,而頭部劇集、綜藝的貼片廣告時長在60-90秒左右,長 期來看付費滲透率提升將對貼片廣告總時長形成擠壓是趨勢所在。

3.1.2 植入廣告優(yōu)勢明顯

總結(jié)來看,我們認為相比貼片和傳統(tǒng)植入廣告,智能植入廣告優(yōu)勢主要有以下3點:1大幅優(yōu)化轉(zhuǎn) 化效率:可根據(jù)合適場景匹配廣告內(nèi)容進行投放,精準營銷提升 CTR;2規(guī)模化生產(chǎn):智能批量 識別廣告位,規(guī)?;咝V踩?3降低門檻,吸引更多廣告主:效果化實時投放,降低投放門檻, 吸引海量中小廣告主投放。

優(yōu)勢 1:識別場景精準投放,更可直達購買界面,閉環(huán)營銷顯著提升轉(zhuǎn)化效率。智能植入并 不只是識別出視頻中的可植入空間進行投放,更在于判斷出視頻的情景進行精準匹配。以極 鏈科技廣告案例為例,將長隆旅游廣告植入電視劇《人民的名義》中,廣告曝光量 381 萬次, 廣告點擊率 6306 次,CTR 為 0.16%;而植入綜藝節(jié)目中海洋樂園的場景后,廣告曝光量 224 萬,廣告點擊率 6.7 萬次,CTR 為 1.96%,提升 10 倍以上。在場景基礎(chǔ)上還可以通過植入電 商鏈接,觸發(fā)用戶點擊跳轉(zhuǎn)至購買頁面促進銷售,長隆旅游電商平均跳轉(zhuǎn)率21.74%,而傳統(tǒng) 貼片電商轉(zhuǎn)化率 0.3%,超出 72 倍。

優(yōu)勢 2:智能批量識別廣告位,規(guī)?;咝е踩?。無需人工判別,智能識別拆分視頻流像素, 低成本、高效率、精準發(fā)現(xiàn)增量廣告位。傳統(tǒng)植入方式工序繁瑣,智能植入可以極大節(jié)省工時, 效率提升在百倍以上。

優(yōu)勢 3:降低投放門檻并提供效果監(jiān)測,吸引更多中小廣告主參與。傳統(tǒng)植入廣告一般發(fā)生在 影視劇和綜藝的制作過程中,需要提前簽約且為品牌廣告,廣告效果好壞完全取決于電視劇或 影片、節(jié)目的收視情況,之前門檻太高,只有大型品牌廣告主才有實力做投放,大幅限制了視 頻廣告的市場規(guī)模。而智能植入則可不受劇集或節(jié)目限制在進行全網(wǎng)投放(只要有空余廣告位), 實現(xiàn)實時投放和程序化購買,對廣告曝光、點擊和轉(zhuǎn)化效果實時監(jiān)測,植入廣告走向效果化。 智能植入廣告實現(xiàn)以 CPC、CPM 計價,廣告主可以像投放搜索廣告、信息流廣告等充值,不 同預(yù)算體量可以靈活投放,例如極鏈科技CPM大多在 100-150元左右,把原有動輒百萬的傳 統(tǒng)植入門檻大大降低,能夠充分吸引中小廣告主投放。

綜上所述,未來視頻廣告模式正在發(fā)生進化,智能植入廣告將替代傳統(tǒng)貼片廣告成為重要的視頻廣 告形態(tài),相比貼片和傳統(tǒng)植入,智能植入廣告優(yōu)勢明顯:精準化、規(guī)?;㈤T檻降低均將推動行業(yè) 快速發(fā)展,智能植入廣告已是計算機視覺最易落地的商業(yè)化形態(tài)之一。

3.1.3 直播互動、文娛電商改善互動體驗,閉環(huán)營銷進一步提升轉(zhuǎn)化效果

除了主賽道——智能植入廣告外,視覺AI在智能營銷中不僅可以應(yīng)用于愛奇藝、芒果TV等 PGC 點播視頻平臺,還可應(yīng)用于直播平臺提升互動體驗,更進一步還可以通過植入電商鏈接、電商購物 小程序、IP商業(yè)開發(fā)服務(wù)等打造文娛電商系統(tǒng),直達購買行為,實現(xiàn)視頻場景內(nèi)的閉環(huán)營銷。

直播互動提升營銷體驗,助力流量變現(xiàn)。直播場景本身粉絲和互動性,視覺 AI 在直播過程中創(chuàng)建 抽獎、投票、紅包、卡牌收集等互動形式,在網(wǎng)絡(luò)直播中將用戶互動和內(nèi)容營銷融為一體。

3.2 其他場景:自動審核、視頻信息檢索和內(nèi)容自動生產(chǎn)起步

以智能植入為代表的智能營銷已經(jīng)借助視覺AI技術(shù)實現(xiàn)規(guī)?;纳虡I(yè)開發(fā),除此之外,行業(yè)也在 探索將 AI技術(shù)應(yīng)用于視頻內(nèi)容審核、視頻信息檢索和視頻內(nèi)容自動生產(chǎn)等場景的可能性。雖然這 些領(lǐng)域尚處于早期階段發(fā)展規(guī)模較小,還沒有的成熟商業(yè)模式,但我們認為放眼長期仍值得關(guān)注。

3.2.1 視頻內(nèi)容自動審核

基于視覺感知智能和視頻結(jié)構(gòu)化技術(shù),視覺AI可以對視頻中的圖像進行檢測,及時發(fā)現(xiàn)涉黃涉暴、 政治敏感、問題明星等風(fēng)險內(nèi)容。1)敏感人物:憑借人臉識別技術(shù)和名人圖像庫,計算機可以自 動準確監(jiān)測視頻中是否存在敏感人物,還可以靈活配置人物黑名單、同步辨識敏感和普通人物,一 旦普通人物變?yōu)槊舾腥宋?,可快速屏蔽相關(guān)視頻。2)敏感言論和行為:圖像認知智能會幫助計算 機理解視頻信息和場景,并實時全網(wǎng)比對。

相比人工審核,AI 智能審核優(yōu)勢明顯。1)成本優(yōu)勢:據(jù)騰訊財經(jīng)報道,快手于18年 4 月急招 3000 人內(nèi)容審核員,審核團隊規(guī)模達 5000 人,抖音審核團隊亦有數(shù)千人,可見視頻內(nèi)容審核需求旺盛 且隨視頻流規(guī)模擴大而增長。相比人工肉眼審核,AI 視頻審核最大優(yōu)勢在于自動化批量審核提高 效率,能夠大大節(jié)約人工成本;2)實時更新:視覺 AI 在審核內(nèi)容的同時也是學(xué)習(xí)全網(wǎng)視頻的過 程,通過深度學(xué)習(xí),計算機可以實時更新黑名單和樣本庫,不斷提高識別準確度。

3.2.2 視頻信息檢索與版權(quán)保護

計算機視覺突破視頻檢索技術(shù)瓶頸,有望實現(xiàn)“用視頻找視頻”。視頻信息檢索如我們前文所述, 圖像感知、認知智能和視頻結(jié)構(gòu)化技術(shù)使得影像也能被解析成線性數(shù)據(jù),這也為視頻信息的檢索打 破了技術(shù)瓶頸。長期以來搜索引擎智能檢索文字信息,后來隨技術(shù)進步實現(xiàn)了以圖搜圖。AI 通過 視頻結(jié)構(gòu)化技術(shù)對視頻幀拆分,進而給視頻和幀打上標簽,可實現(xiàn)海量視頻分類、信息提取、視頻 比對,未來隨技術(shù)成熟,上傳影像片段或截圖后檢索視頻源或相關(guān)視頻也可實現(xiàn)。

影像智能賦能視頻版權(quán)保護。目前視頻版權(quán)保護的一大痛點在于,傳統(tǒng)技術(shù)難以實現(xiàn)自動化的視頻 比對和侵權(quán)判定。影像智能感知技術(shù)成熟后,由于 “視頻指紋”是根據(jù)視頻多模態(tài)特征的唯一標 識,不會隨媒體文件格式轉(zhuǎn)換、剪輯、壓縮旋轉(zhuǎn)而產(chǎn)生變化,基于此構(gòu)建的智能媒資搜索引擎還可 以在全網(wǎng)進行視頻比對,應(yīng)用于視頻版權(quán)保護。

3.2.3 智能影像生產(chǎn)

除了對已有視頻進行解構(gòu)、分析,將影像轉(zhuǎn)化為數(shù)據(jù),挖掘下游應(yīng)用場景,視覺AI技術(shù)還可以從 數(shù)據(jù)(內(nèi)核)到視頻(呈現(xiàn)方式),切入上游內(nèi)容生產(chǎn),提供智能視頻編輯、短視頻自動生成、后 期特效自動化和信息可視化服務(wù)等,視頻相較于其他信息媒介固然信息容量最大、傳播效率最高, 但同時創(chuàng)作難度、耗費時間和成本也最多,智能影像生產(chǎn)可以提升視頻生產(chǎn)效率、降低內(nèi)容制作成 本。

智能視頻編輯:例如針對綜藝節(jié)目的大量精彩鏡頭,1 個小時的原始視頻需要專業(yè)人員數(shù)個 小時才能完成,而通過智能影像技術(shù)可擺脫專業(yè)設(shè)備、專業(yè)編輯軟件及專業(yè)人員的限制,大 大降低制作成本。利用智能影像技術(shù)對人物、姿態(tài)、動作,運動軌跡進行全景分析并自動剪 輯和合成,最快只需十到幾十秒,將生產(chǎn)效率提升超過 10 倍。

影視輕工業(yè):面向高端、專業(yè)視頻內(nèi)容生產(chǎn)市場的特效、三維等后期制作服務(wù),我們認為隨 著技術(shù)成熟,專業(yè)影視生產(chǎn)領(lǐng)域中一些并不復(fù)雜但需耗費人力的特效處理工作將被視覺 AI 替代,降低后期成本,提升影視工業(yè)化水平。

視頻信息可視化:依靠大數(shù)據(jù)平臺基礎(chǔ),借助可視化模型技術(shù),以數(shù)據(jù)地圖、時間線、氣泡 圖、交互性圖表、人物關(guān)系圖等方式呈現(xiàn)多維數(shù)據(jù)信息,實現(xiàn)信息可視化加工生產(chǎn)。

一個應(yīng)用實例:智能影像生產(chǎn)技術(shù)賦能智慧媒體。2019 年兩會期間光明網(wǎng)借助影譜科技的智能影 像 AGC 技術(shù),根據(jù)語義場景生產(chǎn)視頻內(nèi)容,影像跟隨語義、表情、手勢等實時變化演繹,從而可 視化、智能化地呈現(xiàn)政協(xié)委員履職作業(yè)。這不僅讓政協(xié)委員履職內(nèi)容更加直觀易懂,相比普通視頻 承載的內(nèi)容也更加豐富趣味。例如政協(xié)委員講到校園進行遠程的沉浸式非常強的互動的教學(xué)時,其 身后背景便成了一面學(xué)術(shù)感十足的畫面,VR 眼鏡也自動戴在人物眼鏡上。

4. 視覺 AI+大文娛領(lǐng)跑者:影譜科技和極鏈科技

影譜科技和極鏈科技均重點涉及國內(nèi)計算機視覺應(yīng)用的大文娛行業(yè),他們目前均把智能營銷作為公 司主要業(yè)務(wù)之一,說明廣告營銷是視覺 AI+大文娛行業(yè)落地最順利的應(yīng)用領(lǐng)域。同時各自業(yè)務(wù)和商 業(yè)模式、產(chǎn)品服務(wù)形態(tài)又各有側(cè)重,

4.1 影譜科技:依靠計算機視覺打造智能營銷平臺,探索內(nèi)容 自動化生產(chǎn)

影譜科技是領(lǐng)先的數(shù)字媒體可視化技術(shù)服務(wù)者和原生視頻營銷引領(lǐng)者,其商業(yè)模式包括兩大核心:

ACM內(nèi)核:可自由支配的自動化生產(chǎn)廣告庫存(Automatic Content Marketing),即智能植 入廣告業(yè)務(wù),目前已規(guī)?;涞亍F渖虡I(yè)模式如上文所述,主要依靠接入內(nèi)容方或視頻平臺 的視頻,依靠視頻結(jié)構(gòu)化技術(shù)發(fā)掘植入廣告位并進行精準投放,獲取廣告發(fā)布費用,成本主 要是向上游內(nèi)容方和視頻平臺的分成,以及技術(shù)成本等。

AGC內(nèi)核:機器自動化生產(chǎn)的視頻內(nèi)容(Automatic Generated Content),包括短視頻自動生 產(chǎn),影視輕工業(yè)和信息可視化服務(wù),目前尚處于商業(yè)化落地早期,但隨視頻化程度提升未來 空間較大。

公司智能營銷平臺由“植入易”和“Video易”兩大核心產(chǎn)品構(gòu)成:“植入易”通過智能計算、浮 層架設(shè)和實時植入三大技術(shù),自動掃描發(fā)現(xiàn)視頻中廣告位,結(jié)合場景精確植入,展現(xiàn)形式包括貼紙、 LOGO、道具、畫中畫等多種形態(tài),重在品牌和產(chǎn)品展示;而“Video 易”可視化技術(shù)服務(wù)平臺將 視頻內(nèi)容延展,實現(xiàn)內(nèi)容與觀眾互動營銷,產(chǎn)品包括直鏈 URL、投票抽獎紅包小程序、電商鏈接 等,重在互動和轉(zhuǎn)化。

攜手商湯科技,引入領(lǐng)先技術(shù)聚焦 AI+大文娛產(chǎn)業(yè)。影譜的底層技術(shù)架構(gòu)接入了商湯 SenseMedia互聯(lián)網(wǎng)廣電視頻結(jié)構(gòu)化解決方案和SenseAR增強現(xiàn)實繪制平臺的功能,共同聚焦于AI+大文娛產(chǎn) 業(yè)。雙方憑借在計算機視覺、視頻結(jié)構(gòu)化、深度學(xué)習(xí)、大數(shù)據(jù)、視頻廣告投放、網(wǎng)絡(luò)視頻互動技術(shù) 等領(lǐng)域的獨特優(yōu)勢,面向互聯(lián)網(wǎng)、影視、視頻等大文娛產(chǎn)業(yè)細分領(lǐng)域提供 AI 影像商業(yè)化服務(wù),挖 掘視覺技術(shù)的多維度應(yīng)用價值,拓展商業(yè)邊界。

覆蓋海量視頻流量,為場景營銷提供大數(shù)據(jù)支持。公司與湖南衛(wèi)視、芒果TV、華數(shù) TV、火星文 化等多家內(nèi)容制作方簽署合作協(xié)議,同時為騰訊視頻、樂視TV、迅雷、搜狐視頻、暴風(fēng)影音等多 家視頻平臺提供視覺營銷技術(shù)服務(wù)。

創(chuàng)新營銷方式,贏得眾多品牌廣告主青睞。公司已幫助蒙牛、雀巢、匯源、立邦、藍月亮等多家知 名廣告主進行場景營銷,植入案例深受廣告主認可,目前合作的品牌廣告主豐富,標桿效應(yīng)助力未 來客戶拓展。

4.2 極鏈科技:視覺 AI 賦能場景經(jīng)濟,營銷應(yīng)用矩陣豐富

視覺AI技術(shù)驅(qū)動,“廣告+電商+互娛”打造視頻場景產(chǎn)業(yè)閉環(huán)。極鏈科技是一家以視頻 AI 技術(shù) 為核心,對全網(wǎng)視頻進行場景解析,進而驅(qū)動場景新經(jīng)濟發(fā)展的人工智能科技公司,核心技術(shù)為VideoAI視頻智能系統(tǒng)、VideoOS視頻小程序系統(tǒng),主要業(yè)務(wù)為廣告、電視和互娛。極鏈除了在植 入廣告上有AI場景營銷平臺(智能植入廣告),還布局了視頻電商、視頻互娛等,在智能營銷的 產(chǎn)品矩陣更豐富,但尚未向上游切入內(nèi)容生產(chǎn)。

技術(shù)積淀卡位視頻流量場景,收入實現(xiàn)爆發(fā)增長。公司表示合作方覆蓋了65%的頭部流量視頻平 臺,主要為其提供視頻互動操作系統(tǒng),實現(xiàn)廣告自動投放和電商自動投放;支持移動端、PC 端、 OTT 跨屏組合投放。公司為芒果 TV、愛奇藝、中國藍 TV、鳳凰網(wǎng)、風(fēng)行網(wǎng)、搜狐、一直播、抖 音等視頻、直播、短視頻平臺提供AI電商、互動娛樂、情景廣告、視頻搜索、視頻頭條等系統(tǒng)應(yīng) 用。月服務(wù)用戶達 4.2億,和百家品牌、商家、供應(yīng)鏈建立深度合作,協(xié)同全網(wǎng)APP構(gòu)建了完整 的視頻場景產(chǎn)業(yè)閉環(huán),目前在AI+視頻行業(yè)已實現(xiàn)大批量商用。據(jù)華爾街見聞報道,公司 2017 年 營收 1.5 億并實現(xiàn)盈利,2018 年收入 5.8 億,其中 12 月單月營收超過 1 億元。

場景營銷精準匹配受眾,互動形式實現(xiàn)品效合一。ASMP 系統(tǒng)是極鏈科技打造的視頻 AI 情景營銷 平臺,將海量視頻內(nèi)容結(jié)構(gòu)化,進而將商品與內(nèi)容場景精準融合。ASMP 系統(tǒng)首先通過獨創(chuàng)的 Video AI(以視覺識別為基礎(chǔ)的視頻結(jié)構(gòu)化數(shù)據(jù)平臺)自動掃描視頻中的場景,搜索視頻內(nèi)中互動廣告 可投放的點位,然后借助 Video OS(廣告創(chuàng)建程序),自動植入云圖、氣泡對話、視頻內(nèi)投票等 互動廣告。投放過程中還可以通過 Video Data 大數(shù)據(jù)系統(tǒng)實時監(jiān)測投放效果。

4.3 Mirriad: 英國智能植入廣告公司,海外流媒體格局和商業(yè) 模式阻礙植入廣告變現(xiàn)

Mirriad是一家英國視頻植入廣告技術(shù)服務(wù)商,通過專利技術(shù)系統(tǒng)能夠自動掃描視頻,識別人物和 物體,自動標注適合進行廣告植入的位置,進行批量植入,盈利模式為和內(nèi)容方對廣告收入進行分 成,分成比例 20%左右。2017 年和優(yōu)酷合作進行彈個車廣告植入,為公司當年最大單一項目。

該公司于 2017 年 12 月在倫敦 AIM 市場上市,2017 年收入僅為 87.4 萬英鎊,尚處于起步階段,17/16年收入超過一半來自中國。目前公司廣告投放方式仍為合約投放的項目式,尚未實現(xiàn)程序化購買實 時投放。我們認為這與國外視頻網(wǎng)站的競爭格局和商業(yè)模式有關(guān),公開資料顯示Mirriad并未接入 國外主流視頻平臺。

Netflix穩(wěn)居海外流媒體龍頭,商業(yè)模式不依靠廣告變現(xiàn)。國內(nèi)長視頻平臺中,愛奇藝、騰訊視頻 和優(yōu)酷土豆三足鼎立,活躍用戶和付費滲透率差距不大;而海外流媒體則以 Netflix占據(jù)絕對龍頭 地位,無論是在訂閱用戶規(guī)模、滲透率上都遠遠領(lǐng)先Amazon和 Hulu,更重要的是海外流媒體基 本以用戶訂閱費用為主要收入,基本不通過廣告變現(xiàn),不存在植入廣告空間,比如Netflix收入中 97.7%都來自訂閱費用。Mirriad的 2017 年收入一半以上來自中國,印度占比 23%,也是由于中國、 印度的視頻平臺基本都以免費+廣告的模式起家,付費率仍然較低。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49014

    瀏覽量

    249432
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1709

    瀏覽量

    46777
  • 智能影像分析
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    8887

原文標題:計算機視覺及智能影像行業(yè)深度研究報告

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    光電耦合器行業(yè)研究報告

    電子發(fā)燒友網(wǎng)站提供《光電耦合器行業(yè)研究報告.docx》資料免費下載
    發(fā)表于 05-30 15:33 ?0次下載

    利用邊緣計算和工業(yè)計算機實現(xiàn)智能視頻分析

    IVA的好處、實際部署應(yīng)用程序以及工業(yè)計算機如何實現(xiàn)這些解決方案。一、什么是智能視頻分析(IVA)?智能視頻分析(IVA)集成了復(fù)雜的計算機視覺
    的頭像 發(fā)表于 05-16 14:37 ?156次閱讀
    利用邊緣<b class='flag-5'>計算</b>和工業(yè)<b class='flag-5'>計算機</b>實現(xiàn)<b class='flag-5'>智能</b>視頻分析

    一文帶你了解工業(yè)計算機尺寸

    工業(yè)計算機是現(xiàn)代自動化、人工智能(AI)和邊緣計算的支柱。這些堅固耐用的系統(tǒng)旨在承受惡劣的環(huán)境,同時為關(guān)鍵應(yīng)用提供可靠的性能。然而,由于有這么多可用的外形尺寸,為您的工業(yè)計算機選擇合適
    的頭像 發(fā)表于 04-24 13:35 ?293次閱讀
    一文帶你了解工業(yè)<b class='flag-5'>計算機</b>尺寸

    中科視語入選甲子光年《2025 中國AI Agent行業(yè)研究報告

    3月12日,備受矚目的《2025中國AIAgent行業(yè)研究報告》由甲子光年重磅發(fā)布!在這份極具前瞻性的行業(yè)報告中,中科視語憑借卓越的實力脫穎而出,成功入選為國內(nèi)重點AIAgent廠商的典型案例。該
    的頭像 發(fā)表于 03-13 16:24 ?632次閱讀
    中科視語入選甲子光年《2025 中國AI Agent<b class='flag-5'>行業(yè)</b><b class='flag-5'>研究報告</b>》

    嵌入式軟件測試技術(shù)深度研究報告

    嵌入式軟件測試技術(shù)深度研究報告 ——基于winAMS的全生命周期質(zhì)量保障體系構(gòu)建 一、行業(yè)技術(shù)瓶頸與解決方案框架 2025年嵌入式軟件測試領(lǐng)域面臨兩大核心矛盾: ? 安全合規(guī)與開發(fā)效率的沖突
    的頭像 發(fā)表于 03-03 13:54 ?349次閱讀

    Arm KleidiCV與OpenCV集成助力移動端計算機視覺性能優(yōu)化

    生成式及多模態(tài)人工智能 (AI) 工作負載的廣泛增長,推動了對計算機視覺 (CV) 技術(shù)日益高漲的需求。此類技術(shù)能夠解釋并分析源自現(xiàn)實世界的視覺信息,并可應(yīng)用于人臉識別、照片分類、濾鏡
    的頭像 發(fā)表于 02-24 10:15 ?565次閱讀

    2025年汽車微電機及運動機構(gòu)行業(yè)研究報告

    佐思汽研發(fā)布了《2025年汽車微電機及運動機構(gòu)行業(yè)研究報告》。
    的頭像 發(fā)表于 02-20 14:14 ?1056次閱讀
    2025年汽車微電機及運動機構(gòu)<b class='flag-5'>行業(yè)</b><b class='flag-5'>研究報告</b>

    廣電計量新年首篇深度研究報告出爐

    新年伊始,廣電計量首篇深度研究報告出爐,公司憑借全面發(fā)展的企業(yè)實力和資本市場的優(yōu)異表現(xiàn)在新的一年獲得資本市場的認可。
    的頭像 發(fā)表于 01-03 11:31 ?756次閱讀

    量子計算機與普通計算機工作原理的區(qū)別

    ? 本文介紹了量子計算機與普通計算機工作原理的區(qū)別。 量子計算是一個新興的研究領(lǐng)域,科學(xué)家們利用量子力學(xué),制造出具有革命性能力的計算機。雖然
    的頭像 發(fā)表于 11-24 11:00 ?1481次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區(qū)別

    【小白入門必看】一文讀懂深度學(xué)習(xí)計算機視覺技術(shù)及學(xué)習(xí)路線

    一、什么是計算機視覺計算機視覺,其實就是教機器怎么像我們?nèi)艘粯?,用攝像頭看看周圍的世界,然后理解它。比如說,它能認出這是個蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉(zhuǎn)換
    的頭像 發(fā)表于 10-31 17:00 ?1241次閱讀
    【小白入門必看】一文讀懂<b class='flag-5'>深度</b>學(xué)習(xí)<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術(shù)及學(xué)習(xí)路線

    計算機控制系統(tǒng)實踐報告

    計算機控制技術(shù)實踐報告
    發(fā)表于 10-17 13:45 ?1次下載

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領(lǐng)域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動了多個行業(yè)的變革,也
    的頭像 發(fā)表于 08-14 09:49 ?2042次閱讀

    深視智能參編《2024智能檢測裝備產(chǎn)業(yè)發(fā)展研究報告:機器視覺篇》

    為全面了解機器視覺檢測裝備產(chǎn)業(yè)發(fā)展情況,中國電子技術(shù)標準化研究院聯(lián)合業(yè)內(nèi)龍頭企業(yè)、科研院所和產(chǎn)業(yè)聯(lián)盟等(參編單位名單見附件),共同編制了《智能檢測裝備產(chǎn)業(yè)發(fā)展研究報告:機器
    的頭像 發(fā)表于 08-05 08:38 ?651次閱讀
    深視<b class='flag-5'>智能</b>參編《2024<b class='flag-5'>智能</b>檢測裝備產(chǎn)業(yè)發(fā)展<b class='flag-5'>研究報告</b>:機器<b class='flag-5'>視覺</b>篇》

    計算機視覺中的圖像融合

    在許多計算機視覺應(yīng)用中(例如機器人運動和醫(yī)學(xué)成像),需要將多個圖像的相關(guān)信息整合到單一圖像中。這種圖像融合可以提供更高的可靠性、準確性和數(shù)據(jù)質(zhì)量。多視圖融合可以提高圖像分辨率,并恢復(fù)場景的三維表示
    的頭像 發(fā)表于 08-01 08:28 ?1141次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>中的圖像融合

    計算機視覺技術(shù)的AI算法模型

    計算機視覺技術(shù)作為人工智能領(lǐng)域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這一目標,計算機
    的頭像 發(fā)表于 07-24 12:46 ?1806次閱讀