chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI畫家化身“心靈捕手”,繪制具備情感特征的人物肖像

如意 ? 來源:雷鋒網 ? 作者:雷鋒網 ? 2020-07-05 09:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI在藝術界表現出越來越驚人的“天賦”

我們知道用AI來繪畫、寫詩、作曲已經不是新鮮事。但在藝術領域,AI在試圖模仿、甚至超越人類的過程中,始終存在一個難以逾越的瓶頸,就是人類與生而來的創(chuàng)造力。

這也是AI研發(fā)人員聚焦深度學習和強化學習著力攻克的難點之一。

近日,預印論文庫arXiv上發(fā)表了一項最新研究成果,論文中的AI畫家可以化身“心靈捕手”,通過對話式溝通感受人類的獨特品質、個性和情緒,從而繪制具備內在情感特征的人物肖像。

據了解,這位Empathic AI Painter,出自來自加拿大溫哥華西蒙弗雷澤大學(SFU)iViz實驗室團隊。此前,他們的AI畫家曾在國際神經信息處理系統(tǒng)(NeurIPS)大會做了現場演示,吸引眾多用戶參與圍觀,還受到CTV國家新聞的專項報道。

那么這款“心靈捕手”AI畫家是如何進行藝術創(chuàng)作的呢?

會聊天的AI畫家

據該團隊介紹,AI畫家具備兩套創(chuàng)意系統(tǒng),一是對話式語音交互系統(tǒng),一是AI人像生成模型系統(tǒng),他們均通過3D虛擬人像來呈現。

Empathic AI Painter

與傳統(tǒng)繪制畫像不同,它不是一種靜態(tài)的“眼觀”模式,而是采取對話聊天的形式,捕捉內在情緒完成藝術創(chuàng)作。

該團隊教授史蒂夫·迪帕拉( DiPaola)表示,3D虛擬畫家的語音交互系統(tǒng)可以與用戶聊天,就某一事件采訪他們的感受,了解他們的性格,進而通過AI人像生成模型,在繪畫過程中體現不同的情感特質。總的來說,AI畫家需要完成三項任務:

感知用戶語言和行為

基于以上信息,判定人物性格和情感特質;

通過AI人像生成模型,在繪畫風格、色彩、紋理上呈現不同的用戶特質;

在ECA方面,3D虛擬人像融合了NLP自然語言處理模型,在交談中通過面部情感、語言壓力、語義,感知人類的情感和對話,并作出相應的反饋。另外,其內置的共情建模,還可以通過手勢、言語、表情,對用戶情緒作出感知性反應。自然、真誠的對話表現可以讓人類更真實的表現自己。

在個人特質評估方面,研究人員采用了“五大人格模型”(FFM)。它是由科斯塔和麥克雷在20世紀80年代提出的,被廣泛用于人格分析。模型提出了神經質(N)、外傾性(E)、經驗開放性(O)、宜人性(A)和認真性(C)五大人格因素,并通過NEO人格調查表進行測量。

在肖像渲染階段,利用mDD((ModifiedDeep Dream)模型在16萬張數據集上進行深度訓練,由ePainterly模塊完成的最終的風格繪制。

17種不同類型的情感肖像

那么它的作畫效果如何呢?之前提到,AI畫家曾在NeurIPS 2019大會上做過現場展示,當時有26位用戶參與,并完成的現場交互。實際上原、人格調查表有120多個問題,大約需要45分鐘才能完成。

但這里研究人員僅使用了每個維度的一個問題進行了互動,用時不足5分鐘。以下是圍繞“會議感受”主題下的互動問題:

最終結果顯示,84.72%的用戶語音被準確識別,AI畫家完成呈現除了17中不同的個性類別,同時用戶也表示,該風格表現出了其內在的情感特征。(以下是部分作品)

目前這款3D虛擬畫家的繪畫作品以已在去全球展出,包括紐約市和惠特尼的現代藝術博物館(MoMA)。

DiPaola教授認為,AI在激發(fā)藝術與高級計算機技術融合方面存在無限的潛力。他們所研發(fā)的AI系統(tǒng)只是藝術創(chuàng)新的第一步,之后他們還將在此系統(tǒng)上,探索基于詩歌、散文的藝術創(chuàng)作。

背后的技術原理

與傳統(tǒng)AI設計使用單一算法不同,DiPaola教授團隊的AI系統(tǒng)融合多種不同的技術。我們先來看一下完成的AI系統(tǒng)的架構組成,分為對話交互循環(huán)(Conversational Interaction Loop)和生成風格化肖像(Generative Portrait stylization)兩大模塊組成,這兩個模塊之間由BIG-5人格模型鏈接,用于傳達個性化肖像的關鍵信息。

第一階段的對話交互循環(huán)功能是基于具有移情模塊的M-Path系統(tǒng)實現的。它可以呈現出3D虛擬人像的形式。在與人類的對話中,具備類似視頻會議的輸入輸出設置,能夠根據用戶的情感和語言屬性實時處理輸入,進而產生言語或行為的移情輸出。具體來說,M-Path系統(tǒng)的運行是基于三個不同模塊控制:

感知模塊:用于采集和處理參與者信息。當用戶講話時,此模塊通過麥克風和攝像機收集音頻和視頻作為輸入信號。在視頻輸入源中,面部情感識別模塊采用的是OpenCV算法,用來識別不同面部表情所對應的情緒類別。本次研究中將基本情緒分為6種,憤怒,厭惡,恐懼,喜悅,悲傷,驚奇和蔑視,這一分類是基于CK+數據集的深度學習訓練而獲得。

另外,來自麥克風的語音輸入首先會被傳送至文本模塊,進行轉化轉換處理。該模塊采用的是Google的STT服務。

情緒分析組件使用從STT服務接收到的文本來評估文本的極性值(正-中性-負),然后通過SO-CAL情感分析器在NRC-Canada詞典上進行了重新訓練,最后將文本發(fā)送至決策組件生成對話響應。整個處理過程會持續(xù)到對方發(fā)送語音結束為止。

行為控制器模塊:負責在對話循環(huán)中,生成同理心和具有目標導向的語言/非語言響應。 在收聽階段,3D虛擬人像會產生相應的情感匹配和反向傳播行為。情感匹配是通過移情機制對用戶面部表情的選擇而實現的。而在交談中通過檢測到暫停觸發(fā)的點頭行為來創(chuàng)建反向傳播,這兩種行為的集合,最終生成了獲取情感的聆聽行為。

當對話結束后,從STT引擎接收到的文本信息會與用戶的總體情感一起傳遞至對話管理器(Dialogue Manager),并最終發(fā)送到移情機制(e Empathy Mechanisms)組件。 DM的目標是完成Big-5人格問卷識別的個性類別。 EM的目標生成對應類別的情感響應。

行為管理模塊:用于創(chuàng)建自然的對話行為。M-Path在對話的所有狀態(tài)下連續(xù)生成非語言或非語言行為,如面部表情,身體姿勢、手勢及嘴唇移動會與語音輸出同步完成,并作為行為標記語言(Behavior Markup Language)消息發(fā)送到Smartbody角色動畫平臺以顯示生成的行為。

第二階段生成風格化肖像,這部分的處理分為三個步驟。首先主要是運用AI工具對人像進行預處理,包括圖像背景分割,調整人像的光和色彩的平衡。

然后將預處理的圖像輸入至mDD系統(tǒng)模型進行深度訓練,這里借用的是Google的Deep Dream模型,基于本次研究特性進行了部分調整,因此在這里成為mDD(ModifiedDeep Dream)。它所使用的數據集收集了來自3000位藝術家的160,000張帶有標簽和分類的畫作,總大小為67 GB。

最后,ePainterly系統(tǒng)結合Deep Style來處理人像表面紋理以及非真實感的渲染(NPR)技術,例如粒子系統(tǒng),調色板操縱和筆觸引擎技術。這個不斷迭代的過程將完成最終的肖像風格。其中ePainterly模塊是講點繪畫系統(tǒng)Painterly的擴展。

這部分NPR渲染在很大程度上減少了mDD輸出圖像時產生的噪聲偽影。以下是各個階段的效果圖:

雖然AI畫家在捕捉人類情感,繪制風格化肖像方面表現非常出色,但該研究團隊認為它還有很大的擴展空間,并表示從情感評估模型、用戶個性分析和互動場景三個方面對其進行優(yōu)化。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    37210

    瀏覽量

    291790
  • 人臉識別
    +關注

    關注

    77

    文章

    4104

    瀏覽量

    87228
  • 3D打印
    +關注

    關注

    27

    文章

    3612

    瀏覽量

    115999
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI玩具:以多輪對話、情感陪伴等為賣點,多款方案優(yōu)化角逐

    廠商入局。實際上,針對傳統(tǒng)玩具簡單地執(zhí)行指令,生硬的聊天對話等,借助AI大模型的引入,AI玩具在多輪對話以及建立人物性格角色、情感陪伴等方面提升非常顯著。 涂鴉T5
    的頭像 發(fā)表于 04-28 00:12 ?5643次閱讀
    <b class='flag-5'>AI</b>玩具:以多輪對話、<b class='flag-5'>情感</b>陪伴等為賣點,多款方案優(yōu)化角逐

    廣和通發(fā)布端側情感對話大模型FiboEmo-LLM

    9月,廣和通正式發(fā)布自主研發(fā)的端側情感對話大模型FiboEmo-LLM。該模型專注于情感計算與自然語言交互融合,致力于為AI玩具、智能陪伴設備等終端場景提供“情感理解-
    的頭像 發(fā)表于 09-26 13:37 ?1472次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    AI大家都很了解了吧;AGI是什么呢? AGI:通用人工智能,可以再各個應用領域都具備AI的處理能力。 AGI可以組成能夠24小時連續(xù)工作的優(yōu)秀員工隊伍,他們擁有比人類更強的能力和領導力,能夠
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    載體,關鍵是能在能量載體的特征長度范圍內操縱傳輸特性。 AI發(fā)揮的作用越來越大了,會有替代人類的一天嗎?
    發(fā)表于 09-17 11:45

    Arm首席執(zhí)行官Rene Haas入選《時代》周刊全球AI百大人物

    近日,Arm 首席執(zhí)行官 Rene Haas 榮登 《時代》周刊 2025 年全球 AI 百大人物榜單 (TIME100 AI 2025)。該榜單甄選了在塑造人工智能 (AI) 未來方
    的頭像 發(fā)表于 09-04 19:58 ?1146次閱讀

    小馬智行彭軍入選2025年全球AI領域百大影響力人物

    近日,《時代》周刊公布2025年AI領域100位最具影響力人物(TIME100 AI),小馬智行創(chuàng)始人、首席執(zhí)行官彭軍上榜。彭軍是榜單中唯一以自動駕駛領域成就登榜的人選。
    的頭像 發(fā)表于 09-02 09:36 ?433次閱讀

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    1. 項目概述 本項目旨在開發(fā)并部署一個高精度的深度學習模型,用于自動鑒別一張圖片是由AI生成(如Stable Diffusion, DALL-E, Midjourney等工具生成)還是真實的畫家
    發(fā)表于 08-21 13:59

    具備光照魯棒和自適應特征剔除的VSLAM前端框架

    現有的基于特征的VSLAM系統(tǒng)依賴于固定的前端參數,這使得它們在面對光照突變時顯得十分脆弱,且特征跟蹤也不穩(wěn)定。為應對這些挑戰(zhàn),我們提出了“IRAF-SLAM”,這是一種具備光照魯棒性且能自適應
    的頭像 發(fā)表于 07-30 10:38 ?345次閱讀
    <b class='flag-5'>具備</b>光照魯棒和自適應<b class='flag-5'>特征</b>剔除的VSLAM前端框架

    【BPI-CanMV-K230D-Zero開發(fā)板體驗】視頻會議場景下的 AI 應用(電子云臺 EPTZ、人像居中 / 追蹤、畫中畫)

    表情細節(jié),又想看清整個舞臺畫面時,“畫中畫”功能就提供了這種優(yōu)勢。“畫中畫”通過在畫面上疊加一個全景畫面,來達到同時看清人物細節(jié)和舞臺全景的效果。   除此之外,會議場景還有諸多 AI
    發(fā)表于 07-09 20:56

    AI 重塑玩具產業(yè),從功能疊加到情感共生的進化之路?

    電子發(fā)燒友網報道(文/黃山明)AI技術的浪潮正以前所未有的速度重塑玩具產業(yè)的生態(tài)格局。當傳統(tǒng)玩具還在依靠物理形態(tài)和基礎電子元件吸引消費者時,搭載著語音識別、情感計算和深度學習模塊的AI玩具已經悄然
    的頭像 發(fā)表于 05-22 09:01 ?4712次閱讀

    【「零基礎開發(fā)AI Agent」閱讀體驗】+讀《零基礎開發(fā)AI Agent》掌握扣子平臺開發(fā)智能體方法

    都比較復雜,涉及到的基礎素材很多,而閱讀書籍的人并沒有,所以最好像其他的編程書籍一樣也建立一個素材庫,幫助讀者更好的理解知識并有實際項目的參照價值。 不過總體來說,我還是從這本書中收獲頗豐,對AI
    發(fā)表于 05-14 19:51

    洲明科技推出DeepSeek滿血版AI全息情感陪伴艙

    在這個科技日新月異的時代,人工智能正以前所未有的速度融入日常生活。從生產力工具到情感陪伴,隨著DeepSeek等大模型加速進化,AI不僅正重塑產業(yè)格局,更在改變人類與世界的交互方式。
    的頭像 發(fā)表于 03-07 16:52 ?1096次閱讀

    125M采樣率“捕手”登場!這8大場景讓你秒懂高速數據采集有多硬核!

    【導語】每秒1.25億次精準抓取,毫秒級故障無處遁形!凌智電子DAQ217高速數據采集器,以125M采樣率+4通道同步技術,化身工業(yè)、科研、醫(yī)療領域的“數據捕手”!今天帶你解鎖它的8大高能戰(zhàn)場
    的頭像 發(fā)表于 03-01 15:35 ?549次閱讀
    125M采樣率“<b class='flag-5'>捕手</b>”登場!這8大場景讓你秒懂高速數據采集有多硬核!

    湯姆貓發(fā)布AI語音情感陪伴機器人研發(fā)進展

    湯姆貓公司近日透露了其AI產品的研發(fā)進展,其中AI語音情感陪伴機器人備受矚目。據官方介紹,這款機器人預計將于2024年12月底前正式發(fā)售,為用戶帶來全新的互動體驗。 該機器人頭部設有精密的傳動裝置
    的頭像 發(fā)表于 12-17 11:27 ?1517次閱讀

    基于LSTM神經網絡的情感分析方法

    能力而受到廣泛關注。 1. 引言 情感分析在商業(yè)智能、客戶服務、社交媒體監(jiān)控等領域具有廣泛的應用。傳統(tǒng)的情感分析方法依賴于手工特征提取和機器學習算法,但這些方法往往難以處理文本中的長距離依賴關系。LSTM作為一種循環(huán)神經網絡(
    的頭像 發(fā)表于 11-13 10:15 ?1534次閱讀