chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI新模型可將文本轉(zhuǎn)換為生動的圖像

如意 ? 來源:站長之家 ? 作者:站長之家 ? 2021-01-07 16:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如今人工智能越來越強(qiáng)大,比如可以實(shí)現(xiàn)生成音樂、改變圖片藝術(shù)風(fēng)格等等。最近,人工智能非營利組織OpenAI發(fā)布了一個(gè)名為DALL-E的神經(jīng)網(wǎng)絡(luò),可以將文本轉(zhuǎn)換成與內(nèi)容相關(guān)的圖像。

比如生成下面這些穿著芭蕾舞裙揮舞著光劍的熊貓寶寶:

OpenAI在一篇博文中表示,該系統(tǒng)是具有里程碑意義的GPT-3語言模型的120億參數(shù)版本。

DALL-E模型具有多種功能,包括創(chuàng)建動物和物體的擬物化版本,以合理的方式展示相關(guān)的概念,渲染文本,以及對現(xiàn)有圖像進(jìn)行轉(zhuǎn)換。

比如在該模型中選定“與貓有關(guān)的文本關(guān)鍵詞”,同時(shí)選擇給定的其中一種貓類型,最終系統(tǒng)會自動生成一系列與貓主題有關(guān)的圖像,并且風(fēng)格呈現(xiàn)多樣化。

訓(xùn)練該模型的數(shù)據(jù)集主要基于互聯(lián)網(wǎng)大量文本-圖像。這使得它能夠通過探索提示的結(jié)構(gòu)來創(chuàng)造出全新的圖片。比如生成一些令人印象深刻的地標(biāo)、位置、雜交動物和不同年代設(shè)計(jì)的圖像。但是OpenAI承認(rèn)并不是所有的結(jié)果都是成功的。

不過,OpenAI承認(rèn)并不是所有生成的結(jié)果都是成功的。該公司表示,DALL-E系統(tǒng)有時(shí)無法繪制出某些特定的項(xiàng)目,混淆了對象與其特定屬性之間的關(guān)系。

通常,提示DALL-E寫的字符串越長,成功率越低。測試中發(fā)現(xiàn),重復(fù)部分文本內(nèi)容,準(zhǔn)確率有所提高。

當(dāng)回答有關(guān)地理方面的問題時(shí),比如旗幟、菜肴和當(dāng)?shù)匾吧鷦游?,DALL-E也經(jīng)常反映出膚淺的刻板印象??紤]到人們越來越關(guān)注人工智能算法偏見的問題,這個(gè)缺點(diǎn)尤為明顯。

OpenAI表示,它計(jì)劃分析DALL-E等模特的社會影響,但該公司認(rèn)為,該系統(tǒng)表明“通過語言操縱視覺概念現(xiàn)在已經(jīng)觸手可及?!?/p>

感興趣的小伙伴可以在OpenAI網(wǎng)站上查看更多DALL-E模型生成的圖像。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    28

    文章

    1340

    瀏覽量

    59188
  • AI
    AI
    +關(guān)注

    關(guān)注

    90

    文章

    38225

    瀏覽量

    297078
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3650

    瀏覽量

    51721
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    無法將Tensorflow Lite模型轉(zhuǎn)換為OpenVINO?格式怎么處理?

    將 Tensorflow Lite 模型轉(zhuǎn)換為 OpenVINO? 格式。 遇到的錯(cuò)誤: FrontEnd API failed with OpConversionFailure:No translator found for TFLite_Detection_PostP
    發(fā)表于 06-25 08:27

    2.0.0版本的ST Edge AI Core在linux平臺上可以把量化后的onnx模型轉(zhuǎn)換為.nb,但是運(yùn)行報(bào)錯(cuò),缺少文件,為什么?

    2.0.0版本的ST Edge AI Core工具在linux平臺上應(yīng)該是可以把量化后的onnx模型轉(zhuǎn)換為.nb,但是運(yùn)行報(bào)錯(cuò),缺少文件。
    發(fā)表于 06-17 06:29

    使用OpenVINO GenAI和LoRA適配器進(jìn)行圖像生成

    借助生成式 AI 模型(如 Stable Diffusion 和 FLUX.1),用戶可以將平平無奇的文本提示詞轉(zhuǎn)換為令人驚艷的視覺效果。
    的頭像 發(fā)表于 03-12 13:49 ?1563次閱讀
    使用OpenVINO GenAI和LoRA適配器進(jìn)行<b class='flag-5'>圖像</b>生成

    將ONNX模型轉(zhuǎn)換為中間表示 (IR) 格式,收到了錯(cuò)誤的輸出是怎么回事?

    將 ONNX* 模型轉(zhuǎn)換為中間表示 (IR) 格式,并收到了錯(cuò)誤的推斷輸出。自定義模型使用動態(tài)形狀。
    發(fā)表于 03-07 08:20

    將YOLOv4模型轉(zhuǎn)換為IR的說明,無法將模型轉(zhuǎn)換為TensorFlow2格式怎么解決?

    遵照 將 YOLOv4 模型轉(zhuǎn)換為 IR 的 說明,但無法將模型轉(zhuǎn)換為 TensorFlow2* 格式。 將 YOLOv4 darknet 轉(zhuǎn)換為
    發(fā)表于 03-07 07:14

    如何將Keras H5模型轉(zhuǎn)換為中間表示 (IR) 格式?

    第 1 步: 將 Keras H5 模型轉(zhuǎn)換為保存的型號格式 安裝 依賴關(guān)系: cd deployment_toolsmodel_optimizerinstall_prerequisites
    發(fā)表于 03-07 06:11

    可以使用OpenVINO?工具包將中間表示 (IR) 模型轉(zhuǎn)換為TensorFlow格式嗎?

    無法將中間表示 (IR) 模型轉(zhuǎn)換為 TensorFlow* 格式
    發(fā)表于 03-06 06:51

    ONNX模型無法轉(zhuǎn)換為IR v10,為什么?

    使用以下命令將 ONNX* 模型轉(zhuǎn)換為 IR:mo --input_model model.onnx 該模型無法轉(zhuǎn)換為 IR v10,而是轉(zhuǎn)換為
    發(fā)表于 03-06 06:32

    使用模型優(yōu)化器命令將ONNX模型轉(zhuǎn)換為OpenVINO? IR格式時(shí)出現(xiàn)“ReplacementID”錯(cuò)誤怎么解決?

    使用模型優(yōu)化器命令將 ONNX 模型轉(zhuǎn)換為 OpenVINO? IR 格式: --input_model \"{onnx_path} --input_shape [1,512, 896
    發(fā)表于 03-05 09:41

    將ONNX模型轉(zhuǎn)換為IR后報(bào)錯(cuò),怎么解決?

    運(yùn)行模型優(yōu)化器,以將 ONNX 模型轉(zhuǎn)換為 IR。 收到錯(cuò)誤:[ ERROR ] The ExpandDims node Unsqueeze_333 has more than 1 input
    發(fā)表于 03-05 09:11

    使用myriad_compile將IR模型轉(zhuǎn)換為blob后收到錯(cuò)誤怎么解決?

    使用模型優(yōu)化器將自定義 TensorFlow* 2 模型轉(zhuǎn)換為中間表示 (IR)。 使用 myriad_compile 將 IR 模型轉(zhuǎn)換為
    發(fā)表于 03-05 08:27

    添越智創(chuàng)基于 RK3588 開發(fā)板部署測試 DeepSeek 模型全攻略

    常見的 Hugging Face 格式模型,轉(zhuǎn)換為 RKLLM 模型轉(zhuǎn)換后的模型能完美適配 Rockchip NPU 平臺,充分釋放 NP
    發(fā)表于 02-14 17:42

    一文詳解視覺語言模型

    視覺語言模型(VLM)是一種多模態(tài)、生成式 AI 模型,能夠理解和處理視頻、圖像文本。
    的頭像 發(fā)表于 02-12 11:13 ?3300次閱讀
    一文詳解視覺語言<b class='flag-5'>模型</b>

    【「基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化」閱讀體驗(yàn)】+Embedding技術(shù)解讀

    今天學(xué)習(xí)大模型RAG 檢索增強(qiáng)生成技術(shù)Embedding,即嵌入,是一種將離散數(shù)據(jù)(如文字、圖像、音頻等)轉(zhuǎn)換為連續(xù)的密集向量表示的技術(shù)。這些向量能夠反映原始數(shù)據(jù)之間的關(guān)系,使得計(jì)算機(jī)能夠更好地處
    發(fā)表于 01-17 19:53