chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TensorFlow再填新功能!谷歌宣布推出TensorFlow.Text

DPVg_AI_era ? 來源:lq ? 2019-06-15 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌發(fā)布TensorFlow優(yōu)化新功能TF.Text庫,可對語言文本AI模型進行周期性預(yù)處理,大大節(jié)約了AI開發(fā)者對文本模型的訓(xùn)練時間,簡化訓(xùn)練流程。

TensorFlow再填新功能!

谷歌宣布推出TensorFlow.Text,這是一個利用TensorFlow對語言文本模型進行預(yù)處理的庫。TF官博第一時間發(fā)布了更新消息,并對TF.Text的新功能和特性進行了簡要介紹。

TensorFlow一直以來致力于為用戶提供更廣泛的選擇,幫助用戶利用圖像和視頻數(shù)據(jù)構(gòu)建模型。但是,許多模型是以文本開頭的,從這些模型構(gòu)建的語言模型需要進行一些預(yù)處理,才能將文本輸入到模型中。比如關(guān)于使用IMDB數(shù)據(jù)集的文本分類教程,就是從已經(jīng)轉(zhuǎn)換為整數(shù)ID的文本數(shù)據(jù)開始入手的。

如果模型訓(xùn)練和推理的時間不一樣,在訓(xùn)練過程以外完成的預(yù)處理可能會和模型產(chǎn)生偏差,這就需要額外投入更多的時間和精力對預(yù)處理的過程進行協(xié)調(diào)。

TensorFlow本次推出的TF.Text就是為了解決這個問題,TF.Text是一個TensorFlow 2.0庫,可以使用PIP命令輕松安裝。它可以在基于文本的模型中定期執(zhí)行這些預(yù)處理過程,并提供TensorFlow核心組件中并未提供的、關(guān)于語言建模的更多功能和操作。

其中最常見的功能就是文本的詞條化(tokenization)。詞條化是將字符串分解為token的過程。這些token可能是單詞、數(shù)字和標點符號,或是上述幾種元素的組合。

TF.Text的Tokenizer使用RaggedTensors,這是一種用于識別文本的新型張量。

三個新的Tokenizer,系統(tǒng)解決文本AI模型預(yù)訓(xùn)練問題

TF.Text提供了三個新的tokenizer。其中最基本的是空白tokenizer,可以在ICU定義的空白字符(例如空格,制表符,換行符)上拆分UTF-8字符串。

tokenizer=tensorflow_text.WhitespaceTokenizer()tokens = tokenizer.tokenize(['everything not saved will be lost.', u'Sad?'.encode('UTF-8')])print(tokens.to_list())

[['everything', 'not', 'saved', 'will', 'be', 'lost.'], ['Sadxe2x98xb9']]

此次發(fā)布的初始版本還包括一個面向unicode腳本的tokenizer,可以根據(jù)Unicode腳本邊界拆分UTF-8字符串。值得注意的是,它和空白tokenizer很類似,最明顯的區(qū)別在于后者可以從標準文本(如USCRIPT_LATIN,USCRIPT_CYRILLIC等)中分割出標點符號。

tokenizer = tensorflow_text.UnicodeScriptTokenizer()tokens = tokenizer.tokenize(['everything not saved will be lost.', u'Sad?'.encode('UTF-8')])print(tokens.to_list())

[['everything', 'not', 'saved', 'will', 'be', 'lost', '.'], ['Sad', 'xe2x98xb9']]

TF.Text中提供的最后一個tokenizer是一個Wordpiece tokenizer。這是一個無監(jiān)督的tokenizer,需要一個預(yù)先確定的詞匯表,進一步將token分成子詞(前綴和后綴)。Wordpiece常用于谷歌的BERT模型。

def_CreateTable(vocab,num_oov=1): init = tf.lookup.KeyValueTensorInitializer( vocab, tf.range(tf.size(vocab, out_type=tf.int64), dtype=tf.int64), key_dtype=tf.string, value_dtype=tf.int64) return tf.lookup.StaticVocabularyTable( init, num_oov, lookup_key_dtype=tf.string)vocab_table = _CreateTable(["great", "they", "the", "##'", "##re", "##est"])tokens = [["they're", "the", "greatest"]]tokenizer = tensorflow_text.WordpieceTokenizer( vocab_table, token_out_type=tf.string)result = tokenizer.tokenize(tokens)print(result.to_list())

[[['they', "##'", '##re'], ['the'], ['great', '##est']]]

每個Tokenizer都在UTF-8編碼的字符串上進行標記,并提供了將字節(jié)偏移量轉(zhuǎn)換為原始字符串的選項。調(diào)用者可以了解創(chuàng)建的token的原始字符串中的字節(jié)對齊。

此外,TF.Text庫還包括歸一化、n-gram和標記序列約束等功能。

新功能組件密集發(fā)布,TensorFlow大家庭日益完善

有關(guān)更深入的實例,可以查看Colab notebook內(nèi)容,其中包含許多本文中未討論的新的可用操作的各種代碼段。未來計劃繼續(xù)提供更多新工具,讓使用TensorFlow構(gòu)建語言模型變得更加方便。

今年上半年,谷歌陸續(xù)發(fā)布了多個基于TensorFlow的新功能和新組件。5月,谷歌發(fā)布TensorFlow Graphics,讓機器學(xué)習(xí)與圖形和3D模型的關(guān)系更加密切。今年3月,谷歌發(fā)布旨在增強隱私保護的終端設(shè)備機器學(xué)習(xí)方法TensorFlow Federated。此外,TensorFlow框架面向JavaScript和iOS開發(fā)者的版本TensorFlow.js和TensorFlow Swift也于今年春天發(fā)布。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108005
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3516

    瀏覽量

    50344
  • tensorflow
    +關(guān)注

    關(guān)注

    13

    文章

    330

    瀏覽量

    61145

原文標題:TensorFlow官宣新功能TF.Text:攻克語言AI模型預(yù)處理偏差難題

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    無法將Tensorflow Lite模型轉(zhuǎn)換為OpenVINO?格式怎么處理?

    Tensorflow Lite 模型轉(zhuǎn)換為 OpenVINO? 格式。 遇到的錯誤: FrontEnd API failed with OpConversionFailure:No translator found for TFLite_Detection_PostProcess node.
    發(fā)表于 06-25 08:27

    用樹莓派搞深度學(xué)習(xí)?TensorFlow啟動!

    介紹本頁面將指導(dǎo)您在搭載64位Bullseye操作系統(tǒng)的RaspberryPi4上安裝TensorFlow。TensorFlow是一個專為深度學(xué)習(xí)開發(fā)的大型軟件庫,它消耗大量資源。您可以在
    的頭像 發(fā)表于 03-25 09:33 ?423次閱讀
    用樹莓派搞深度學(xué)習(xí)?<b class='flag-5'>TensorFlow</b>啟動!

    使用OpenVINO? 2020.4.582將自定義TensorFlow 2模型轉(zhuǎn)換為中間表示 (IR)收到錯誤怎么解決?

    轉(zhuǎn)換自定義 TensorFlow 2 模型 mask_rcnn_inception_resnet_v2_1024x1024_coco17 要 IR 使用模型優(yōu)化器命令: 注意上面的鏈接可能無法
    發(fā)表于 03-07 07:28

    可以使用OpenVINO?工具包將中間表示 (IR) 模型轉(zhuǎn)換為TensorFlow格式嗎?

    無法將中間表示 (IR) 模型轉(zhuǎn)換為 TensorFlow* 格式
    發(fā)表于 03-06 06:51

    使用各種TensorFlow模型運行模型優(yōu)化器時遇到錯誤非法指令怎么解決?

    使用各種 TensorFlow 模型運行模型優(yōu)化器時遇到 [i]錯誤非法指令
    發(fā)表于 03-05 09:56

    TensorFlow saved_model格式轉(zhuǎn)換為IR遇到錯誤怎么解決?

    TensorFlow saved_model格式轉(zhuǎn)換為 IR。 遇到錯誤: FrontEnd API failed with OpConversionFailure: : No translator found for TensorListFromTensor node.
    發(fā)表于 03-05 09:12

    OpenVINO?是否與TensorFlow集成支持Raspberry Pi?

    無法確定OpenVINO?是否與 TensorFlow* 集成支持 Raspberry Pi。
    發(fā)表于 03-05 08:26

    為什么無法將自定義EfficientDet模型從TensorFlow 2轉(zhuǎn)換為中間表示(IR)?

    將自定義 EfficientDet 模型從 TensorFlow* 2 轉(zhuǎn)換 為 IR 時遇到錯誤: [ ERROR ] Exception occurred during running replacer \"REPLACEMENT_ID\" ()
    發(fā)表于 03-05 06:29

    榮耀手機新增谷歌Circle to Search功能

    近日,全球知名科技品牌榮耀宣布,在其旗艦智能手機HONOR Magic V3及HONOR 200系列上,正式推出谷歌(Google)Circle to Search功能。這一創(chuàng)
    的頭像 發(fā)表于 10-17 18:16 ?1168次閱讀

    快速部署Tensorflow和TFLITE模型在Jacinto7 Soc

    電子發(fā)燒友網(wǎng)站提供《快速部署Tensorflow和TFLITE模型在Jacinto7 Soc.pdf》資料免費下載
    發(fā)表于 09-27 11:41 ?0次下載
    快速部署<b class='flag-5'>Tensorflow</b>和TFLITE模型在Jacinto7 Soc

    第四章:在 PC 交叉編譯 aarch64 的 tensorflow 開發(fā)環(huán)境并測試

    本文介紹了在 PC 端交叉編譯 aarch64 平臺的 tensorflow 庫而非 tensorflow lite 的心酸過程。
    的頭像 發(fā)表于 08-25 11:38 ?2546次閱讀
    第四章:在 PC 交叉編譯 aarch64 的 <b class='flag-5'>tensorflow</b> 開發(fā)環(huán)境并測試

    stm32mp135d的板子可不可以跑tensorflow的模型???

    請問是stm32mp135d的板子可不可以跑tensorflow的模型啊?
    發(fā)表于 07-18 06:49

    如何在Tensorflow中實現(xiàn)反卷積

    TensorFlow中實現(xiàn)反卷積(也稱為轉(zhuǎn)置卷積或分數(shù)步長卷積)是一個涉及多個概念和步驟的過程。反卷積在深度學(xué)習(xí)領(lǐng)域,特別是在圖像分割、圖像超分辨率、以及生成模型(如生成對抗網(wǎng)絡(luò)GANs)等任務(wù)中
    的頭像 發(fā)表于 07-14 10:46 ?1129次閱讀

    TensorFlow是什么?TensorFlow怎么用?

    TensorFlow是由Google開發(fā)的一個開源深度學(xué)習(xí)框架,它允許開發(fā)者方便地構(gòu)建、訓(xùn)練和部署各種復(fù)雜的機器學(xué)習(xí)模型。TensorFlow憑借其高效的計算性能、靈活的架構(gòu)以及豐富的工具和庫,在學(xué)
    的頭像 發(fā)表于 07-12 16:38 ?1315次閱讀

    使用TensorFlow進行神經(jīng)網(wǎng)絡(luò)模型更新

    使用TensorFlow進行神經(jīng)網(wǎng)絡(luò)模型的更新是一個涉及多個步驟的過程,包括模型定義、訓(xùn)練、評估以及根據(jù)新數(shù)據(jù)或需求進行模型微調(diào)(Fine-tuning)或重新訓(xùn)練。下面我將詳細闡述這個過程,并附上相應(yīng)的TensorFlow代碼示例。
    的頭像 發(fā)表于 07-12 11:51 ?852次閱讀