chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何為Google翻譯上的性別中性詞提供女性化和男性化兩種翻譯結(jié)果的技術(shù)原理

電子工程師 ? 來源:lq ? 2018-12-12 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如何消除 AI 帶來的性別偏見是個(gè)令人頭疼的問題,那究竟有沒有方法去解決?

12 月 6 日,Google 宣布他們邁出了減少 Google 翻譯中性別偏見的第一步,并且還詳細(xì)介紹了如何為 Google 翻譯上的性別中性詞提供女性化和男性化兩種翻譯結(jié)果的技術(shù)原理。

過去幾年,Google 翻譯通過使用基于端到端的神經(jīng)網(wǎng)絡(luò)系統(tǒng)大大提高了翻譯質(zhì)量,但與此同時(shí),模型的翻譯結(jié)果呈現(xiàn)出了社會(huì)偏見,尤其是性別偏見。具體而言,由于 Google 翻譯的結(jié)果一直都是從網(wǎng)上數(shù)以億計(jì)的已翻譯數(shù)據(jù)中學(xué)習(xí)得到,這造成的后果是,即使翻譯結(jié)果可能具有女性化或男性化形式的傾向,但它也只為查詢提供一種翻譯。因而,這無可避免地復(fù)制了已有的性別偏見。例如,像“強(qiáng)壯”或“醫(yī)生”這樣的詞語,它會(huì)生成偏向于男性化的翻譯結(jié)果,而對于“護(hù)士”或“美麗”等詞匯,則會(huì)生成偏向于女性化的翻譯。

現(xiàn)在,Google 翻譯解決了上述問題。當(dāng)你把諸如“外科醫(yī)生”這樣的單字從英語翻譯成法語、意大利語、葡萄牙語或西班牙語時(shí),會(huì)得到的男性化和女性化的兩種翻譯結(jié)果。另外,當(dāng)把短語和句子從土耳其語翻譯成英語時(shí),你也會(huì)得到這兩類翻譯,比如你用土耳其語輸入“o bir doktor”,就會(huì)得到“she is a doctor”和“he is a doctor”這兩種按性別翻譯的結(jié)果。

Google 翻譯中有特定性別的翻譯

Google 團(tuán)隊(duì)是如何做的?

要知道,支持單字查詢的特定性別翻譯涉及到用性別屬性豐富 Google 的底層詞庫。支持較長(短語和句子)查詢的性別翻譯尤其具有挑戰(zhàn)性,這甚至需要對翻譯框架進(jìn)行部分重構(gòu)。對于這些較長的查詢,他們最初將重點(diǎn)放在從土耳其語到英文的翻譯上??傮w而言,他們制訂了三步法來解決土耳其語中性別中立查詢的問題,即同時(shí)提供英文的男性化和女性化翻譯結(jié)果。

檢測性別中立查詢

許多土耳其語中提到人的句子都是性別中立的,但并不是全部都這樣。檢測哪些查詢符合特定性別的翻譯是一個(gè)難題,由于土耳其語在形態(tài)學(xué)上的很復(fù)雜,這意味著指代一個(gè)人可以是明確的性別中立代詞(例如 O,Ona)或隱式編碼。例如,“Biliyor mu?”沒有明確的性別中立代名詞,可以翻譯為“她知道嗎?”或“他知道嗎?”這種復(fù)雜性導(dǎo)致我們不能使用簡單的性別中性代詞列表來檢測性別中立的土耳其語查詢,另外我們還需要一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)。Google 團(tuán)隊(duì)估計(jì)大約有 10% 的土耳其語的翻譯查詢含糊不清,能同時(shí)符合女性化和男性化翻譯的條件。

為了檢測這些查詢,他們使用了最先進(jìn)的文本分類算法(與他們的云自然語言 API 中使用的算法相同)來構(gòu)建一個(gè)系統(tǒng),該系統(tǒng)能夠檢測給定的土耳其語查詢何時(shí)是性別中立的。這就導(dǎo)致在翻譯前新增了一個(gè)步驟,所以他們必須平衡模型在延遲時(shí)的復(fù)雜性。Google 團(tuán)隊(duì)對數(shù)千個(gè)土耳其人進(jìn)行系統(tǒng)培訓(xùn),要求這些人判斷出一個(gè)給定的例子是否是性別中立的。而他們最終的分類系統(tǒng)是卷積神經(jīng)網(wǎng)絡(luò),以此可以準(zhǔn)確檢測出需要按性別翻譯的查詢。

生成特定性別翻譯

隨后,Google 團(tuán)隊(duì)增強(qiáng)了基礎(chǔ)神經(jīng)機(jī)器翻譯(NMT)系統(tǒng),以便在需要時(shí)生成女性化和男性化翻譯。當(dāng)沒有要求區(qū)分性別時(shí),訓(xùn)練模型生成的是默認(rèn)翻譯。這主要包括:

識別并將平行訓(xùn)練數(shù)據(jù)劃分為具有女性化詞語、男性化詞語和性別不明詞語。

在句子的開頭添加一個(gè)新增的輸入標(biāo)記,以指定要翻譯的所需性別,類似于已構(gòu)建的多語言 NMT 系統(tǒng)的方式:

<2MALE> O bir doktor→他是一名醫(yī)生

<2FEMALE> O bir doktor→她是一名醫(yī)生

訓(xùn)練增強(qiáng)的 NMT 模型對女性、男性和性別中立數(shù)據(jù)源的影響。他們對這些來源進(jìn)行了各種混合比試驗(yàn),使模型在這三個(gè)任務(wù)中的表現(xiàn)同樣出色。

如果確定用戶查詢是性別中立的,他們會(huì)在翻譯請求中添加性別前綴。對于這些要求,他們的最終 NMT 模型可以在 99% 情況下生成可靠的女性化和男性化性別的翻譯結(jié)果。此外,系統(tǒng)在沒有性別前綴的查詢中還能保持翻譯質(zhì)量。

檢查準(zhǔn)確性

最后的一個(gè)步驟決定是否顯示特定性別的翻譯結(jié)果。由于產(chǎn)生男性化翻譯的訓(xùn)練數(shù)據(jù)與產(chǎn)生女性化翻譯的訓(xùn)練數(shù)據(jù)不同,因此在與性別無關(guān)的兩種翻譯間可能存在差異。如果確定特定性別的翻譯質(zhì)量低,則只顯示單一的默認(rèn)翻譯。為了確定特定性別的句子翻譯質(zhì)量,他們進(jìn)行以下驗(yàn)證:

要求的女性翻譯是女性化的;

要求的男性化翻譯是男性化的;

除了與性別相關(guān)的變化,如果女性化和男性化翻譯完全相同,即使翻譯結(jié)果間的措辭發(fā)生微小變化也會(huì)被系統(tǒng)過濾掉。

男性化和女性化翻譯僅在性別方面有所不同,即“he”和“his”與“she”和“her”。因此,他們展示了特定性別的翻譯。底部:男性化和女性化翻譯在性別方面有所不同,即“he”與“she”。但是,從“really”到“actually”的變化與性別無關(guān)。因此,系統(tǒng)將過濾特定性別的翻譯并顯示默認(rèn)翻譯結(jié)果。

如果將所有內(nèi)容放在一起,輸入句子首先會(huì)通過分類器,分類器檢測它們是否可以進(jìn)行特定性別翻譯。如果分類器說“是”,系統(tǒng)則向增強(qiáng)型 NMT 模型發(fā)送三個(gè)請求:女性化翻譯請求、男性化翻譯請求和性別中立翻譯請求。最后一步考慮了所有的三個(gè)答案,并決定是否顯示特定性別翻譯或單個(gè)默認(rèn)翻譯。Google 團(tuán)隊(duì)認(rèn)為,這一步仍然相當(dāng)保守,為了最大限度提高所顯示的特定性別的翻譯質(zhì)量,因此系統(tǒng)的整體召回率僅為 60% 左右。

對 Google來說,這只是他們解決機(jī)器翻譯系統(tǒng)中性別偏見的第一步,未來,他們計(jì)劃將特定性別的翻譯擴(kuò)展到更多語言,并解決自動(dòng)完成查詢等功能中的性別偏見問題。此外,他們已經(jīng)在考慮如何在翻譯中解決非二元性別的問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1789

    瀏覽量

    58975
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103516
  • 機(jī)器翻譯
    +關(guān)注

    關(guān)注

    0

    文章

    140

    瀏覽量

    15190

原文標(biāo)題:“男醫(yī)生,女護(hù)士?”消除偏見,Google有大招

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    CC-Link IE 轉(zhuǎn) Modbus TCP,閥門通訊的“雙語翻譯官”

    。這就好比一位說“高速實(shí)時(shí)語”的PLC,要和只會(huì)“經(jīng)典通用語”的閥門對話,此時(shí),一位可靠的“雙語翻譯官”——耐達(dá)訊通信技術(shù)協(xié)議轉(zhuǎn)換網(wǎng)關(guān),就顯得至關(guān)重要了。 協(xié)議轉(zhuǎn)換網(wǎng)關(guān)的核心工作原理就是“翻譯”。它在 CC-Link IE 網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-09 09:46 ?115次閱讀

    CAN收發(fā)器:總線信號的“翻譯官”

    在CAN總線通信中,CAN收發(fā)器(Transceiver)扮演著至關(guān)重要的角色——它就像一位“翻譯官”,負(fù)責(zé)將微控制器(MCU)的數(shù)字信號轉(zhuǎn)換為總線上的差分信號,同時(shí)把總線信號翻譯回MCU能理解
    的頭像 發(fā)表于 06-27 11:34 ?424次閱讀
    CAN收發(fā)器:總線信號的“<b class='flag-5'>翻譯</b>官”

    時(shí)空壺 T1 離線翻譯機(jī):解鎖無網(wǎng)生活溝通自由

    在全球浪潮席卷之下,跨國交流已然成為現(xiàn)代人生活的重要組成部分。無論是出國旅行、商務(wù)洽談,還是文化體驗(yàn),語言障礙始終是橫亙在人們面前的一道難題。而網(wǎng)絡(luò)覆蓋的局限性,更是讓依賴在線翻譯的設(shè)備在關(guān)鍵時(shí)刻
    的頭像 發(fā)表于 06-05 10:30 ?300次閱讀
    時(shí)空壺 T1 離線<b class='flag-5'>翻譯</b>機(jī):解鎖無網(wǎng)生活溝通自由

    Ethercat轉(zhuǎn)Profinet網(wǎng)關(guān)如何用“協(xié)議翻譯術(shù)”打通自動(dòng)產(chǎn)線任督二脈

    Ethercat轉(zhuǎn)Profinet網(wǎng)關(guān)如何用“協(xié)議翻譯術(shù)”打通自動(dòng)產(chǎn)線任督二脈
    的頭像 發(fā)表于 05-10 14:42 ?194次閱讀
    Ethercat轉(zhuǎn)Profinet網(wǎng)關(guān)如何用“協(xié)議<b class='flag-5'>翻譯</b>術(shù)”打通自動(dòng)<b class='flag-5'>化</b>產(chǎn)線任督二脈

    EtherCAT轉(zhuǎn)Profinet網(wǎng)關(guān):紡織業(yè)設(shè)備互聯(lián)的“翻譯官”

    EtherCAT轉(zhuǎn)Profinet網(wǎng)關(guān)不僅是紡織車間設(shè)備互聯(lián)的“翻譯官”,更是推動(dòng)生產(chǎn)模式革新的“加速器”。其價(jià)值在于打破協(xié)議壁壘的同時(shí),為紡織業(yè)的精益、柔性化生產(chǎn)提供了可落地的技術(shù)
    的頭像 發(fā)表于 04-28 15:39 ?200次閱讀
    EtherCAT轉(zhuǎn)Profinet網(wǎng)關(guān):紡織業(yè)設(shè)備互聯(lián)的“<b class='flag-5'>翻譯</b>官”

    女性機(jī)器人能否代替女性

    ? ? ? 在探討“女性機(jī)器人能否代替女性”這一議題時(shí),我們首先需要明確幾個(gè)核心概念:何為女性機(jī)器人?何為替代?以及這一替代是基于何種維度和
    的頭像 發(fā)表于 02-08 15:49 ?840次閱讀

    AI助力實(shí)時(shí)翻譯耳機(jī)

    是一能夠?qū)崟r(shí)將一語言翻譯成另一語言的耳機(jī)設(shè)備。它通常由一個(gè)耳機(jī)和一個(gè)配套的應(yīng)用程序組成,用戶可以通過應(yīng)用程序選擇需要翻譯的語言,并通過
    的頭像 發(fā)表于 01-24 11:14 ?1640次閱讀
    AI助力實(shí)時(shí)<b class='flag-5'>翻譯</b>耳機(jī)

    LLMWorld上線代碼翻譯新工具——問丫·碼語翻譯俠,快來體驗(yàn)!

    應(yīng)用案例 aicode.llmworld.net 案例一 閱讀復(fù)雜算法,將計(jì)算機(jī)語言翻譯成自然語言和偽代碼,快速幫助用戶理解算法實(shí)現(xiàn)邏輯。 Input(C++): 正弦波信號進(jìn)行傅里葉變換,并輸出其頻域結(jié)果的C++
    的頭像 發(fā)表于 12-09 11:11 ?990次閱讀
    LLMWorld上線代碼<b class='flag-5'>翻譯</b>新工具——問丫·碼語<b class='flag-5'>翻譯</b>俠,快來體驗(yàn)!

    IMAX攜手Camb.AI實(shí)現(xiàn)影院實(shí)時(shí)語言翻譯

    內(nèi)容和精彩紀(jì)錄片精準(zhǔn)地本地化為多達(dá)140語言,以滿足全球不同地區(qū)觀眾的多樣需求。傳統(tǒng)配音方式不僅成本高昂,而且耗時(shí)較長,難以滿足快速變化的市場需求。而Camb.AI的DubStudio平臺(tái)則憑借其先進(jìn)的人工智能技術(shù),承諾能夠
    的頭像 發(fā)表于 11-26 13:55 ?843次閱讀

    阿里國際發(fā)布翻譯大模型Marco

    近日,阿里國際正式推出了其翻譯大模型——Marco。這款模型已在阿里國際AI官網(wǎng)Aidge上線,并向全球用戶開放使用。
    的頭像 發(fā)表于 10-17 16:07 ?709次閱讀

    用邏輯和翻譯用例優(yōu)化資產(chǎn)跟蹤器

    電子發(fā)燒友網(wǎng)站提供《用邏輯和翻譯用例優(yōu)化資產(chǎn)跟蹤器.pdf》資料免費(fèi)下載
    發(fā)表于 09-21 11:24 ?0次下載
    用邏輯和<b class='flag-5'>翻譯</b>用例優(yōu)化資產(chǎn)跟蹤器

    使用邏輯和翻譯優(yōu)化車身控制模塊(BCM)應(yīng)用說明

    電子發(fā)燒友網(wǎng)站提供《使用邏輯和翻譯優(yōu)化車身控制模塊(BCM)應(yīng)用說明.pdf》資料免費(fèi)下載
    發(fā)表于 09-11 11:30 ?0次下載
    使用邏輯和<b class='flag-5'>翻譯</b>優(yōu)化車身控制模塊(BCM)應(yīng)用說明

    DeepL推出新一代翻譯編輯大型語言模型

    在人工智能與語言處理領(lǐng)域,DeepL再次以其創(chuàng)新實(shí)力引領(lǐng)潮流,宣布成功推出新一代面向翻譯與編輯應(yīng)用的大型語言模型。這一里程碑式的進(jìn)展,不僅鞏固了DeepL作為頂尖語言人工智能公司的地位,更標(biāo)志著機(jī)器翻譯技術(shù)向更高質(zhì)量、更智能
    的頭像 發(fā)表于 07-19 15:56 ?1011次閱讀

    DeepL 推出下一代大型語言模型(&quot;LLM&quot;),翻譯質(zhì)量超越競爭對手

    和編輯打造的高度專業(yè)的 LLM 技術(shù)提供支持。此次發(fā)布是 DeepL 企業(yè)語言人工智能平臺(tái)的一項(xiàng)重大突破,為翻譯質(zhì)量和性能樹立了新的行業(yè)標(biāo)準(zhǔn)。 新的語言模式是三大發(fā)展的
    的頭像 發(fā)表于 07-18 09:29 ?774次閱讀

    超ChatGPT-4o,國產(chǎn)大模型竟然更懂翻譯,8款大模型深度測評|AI 橫評

    、速度慢、費(fèi)用高且難以準(zhǔn)確理解上下文”的問題。相比之下,AI大模型憑借其強(qiáng)大的學(xué)習(xí)能力和適應(yīng)性,在翻譯質(zhì)量、效率、上下文理解和多語言支持等方面表現(xiàn)出色,提供了更加
    的頭像 發(fā)表于 07-14 08:04 ?128次閱讀
    超ChatGPT-4o,國產(chǎn)大模型竟然更懂<b class='flag-5'>翻譯</b>,8款大模型深度測評|AI 橫評