chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

再現(xiàn)輝煌:瑞典國家圖書館運用 AI 解析數(shù)百年數(shù)據(jù)

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:未知 ? 2023-02-15 16:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

瑞典國家圖書館正在使用五百年來的瑞典語文本訓(xùn)練最先進(jìn)的 AI 模型,以支持歷史、語言學(xué)、媒體研究等方面的人文研究。

從價值連城的中世紀(jì)手稿到今天的披薩店菜單,瑞典國家圖書館在過去 500 年中收藏了幾乎所有瑞典語出版物。

由于瑞典法律要求一切瑞典語出版物都要上交副本至瑞典國家圖書館(也稱為瑞典皇家圖書館),因此該圖書館的藏品涵蓋了各清晰度的書籍、報紙、無線廣播、電視廣播、互聯(lián)網(wǎng)內(nèi)容、博士論文、明信片、菜單和電子游戲。這個內(nèi)容豐富的收藏集含近 26 PB 的數(shù)據(jù),是訓(xùn)練尖端 AI 的最佳選擇。

瑞典國家圖書館數(shù)據(jù)實驗室 KBLab 的負(fù)責(zé)人 Love B?rjeson 表示:“我們有最好的數(shù)據(jù),所以我們可以構(gòu)建最先進(jìn)的瑞典語 AI 模型?!?/p>

該團(tuán)隊使用 NVIDIA DGX 系統(tǒng)開發(fā)了二十多個可在 Hugging Face 上使用的開源 Transformer 模型。這些模型推動了圖書館和其他學(xué)術(shù)機(jī)構(gòu)的研究,每月的開發(fā)者下載量多達(dá) 20 萬。

B?rjeson 表示:“在我們的實驗室成立前,研究者無法在圖書館訪問數(shù)據(jù)集,他們每次只能查閱一個對象。因此,為幫助那些需要大量查閱資料的研究者,創(chuàng)建圖書館的數(shù)據(jù)集十分必要。”

這樣,研究者很快就能創(chuàng)建專門的數(shù)據(jù)集。例如,調(diào)出所有描繪教堂的瑞典明信片、所有特定風(fēng)格的文本或是所有提到某一歷史人物的書籍、報紙文章及電視廣播。

從圖書館檔案到 AI 訓(xùn)練數(shù)據(jù)

瑞典國家圖書館的數(shù)據(jù)集涵蓋了瑞典語的所有變體,包括各種正式和非正式變體、地區(qū)方言以及隨著時間的推移而產(chǎn)生的變化。

B?rjeson 表示:“數(shù)據(jù)還在持續(xù)不斷地涌入并增長,我們每個月都會增加超過 50 TB 的新數(shù)據(jù)。在處理成倍增長的數(shù)據(jù)的同時,我們還要將數(shù)百年前的實物藏品轉(zhuǎn)換成數(shù)據(jù)錄入,所以我們一直在不斷擴(kuò)大我們的數(shù)據(jù)集?!?/p>

2019 年 KBLab 成立后不久,B?rjeson 就看到了運用龐大的圖書館檔案訓(xùn)練 Transformer 語言模型的潛力。谷歌早期的多語言自然語言處理模型含有 5GB 瑞典語文本,他從此受到了啟發(fā)。

KBLab 的第一個模型使用了谷歌多語言自然語言處理模型 4 倍之多的數(shù)據(jù)——B?rjeson 團(tuán)隊的目標(biāo)是使用至少 1 TB 的瑞典語文本訓(xùn)練模型。在發(fā)現(xiàn)多語言數(shù)據(jù)集可能提高 AI 的性能之后,這座實驗室開始進(jìn)行實驗,在其數(shù)據(jù)集中添加荷蘭語、德語和挪威語內(nèi)容。

NVIDIA AI 和 GPU 加速模型開發(fā)

該實驗室一開始使用的是消費級 NVIDIA GPU,但 B?rjeson 很快發(fā)現(xiàn)他的團(tuán)隊需要數(shù)據(jù)中心規(guī)模的計算來訓(xùn)練更大的模型。

B?rjeson 表示:“我們意識到在小型工作站上無法完成這項工作,所以 NVIDIA DGX 是明智之選。我們很多的工作離不開 DGX 系統(tǒng)。”

該實驗室使用兩套來自瑞典供應(yīng)商 AddPro 的 NVIDIA DGX 系統(tǒng)進(jìn)行本地 AI 開發(fā)。這些系統(tǒng)用于處理敏感數(shù)據(jù)、開展大規(guī)模實驗和微調(diào)模型。它們還準(zhǔn)備在全歐盟搭載 GPU 的大型超級計算機(jī)上進(jìn)行更大規(guī)模的運行,其中包括盧森堡的 MeluXina 系統(tǒng)。

B?rjeson 表示:“我們在 DGX 系統(tǒng)上的工作至關(guān)重要,因為我們希望能夠在高性能計算環(huán)境中做到最好,這必須將超級計算機(jī)的作用發(fā)揮到極致。”

該團(tuán)隊還采用了用于訓(xùn)練大型語言模型的 PyTorch 框架 NVIDIA NeMo Megatron。其內(nèi)置的 NVIDIA CUDA 和 NVIDIA NCCL 庫可優(yōu)化 GPU 在多節(jié)點系統(tǒng)中的使用。

B?rjeson 表示:“我們十分依賴 NVIDIA 的框架。因為我們實驗室的規(guī)模較小,無法派出 50 名工程師優(yōu)化每個項目的 AI 訓(xùn)練,NVIDIA 的優(yōu)勢在這就十分明顯了?!?/p>

利用多模態(tài)數(shù)據(jù)開展人文科學(xué)研究

除了能夠理解瑞典語文本的 Transformer 模型外,KBLab 還有一個能將聲音轉(zhuǎn)換成文本的 AI 工具。這使得圖書館能夠?qū)⑵浯罅康臒o線廣播收藏轉(zhuǎn)換成數(shù)據(jù)集,以便研究者能夠搜索錄音中的具體內(nèi)容。

KBLab 還在開發(fā)生成式文本模型,同時還在研究一個可以處理視頻并自動生成內(nèi)容描述的 AI 模型。

B?rjeson 表示:“我們還希望將各種模態(tài)的數(shù)據(jù)聯(lián)系起來。當(dāng)你在圖書館數(shù)據(jù)庫中搜索一個特定的詞語時,系統(tǒng)將能夠返回包括文本、音頻和視頻在內(nèi)的結(jié)果?!?/p>

KBLab 與哥德堡大學(xué)的研究者開展了合作。這些研究者正在使用該 KBLab 的模型開發(fā)用于語言學(xué)研究的下游應(yīng)用程序。項目之一是幫助瑞典學(xué)院升級用于創(chuàng)建瑞典語詞典的數(shù)據(jù)驅(qū)動技術(shù)。

B?rjeson 表示:“這些模型的社會效益遠(yuǎn)遠(yuǎn)超出了我們的最初預(yù)想?!?/p>

9aac0100-ad07-11ed-bfe3-dac502259ad0.png ? ? ?

點擊“閱讀原文”掃描下方海報二維碼,即可免費注冊 GTC 23,切莫錯過這場 AI 和元宇宙時代的技術(shù)大會!


原文標(biāo)題:再現(xiàn)輝煌:瑞典國家圖書館運用 AI 解析數(shù)百年數(shù)據(jù)

文章出處:【微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4018

    瀏覽量

    96977

原文標(biāo)題:再現(xiàn)輝煌:瑞典國家圖書館運用 AI 解析數(shù)百年數(shù)據(jù)

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    DEKRA德凱舉行百年慶典 推動可持續(xù)發(fā)展

    領(lǐng)事Lukas Meyer先生,DEKRA德凱集團(tuán)首席執(zhí)行官Stan Zurkiewicz先生,DEKRA德凱集團(tuán)執(zhí)行副總裁、亞太區(qū)總裁Kilian Aviles博士,DEKRA德凱亞太區(qū)高級副總裁、中國大陸及香港董事總經(jīng)理吳航軍先生,以及近五百位嘉賓、客戶及合作伙伴齊聚一堂,共同回顧百年安全的
    的頭像 發(fā)表于 09-14 16:31 ?944次閱讀

    愛立信與多家瑞典領(lǐng)先企業(yè)成立Sferical AI公司

    愛立信與多家瑞典領(lǐng)先企業(yè)于20255月共同成立的專注服務(wù)瑞典市場的先進(jìn)AI企業(yè)近日以“Sferical AI”之名正式亮相。
    的頭像 發(fā)表于 09-03 16:51 ?5198次閱讀

    施耐德電氣助力百年學(xué)府數(shù)據(jù)中心改造升級

    面對不同場景下的“跨時空”能效升級挑戰(zhàn),施耐德電氣精準(zhǔn)施策,以先進(jìn)的AI技術(shù)為核心應(yīng)用,依托SmartCool末端空調(diào)節(jié)能解決方案與多種施家硬件設(shè)備解決方案的聯(lián)合攜手,為這家百年學(xué)府的數(shù)據(jù)中心量身
    的頭像 發(fā)表于 08-13 16:47 ?886次閱讀

    RFID 系統(tǒng)與智能工具柜:重構(gòu)社康、圖書館與醫(yī)療行業(yè)的資產(chǎn)管理范式

    在數(shù)字化轉(zhuǎn)型的深水區(qū),基層服務(wù)與專業(yè)機(jī)構(gòu)的資產(chǎn)管理正面臨效率與安全的雙重考驗:某社康中心每月因疫苗冷鏈記錄疏漏被約談 3 次;某圖書館年度盤點耗費 500 工時,仍有 12% 圖書賬實不符;某醫(yī)院
    的頭像 發(fā)表于 07-07 16:21 ?318次閱讀
    RFID 系統(tǒng)與智能工具柜:重構(gòu)社康、<b class='flag-5'>圖書館</b>與醫(yī)療行業(yè)的資產(chǎn)管理范式

    圖書館WiFi總掉線?我的秘密武器居然是它.

    圖書館阿姨收書還快 ??穩(wěn)定輸出??:連續(xù)3小時查資料,中途只掉線1次(還是因為我手機(jī)不小心碰掉了USB) ??無縫銜接??:換IP后不用重新登錄數(shù)據(jù)庫,連cookie都還在 ??3. 實測對比:蜂鳥IP
    發(fā)表于 06-10 18:05

    RFID在圖書館自動化中的應(yīng)用

    RFID在圖書館自動化中的優(yōu)勢高效率:RFID可以快速批量讀取圖書信息,大幅縮短借還書時間,提高圖書館管理效率。準(zhǔn)確性:RFID減少了人工操作的錯誤率,提高了圖書管理的準(zhǔn)確性和可靠性。
    的頭像 發(fā)表于 05-27 17:15 ?429次閱讀
    RFID在<b class='flag-5'>圖書館</b>自動化中的應(yīng)用

    RFID智能書架:圖書館數(shù)字化轉(zhuǎn)型的新核心技術(shù)

    隨著數(shù)字化轉(zhuǎn)型的推進(jìn),圖書館智能化升級成為趨勢。RFID智能書架憑借高效、精準(zhǔn)、自動化的管理能力,成為圖書館現(xiàn)代化轉(zhuǎn)型的新寵。
    的頭像 發(fā)表于 04-28 11:26 ?495次閱讀
    RFID智能書架:<b class='flag-5'>圖書館</b>數(shù)字化轉(zhuǎn)型的新核心技術(shù)

    圖書館效率革命!RFID智能書柜如何顛覆傳統(tǒng)借閱體驗?

    傳統(tǒng)借閱體驗繁瑣且低效,圖書館借閱效率亟待提升。RFID智能書柜顛覆傳統(tǒng)借閱體驗,實現(xiàn)圖書精準(zhǔn)定位與高效管理。便捷自助借還,縮短借還時間,降低排隊時間,提高借閱體驗。
    的頭像 發(fā)表于 04-23 15:21 ?395次閱讀
    <b class='flag-5'>圖書館</b>效率革命!RFID智能書柜如何顛覆傳統(tǒng)借閱體驗?

    RFID圖書管理系統(tǒng)如何重構(gòu)數(shù)字化倉儲管理新生態(tài)

    圖書館與出版行業(yè)數(shù)字化轉(zhuǎn)型進(jìn)程中,RFID圖書管理系統(tǒng)正打破傳統(tǒng)人工管理的效率瓶頸,通過與數(shù)字化倉儲管理系統(tǒng)的深度融合,實現(xiàn)從圖書采購、入庫到借閱的全鏈路智能化。本文結(jié)合RFID固定資產(chǎn)管理軟件的應(yīng)用邏輯,
    的頭像 發(fā)表于 04-18 16:59 ?490次閱讀
    RFID<b class='flag-5'>圖書</b>管理系統(tǒng)如何重構(gòu)數(shù)字化倉儲管理新生態(tài)

    智慧閱讀觸手可及——RFID微型圖書館,你了解嗎?

    RFID微型圖書館是一種新型的閱讀模式,通過射頻識別技術(shù)構(gòu)建的小型化、智能化圖書館設(shè)施。它提供24小時自助服務(wù)、多種登錄方式、圖書定位與查找、快速盤點圖書
    的頭像 發(fā)表于 04-09 15:37 ?458次閱讀
    智慧閱讀觸手可及——RFID微型<b class='flag-5'>圖書館</b>,你了解嗎?

    你的樹莓派為什么越用越卡?揭秘SD卡里的&amp;quot;圖書館管理員&amp;quot;

    導(dǎo)語有沒有遇到過樹莓派啟動變慢、運行卡頓,甚至莫名“死機(jī)”?這些問題很可能和SD卡里的“隱形管家”——文件系統(tǒng)有關(guān)!今天我們將用“圖書館管理員”的比喻,帶你輕松看懂樹莓派啟動流程、文件系統(tǒng)的核心作用
    的頭像 發(fā)表于 03-25 09:23 ?1002次閱讀
    你的樹莓派為什么越用越卡?揭秘SD卡里的&amp;quot;<b class='flag-5'>圖書館</b>管理員&amp;quot;

    EEPROM芯片市場應(yīng)用與出貨量分析(截至2025年數(shù)據(jù)

    EEPROM芯片市場應(yīng)用與出貨量分析(截至2025年數(shù)據(jù)
    的頭像 發(fā)表于 03-03 16:57 ?1228次閱讀

    用騰訊ima和Deepseek建立個人微信知識庫

    騰訊AI圖書館來了,是時候升級英飛凌工業(yè)半導(dǎo)體的《微信圖書館》啦。(對于工程師零難度)近日騰訊推出了AI智能工作臺ima.copilot,本人親測,可以在微信平臺上建立方便實用的私人
    的頭像 發(fā)表于 02-25 17:33 ?1715次閱讀
    用騰訊ima和Deepseek建立個人微信知識庫

    二維碼掃描頭嵌入在圖書自助管理設(shè)備中的應(yīng)用案例

    在當(dāng)今數(shù)字化時代,二維碼掃描技術(shù)已廣泛應(yīng)用于各行各業(yè),其中,在圖書自助管理設(shè)備中的嵌入應(yīng)用尤為引人注目。這不僅極大地提升了圖書館的服務(wù)效率與用戶體驗,還實現(xiàn)了圖書管理流程的智能化與自動化。以下將詳細(xì)
    的頭像 發(fā)表于 12-19 16:22 ?765次閱讀
    二維碼掃描頭嵌入在<b class='flag-5'>圖書</b>自助管理設(shè)備中的應(yīng)用案例

    如何保障圖書館用電安全?——安科瑞 丁佳雯

    一、圖書館的安全挑戰(zhàn)? 圖書館作為公共場所,其電氣系統(tǒng)復(fù)雜且龐大,包括照明、空調(diào)、電腦、電子閱讀設(shè)備等眾多用電設(shè)備。這些設(shè)備在長時間運行過程中,可能會因老化、接觸不良或設(shè)計缺陷等原因產(chǎn)生故障電弧
    的頭像 發(fā)表于 12-13 14:34 ?625次閱讀
    如何保障<b class='flag-5'>圖書館</b>用電安全?——安科瑞 丁佳雯