chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)科學家們常用的一種工具——Jupyter notebook,納入天文學研究

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-11-05 15:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在智利北部安第斯山脈高達2700米的塞隆·帕切翁山巔,美國的“大型綜合巡天望遠鏡”(LSST)正在緊鑼密鼓地施工著。到2022年,也就是LSST正式投入使用的時候,它將把30億像素的相機對準太空,每晚完成30千兆的拍攝任務,這會是人類研究宇宙暗物質(zhì)的一大基礎.

而為了處理望遠鏡每天自動生成的TB級數(shù)據(jù),天文學家們開始轉(zhuǎn)向數(shù)據(jù)科學,把數(shù)據(jù)科學家們熟悉且常用的一種工具——Jupyter notebook,納入天文學研究。

Jupyter是一個免費的、開源的、交互式的網(wǎng)絡工具,它是一個計算筆記本,允許研究人員把軟件代碼、計算輸出、注釋性文本和多媒體資源集中在一個文檔中。就歷史來看,計算筆記本已經(jīng)在世上存在了幾十年,但是直到幾年前,以Jupyter為代表的notebook才開始被技術人員廣泛使用,并大受歡迎。

當然,Jupyter的流行離不開用戶和開發(fā)者社區(qū)的共同努力。經(jīng)過架構(gòu)的重新設計和其他優(yōu)化,現(xiàn)在它已經(jīng)支持幾十種編程語言——這也反映在名稱變化上(Jupyter notebook原名IPython Notebook)。根據(jù)公司聯(lián)合創(chuàng)始人Fernando Pérez的說法,現(xiàn)在的名字Jupyter是數(shù)據(jù)科學常用的3種語言的組合:Julia(Ju)、Python(Py)和R。

上個月,代碼托管平臺GitHub發(fā)布了一份分析,指出當前公開的Jupyter notebook數(shù)量大約在250萬份,而在2015年,這個數(shù)字只有不到20萬份。Pérez認為這里面有應用程序、網(wǎng)絡軟件經(jīng)過不斷升級迭代,性能超越競品的原因,但更多應該歸功于Python在科研領域的大面積應用和數(shù)據(jù)科學的成熟——尤其是當人們進行科學研究和數(shù)據(jù)分析時,發(fā)現(xiàn)遠程數(shù)據(jù)過于龐大,超出了筆記本電腦的訪問上限,如LSST。

在很多情況下,把計算機接入數(shù)據(jù)比把數(shù)據(jù)輸入計算機要容易得多。Jupyter是基于云的,只要你告訴我你的數(shù)據(jù)在哪里,我就馬上能在那兒給你臺計算機?!狥ernando Pérez

對于數(shù)據(jù)科學家來說,Jupyter已經(jīng)成為事實上的標配。而在見識了這種工具之后,華盛頓大學的天文學家、負責協(xié)調(diào)LSST數(shù)據(jù)管理團隊的馬里奧·尤里奇也表示:“我從未見過這么快的遷移,真的是太棒了!”

數(shù)據(jù)探索

類比來看,計算筆記本實際上就是用于科學計算的實驗室筆記本,只不過上面寫的既不是用凝膠電泳分離DNA,也不是實驗室指南,而是嵌入代碼、數(shù)據(jù)和文本來記錄“實驗者”的計算方法。公司聯(lián)合創(chuàng)始人Brian Granger把它稱為“計算敘事”——一個允許研究人員用分析、假設和猜想來補充代碼和數(shù)據(jù)的文件。

這種工具能幫數(shù)據(jù)科學家極大地推進數(shù)據(jù)探索。notebook是交互式的,用戶可以在這種環(huán)境中運行代碼、查看發(fā)生的情況,然后重復這種發(fā)生在數(shù)據(jù)和研究人員之間的循環(huán)和迭代。這是人和數(shù)據(jù)對話的一種途徑,它允許用戶記錄這些對話,建立起與主題、理論,數(shù)據(jù)和結(jié)果之間更強大的聯(lián)系。當然,Jupyter不是承載對話的唯一平臺——它的前身IPython Notebook是一種交互式Python解釋器,也可以充當對話平臺。

此外,研究人員還可以用notebook為他們的軟件創(chuàng)建教程或交互式手冊,這也是哈佛大學系統(tǒng)神經(jīng)科學家Mackenzie Mathis所做的嘗試。她和她的團隊曾為神經(jīng)科學研究開發(fā)了一個代碼庫,這允許他們把notebook作為手稿和教具用于教學。而根據(jù)Barba——一名從2013年起就在每門課程中都用notebook教學的教授——的體驗,她認為IPython Notebook是用于教授科學和工程計算的殺手級應用程序,使她的學生能從中高效汲取課程知識。

愛我所愛

提到編程,編程語言最能挑動技術人員神經(jīng)。Jupyter notebook有兩個組件。用戶在前端網(wǎng)頁中的矩形單元格輸入編程代碼或文本,然后,瀏覽器會將該代碼傳遞給后端“內(nèi)核”,由后端運行代碼并返回結(jié)果。根據(jù)Pérez的統(tǒng)計,現(xiàn)在Jupyter內(nèi)核的數(shù)量已經(jīng)達到100多個,支持上百種編程語言。這是個極大的優(yōu)勢,因為通常情況下,每個notebook只能運行一個內(nèi)核和一種語言,即便存在變通的方法,也只局限在Python、Julia、R和Fortran這4種之間。

重要的是,Jupyter的內(nèi)核不需要駐留在用戶的計算機上。未來,當LSST的天文學家用Jupyter notebook分析數(shù)據(jù)時,他們的代碼會在伊利諾伊州運行,由超級計算機提供普通臺式機無法比擬的龐大算力。notebook也可以在云中運行,例如谷歌的Colaboratory項目就為Jupyter提供了一個以谷歌為主題的前端,它允許用戶進行協(xié)作、利用Google Cloud的代碼,并將文檔保存在Google Drive上。

今年1月,Jupyter推出下一代產(chǎn)品JupyterLab,可作為獨立軟件包或作為免費的Anaconda科學計算環(huán)境的一部分。

Jason Grout是彭博社的軟件工程師,也是JupyterLab團隊的成員之一。在他眼里,JupyterLab是Jupyter notebook的“下一代Web界面” ——它擴展了原先notebook的概念,把文本編輯器、瀏覽器、數(shù)據(jù)文件查看器、文本編輯器、命令控制臺及其他自定義的內(nèi)容以標簽的形式排列在工作區(qū)中。一般Jupyter notebook會為每個notebook分配了各自的內(nèi)核,而JupyterLab則是創(chuàng)建了一個允許共享這些組件的計算環(huán)境。這意味著用戶可以在一個窗口中查看notebook,在另一個窗口中編輯所需的數(shù)據(jù)文件,并在第三個窗口中記錄所有運行的命令 ——所有這些都在一個Web瀏覽器界面中進行。

用戶還可以自定義JupyterLab以適應他們的工作流。它建立在可擴展系統(tǒng)之上,能提供新的主題、文件編輯器和查看器,甚至可以顯示基因組比對或地理空間數(shù)據(jù)等內(nèi)容。為了方便用戶自定義擴展,Pérez還自制了一個教學視頻,演示了如何創(chuàng)建了一個能顯示3D大腦成像數(shù)據(jù)的組件。

這是一個完全[神經(jīng)科學]領域的特定工具,顯然,Jupyter團隊不需要編寫這些東西,但我們提供了正確的標準,然后社區(qū)可以在24小時內(nèi)學會怎么做并自己寫一個。

此外,依靠另兩個工具,Jupyter的可用性也得到了大大加強。其中一個是JupyterHub,這項服務允許機構(gòu)向大量用戶提供Jupyter notebook。比如加州大學伯克利分校就用這種方法確保所有學生在所有課程下都擁有相同的計算環(huán)境?!拔覀儾豢赡転?00名學生一一提供IT支持,幫助他們在安裝失敗時debug,這是不可行的。”

另一個是Binder,一種允許用戶在瀏覽器中使用GitHub上的Jupyter notebook、無需安裝軟件或任何編程庫的開源服務。

值得關注的問題

盡管Jupyter notebook通過簡化代碼促進代碼復現(xiàn),但作為使用者,掌握 notebook的正確用法還是很重要的。

今年早些時候,艾倫人工智能研究所的研究工程師Joel Grus在Jupyter開發(fā)者大會上發(fā)表了題為“I don’t like notebooks”的演講。他指出,當 notebook沒有按預期運行時,程序員們往往會感到手足無措,但出現(xiàn)這個問題的原因很可能是他們沒有按順序去運行代碼塊。Jupyter notebook的簡便從某種程度上來說是助紂為虐,它難以邏輯地組織代碼,將其分解為可重用的模塊并進行開發(fā)測試,以確保代碼正常工作。所以被慣壞的用戶寫出來的代碼也越來越混亂不清。

Grus承認,雖然這些都不是難以解決的問題,但 notebook在執(zhí)行代碼時確實應該注意遵守規(guī)則,比如 把分析代碼移動到可以從 notebook中調(diào)用的外部文件、在notebook頂部定義關鍵變量以及 定期重新啟動內(nèi)核并從頭開始運行notebook。就像一名網(wǎng)友在Twitter上的打趣:“要么重新跑一遍,要么假裝什么都沒發(fā)生?!?/p>

這也是Barba每次用notebook給學生上課時會提醒的一點:“從第一天起,我就對學生們說,你們可以用非線性的方式使用notebook,這能方便你們進行探索,但強大功能背后是要打下更扎實的基礎?!?/p>

為了解決這個問題,一個可能有用的工具是Verdant,這是個能捕捉用戶歷史行為的插件?!白髡邩?gòu)建了一個擴展,它允許用戶在里面部署靈活的工作流,同時捕獲用戶運行的特定代碼、運行順序和具體數(shù)據(jù)?!?/p>

谷歌軟件工程師兼Colaboratory團隊成員Jake VanderPlas表示,Jupyter notebook就像錘子,它們很可能被誤用,也不適合所有領域,但對于數(shù)據(jù)探索和通信來說,notebook確實是個好工具。天文學界似乎非常認同這個觀點:“6年前,我們的計算機里完全不存在什么Jupyter notebook,但現(xiàn)在,每個人都愛它。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • python
    +關注

    關注

    57

    文章

    4867

    瀏覽量

    89804
  • 數(shù)據(jù)科學

    關注

    0

    文章

    168

    瀏覽量

    10771

原文標題:Nature專欄:為什么數(shù)據(jù)科學家會選擇Jupyter

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    科研級CCD相機成像的探索之旅

    的案例。 CCD相機基本原理 - 介紹CCD(電荷耦合器件)技術及其工作原理。 - 解釋光電轉(zhuǎn)換過程和信號讀出方式。 特點 - 引述高分辨率、低噪聲、寬動態(tài)范圍等優(yōu)勢。 - 闡述這些特點對于科學實驗和觀測的重要意義。 應用案例 天文學領域 - 描述
    的頭像 發(fā)表于 12-29 07:15 ?101次閱讀
    科研級CCD相機成像的探索之旅

    思必馳首席科學家俞凱教授當選2026年度IEEE Fellow

    日前,全球最大的專業(yè)技術組織國際電氣電子工程師協(xié)會(The Institute of Electrical and Electronics Engineers, IEEE)公布了2026年度IEEE Fellow(會士)名單,上海交通大學特聘教授、思必馳聯(lián)合創(chuàng)始人、首席科學家俞凱教授當選。
    的頭像 發(fā)表于 12-12 11:36 ?718次閱讀

    中興通訊崔麗受邀出席2025騰沖科學家論壇

    近日,“2025騰沖科學家論壇”在云南啟幕。本屆論壇以“科學·AI改變世界”為主題,匯聚包括諾貝爾獎、圖靈獎、菲爾茲獎得主在內(nèi)的國際頂尖科學家,以及百余位兩院院士、高校校長、科技精英與產(chǎn)業(yè)領袖,共話
    的頭像 發(fā)表于 12-09 11:36 ?501次閱讀

    背散射衍射技術(EBSD)的應用領域

    電子背散射衍射技術(EBSD)在材料科學研究中,對材料的顯微結(jié)構(gòu)和晶體學特性的深入理解是至關重要的。電子背散射衍射技術(EBSD)作為一種強大的顯微分析工具,它允許
    的頭像 發(fā)表于 11-26 17:13 ?718次閱讀
    背散射衍射技術(EBSD)的應用領域

    科學家利用微波激光照射鉆石,制造出時間準晶體

    科學家利用微波激光照射鉆石,制造出時間準晶體。 美國華盛頓大學、麻省理工學院和哈佛大學科學家攜手,成功在鉆石上“雕刻”出一種全新的物質(zhì)形態(tài):時間準晶體。這項突破有望為量子計算、精確計時等領域帶來
    的頭像 發(fā)表于 11-19 07:35 ?140次閱讀
    <b class='flag-5'>科學家</b>利用微波激光照射鉆石,制造出時間準晶體

    國際類腦計算科學家Yulia Sandamirskaya教授加盟時識科技

    近日,國際類腦計算與神經(jīng)形態(tài)機器人領域知名科學家Yulia Sandamirskaya 教授,作為科學家顧問正式加入時識科技(SynSense)。
    的頭像 發(fā)表于 10-13 13:50 ?624次閱讀

    科技感拉滿!鯨啟智能機器人與無人機聯(lián)動,閃耀服務世界青年科學家論壇

    9 月 20 日,以 “青年,世界科學的未來” 為主題的世界青年科學家論壇(南京)在江北新區(qū)啟幕。20 余位諾貝爾獎得主、海內(nèi)外院士,超百位國際國內(nèi)青年科學家及產(chǎn)業(yè)代表齊聚,圍繞前沿科技展
    的頭像 發(fā)表于 10-11 16:54 ?210次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    AI被賦予了人的智能,科學家希望在沒有人類的引導下,AI自主的提出科學假設,諾貝爾獎級別的假設哦。 AI驅(qū)動科學被認為是科學發(fā)現(xiàn)的第五個范
    發(fā)表于 09-17 11:45

    連載|業(yè)余無線電史話(八):從射電天文學誕生到馬可尼逝世

    射電天文學的誕生隨著無線電的發(fā)明,托馬斯·愛迪生可能是第個意識到可以收聽恒星發(fā)出信號的人。愛迪生的助手A·肯內(nèi)利教授于1890年提出了朝這個方向進行實驗的建議。在封寫給利克天文
    的頭像 發(fā)表于 07-06 07:32 ?1553次閱讀
    連載|業(yè)余無線電史話(八):從射電<b class='flag-5'>天文學</b>誕生到馬可尼逝世

    樹莓派+望遠鏡:如何用 Wi-Fi 實現(xiàn)遠程天文觀測?

    我非常熱愛天文學天文攝影。我確信,和我樣,所有業(yè)余天文學家都希望擁有個價格實惠的個人天文
    的頭像 發(fā)表于 06-20 16:57 ?1385次閱讀
    樹莓派+望遠鏡:如何用 Wi-Fi 實現(xiàn)遠程<b class='flag-5'>天文</b>觀測?

    地物光譜儀如何幫助科學家研究植被和土壤?

    在遙感、生態(tài)、農(nóng)業(yè)等研究領域,科學家常常會提到工具: 地物光譜儀 。它看起來像臺“測光的
    的頭像 發(fā)表于 05-20 15:46 ?513次閱讀
    地物光譜儀如何幫助<b class='flag-5'>科學家</b><b class='flag-5'>研究</b>植被和土壤?

    分享原子鐘在科研領域的重要性

    在現(xiàn)代科技飛速發(fā)展的今天,時間測量已經(jīng)成為科學研究中不可或缺的部分。無論是天文學、物理學,還是通信技術、導航系統(tǒng),精確的時間測量都扮演著至關重要的角色。而在這其中,原子鐘作為目前最精確的計時
    的頭像 發(fā)表于 05-15 15:55 ?677次閱讀
    分享原子鐘在科研領域的重要性

    我國科學家制備出可控手性石墨烯卷

    日前,我國科學家開發(fā)了一種名為“石蠟輔助浸入法”的新技術,成功讓二維材料“卷起來”,制備出具有可控手性的石墨烯卷,為未來量子計算和自旋電子器件的發(fā)展奠定了堅實基礎。 由天津大學教授胡文平、雷圣賓、李
    的頭像 發(fā)表于 02-26 11:17 ?839次閱讀

    一種新型的非晶態(tài)NbP半金屬薄膜

    來自斯坦福大學和韓國Ajou大學的科學家在《Science》雜志上發(fā)表了項開創(chuàng)性的研究成果。他們發(fā)現(xiàn)了一種新型的非晶態(tài)NbP半金屬薄膜,
    的頭像 發(fā)表于 02-07 10:08 ?1332次閱讀
    <b class='flag-5'>一種</b>新型的非晶態(tài)NbP半金屬薄膜

    NVIDIA RAPIDS cuDF如何賦能AI加速數(shù)據(jù)科學

    隨著 AI 正幫助各行各業(yè)推動創(chuàng)新和提高效率,基于海量的高質(zhì)量數(shù)據(jù)來訓練各種模型是充分發(fā)揮 AI 應用潛力的必經(jīng)之路,正因如此,數(shù)據(jù)科學家面臨著日益增長的工作負載需求,迫切需求尋找高
    的頭像 發(fā)表于 01-24 09:26 ?1205次閱讀