chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

提高數(shù)據(jù)分析的科學性與透明度,用統(tǒng)計學“反轉”中心法則

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-01-06 14:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“對我而言,回答了自己心中的問題或者做出一個新的發(fā)現(xiàn),這種成就感要遠高于生活中的其他快樂?!崩铈阂顚Α堵槭±砉た萍荚u論》中國這樣說道。

而她的研究內(nèi)容在很多人眼里或許稍顯枯燥:針對前沿的生物學問題開發(fā)新的統(tǒng)計學方法,尤其著重于對大規(guī)?;蚪M和轉錄組數(shù)據(jù)進行分析方法的開發(fā)。

由于高通量實驗技術的發(fā)展,生命科學從一個靠觀察實驗為主的學科逐漸變得更加需要定量化,而這些大規(guī)模數(shù)據(jù)的產(chǎn)生也需要算法才能夠進行分析,從而總結出數(shù)學規(guī)律并用規(guī)律來刻畫事物的本質(zhì)。

加州大學洛杉磯分校(UCLA)統(tǒng)計系(已獲得終身教職)副教授和博士生導師,生物統(tǒng)計系、人類遺傳學系和計算醫(yī)學系博士生導師李婧翌認為,生命科學作為一個“宏科學”,盡管問題的本質(zhì)與生命強相關,但研究手段需要各個學科一起合作,計算則是其中非常重要的一部分,大數(shù)據(jù)也需要有非常適合的挖掘工具,這對于從小對數(shù)學與科學有強烈興趣、并在本科與博士階段分別接受了生命科學與生物統(tǒng)計學系統(tǒng)教育的李婧翌有強大的吸引。

李婧翌的研究專注于統(tǒng)計學與生命科學的交叉問題,她首創(chuàng)性地使用嚴格的統(tǒng)計學來分析已發(fā)表的轉錄組學和蛋白組學數(shù)據(jù),發(fā)現(xiàn)在過往研究中,由于研究人員對測量誤差的忽略,轉錄的重要性被嚴重低估,該分析挑戰(zhàn)了“翻譯比轉錄重要”的觀點卻支持了之前大量在 mRNA 轉錄水平的科學發(fā)現(xiàn)。因其重要性,李婧翌的研究結果被發(fā)表在 Science 雜志并收錄于本科教材 Molecular Cell Biology 中。

7a9455dc-4fcd-11eb-8b86-12bb97331649.png

圖 | 左圖是論文 B.Schwanh?usseretal.,Nature473,337(2011) 中在不考慮實驗數(shù)據(jù)誤差的情況下對轉錄、翻譯、mRNA 降解和蛋白質(zhì)降解這四個步驟對于蛋白質(zhì)含量的貢獻的估計;右圖是在校正了實驗數(shù)據(jù)誤差之后的估計。(來源:李婧翌的論文 Li et al. (2015). Statistics requantitates the central dogma. Science347(6226):1066-1067.)

此外,李婧翌團隊還開發(fā)了大量生物信息學工具在組織和單細胞水平上對 mRNA 分子進行全系統(tǒng)測量,并正在開發(fā)一項能夠尋找到人群亞型中和疾病相關的基因變異的新的統(tǒng)計度量。

憑借上述優(yōu)異的研究成果,李婧翌成功入選 《麻省理工科技評論》“35 歲以下科技創(chuàng)新 35 人”(Innovators Under 35)2020 年中國區(qū)榜單。

圖 |《麻省理工科技評論》“35 歲以下科技創(chuàng)新 35 人”2020 年中國區(qū)榜單入選者李婧翌

無心插柳,卻顛覆固有認知

早在 1958 年,中心轉錄法則便被提出,它指的是遺傳信息被編碼在 DNA 中,通過轉錄會變成 mRNA,再通過翻譯的過程變成蛋白質(zhì),這是所有有細胞結構的生物所遵循的法則。 在這個過程中,除了轉錄和翻譯生成了 mRNA 和蛋白質(zhì)這兩個步驟,還存在 mRNA 和蛋白質(zhì)的降解,這四個步驟共同決定了每一個基因所對應的蛋白質(zhì)到底在我們細胞中存在多少量。不過,此前中心轉錄法則是一個定性表述,“沒有人知道每一步的速率是多少,也沒有人知道對最后蛋白質(zhì)含量的影響有多少?!? 在李婧翌博士即將畢業(yè)之時,她與合作者 Mark Biggin 博士共同研究中心轉錄法則的定量工作。偶然的一次機會,李婧翌和合作者發(fā)現(xiàn),2011 年發(fā)表在Nature上的一篇文章首次在小鼠的全基因組的基因中進行了 4 項步驟的測量,其得出的結論是每個基因的 mRNA 的含量對于蛋白質(zhì)含量的預測效果比較差,也就是說一個基因內(nèi) mRNA 的高或低并不太能代表它的蛋白質(zhì)含量的高或低。 “這在當時是個非常讓人震驚的結論。因為我們有很多實驗手段可以用來研究 mRNA,但是研究蛋白質(zhì)相對困難很多,所以大量生物學的發(fā)現(xiàn)成果都圍繞 mRNA 的含量水平。如果這篇文章的結果為真,那么之前很多 mRNA 的結果可能都沒有什么意義了?!崩铈阂罱忉尩?。 當李婧翌與合作伙伴看到這篇文章時,他們觀察到這項工作是將高通量質(zhì)譜轉化為蛋白質(zhì)含量,但在轉化過程中,它的標準實際上只基于高表達蛋白,并假設同樣的轉換方式也適用于低表達蛋白,由此導致了研究里面很多低表達蛋白的表達指征是很不準的,也就意味著高通量蛋白質(zhì)測量很有可能存在誤差。 為了解決這一疑惑,李婧翌將實驗誤差考慮進建模后發(fā)現(xiàn),實際上 mRNA 和蛋白質(zhì)含量的相關性比 Nature 的文章報道的要高很多,轉錄的重要性被嚴重低估。這項“無心插柳”的研究結果被發(fā)表在 Science 雜志并收錄于本科教材 Molecular Cell Biology 中。 李婧翌對《麻省理工科技評論》中國回憶道:“我覺得很有趣的一點是,我們將很基本的統(tǒng)計方法用到了正確的問題上,從而發(fā)現(xiàn)了非常意想不到的結果。這也說明了考慮數(shù)據(jù)測量的隨機性和數(shù)據(jù)噪音對科學結論十分重要。”這一年,李婧翌還不到 30 歲??蒲信c教育同樣重要 作為一個青年科學家,李婧翌認為,保持對未知問題的好奇心,用研究拓寬人類的知識邊界,是支撐她科研工作的重要推動力。 作為一個科研人員,李婧翌認為目前的統(tǒng)計分析還遠遠談不上科學,“如果一個分析人員在寫研究報告時沒有記錄分析的每一步,而只是簡略地記錄一個結果,那最終結果就不太透明,并且可能也不能被重復,可信度就要大打折扣?!? 此外,李婧翌提到,如果要將最新研究的統(tǒng)計學方法發(fā)表在比較好的學術雜志上,通常情況下做的越復雜越容易發(fā)表,這就導致統(tǒng)計學領域出現(xiàn)一個通病:很多統(tǒng)計方法都比較像“黑箱”,它們過于復雜,也沒有給實際應用的人員講授清楚優(yōu)缺點到底在哪里。

7c078128-4fcd-11eb-8b86-12bb97331649.png

圖 | 對于同樣的一套多個病人樣本中的基因表達數(shù)據(jù),病人是觀測值,而基因是特征。大部分的病人已知得病或未得病。如果研究問題是:基因A是否為一個有效的疾病標志物,那么假設檢驗是合適的統(tǒng)計方法。而如果研究問題是:1號病人是否得病,那么二元分類是合適的統(tǒng)計方法。(來源:李婧翌的論文Li et al. (2020). Statistical hypothesis testing versus machine-learning binary classification: distinctions and guidelines. Patterns 1(7):110115.)

作為一個有交叉學科背景的研究人員,李婧翌充分利用了這一點:能夠更好地讓生命科學領域的數(shù)據(jù)分析人員去理解現(xiàn)有的一些經(jīng)典方法的優(yōu)缺點和適用范圍,同時,李婧翌自己發(fā)展新方法也將以此為目標,創(chuàng)造出更透明、更穩(wěn)定的統(tǒng)計學方法。舉例而言,李婧翌在最近發(fā)表的一篇文章中就嘗試對兩種常用但經(jīng)常被混淆的統(tǒng)計方法:假設檢驗和二元分類,進行解釋并闡述這兩種方法各自適用的數(shù)據(jù)分析問題。譬如對致癌基因和抑癌基因的預測問題,李婧翌解釋了為什么基于現(xiàn)有的大數(shù)據(jù),二元分類是一個更加適用的統(tǒng)計方法。 作為教師,李婧翌致力于將統(tǒng)計方法開發(fā)和實際應用的重要性更緊密的結合。 李婧翌認為,無論中美,目前統(tǒng)計學的基礎教育中都有很多過時的教學內(nèi)容,因為很多計算都已經(jīng)可以依靠計算機的程序包來進行自動化運算。統(tǒng)計學教育更重要的應該是去教授學生為什么需要統(tǒng)計學,數(shù)據(jù)背后的隨機性應該怎么去理解,以及數(shù)據(jù)分析到底想解決什么問題,“我覺得這些其實是統(tǒng)計教育需要改變的的東西,我希望我能夠發(fā)揮一些作用。”

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動化
    +關注

    關注

    29

    文章

    5832

    瀏覽量

    88022
  • 統(tǒng)計
    +關注

    關注

    1

    文章

    20

    瀏覽量

    13697
  • 數(shù)據(jù)分析

    關注

    2

    文章

    1494

    瀏覽量

    35718

原文標題:提高數(shù)據(jù)分析的科學性與透明度,UCLA教授用統(tǒng)計學“反轉”中心法則

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    電焊機EMC測試整改:基于200+案例的統(tǒng)計學分析

    深圳南柯電子|電焊機EMC測試整改:基于200+案例的統(tǒng)計學分析
    的頭像 發(fā)表于 08-06 10:56 ?688次閱讀

    AI數(shù)據(jù)分析儀設計原理圖:RapidIO信號接入 平板AI數(shù)據(jù)分析

    AI數(shù)據(jù)分析儀, 平板數(shù)據(jù)分析儀, 數(shù)據(jù)分析儀, AI邊緣計算, 高帶寬數(shù)據(jù)輸入
    的頭像 發(fā)表于 07-17 09:20 ?367次閱讀
    AI<b class='flag-5'>數(shù)據(jù)分析</b>儀設計原理圖:RapidIO信號接入 平板AI<b class='flag-5'>數(shù)據(jù)分析</b>儀

    采用微米級三角形橫截面柵線,實現(xiàn)99.86%透明度與低電阻,引領前接觸技術革新與應用

    設計一種既能減少光損失又能保持高導電的前接觸結構。采用微米級三角形橫截面柵線,通過光散射原理實現(xiàn)了99.86%的光學透明度和低至4.8Ω/sq的薄層電阻。三角形柵線設
    的頭像 發(fā)表于 03-12 09:02 ?632次閱讀
    采用微米級三角形橫截面柵線,實現(xiàn)99.86%<b class='flag-5'>透明度</b>與低電阻,引領前接觸技術革新與應用

    AI模型思維鏈功能升級,提升透明度與可信度

    透明度。 值得注意的是,此次更新發(fā)生在DeepSeek-R1推理模型發(fā)布之后。作為OpenAI的競爭對手,DeepSeek-R1同樣具備展示其反應背后思維過程的能力。兩大模型在這一功能上的不謀而合,無疑彰顯了AI領域對于提升決策透明度與可解釋
    的頭像 發(fā)表于 02-10 09:06 ?697次閱讀

    Mathematica 在數(shù)據(jù)分析中的應用

    數(shù)據(jù)分析是現(xiàn)代科學研究和商業(yè)決策中不可或缺的一部分。隨著數(shù)據(jù)量的爆炸增長,對數(shù)據(jù)分析工具的需求也在不斷增加。Mathematica,作為一
    的頭像 發(fā)表于 12-26 15:41 ?974次閱讀

    首個科學計算基座大模型BBT-Neutron開源,助力突破大科學裝置數(shù)據(jù)分析瓶頸

    大語言模型能否解決傳統(tǒng)大語言模型在大規(guī)模數(shù)值數(shù)據(jù)分析中的局限性問題,助力科學界大科學裝置設計、高能物理領域科學計算? 高能物理是探索宇宙基本組成與規(guī)律的前沿
    的頭像 發(fā)表于 12-26 15:29 ?940次閱讀
    首個<b class='flag-5'>科學</b>計算基座大模型BBT-Neutron開源,助力突破大<b class='flag-5'>科學</b>裝置<b class='flag-5'>數(shù)據(jù)分析</b>瓶頸

    宏集MSR165沖擊振動數(shù)據(jù)記錄儀讓運輸透明

    為了確保每個貨物在旅途中的安全無損,專業(yè)包裝服務提供商Wegmüller AG使用宏集MSR165數(shù)據(jù)記錄儀進行追蹤記錄,提升運輸過程的透明度和可靠,從根本上解決運輸問題,并清晰界定責任。
    的頭像 發(fā)表于 12-24 17:36 ?545次閱讀

    數(shù)據(jù)可視化與數(shù)據(jù)分析的關系

    的含義。 數(shù)據(jù)分析的定義與作用 數(shù)據(jù)分析是一種使用統(tǒng)計和邏輯方法來分析數(shù)據(jù)集的過程,目的是發(fā)現(xiàn)模式、趨勢和關聯(lián)
    的頭像 發(fā)表于 12-06 17:09 ?1248次閱讀

    葡萄酒俱樂部計劃部署RFID技術以提高供應鏈的透明度

    提高葡萄酒供應鏈的透明度和效率。 該解決方案是基于區(qū)塊鏈和RFID技術來跟蹤每瓶酒在運輸、儲存、購買和消費過程中的信息。該系統(tǒng)記錄了每瓶葡萄酒的數(shù)字標識、生活故事以及周圍的條件,一直到消費者手中。 通過將 超高頻RFID標簽 嵌入到瓶子
    的頭像 發(fā)表于 11-23 16:18 ?608次閱讀

    LLM在數(shù)據(jù)分析中的作用

    隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)分析已經(jīng)成為企業(yè)和組織決策的關鍵工具。數(shù)據(jù)科學家和分析師需要從海量數(shù)據(jù)
    的頭像 發(fā)表于 11-19 15:35 ?1459次閱讀

    為什么選擇eda進行數(shù)據(jù)分析

    數(shù)據(jù)科學領域,數(shù)據(jù)分析是一個復雜且多步驟的過程,它涉及到數(shù)據(jù)的收集、清洗、探索、建模和解釋。在這些步驟中,探索性數(shù)據(jù)分析(EDA)扮演著至
    的頭像 發(fā)表于 11-13 10:41 ?978次閱讀

    raid 在大數(shù)據(jù)分析中的應用

    RAID(Redundant Array of Independent Disks,獨立磁盤冗余陣列)在大數(shù)據(jù)分析中的應用主要體現(xiàn)在提高存儲系統(tǒng)的性能、可靠和容量上。以下是RAID在大數(shù)據(jù)分
    的頭像 發(fā)表于 11-12 09:44 ?936次閱讀

    SUMIF函數(shù)在數(shù)據(jù)分析中的應用

    在商業(yè)和科學研究中,數(shù)據(jù)分析是一項基本且關鍵的技能。Excel作為最常用的數(shù)據(jù)分析工具之一,提供了多種函數(shù)來幫助用戶處理和分析數(shù)據(jù)。SUMI
    的頭像 發(fā)表于 11-11 09:14 ?1242次閱讀

    智能制造中的數(shù)據(jù)分析應用

    隨著工業(yè)4.0的推進,智能制造已經(jīng)成為制造業(yè)轉型升級的關鍵。數(shù)據(jù)分析作為智能制造的核心驅動力,正逐步改變傳統(tǒng)的生產(chǎn)方式,為企業(yè)帶來更高的效率和更大的競爭力。 一、數(shù)據(jù)分析在智能制造中的重要
    的頭像 發(fā)表于 11-07 09:56 ?1177次閱讀

    數(shù)據(jù)分析在數(shù)字化中的作用

    與重要 數(shù)據(jù)分析是指使用統(tǒng)計和邏輯方法對數(shù)據(jù)進行處理和解釋的過程。它涉及到數(shù)據(jù)的收集、清洗、轉換、建模和解釋,目的是發(fā)現(xiàn)
    的頭像 發(fā)表于 10-27 17:35 ?1402次閱讀