chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大學里好不容易聽懂的統(tǒng)計學,會變成一件沒“意義”的事情嗎?

DPVg_AI_era ? 來源:lp ? 2019-03-22 08:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

三位統(tǒng)計學家在Nature上發(fā)布公開信,號召科學家放棄追求“統(tǒng)計學意義”,這封公開信一周之內(nèi)吸引了超過800名研究人員共同簽署。大學里好不容易聽懂的統(tǒng)計學,會變成一件沒“意義”的事情嗎?

統(tǒng)計學白學了?

最新一期Nature雜志發(fā)表了三位統(tǒng)計學家的一封公開信,他們號召科學家放棄追求“統(tǒng)計學意義”,并且停止用統(tǒng)計學中常見的P值作為判斷標準。

一般認為P≤0.05或者P≤0.01就有顯著性差異,研究就有統(tǒng)計意義。

統(tǒng)計學上無顯著的結(jié)果并不能“證明”零假設(shè);統(tǒng)計上顯著的結(jié)果也沒有“證明”某些其他假設(shè)。事實真的是這樣嗎?

他們的這篇文章名為《科學家們起來反對統(tǒng)計學意義》(Scientists rise up against statistical significance)。

標題猶如戰(zhàn)斗檄文一樣令人振奮。在文章發(fā)出不到24小時,就有250多人簽名支持,一周之內(nèi)吸引了超過800名研究人員共同反對。

大學里好不容易聽懂的統(tǒng)計學,會變成一件沒“意義”的事情嗎?

為什么要放棄統(tǒng)計學意義的概念?

幾代人以來,研究人員一直被警告說:統(tǒng)計上不顯著的結(jié)果并不能“證明”零假設(shè)(即假設(shè)各組之間沒有差異,或者某個處理方法對某些測量結(jié)果沒有影響)。統(tǒng)計上顯著的結(jié)果也不能“證明”其他一些假設(shè)。這種誤解用夸大的觀點扭曲了文獻,而且導致了一些研究之間的沖突。

因此,三位統(tǒng)計學家提出一些建議,讓科學家們不至于成為這些誤解的犧牲品。

首先明確必須停止的事:永遠不應(yīng)該僅僅因為P值大于閾值(如0.05)就得出“沒有差異”或“沒有關(guān)聯(lián)”的結(jié)論;或者,僅僅因為置信區(qū)間包含0就得出這樣的結(jié)論。

同時,我們也不應(yīng)該斷定兩項研究之間存在沖突,只因為其中一項研究的結(jié)果具有統(tǒng)計學意義,而另一項則沒有。這些錯誤浪費了研究工作,誤導了政策決策。

例如,考慮一系列對消炎藥意外效果的分析。由于他們的研究結(jié)果在統(tǒng)計學上不顯著,一組研究人員得出結(jié)論說:暴露在這些藥物中與新發(fā)房顫(最常見的心律紊亂)“無關(guān)”,并且這些結(jié)果與之前的一項研究結(jié)果相反,而之前的研究結(jié)果具有統(tǒng)計學意義。

現(xiàn)在,讓我們看看實際的數(shù)據(jù)。研究人員描述了他們的統(tǒng)計不顯著的結(jié)果,發(fā)現(xiàn)風險比為1.2。他們還發(fā)現(xiàn)95%的置信區(qū)間跨越了從微不足道的風險降低3%到非常顯著的風險增加48%(P = 0.091)。研究人員從較早的具有統(tǒng)計學意義的研究中發(fā)現(xiàn),風險比同樣為1.2。這項研究更加精確,其風險區(qū)間在9%到33%之間(P = 0.0003)。

當區(qū)間估計包含嚴重的風險增加時,得出結(jié)論認為統(tǒng)計上不顯著的結(jié)果顯示“無關(guān)聯(lián)”是荒謬的;同樣荒謬的是,聲稱這些結(jié)果與先前研究中顯示相同觀察效果的結(jié)果相反。然而,這些常見的實踐表明,依賴統(tǒng)計意義上的閾值會誤導我們。

謹防錯誤結(jié)論

這些錯誤以及類似的錯誤普遍存在。對數(shù)百篇文章的調(diào)查發(fā)現(xiàn),統(tǒng)計上不顯著的結(jié)果被解釋為“沒有差異”或“沒有影響”的約有一半。

2016年,美國統(tǒng)計協(xié)會在《美國統(tǒng)計學家》上發(fā)表聲明,警告誤用統(tǒng)計意義和P值。本月,《美國統(tǒng)計學家》雜志又發(fā)表了40多篇關(guān)于“21世紀的統(tǒng)計推斷:一個沒有P<0.05的世界”的論文。編輯們在介紹這期特刊的時候謹慎地說,“不要說’統(tǒng)計意義重大’”。

《美國統(tǒng)計學家》雜志最新報道

三位統(tǒng)計學家也同意這一點,并呼吁放棄整個統(tǒng)計意義的概念。

停止使用非黑即白的P值,800多研究者同意

這三位統(tǒng)計學家寫完《科學家們起來反對統(tǒng)計學意義》(Scientists rise up against statistical significance)一文草稿之后,邀請了其他人閱讀,并表示如果人們同意三人的觀點,就簽上自己的名字。

沒想到這篇文章得到了諸多人的贊同,在最初的24小時內(nèi),就有250人簽了名。一星期后,共收到800多份簽名,簽名者包括來自50多個國家的統(tǒng)計學家、臨床和醫(yī)學研究人員、生物學家和心理學家,除南極洲沒人以外,所有大洲都有人簽名。

一名倡導者稱,這是“對統(tǒng)計意義輕率測試的外科手術(shù)式打擊”,也是“一個為更好的科學實踐發(fā)聲的機會”。

同時,三位統(tǒng)計學家也強調(diào),他們不是在呼吁禁止P值。不是說P值不能在某些特定的應(yīng)用程序中用作決策標準,而是他們與過去幾十年的許多其他研究結(jié)果一樣,呼吁停止以傳統(tǒng)的二分法使用P值——來決定結(jié)果是反駁還是支持一項科學假設(shè)。

避免這種“二分法”的一個原因是,所有的統(tǒng)計數(shù)據(jù),包括P值和置信區(qū)間,都會隨著研究的不同而自然地發(fā)生變化,并且往往變化非常大。事實上,單憑隨機變化就能很容易導致P值的巨大差異,遠遠不止落在0.05閾值的任何一側(cè)。例如,即使研究人員可以對一些真實的效果進行兩次完美的復(fù)制研究,每次都有80%的機會達到P < 0.05,那么其中一個得到P < 0.01,另一個得到P > 0.30也就不足為奇了。無論P值是大是小,都需要謹慎。

問題不在于統(tǒng)計,而在于人和認知:把結(jié)果分成“統(tǒng)計顯著性”和“統(tǒng)計非顯著性”,讓人們認為以這種方式分配的項目是截然不同的。同樣的問題也可能出現(xiàn)在任何涉及二分法的統(tǒng)計替代方法中,無論是頻域法、貝葉斯法還是其他方法。

不幸的是,科學家和期刊編輯們錯誤地認為,超過統(tǒng)計意義的臨界值就足以證明一個結(jié)果是“真實的”,這導致他們對這類結(jié)果給予了特權(quán),從而扭曲了文獻。統(tǒng)計上有意義的估計值在大小上向上偏倚,而且可能偏差的幅度很大,而統(tǒng)計上不顯著的估計值是向下偏倚的。

因此,任何側(cè)重于統(tǒng)計學意義的估計的討論都是有偏見的。最重要的是,對統(tǒng)計意義的嚴格關(guān)注鼓勵研究人員選擇一些數(shù)據(jù)和方法,這些數(shù)據(jù)和方法對于某些期望的結(jié)果具有統(tǒng)計顯著性(或者僅僅是可發(fā)表的),或者對于不期望的結(jié)果沒有統(tǒng)計顯著性,例如藥物的潛在副作用,從而使結(jié)論無效。

預(yù)先登記研究和承諾公布所有分析的所有結(jié)果可以大大減輕這些問題。然而,即使是預(yù)先登記的研究結(jié)果也可能因分析計劃中始終未作決定而產(chǎn)生偏差。即使是出于好意,這也會發(fā)生。

放棄了統(tǒng)計學意義,我該怎么辦?

Nature在2014年的一篇文章中,討論了P值并不像許多科學家所假設(shè)的那樣可靠,當時文章引起了業(yè)界很大反響,由此引發(fā)了后來美國統(tǒng)計協(xié)會在2016年警告濫用統(tǒng)計意義和P值。

如果研究人員確實放棄了統(tǒng)計學意義,他們應(yīng)該做些什么呢?

三位統(tǒng)計學家認為:我們必須學會接受不確定性。

一種實用的方法是將置信區(qū)間重新命名為“兼容區(qū)間”(compatibility intervals),并以避免過度自信的方式解釋它們。具體地說,建議作者描述區(qū)間內(nèi)所有值的實際含義,特別是觀察到的效果和極限。在這樣做時,他們應(yīng)該記住,考慮到用來計算區(qū)間的統(tǒng)計假設(shè),區(qū)間極限之間的所有值都與數(shù)據(jù)合理地兼容。因此,在區(qū)間中挑出一個特定的值(例如null值)沒有任何意義。

當談到兼容間隔時,請記住四件事:

首先,僅僅因為區(qū)間給出了與數(shù)據(jù)最相容的值,在給定假設(shè)條件下,并不意味著區(qū)間外的值是不相容的;它們只是兼容性較差。事實上,區(qū)間外的值與區(qū)間內(nèi)的值沒有本質(zhì)上的區(qū)別。因此,說區(qū)間表示所有可能的值是錯誤的。

其次,根據(jù)假設(shè),并不是所有的值都與數(shù)據(jù)一致。點估計值(point estimate)是最兼容的,接近它的值比接近極限的值更兼容。這就是為什么我們敦促作者討論點估計,即使他們有一個大的P值或一個大的區(qū)間,以及討論該區(qū)間的極限。

第三,與0.05的閾值一樣,用于計算區(qū)間的默認95%本身也是一種任意約定。它基于這樣一種錯誤的想法,即計算出的區(qū)間本身有95%的幾率包含真實值,同時還有一種模糊的感覺,即這是一個自信決策的基礎(chǔ)。根據(jù)應(yīng)用程序的不同,可以調(diào)整不同的級別。而且,就像在抗炎藥物的例子中一樣,如果把區(qū)間估計施加的二分法當作一種科學標準來對待,區(qū)間估計可能會使統(tǒng)計顯著性的問題長期存在。

最后,也是最重要的一點,要謙虛:兼容性評估取決于用于計算區(qū)間的統(tǒng)計假設(shè)的正確性。在實踐中,這些假設(shè)受制于相當大的不確定性。使這些假設(shè)盡可能清晰,并測試你可以測試的假設(shè),例如通過繪制數(shù)據(jù)并擬合替代模型,然后報告所有結(jié)果。

無論統(tǒng)計數(shù)據(jù)顯示什么,都可以為你的結(jié)果提出理由,但要討論一系列可能的解釋,而不僅僅是你喜歡的那些。推論應(yīng)該是科學的,而不僅僅是統(tǒng)計的。背景證據(jù)、研究設(shè)計、數(shù)據(jù)質(zhì)量和對潛在機制的理解等因素往往比P值或區(qū)間等統(tǒng)計度量更重要。

同時,三位統(tǒng)計學家呼吁消除統(tǒng)計意義,并將置信區(qū)間作為兼容性區(qū)間,這并不是萬靈藥。盡管它將消除許多不好的實踐,但它很可能引入新的問題。因此,監(jiān)測文獻中的統(tǒng)計濫用應(yīng)該是科學界目前的一項優(yōu)先事項。

但是,當原始研究和復(fù)制研究的結(jié)果高度一致時,消除分類將有助于阻止過分自信的斷言、“沒有區(qū)別”的不合理聲明和關(guān)于“復(fù)制失敗”的荒謬聲明。濫用統(tǒng)計意義對科學界和那些依賴科學建議的人造成了很大的危害。P值、區(qū)間和其他統(tǒng)計度量都有它們的位置,但現(xiàn)在是統(tǒng)計意義消失的時候了。

這也并不意味著大學的統(tǒng)計學白上了。研究人員可以從教育自己對統(tǒng)計的誤解開始,最重要的是在每項研究中從多個角度考慮不確定性。從邏輯、背景知識和實驗設(shè)計應(yīng)與P值和類似指標一起考慮,以得出結(jié)論并確定其確定性。

在確定使用哪種方法時,研究人員還應(yīng)盡可能地關(guān)注實際問題。對于使用統(tǒng)計數(shù)據(jù)的最佳方式而言,在抽象理論上給予否定的人,在提出具體情景時,往往會給予肯定的結(jié)果。

簡而言之,要持懷疑態(tài)度,選擇一個好問題,并嘗試以多種方式回答它。畢竟,接近事實需要很多數(shù)字。

最后,介紹一下這三位統(tǒng)計學家。

Valentin Amrhein,瑞士巴塞爾大學的動物學教授;

Sander Greenland,加州大學洛杉磯分校的流行病學和統(tǒng)計學教授;

Blake McShane,伊利諾伊州埃文斯頓西北大學的統(tǒng)計學方法學家和營銷學教授。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91832
  • 科學家
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    11385
  • 統(tǒng)計
    +關(guān)注

    關(guān)注

    1

    文章

    20

    瀏覽量

    13643

原文標題:大學統(tǒng)計學白上了?800多科學家聯(lián)名反對“統(tǒng)計學意義”,P值該廢了

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【正點原子STM32MP257開發(fā)板試用】STM32MP257開發(fā)板內(nèi)核及外設(shè)性能測試

    收到STM32MP257有段時間了,直忙于工作,好不容易有閑暇時間來寫下測評報告,好了,本期測評主要講解正點原子STM32MP257開發(fā)板的硬件內(nèi)核幾外設(shè)的性能參數(shù)測試。 話不多說了,開始進入正題
    發(fā)表于 07-03 20:07

    自己寫庫:構(gòu)建庫函數(shù)雛形

    實際上,構(gòu)建固件庫是一件費時費力的事情,并且它對開發(fā)者對芯片的熟悉程度有定的要求。甚至,當個固件庫的封裝程度很高時,想要閱讀并理解該固件庫的底層代碼也
    的頭像 發(fā)表于 06-19 11:19 ?415次閱讀
    自己寫庫:構(gòu)建庫函數(shù)雛形

    圖書館WiFi總掉線?我的秘密武器居然是它.

    作為個泡圖書館的“網(wǎng)絡(luò)難民”,我太懂那種抓狂了——好不容易找到個插座坐下,正啃著文獻呢,WiFi突然斷連,IP還被限制訪問。重新登錄、換瀏覽器、甚至重啟電腦都不管用...直到我在圖書館“偶遇”了
    發(fā)表于 06-10 18:05

    從“芯”出發(fā),WT3000TX讓每程騎行都有&amp;quot;聲&amp;quot;有色

    小伙伴們,歡迎來到我們唯創(chuàng)小講堂的第8期!話說,上周末好不容易和小集美去綠道騎次自行車,本來天氣還好好的,沒想到下子就下起了小雨,我趕緊雙手緊握車把,眼睛專注前方,生怕天黑路滑
    的頭像 發(fā)表于 06-10 12:04 ?222次閱讀
    從“芯”出發(fā),WT3000TX讓每<b class='flag-5'>一</b>程騎行都有&amp;quot;聲&amp;quot;有色

    沖壓清洗機的使用技巧及維護保養(yǎng)方法詳解

    你有沒有這樣的經(jīng)歷?好不容易完成批沖壓,滿心歡喜地準備驗收,結(jié)果發(fā)現(xiàn)表面油污、殘渣像甩不掉的小尾巴,硬生生拉低了成品顏值。更別提客戶挑剔的眼神,簡直讓人抓狂!別急,今天我們就來聊聊科偉達的沖壓
    的頭像 發(fā)表于 05-06 16:46 ?233次閱讀
    沖壓<b class='flag-5'>件</b>清洗機的使用技巧及維護保養(yǎng)方法詳解

    擦窗機器人的EMC問題整改分享

    前言對于很多家庭來說,在搞大清潔的時候,清潔窗戶都是一件不容易的事,費時費力,還不容易搞干凈,而且樓層高的住戶在清潔窗戶的外窗時還有危險,安全沒有保障?;谶@些原因,
    的頭像 發(fā)表于 03-18 11:34 ?561次閱讀
    擦窗機器人的EMC問題整改分享

    輕連APP顛覆傳統(tǒng)!輕松掌控工業(yè)自動化的全新PLC控制器

    和操作,那可太麻煩了。必須得用電腦,安裝堆復(fù)雜的編程軟件,還得有專業(yè)的知識儲備,這無形之中就把很多想涉足工控領(lǐng)域的朋友拒之門外了。就算好不容易完成編程,還得守在顯示屏前時刻監(jiān)控運行狀態(tài),靈活性太差。 但現(xiàn)在,這些問題
    的頭像 發(fā)表于 03-04 16:04 ?448次閱讀

    功率半導體驅(qū)動電源設(shè)計()綜述

    工業(yè)應(yīng)用中,功率半導體的驅(qū)動電源功率不大,設(shè)計看似簡單,但要設(shè)計出簡單低成本的電路并不容易,主要難點有幾點:1電路要求簡潔,占用線路板面積要小個EasyPACK2B1200V100A六單元IGBT
    的頭像 發(fā)表于 02-14 18:02 ?492次閱讀
    功率半導體驅(qū)動電源設(shè)計(<b class='flag-5'>一</b>)綜述

    網(wǎng)線幾根線的意義

    網(wǎng)線的八根線各自承擔著不同的功能和作用,它們共同構(gòu)成了網(wǎng)絡(luò)通信的基礎(chǔ)設(shè)施,并為數(shù)據(jù)的穩(wěn)定、可靠傳輸提供了保障。以下是這八根線各自的意義、發(fā)送數(shù)據(jù)線對 第1根線:發(fā)送數(shù)據(jù)信號(+) 在
    的頭像 發(fā)表于 02-05 10:47 ?1138次閱讀

    TSC2017的復(fù)位腳,整好在芯片的中央,不容易走線,請問是否可以將其直接短接到電源?

    TSC2017的復(fù)位腳,整好在芯片的中央,不容易走線,請問是否可以將其直接短接到電源,例如和旁邊的A0腳起,直接短接在VCC上,謝謝。
    發(fā)表于 12-24 08:35

    NAS重置密碼攻略來襲,讓你告別‘密碼焦慮’!

    你是否曾遇到過這樣的尷尬場景:當你登錄某個賬號時,突然發(fā)現(xiàn)自己的腦子像是被格式化了樣,片空白。好不容易憑感覺輸入了幾組可能的密碼組合,結(jié)果系統(tǒng)無情地吐出了“密碼錯誤”的提示。 更讓人抓狂
    的頭像 發(fā)表于 12-11 15:29 ?1111次閱讀
    NAS重置密碼攻略來襲,讓你告別‘密碼焦慮’!

    嵌入式學習-飛凌嵌入式ElfBoard ELF 1板卡-應(yīng)用編程示例之文件IO的方式控制LED

    個問題,我們好不容易寫好的第個程序怎么放到開發(fā)板執(zhí)行呢?直接把led.c拷貝到開發(fā)板上好像不行,因為led.c是C語言,而開發(fā)板只認識二進制程序。如果使用之前ubuntu中介紹過的gcc編譯工具,用
    發(fā)表于 10-22 10:49

    飛凌嵌入式ElfBoard ELF 1板卡-應(yīng)用編程示例之文件IO的方式控制LED

    個問題,我們好不容易寫好的第個程序怎么放到開發(fā)板執(zhí)行呢?直接把led.c拷貝到開發(fā)板上好像不行,因為led.c是C語言,而開發(fā)板只認識二進制程序。如果使用之前ubuntu中介紹過的gcc編譯工具,用
    發(fā)表于 10-21 09:41

    【圖文】存儲設(shè)備 |ICY DOCK 三款高效NVMe PCIe轉(zhuǎn)接卡

    如今,PCIeNVMe接口已經(jīng)變得如此普遍,以至于當談到SSD存儲時,人們就會想到M.2。不僅安裝方便、占用空間小,而且利用PCIe接口提供數(shù)十倍于SATASSD的性能。令人失望的一件
    的頭像 發(fā)表于 10-12 17:22 ?984次閱讀
    【圖文】存儲設(shè)備 |ICY DOCK 三款高效NVMe PCIe轉(zhuǎn)接卡

    為什么做一件事或者學習FPGA每隔段時間就會感覺遇到瓶頸呢?

    一件事或者學習每隔段時間就會感覺遇到瓶頸
    發(fā)表于 07-30 08:59