chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是科學假設(shè)?什么是統(tǒng)計假設(shè)?什么又是機器學習假設(shè)呢?

nlfO_thejiangme ? 來源:lp ? 2019-03-16 10:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

什么是科學假設(shè)?什么是統(tǒng)計假設(shè)?什么又是機器學習假設(shè)呢?

雖然同為假說,這三個東西其實還真不太一樣!

今天,就帶你來區(qū)分一下“假設(shè)”三兄弟。

了解完它們的區(qū)別后,你會對假設(shè)一詞在不同領(lǐng)域會有更深刻的認識,對于更好的使用假設(shè)會有更深入的理解。同時,對于機器學習的入門者來說,這樣一篇文章對于個人今后在該領(lǐng)域的發(fā)展就是如虎添翼。

通常,我們所理解的監(jiān)督性機器學習,是一個類似于研究從輸入映射到輸出的目標函數(shù)問題。

這個過程可以被分為如何選取假設(shè)空間,以及評估候選的假設(shè)空間。

作為一個機器學習領(lǐng)域的初學者來說,假設(shè)這個詞的概念可能讓他們會產(chǎn)生困惑,有時會產(chǎn)生歧義,比如在統(tǒng)計領(lǐng)域我們會有假設(shè)檢驗,而在科學領(lǐng)域我們又會有科學假說。

這些定義互有關(guān)聯(lián),卻不盡相同。

所以什么是假設(shè)呢?

假設(shè)是一種對事物的解釋。

它是一種憑借經(jīng)驗和知識所提出的猜測性想法,需要一定的評估依據(jù)。

一個好的假設(shè)是可驗證的,驗證結(jié)果有可能是對的,也可能是錯的。

在科學界,假說一定是可以被證偽的,即通過觀察檢驗結(jié)果,可以證實這個假說是錯誤的。同時,在驗證結(jié)果出來之前,假說的框架結(jié)構(gòu)一定要確定好。

...任何一個或一系列假說想要成為科學定理或者科學理論,一定要滿足這樣一個基本條件—那就是,它是可以被證偽的。

選自《What is This Thing Called Science?》1999年,第三版,第61-62頁

一個好的假說既能滿足現(xiàn)有證據(jù),又可以用來預測新的觀察或新的情況。

一個假說如果說完全滿足現(xiàn)有證據(jù),同時可以被驗證,那么它將會成為理論或者成為理論的一部分。

小結(jié)一下,科學假說是指符合證據(jù)、同時可以被證實或者被反駁的猜測性解釋。

統(tǒng)計學中的假設(shè)又該如何定義呢?

大多統(tǒng)計問題是研究觀測樣本之間潛在關(guān)系。

統(tǒng)計學上的假設(shè)檢驗通常是計算產(chǎn)生“影響”的臨界值,通過計算臨界值可以來判定觀測樣本之間是否存在某種關(guān)系。

如果似然值很小,這種影響結(jié)果就可能會是真實的,如果似然值很大,那我們可能觀測到了統(tǒng)計波動,這種影響可能并不真實。

舉例來說,通過推斷兩組樣本之間均值所存在的關(guān)系,可以判斷它們是否具有相同的統(tǒng)計分布,或者它們之間又有哪些差異。

舉個例子,我們可以假設(shè)兩組樣本的均值相同。

這種假設(shè)對我們來說沒什么影響,也叫作零假設(shè)。通過假設(shè)檢驗,我們可以得到拒絕該假設(shè)或者保留該假設(shè)。即便我們不能拒絕零假設(shè),也不等于我們接受零假設(shè)是對的,因為結(jié)果只是一個概率。

..在社會科學研究中,我們通過建立假設(shè)、制定標準來衡量是否保留或拒絕我們的假設(shè),通常都是零假設(shè)。

《Statistics in plain English》2010年第三版,64-65頁

在我們的例子中,如果零假設(shè)被否定,其相對立的備擇假設(shè)就認為均值之間存在差異。

零假設(shè)(H0):沒有影響

備擇假設(shè)(H1):存在影響

統(tǒng)計學中的假設(shè)檢驗通常不會評判影響的大小,只會近似估計被觀測樣本之間是否存在差異。

小結(jié)一下,統(tǒng)計學中的假設(shè)指的是用概率來解釋樣本觀測值之間是否存在關(guān)系。

最后,什么是機器學習中的假設(shè)呢?

機器學習,尤其是監(jiān)督性學習,是用已有數(shù)據(jù)學習得到一個最佳的函數(shù)來表示輸入到輸出之間的映射關(guān)系。

說的專業(yè)些,這個叫做函數(shù)逼近。就是說我們想找到一個接近于我們目標函數(shù)(我們假設(shè)它存在)的方程,可以滿足在問題定義域里所有觀測結(jié)果都可以從輸入映射到輸出結(jié)果。

在機器學習中,一個近似目標函數(shù)并且將輸入映射到輸出的模型被稱為假設(shè)。

算法選?。ū热?a href="http://www.brongaenegriffin.com/tags/神經(jīng)網(wǎng)絡(luò)/" target="_blank">神經(jīng)網(wǎng)絡(luò))和算法配置(如網(wǎng)絡(luò)拓撲和超參數(shù))決定了模型可能表示的假設(shè)空間。

機器學習算法的學習是尋找最接近目標函數(shù)的假設(shè),即將已選取的假設(shè)空間轉(zhuǎn)化成最佳或最優(yōu)的假設(shè)。

“學習”是在可能的假設(shè)空間中尋找一個表現(xiàn)良優(yōu)的假設(shè)空間,即使在訓練集之外新樣本上也能適用。

選自《Artificial Intelligence: A Modern Approach》2009年第二版,第695頁。

這種機器學習的框架很常見,通??梢詭椭覀冞x取算法、理解學習和泛化問題,甚至是“偏差-方差”的權(quán)衡。舉例來說,訓練集通常是學習假設(shè),而測試數(shù)據(jù)集是用來評估假設(shè)。

我們通常會用小寫(h)來表示給予的特定假設(shè),用大寫(H)來表示被探索的假設(shè)空間。

假設(shè)(h):單一假設(shè),如一個實例或特定的候選模型,可以將輸入映射到輸出,同時也可以對模型進行評估和預測。

假設(shè)集(H):一個包括所有可能的輸入映射到輸出之間關(guān)系的假設(shè)空間,通常受選取的問題框架、模型和模型調(diào)參所限制。

在選擇算法和配置過程中,我們需要選取一個對目標函數(shù)來說是最好的逼近函數(shù)作為假設(shè)空間。這是非常具有挑戰(zhàn)的,通常對于一系列不同的假設(shè)空間進行抽查會更為有效。

如果假設(shè)空間包含真函數(shù),則學習問題是可實現(xiàn)的。不幸的是,我們不能總是判斷一個給定的學習問題是否可以實現(xiàn),因為真正的函數(shù)是未知的。

選自《Artificial Intelligence: A Modern Approach》2009年第二版,697頁。

這是一個困難的問題。通常,我們通過限制假設(shè)空間的大小和評估假設(shè)的復雜性來簡化搜索過程。

假設(shè)空間的表達性和假設(shè)搜索的復雜性之間存在一種權(quán)衡關(guān)系。

選自《Artificial Intelligence: A Modern Approach》2009年第二版,697頁。

小結(jié)一下,機器學習中的假設(shè)是一個近似目標函數(shù)的候選模型,用于表示輸入樣本到輸出樣本之間的映射關(guān)系。

總 結(jié)

讓我們重新梳理一遍對假設(shè)的三個定義:

科學假說是一種對于觀察現(xiàn)象的猜測性解釋,并且是可以被證偽的。

統(tǒng)計中的假設(shè)是用概率的方式來解釋數(shù)據(jù)樣本之間的關(guān)系。

機器學習中的假設(shè)是一個近似目標函數(shù)的候選模型,用于表示輸入樣本到輸出樣本之間的映射關(guān)系。

機器學習的假設(shè)定義要比科學中的定義更加廣泛。

和科學假說一樣,機器學習也是基于現(xiàn)有證據(jù),可以被證偽,并對新情況進行預測。

在機器學習中的假設(shè):

涵蓋現(xiàn)有證據(jù):即訓練數(shù)據(jù)集

可以被證偽:有一個測試集來評估模型表現(xiàn),并且與基礎(chǔ)模型作對比,確定訓練過程是否有效。

適用于新的情況:可被用來對新數(shù)據(jù)集進行預測。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107874
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4417

    瀏覽量

    67568
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8555

    瀏覽量

    136999

原文標題:“假設(shè)”家族大起底!如何正確區(qū)分科學假設(shè)、統(tǒng)計假設(shè)和機器學習假設(shè)?

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    景:神經(jīng)網(wǎng)絡(luò)中的權(quán)重矩陣計算、降維算法(如PCA)等。 概率論與數(shù)理統(tǒng)計核心內(nèi)容:貝葉斯定理、最大似然估計、假設(shè)檢驗等。應用場景:模型不確定性分析、A/B測試效果評估等。 微積分核心內(nèi)容:導數(shù)、梯度
    發(fā)表于 02-27 10:53

    假設(shè)系統(tǒng)的時鐘頻率是200k,延時10個時鐘周期是什么意思?

    本人基礎(chǔ)薄弱,對于時序的問題請教一下大家,希望大家多多批評指教。 假設(shè)系統(tǒng)的時鐘頻率是200k,延時10個時鐘周期是什么意思。 要求延時10個時鐘周期是怎么算出來的假設(shè)for(
    發(fā)表于 01-20 06:56

    機器學習和深度學習中需避免的 7 個常見錯誤與局限性

    ,并驗證輸出結(jié)果,就能不斷提升專業(yè)技能,養(yǎng)成優(yōu)秀數(shù)據(jù)科學家的工作習慣。需避免的機器學習和深度學習數(shù)據(jù)錯誤在訓練數(shù)據(jù)驅(qū)動的人工智能模型時,我們會遇到一些常見錯誤和局
    的頭像 發(fā)表于 01-07 15:37 ?212次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    電源效率的重要性與測量考慮因素

    電源效率對性能和成本效益都至關(guān)重要,影響著能源使用、運行可靠性和長期節(jié)約。假設(shè)一個典型電源的運行壽命為五年,那么由于效率較低而浪費的能源將比原始電源的成本更高!
    的頭像 發(fā)表于 01-07 09:29 ?765次閱讀
    電源效率的重要性與測量考慮因素

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護科學

    損壞的風險(所有浸入水中的技術(shù)設(shè)備都是如此),這意味著數(shù)據(jù)可能會在不知不覺中丟失,而基線數(shù)據(jù)集的后續(xù)缺口可能會妨礙科學家得出具有統(tǒng)計意義的可靠結(jié)論。 在邊緣部署深度學習模型可以規(guī)避自主記錄器數(shù)據(jù)
    發(fā)表于 10-27 09:18

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    AI被賦予了人的智能,科學家們希望在沒有人類的引導下,AI自主的提出科學假設(shè),諾貝爾獎級別的假設(shè)哦。 AI驅(qū)動科學被認為是
    發(fā)表于 09-17 11:45

    橫河示波器如何使用統(tǒng)計功能

    使用統(tǒng)計功能,可以對波形自動測量的參數(shù)進行5種類型的統(tǒng)計:最大值、最小值、平均值、標準偏差、統(tǒng)計運算測量值的個數(shù)。我們最多可以統(tǒng)計9個自動測量的項目,而且可以把
    的頭像 發(fā)表于 07-23 17:49 ?903次閱讀
    橫河示波器如何使用<b class='flag-5'>統(tǒng)計</b>功能<b class='flag-5'>呢</b>?

    經(jīng)顱電刺激系列之相移經(jīng)顱交流電刺激Phase-shifted tACS

    高階認知網(wǎng)絡(luò)(如前額葉-頂葉網(wǎng)絡(luò))的調(diào)控缺乏直接證據(jù)。機制單一性:假設(shè)刺激電流與皮層興奮性呈線性關(guān)系,即電流幅度的瞬時變化直接決定神經(jīng)響應。然而,此假設(shè)無法解釋復
    的頭像 發(fā)表于 06-09 18:37 ?1277次閱讀
    經(jīng)顱電刺激系列之相移經(jīng)顱交流電刺激Phase-shifted tACS

    comp輸出用于tim1剎車,消隱源和pwm輸出是不是得是同一個TIM?

    那不是一個定時器的話 怎么能保證COMP1的消隱觸發(fā)同步?假設(shè)pwm輸出是tim1_ch2,那么我消隱源可以選tim4_oc3?是不是tim1_oc5跟合理?
    發(fā)表于 06-09 07:12

    comp輸出用于tim1剎車,消隱源和pwm輸出是不是得是同一個TIM呀?

    那不是一個定時器的話 怎么能保證COMP1的消隱觸發(fā)同步?假設(shè)pwm輸出是tim1_ch2,那么我消隱源可以選tim4_oc3?是不是tim1_oc5跟合理?
    發(fā)表于 06-05 06:10

    碳化硅襯底厚度測量中探頭溫漂的熱傳導模型與實驗驗證

    模型假設(shè)與簡化 為便于建模,對探頭結(jié)構(gòu)及熱傳導過程進行假設(shè)與簡化。假設(shè)探頭各部件為均勻連續(xù)介質(zhì),忽略探頭內(nèi)部微觀結(jié)構(gòu)差異對熱傳導的影響;熱傳導過程遵循傅里葉定律
    的頭像 發(fā)表于 06-04 09:37 ?548次閱讀
    碳化硅襯底厚度測量中探頭溫漂的熱傳導模型與實驗驗證

    想從linux系統(tǒng)讀回CYC65215部件的配置程序映像,并檢查其CRC是否正確(假設(shè)它有附加 CRC),圖像有CRC嗎?

    我想從 linux 系統(tǒng)讀回 CYC65215 部件的配置程序映像,并檢查其 CRC 是否正確(假設(shè)它有附加 CRC)。圖像有 CRC 嗎? CRC 是否使用標準多項式的已知算法生成? 如果是,是哪條多項式?
    發(fā)表于 05-23 06:22

    VirtualLab Fusion:精確的物理和數(shù)值控制

    速度vs.精度面板包含了不同的與采樣相關(guān)工具的選擇,例如奈奎斯特采樣,包括使用易于控制的滑塊來指定更偏向速度或更偏向精度。 傍軸假設(shè)面板允許用戶對系統(tǒng)應用近似值,從而加快傍軸系統(tǒng)的模擬時間。 速度
    發(fā)表于 05-15 10:33

    comp輸出用于tim1剎車,消隱源和pwm輸出是不是得是同一個TIM?

    那不是一個定時器的話 怎么能保證COMP1的消隱觸發(fā)同步假設(shè)pwm輸出是tim1_ch2,那么我消隱源可以選tim4_oc3?是不是tim1_oc5跟合理?
    發(fā)表于 05-14 08:14

    MOSFET講解-13(可下載)

    這種單橋臂載波的管子,哪個管子發(fā)熱會大?MOS管的四大損耗:開通損耗,關(guān)斷損耗,導通損耗,續(xù)流損耗上橋臂載波情況下:假設(shè)I=1A,Rdson=3mΩ。所以導通損耗:P=I^2*Rdson=3mW續(xù)
    發(fā)表于 04-21 13:35 ?4次下載