chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)中賦予了什么數(shù)學(xué)意義

姚小熊27 ? 來源:雷鋒網(wǎng) ? 作者:雷鋒網(wǎng) ? 2020-10-14 09:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機(jī)器學(xué)習(xí)中的用于聲稱性能的指標(biāo)標(biāo)準(zhǔn)很少被討論。由于在這個(gè)問題上似乎沒有一個(gè)明確的、廣泛的共識(shí),因此我認(rèn)為提供我一直在倡導(dǎo)并盡可能遵循的標(biāo)準(zhǔn)可能會(huì)很有趣。它源于這個(gè)簡(jiǎn)單的前提,這是我的科學(xué)老師從中學(xué)開始就灌輸給我的:

科學(xué)報(bào)告的一般規(guī)則是,您寫下的每個(gè)數(shù)字都應(yīng)為“真”的,因?yàn)椤罢妗钡亩x是什么。

讓我們來研究一下這對(duì)測(cè)試性能等統(tǒng)計(jì)量意味著什么。當(dāng)你在科學(xué)出版物中寫下以下陳述時(shí):

測(cè)試準(zhǔn)確率為52.34%。你所表達(dá)的是,據(jù)你所知,你的模型在從測(cè)試分布中提取的未見數(shù)據(jù)上成功的概率在0.52335和0.52345之間。

這是一個(gè)非常強(qiáng)有力的聲明。

考慮你的測(cè)試集是從正確的測(cè)試分布中抽取的N個(gè)樣本IID組成的。成功率可以表示為一個(gè)二項(xiàng)式變量,其平均概率p由樣本平均值估計(jì):p?s/N

其標(biāo)準(zhǔn)差為:σ=√p(1-p)。

其中當(dāng)p=0.5時(shí),其上限為0.5。

在正態(tài)近似下,估計(jì)量的標(biāo)準(zhǔn)差為:δ=σ/√N(yùn)。

這個(gè)精度估計(jì)上的誤差δ是這樣的,在最壞的情況下,有約50%的精度:

換句話說,為了保證上述報(bào)告中例子52.34%的準(zhǔn)確率,你的測(cè)試集的大小至少應(yīng)該在30M樣本的數(shù)量級(jí)上!這種粗略的分析很容易轉(zhuǎn)化為除了準(zhǔn)確率以外的任何可計(jì)算的數(shù)量,盡管不能轉(zhuǎn)化為像似然率或困惑度這樣的連續(xù)數(shù)字。

下面是一些常見的機(jī)器學(xué)習(xí)數(shù)據(jù)集的說明。

在ImageNet上可以合理地報(bào)告多少位數(shù)的精度?準(zhǔn)確率在80%左右,測(cè)試集是15萬張圖片:

√(0.8*0.2/150000)=0.103%

這意味著你幾乎可以報(bào)告XX.X%的數(shù)字,而實(shí)際上每個(gè)人都是這樣做的。

MNIST呢,準(zhǔn)確率在99%:

√(0.99*0.01/10000)=0.099%

噗,也報(bào)個(gè)XX.X%就OK了!

然而,最值得注意的是,在大多數(shù)情況下,性能數(shù)據(jù)并不是單獨(dú)呈現(xiàn)的,而是用來比較同一測(cè)試集上的多種方法。在這種情況下,實(shí)驗(yàn)之間的抽樣方差會(huì)被抵消,即使在樣本量較小的情況下,它們之間的準(zhǔn)確度差異也可能在統(tǒng)計(jì)學(xué)上很顯著。估計(jì)圖方差的一個(gè)簡(jiǎn)單方法是執(zhí)行bootstrap重采樣。更嚴(yán)格、通常更嚴(yán)格的檢驗(yàn)包括進(jìn)行配對(duì)差異檢驗(yàn)或更普遍的方差分析。

報(bào)告超出其內(nèi)在精度的數(shù)字可能很具有極大的吸引力,因?yàn)樵谂c基線進(jìn)行比較的情況下,或者當(dāng)人們認(rèn)為測(cè)試集是一成不變的情況下,同時(shí)也不是從測(cè)試分布中抽取的樣本時(shí),性能數(shù)字往往更加重要。當(dāng)在生產(chǎn)中部署模型時(shí),這種做法會(huì)讓人感到驚訝,并且固定的測(cè)試集假設(shè)突然消失了,還有一些無關(guān)緊要的改進(jìn)。更普遍的是,這種做法會(huì)直接導(dǎo)致對(duì)測(cè)試集進(jìn)行過擬合。

那么,在我們的領(lǐng)域中數(shù)字為“真”意味著什么?好吧,這確實(shí)很復(fù)雜。對(duì)于工程師而言,很容易辯稱不應(yīng)該報(bào)告的尺寸超出公差?;蛘邔?duì)于物理學(xué)家來說,物理量不應(yīng)超過測(cè)量誤差。對(duì)于機(jī)器學(xué)習(xí)從業(yè)者,我們不僅要應(yīng)對(duì)測(cè)試集的采樣不確定性,而且還要應(yīng)對(duì)獨(dú)立訓(xùn)練運(yùn)行,訓(xùn)練數(shù)據(jù)的不同初始化和改組下的模型不確定性。

按照這個(gè)標(biāo)準(zhǔn),在機(jī)器學(xué)習(xí)中很難確定哪些數(shù)字是“真”的。解決辦法當(dāng)然是盡可能地報(bào)告其置信區(qū)間。置信區(qū)間是一種更精細(xì)的報(bào)告不確定性的方式,可以考慮到所有隨機(jī)性的來源,以及除簡(jiǎn)單方差之外的顯著性檢驗(yàn)。它們的存在也向你的讀者發(fā)出信號(hào),表明你已經(jīng)考慮過你所報(bào)告的內(nèi)容的意義,而不僅僅是你的代碼所得到的數(shù)字。用置信區(qū)間表示的數(shù)字可能會(huì)被報(bào)告得超出其名義上的精度,不過要注意的是,你現(xiàn)在必須考慮用多少位數(shù)來報(bào)告不確定性,正如這篇博文所解釋的那樣。一路走來都是烏龜。

數(shù)字少了,雜亂無章的東西就少了,科學(xué)性就強(qiáng)了。

避免報(bào)告超出統(tǒng)計(jì)學(xué)意義的數(shù)字結(jié)果,除非你為它們提供一個(gè)明確的置信區(qū)間。這理所當(dāng)然地被認(rèn)為是科學(xué)上的不良行為,尤其是在沒有進(jìn)行配對(duì)顯著性測(cè)試的情況下,用來論證一個(gè)數(shù)字比另一個(gè)數(shù)字好的時(shí)候。僅憑這一點(diǎn)就經(jīng)常有論文被拒絕。一個(gè)良好的習(xí)慣是對(duì)報(bào)告中帶有大量數(shù)字的準(zhǔn)確率數(shù)字始終持懷疑態(tài)度。還記得3000萬、30萬和30萬的經(jīng)驗(yàn)法則對(duì)最壞情況下作為“嗅覺測(cè)試”的統(tǒng)計(jì)顯著性所需樣本數(shù)量的限制嗎?它會(huì)讓你避免追逐統(tǒng)計(jì)上的“幽靈”。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    CRC校驗(yàn)的本質(zhì)和物理意義

    工業(yè)控制系統(tǒng),Modbus RTU協(xié)議的CRC校驗(yàn)如同通信網(wǎng)絡(luò)的\"免疫系統(tǒng)\",某石化廠DCS系統(tǒng)曾因CRC計(jì)算錯(cuò)誤導(dǎo)致0.3%的數(shù)據(jù)包丟失,引發(fā)連鎖控制故障。 一、CRC
    發(fā)表于 11-13 07:58

    量子機(jī)器學(xué)習(xí)入門:三種數(shù)據(jù)編碼方法對(duì)比與應(yīng)用

    在傳統(tǒng)機(jī)器學(xué)習(xí)數(shù)據(jù)編碼確實(shí)相對(duì)直觀:獨(dú)熱編碼處理類別變量,標(biāo)準(zhǔn)化調(diào)整數(shù)值范圍,然后直接輸入模型訓(xùn)練。整個(gè)過程更像是數(shù)據(jù)清洗,而非核心算法組件。量子機(jī)器
    的頭像 發(fā)表于 09-15 10:27 ?497次閱讀
    量子<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>入門:三種數(shù)據(jù)編碼方法對(duì)比與應(yīng)用

    FPGA在機(jī)器學(xué)習(xí)的具體應(yīng)用

    ,越來越多地被應(yīng)用于機(jī)器學(xué)習(xí)任務(wù)。本文將探討 FPGA 在機(jī)器學(xué)習(xí)的應(yīng)用,特別是在加速神經(jīng)網(wǎng)
    的頭像 發(fā)表于 07-16 15:34 ?2648次閱讀

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】+ROS2應(yīng)用案例

    這一部分內(nèi)容,我掌握了如何在ROS 2實(shí)現(xiàn)SLAM,這對(duì)于提高機(jī)器人的自主導(dǎo)航能力具有重要意義。 其他內(nèi)容概述 除了二維碼識(shí)別和SLAM技術(shù),書中還介紹其他視覺應(yīng)用和地圖構(gòu)建的內(nèi)
    發(fā)表于 04-27 11:42

    LD Gen2 Lite激光雷達(dá):賦予機(jī)器人 “感知力” 的關(guān)鍵

    機(jī)器人的感知世界里,激光雷達(dá)宛如一雙敏銳的“慧眼”,賦予機(jī)器人“看”清周圍環(huán)境、自主決策的能力。亮道智能最新推出的純固態(tài)Flash短距激光雷達(dá)LD Gen2 Lite,憑借其獨(dú)特的技術(shù)優(yōu)勢(shì),在
    的頭像 發(fā)表于 04-25 10:42 ?536次閱讀

    嵌入式AI技術(shù)之深度學(xué)習(xí):數(shù)據(jù)樣本預(yù)處理過程中使用合適的特征變換對(duì)深度學(xué)習(xí)意義

    ? 作者:蘇勇Andrew 使用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí),網(wǎng)絡(luò)的每個(gè)層都將對(duì)輸入的數(shù)據(jù)做一次抽象,多層神經(jīng)網(wǎng)絡(luò)構(gòu)成深度學(xué)習(xí)的框架,可以深度理解數(shù)據(jù)中所要表示的規(guī)律。從原理上看,使用深度學(xué)習(xí)
    的頭像 發(fā)表于 04-02 18:21 ?1295次閱讀

    工業(yè)機(jī)器人工作站的建設(shè)意義

    生產(chǎn)流程,減少生產(chǎn)環(huán)節(jié)的浪費(fèi)和延誤,進(jìn)一步提升生產(chǎn)效率。上海桐爾提供的解決方案能夠幫助企業(yè)實(shí)現(xiàn)高效、穩(wěn)定的生產(chǎn)模式,提升市場(chǎng)競(jìng)爭(zhēng)力。 其次,工業(yè)機(jī)器人工作站的建設(shè)有助于改善作業(yè)環(huán)境,降低操作難度。通過
    發(fā)表于 03-17 14:49

    機(jī)器學(xué)習(xí)模型市場(chǎng)前景如何

    當(dāng)今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長(zhǎng)以及計(jì)算能力的飛速提升,機(jī)器學(xué)習(xí)模型的市場(chǎng)前景愈發(fā)廣闊。下面,AI部落小編將探討機(jī)器學(xué)習(xí)模型市場(chǎng)的未來發(fā)展。
    的頭像 發(fā)表于 02-13 09:39 ?631次閱讀

    蘋果曝光高情商臺(tái)燈機(jī)器

    蘋果內(nèi)部機(jī)器人技術(shù)研究團(tuán)隊(duì)近日發(fā)布一篇最新論文,介紹一款名為“ELEGNT”的框架。該框架專為日?;?dòng)的非人形機(jī)器人設(shè)計(jì),旨在
    的頭像 發(fā)表于 02-10 17:57 ?1004次閱讀

    數(shù)學(xué)專業(yè)轉(zhuǎn)人工智能方向:考研/就業(yè)前景分析及大學(xué)四年學(xué)習(xí)路徑全揭秘

    隨著AI技術(shù)的不斷進(jìn)步,專業(yè)人才的需求也日益增長(zhǎng)。數(shù)學(xué)作為AI的基石,為機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)分析等提供理論基礎(chǔ)和工具,因此越來越多的
    的頭像 發(fā)表于 02-07 11:14 ?1716次閱讀
    <b class='flag-5'>數(shù)學(xué)</b>專業(yè)轉(zhuǎn)人工智能方向:考研/就業(yè)前景分析及大學(xué)四年<b class='flag-5'>學(xué)習(xí)</b>路徑全揭秘

    嵌入式機(jī)器學(xué)習(xí)的應(yīng)用特性與軟件開發(fā)環(huán)境

    作者:DigiKey Editor 在許多嵌入式系統(tǒng),必須采用嵌入式機(jī)器學(xué)習(xí)(Embedded Machine Learning)技術(shù),這是指將機(jī)器
    的頭像 發(fā)表于 01-25 17:05 ?1235次閱讀
    嵌入式<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的應(yīng)用特性與軟件開發(fā)環(huán)境

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章,我們介紹機(jī)器學(xué)習(xí)的關(guān)鍵概念術(shù)語。在本文中,我們會(huì)介紹傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)和多
    的頭像 發(fā)表于 12-30 09:16 ?1986次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺(tái)因其彈性擴(kuò)展、高效部署、低成本運(yùn)營(yíng)等優(yōu)勢(shì),逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場(chǎng)上的云原生機(jī)器
    的頭像 發(fā)表于 12-25 11:54 ?708次閱讀

    zeta在機(jī)器學(xué)習(xí)的應(yīng)用 zeta的優(yōu)缺點(diǎn)分析

    在探討ZETA在機(jī)器學(xué)習(xí)的應(yīng)用以及ZETA的優(yōu)缺點(diǎn)時(shí),需要明確的是,ZETA一詞在不同領(lǐng)域可能有不同的含義和應(yīng)用。以下是根據(jù)不同領(lǐng)域的ZETA進(jìn)行的分析: 一、ZETA在機(jī)器
    的頭像 發(fā)表于 12-20 09:11 ?1634次閱讀

    cmp在機(jī)器學(xué)習(xí)的作用 如何使用cmp進(jìn)行數(shù)據(jù)對(duì)比

    機(jī)器學(xué)習(xí)領(lǐng)域,"cmp"這個(gè)術(shù)語可能并不是一個(gè)常見的術(shù)語,它可能是指"比較"(comparison)的縮寫。 比較在機(jī)器學(xué)習(xí)的作用 模型
    的頭像 發(fā)表于 12-17 09:35 ?1334次閱讀