chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

八種不同類型的抽樣技術(shù)介紹

汽車玩家 ? 來源:人工智能遇見磐創(chuàng) ? 作者:人工智能遇見磐創(chuàng) ? 2020-05-04 08:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

介紹

你肯定很熟悉以下情況:你下載了一個比較大的數(shù)據(jù)集,并開始分析并建立你的機器學(xué)習(xí)模型。當(dāng)加載數(shù)據(jù)集時,你的計算機會爆出"內(nèi)存不足"錯誤。

即使是最優(yōu)秀的人也會遇到這種事。這是我們在數(shù)據(jù)科學(xué)中面臨的最大障礙之一,在受計算限制的計算機上處理大量數(shù)據(jù)(并非所有人都擁有Google的資源實力!)。

那么我們?nèi)绾慰朔@個問題呢?是否有一種方法可以選擇數(shù)據(jù)的子集并進行分析,并且該子集可以很好地表示整個數(shù)據(jù)集?

這種方法稱為抽樣。我相信你在學(xué)校期間,甚至在你的職業(yè)生涯中,都會遇到這個名詞很多次。抽樣是合成數(shù)據(jù)子集并進行分析的好方法。但是,那我們只是隨機取一個子集呢?

我們將在本文中進行討論。我們將討論八種不同類型的抽樣技術(shù),以及每種方法的使用場景。這是一篇適合初學(xué)者的文章,會介紹一些統(tǒng)計的知識

目錄

什么是抽樣?

為什么我們需要抽樣?

抽樣步驟

不同類型的抽樣技術(shù)

概率抽樣的類型

非概率抽樣的類型

什么是抽樣?

讓我們從正式定義什么是抽樣開始。

抽樣是一種方法,它使我們能夠基于子集(樣本)的統(tǒng)計信息來獲取總體信息,而無需調(diào)查所有樣本。

上圖完美地說明了什么是抽樣。讓我們通過一個例子更直觀的進行理解。

我們想要找到Delhi這個城市所有成年男性的平均身高。Delhi的人口大約為3千萬,男性大約為1500萬(這些都是假想數(shù)據(jù),不要當(dāng)成實際情況了)。你可以想象,要找到Delhi所有男性的身高來計算平均身高幾乎是不可能的。

我們不可能接觸到所有男性,因此我們無法真正分析整個人口。那么,什么可以我們做的呢?我們可以提取多個樣本,并計算所選樣本中個體的平均身高。

但是,接下來我們又提出了一個問題,我們?nèi)绾稳?我們應(yīng)該隨機抽樣嗎?還是我們必須問專家?

假設(shè)我們?nèi)セ@球場,以所有職業(yè)籃球運動員的平均身高作為樣本。這將不是一個很好的樣本,因為一般來說,籃球運動員的身高比普通男性高,這將使我們對普通男性的身高沒有正確的估計。

這里有一個解決方案,我們在隨機的情況下隨機找一些人,這樣我們的樣本就不會因為身高的不同而產(chǎn)生偏差。

為什么我們需要抽樣?

我確定你在這一點上已經(jīng)有了直覺的答案。

抽樣是為了從樣本中得出關(guān)于群體的結(jié)論,它使我們能夠通過直接觀察群體的一部分(樣本)來確定群體的特征。

選擇一個樣本比選擇一個總體中的所有個體所需的時間更少

樣本選擇是一種經(jīng)濟有效的方法

對樣本的分析比對整個群體的分析更方便、更實用

抽樣步驟

將概念形象化是在記憶的好方法。因此,這是一個以流程圖形式逐步進行抽樣的流程圖!

讓我們以一個有趣的案例研究為例,將這些步驟應(yīng)用于執(zhí)行抽樣。幾個月前,我們在印度舉行了大選。你一定看過當(dāng)時每個新聞頻道的民意調(diào)查:

這些結(jié)果是根據(jù)全國9億選民的意見得出的還是根據(jù)這些選民的一小部分得出的?讓我們看看是怎么做的。

第一步

抽樣過程的第一步是明確定義目標(biāo)群體。

因此,為了進行民意調(diào)查,投票機構(gòu)僅考慮18歲以上且有資格在人口中投票的人。

第二步

抽樣框架(Sampling Frame)–這是構(gòu)成樣本總體的個體列表。

因此,這個例子的抽樣框架將是是名字出現(xiàn)在一個選區(qū)的所有投票人列表。

第三步

一般來說,使用概率抽樣方法是因為每一張選票都有相等的價值。不考慮種姓、社區(qū)或宗教,任何人都可以被包括在樣本中。不同的樣品取自全國各地不同的地區(qū)。

第四步

樣本量(Sample Size)-是指樣本中所包含的個體的數(shù)量,這些個體的數(shù)量需要足量以對期望的準(zhǔn)確度和精度進行推斷。

樣本量越大,我們對總體的推斷就越準(zhǔn)確。

在民意調(diào)查中,各機構(gòu)試圖讓盡可能多的不同背景的人參與抽樣調(diào)查,因為這有助于預(yù)測一個政黨可能贏得的席位數(shù)量。

第五步

一旦確定了目標(biāo)人群,抽樣框架,抽樣技術(shù)和樣本數(shù)量,下一步就是從樣本中收集數(shù)據(jù)。

在民意測驗中,機構(gòu)通常會向人民提出問題,例如他們要投票給哪個政黨或前政黨做了什么工作,等等。

根據(jù)答案,各機構(gòu)試圖解釋選民投票給誰,以及一個政黨要贏得多少席位。

不同類型的抽樣技術(shù)

這里是另一個圖解!這一個是關(guān)于我們可以使用的不同類型的采樣技術(shù):

概率抽樣: 在概率抽樣中,總體中的每個個體都有相等的被選中的機會。概率抽樣給了我們最好的機會去創(chuàng)造一個真正代表總體的樣本

非概率抽樣:在非概率抽樣中,所有元素被選中的機會都不相等。因此,有一個顯著的風(fēng)險,即最終得到一個不具代表性的樣本,它不會產(chǎn)生可推廣的結(jié)果

例如,假設(shè)我們的人口由20個人組成。每個個體的編號從1到20,并由特定的顏色(紅色、藍色、綠色或黃色)表示。在概率抽樣中,每個人被選中的概率是1/20。

對于非概率抽樣,這些概率是不相等的。一個人被選中的機會可能比別人大?,F(xiàn)在我們對這兩種抽樣類型有了一定的了解,讓我們分別深入了解每種抽樣類型,并理解每種抽樣的不同類型。

概率抽樣的類型

簡單隨機抽樣

這是你一定要遇到的一種抽樣技術(shù)。在這里,每個人都是完全由隨機選擇的,人口中的每個成員都有被選擇的機會。

簡單的隨機抽樣可減少選擇偏差。

這種技術(shù)的一大優(yōu)點是它是最直接的概率抽樣方法。但它有一個缺點,它可能不會選擇特別多我們真正感興趣的個體元素。蒙特卡羅方法采用重復(fù)隨機抽樣的方法對未知參數(shù)進行估計。

系統(tǒng)抽樣

在這種類型的抽樣中,第一個個體是隨機選擇的,其他個體是使用固定的“抽樣間隔”選擇的。讓我們舉一個簡單的例子來理解這一點。

假設(shè)我們的總體大小是x,我們必須選擇一個樣本大小為n的樣本,然后,我們要選擇的下一個個體將是距離第一個個體的x/n個間隔。我們可以用同樣的方法選擇其余的。

假設(shè),我們從第3個人開始,樣本容量是5。因此,我們要選擇的下一個個體將是(20/5)= 4,從第3個人開始,即7(3+4),依此類推。

3、3+4=7、7+4=11、11+4=15、15+4=19 . 3、7、11、15、19

系統(tǒng)抽樣比簡單隨機抽樣更方便。然而,如果我們在人群中選擇項目時存在一種潛在的模式,這也可能導(dǎo)致偏差(盡管這種情況發(fā)生的幾率非常低)。

分層抽樣

在這種類型的抽樣中,我們根據(jù)不同的特征,如性別、類別等,把人口分成子組(稱為層)。然后我們從這些子組中選擇樣本:

在這里,我們首先根據(jù)紅、黃、綠、藍等不同的顏色將我們的種群分成不同的子組。然后,從每一種顏色中,我們根據(jù)它們在人口中的比例選擇一個個體。

當(dāng)我們想要從總體的所有子組中得到表示時,我們使用這種類型的抽樣。然而,分層抽樣需要適當(dāng)?shù)娜丝谔卣鞯闹R。

整群抽樣

在整群抽樣中,我們使用總體的子組作為抽樣單位,而不是個體。全體樣本被分為子組,稱為群,并隨機選擇一個完整的群作為抽樣樣本。

在上面的例子中,我們將人口分為5個群。每個群由4個個體組成,我們在樣本中選取了第4個群。我們可以根據(jù)樣本大小包含更多的群。

當(dāng)我們集中在一個特定領(lǐng)域或區(qū)域時,就會使用這種類型的抽樣。

非概率抽樣的類型

便利抽樣

這可能是最簡單的抽樣方法,因為個人的選擇是基于他們的可用性和參與意愿。

這里,假設(shè)編號為4、7、12、15和20的個體想要成為樣本的一部分,因此,我們將把它們包含在樣本中。

便利抽樣容易產(chǎn)生顯著的偏見,因為抽樣可能不能代表諸如宗教或人口的性別等具體特征。

配額抽樣

在這種抽樣中,我們根據(jù)預(yù)先確定的總體特征來選擇樣本??紤]到我們必須為我們的樣本我們選擇一個倍數(shù)為4的個體:

因此,編號為4、8、12、16和20的個人已經(jīng)為我們的樣本保留。

在配額抽樣中,選擇的樣本可能不是未考慮的人口特征的最佳代表。

判斷抽樣

這也稱為選擇性抽樣。在選擇要求參加者時,取決于專家判斷。

假設(shè),我們的專家認(rèn)為,應(yīng)該將編號為1、7、10、15和19的人作為我們的樣本,因為它們可以幫助我們更好地推斷人口。你可以想象,配額抽樣同樣也容易受到專家的偏見,不一定具有代表性。

雪球抽樣

我很喜歡這種抽樣方法。現(xiàn)有的人被要求推薦更多他們認(rèn)識的人,這樣樣本的大小就會像滾雪球一樣增加。當(dāng)抽樣框架難以識別時,這種采樣方法是有效的。

在這里,我們隨機選擇了1個人作為樣本,然后他推薦了6個人,6個人推薦了11個人,依此類推。

1-> 6-> 11-> 14-> 19

雪球抽樣有很大的選擇偏見風(fēng)險,因為被引用的個體將與推薦他們的個體具有共同的特征。

結(jié)尾

在本文中,我們了解了抽樣的概念,抽樣所涉及的步驟以及不同類型的抽樣方法。抽樣在統(tǒng)計世界和現(xiàn)實世界中都有廣泛的應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1789

    瀏覽量

    58862
  • 抽樣
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    7256
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    VirtualLab Fusion應(yīng)用:通過熱透鏡聚焦不同類型的高斯模式

    的精確物理光學(xué)傳播技術(shù)可以對焦點區(qū)域進行詳細分析,尤其是對于不同類型的高斯模式和熱透鏡等復(fù)雜聚焦元件。 Ince高斯光束聚焦 此用例演示了熱透鏡對 Ince-Gaussian模式的聚焦,該透鏡由
    發(fā)表于 02-17 09:55

    電源管理IC的種類型

    工程師必知:電源管理IC的種類型 引 言 在日常生活中,人們對電子設(shè)備的依賴越來越嚴(yán)重,電子技術(shù)的更新?lián)Q代,也同時意味著人們對電源的技術(shù)發(fā)展寄予厚望,下面就為大家
    的頭像 發(fā)表于 01-20 09:50 ?3176次閱讀

    同類型光敏電阻的優(yōu)缺點

    光敏電阻概述 光敏電阻,也稱為光敏電阻器或光敏元件,是一光敏元件,其電阻值隨入射光的強度變化而變化。它們通常由半導(dǎo)體材料制成,如硫化鎘(CdS)、硒化鎘(CdSe)和硒化鉛(PbSe)等。 不同類型
    的頭像 發(fā)表于 01-13 09:43 ?1053次閱讀

    同類型機器人及其所需的滑環(huán)種類

    機器人一直是導(dǎo)電滑環(huán)的一個重要的應(yīng)用領(lǐng)域,由于所對應(yīng)的行業(yè)或者應(yīng)用場景不同,機器人也被分成很多類型,比較常見的分類是工業(yè)機器人、消費級機器人以及特種行業(yè)機器人。這些不同類型的機器人,使用的導(dǎo)電滑環(huán)
    的頭像 發(fā)表于 01-10 12:24 ?416次閱讀

    同類型耦合器的優(yōu)缺點 耦合器與聯(lián)軸器的區(qū)別

    耦合器和聯(lián)軸器都是用于連接兩個旋轉(zhuǎn)軸的機械裝置,但它們在設(shè)計、功能和應(yīng)用上有所不同。以下是關(guān)于不同類型耦合器的優(yōu)缺點、耦合器與聯(lián)軸器的區(qū)別的介紹: 不同類型耦合器的優(yōu)缺點 1. 剛性耦合器 優(yōu)點
    的頭像 發(fā)表于 12-10 15:20 ?1986次閱讀

    同類型PROM器件的比較分析

    同類型PROM器件的比較分析: 一、基本特性 類型 編程次數(shù) 擦除方式 數(shù)據(jù)保存期限 主要特點 PROM 一次 不可擦除 永久 數(shù)據(jù)一旦寫入便不可更改,可靠性高,但靈活性差 EPROM 多次 紫外線擦除 較長 可多次編程,但擦除
    的頭像 發(fā)表于 11-23 11:30 ?1549次閱讀

    同類型adc的優(yōu)缺點分析

    ADC(模數(shù)轉(zhuǎn)換器)是將模擬信號轉(zhuǎn)換為數(shù)字信號的電路,根據(jù)轉(zhuǎn)換原理和應(yīng)用需求的不同,ADC可以分為多種類型,每種類型都有其獨特的優(yōu)缺點,以下是對不同類型ADC的優(yōu)缺點分析: 逐次逼近型ADC(SAR
    的頭像 發(fā)表于 11-19 16:58 ?2815次閱讀

    同類型電感封裝規(guī)格變化對性能有影響嗎

    電子發(fā)燒友網(wǎng)站提供《同類型電感封裝規(guī)格變化對性能有影響嗎.docx》資料免費下載
    發(fā)表于 11-04 10:26 ?0次下載

    同類型電力電容器的比較

    電力電容器是一用于存儲電能的被動電子元件,它們在電力系統(tǒng)中發(fā)揮著至關(guān)重要的作用。通過補償無功功率,電力電容器有助于減少線路損耗、提高電壓穩(wěn)定性,并降低能源成本。 不同類型的電力電容器 油浸式電力
    的頭像 發(fā)表于 11-04 09:26 ?1182次閱讀

    如何識別不同類型的高清線接口

    的高清線接口類型 在識別高清線接口之前,我們需要了解一些常見的接口類型,包括但不限于: HDMI(High-Definition Multimedia Interface) :這是一廣泛使用的高清接口,支持視頻和音頻信號的傳輸
    的頭像 發(fā)表于 10-30 16:07 ?1566次閱讀

    同類型AD轉(zhuǎn)換器的比較

    (Integrating ADC)、閃存型(Flash ADC)以及其他如Σ-Δ(Sigma-Delta)調(diào)制型等。以下是對這些不同類型AD轉(zhuǎn)換器的詳細比較。
    的頭像 發(fā)表于 10-05 11:36 ?4996次閱讀

    同類型變電所的特點

    的配置和設(shè)備,以適應(yīng)其操作的需求和提高整個系統(tǒng)的效率和可靠性。下面詳細介紹這些不同類型的變電所及其特點。 1. 樞紐變電所 位置和作用:樞紐變電所通常位于電力系統(tǒng)的關(guān)鍵節(jié)點,起到匯集和分配大規(guī)模電能的核心作用。這類
    的頭像 發(fā)表于 08-30 10:40 ?1342次閱讀

    同類型熱電偶的區(qū)別在哪

    同類型熱電偶的區(qū)別主要體現(xiàn)在材料組成、測溫范圍、精度、穩(wěn)定性、價格以及適用環(huán)境等多個方面。以下是對幾種常見熱電偶類型的詳細比較和分析。
    的頭像 發(fā)表于 08-28 18:16 ?3533次閱讀

    同類型神經(jīng)網(wǎng)絡(luò)在回歸任務(wù)中的應(yīng)用

    神經(jīng)網(wǎng)絡(luò)是一強大的機器學(xué)習(xí)模型,可以用于各種任務(wù),包括回歸。在本文中,我們將討論不同類型的神經(jīng)網(wǎng)絡(luò),以及它們在回歸任務(wù)中的應(yīng)用。 基本的神經(jīng)網(wǎng)絡(luò) 基本的神經(jīng)網(wǎng)絡(luò),也稱為多層感知器(MLP),是一
    的頭像 發(fā)表于 07-11 10:27 ?2009次閱讀

    水冷液冷負(fù)載系統(tǒng)的六基本類型

    您可以選擇六基本類型的冷卻系統(tǒng),以滿足負(fù)載的冷卻需求。每個人都有其優(yōu)點和缺點。本文旨在識別不同類型的冷卻系統(tǒng)并確定它們的優(yōu)缺點,以便您可以根據(jù)自己的需求做出明智的選擇。
    的頭像 發(fā)表于 07-08 07:35 ?960次閱讀
    水冷液冷負(fù)載系統(tǒng)的六<b class='flag-5'>種</b>基本<b class='flag-5'>類型</b>