chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習特征工程的五個方面優(yōu)點

汽車玩家 ? 來源:今日頭條 ? 作者:不一樣的程序猿 ? 2020-03-15 16:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

特征工程是用數(shù)學轉(zhuǎn)換的方法將原始輸入數(shù)據(jù)轉(zhuǎn)換為用于機器學習模型的新特征。特征工程提高了機器學習模型的準確度和計算效率,體現(xiàn)在以下五個方面

1、把原始數(shù)據(jù)轉(zhuǎn)換成與目標相關(guān)的數(shù)據(jù)

我們可以使用特征工程對原始數(shù)據(jù)進行轉(zhuǎn)換,使其更接近目標變量,轉(zhuǎn)換后的特征對目標更有預(yù)測性。在這種情況下,雖然未加工輸入出現(xiàn)在原始數(shù)據(jù)集中,但如果將轉(zhuǎn)換后的特征作為輸入,則機器學習將提高預(yù)測的準確性。

2、引入額外的數(shù)據(jù)源

特征工程可以使從業(yè)者向機器學習模型引入額外的數(shù)據(jù)源。對于首次注冊的用戶,我們可以猜測該用戶的終生價值。在眾多指標中,我們可以捕捉每個用戶的地理位置。雖然這個數(shù)據(jù)可以直接作為分類特征(例如,IP地址和郵政編碼)提供,但模型基于這些來確定位置信息仍存在困難。

通過第三方的人口統(tǒng)計數(shù)據(jù),我們可以做的更好。例如,這將允許我們計算每個用戶區(qū)域的平均收入和人口密度,并把這些因素直接插入到訓(xùn)練集中?,F(xiàn)在,這些預(yù)測性因素立即變得更容易推斷,而不是依賴模型從原始位置數(shù)據(jù)推斷這種微妙的關(guān)系。更進一步,位置信息轉(zhuǎn)換成收入和人口密度的特征工程,可使我們估計這些位置衍生出的特征哪一個更為重要。

3、使用非結(jié)構(gòu)化的數(shù)據(jù)源

特征工程可使我們在機器學習模型中使用非結(jié)構(gòu)化的數(shù)據(jù)源。許多數(shù)據(jù)源本質(zhì)上并不是結(jié)構(gòu)化的特征向量。非結(jié)構(gòu)化數(shù)據(jù),如文本、時間序列、圖像、視頻、日志數(shù)據(jù)和點擊流等,占創(chuàng)建數(shù)據(jù)的絕大多數(shù)。特征工程使從業(yè)者從上述原始數(shù)據(jù)流中產(chǎn)生機器學習的特征向量。

4、創(chuàng)建更容易解釋的特征

特征工程使機器學習的從業(yè)者能夠創(chuàng)建更易于解釋和實用的特征。通常,使用機器學習發(fā)現(xiàn)數(shù)據(jù)中的模式,對于產(chǎn)生精確的預(yù)測十分有用,但會遇到模型的可解釋性和模型的最終應(yīng)用的一些限制。這些情況下,在驅(qū)動數(shù)據(jù)生成、鏈接原始數(shù)據(jù)和目標變量的過程中,產(chǎn)生更有指示性的新特征,這樣更有價值。

5、用大特征集提高創(chuàng)造性

特征工程使得我們可以扔進大量的特征,觀察它們代表了什么。我們能創(chuàng)建盡可能多的數(shù)據(jù),觀察在訓(xùn)練模型中哪些更有預(yù)測力。這使得機器學習的從業(yè)者在創(chuàng)建和測試特征時擺脫僵化心理,并能夠發(fā)現(xiàn)新的趨勢和模式。

雖然當幾十個甚至上百個特征用于訓(xùn)練機器學習模型時,過擬合成為一個問題,但嚴謹?shù)奶卣鬟x擇算法,可減少特征使其易于管理。例如,我們可以自主選擇前10個特征的預(yù)測,與所有1000個特征的預(yù)測是一樣好,還是優(yōu)于后者。

特征工程

引自《機器學習實戰(zhàn)》

在機器學習應(yīng)用領(lǐng)域中,特征工程扮演著非常重要的角色,可以說特征工程是機器學習應(yīng)用的基礎(chǔ)。在機器學習業(yè)界流傳著這樣一句話:“數(shù)據(jù)和特征決定了機器學習算法的上限,而模型和算法只是不斷逼近而已?!痹跈C器學習應(yīng)用中,特征工程介于“數(shù)據(jù)”和“模型”之間,特征工程是使用數(shù)據(jù)的專業(yè)領(lǐng)域知識創(chuàng)建能夠使機器學習算法工作的特征的過程,而好的數(shù)據(jù)勝于多的數(shù)據(jù)。美國計算機科學家Peter Norvig有兩句經(jīng)典名言:“基于大量數(shù)據(jù)的簡單模型勝于少量數(shù)據(jù)的復(fù)雜模型。”以及“更多的數(shù)據(jù)勝于聰明的算法,而好的數(shù)據(jù)勝于多的數(shù)據(jù)?!币虼?,特征工程的前提是收集足夠多的數(shù)據(jù),其次是從大量數(shù)據(jù)中提取關(guān)鍵信息并表示為模型所需要的形式。合適的特征可以讓模型預(yù)測更加容易,機器學習應(yīng)用更有可能成功。

引自《美團機器學習》

在監(jiān)督機器學習過程中,我們使用數(shù)據(jù)教自動系統(tǒng)如何做出準確的決策。機器學習算法被設(shè)計成發(fā)現(xiàn)模式和歷史訓(xùn)練數(shù)據(jù)間的聯(lián)系;它們從數(shù)據(jù)中學習并將學習結(jié)果編碼到模型中,從而對新數(shù)據(jù)的重要屬性做出準確的預(yù)測。因此,訓(xùn)練數(shù)據(jù)是機器學習中的基本問題。有了高質(zhì)量的數(shù)據(jù),就可以捕捉到細微的差別和關(guān)聯(lián)關(guān)系,從而建立高保真的預(yù)測系統(tǒng)。相反,若訓(xùn)練數(shù)據(jù)質(zhì)量不佳,則再好的機器學習算法也無濟于事。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關(guān)注

    關(guān)注

    67

    文章

    8565

    瀏覽量

    137228
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    機器學習特征工程:縮放、編碼、聚合、嵌入與自動化

    本文轉(zhuǎn)自:DeepHubIMBA好模型的秘訣不在于更花哨的算法,而在于更好的特征。第1部分:數(shù)值特征1.1縮放多數(shù)機器學習算法對尺度敏感。一
    的頭像 發(fā)表于 04-08 14:41 ?731次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>特征</b><b class='flag-5'>工程</b>:縮放、編碼、聚合、嵌入與自動化

    Neway電機方案在機器人技術(shù)方面的優(yōu)勢

    Neway電機方案在機器人技術(shù)方面的優(yōu)勢Neway電機方案在機器人技術(shù)方面展現(xiàn)出顯著優(yōu)勢,其通過全國產(chǎn)器件替代、高功率密度設(shè)計、多重保護功能、寬溫工作能力以及快速交付與供應(yīng)鏈穩(wěn)定性等核
    發(fā)表于 03-30 09:39

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學科的技能,涵蓋數(shù)學基礎(chǔ)、編程能力、算法理論、工程實踐以及業(yè)務(wù)理解等多個方面。 以下是具體技能及學習建議: 線性代數(shù)核心內(nèi)容:矩陣運算、
    發(fā)表于 02-27 10:53

    機器學習特征工程:分類變量的數(shù)值化處理方法

    編碼是機器學習流程里最容易被低估的環(huán)節(jié)之一,模型沒辦法直接處理文本形式的分類數(shù)據(jù),尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類
    的頭像 發(fā)表于 02-10 15:58 ?451次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>特征</b><b class='flag-5'>工程</b>:分類變量的數(shù)值化處理方法

    機器學習和深度學習中需避免的 7 常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機器學習和深度學習中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?351次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 <b class='flag-5'>個</b>常見錯誤與局限性

    方面幫您分辨光纜是否優(yōu)質(zhì)?

    光纜是由纜芯、加強鋼絲、填充物和護套等幾部分組成,另外根據(jù)需要還有防水層、緩沖層、絕緣金屬導(dǎo)線等構(gòu)件。 方面幫您分辨光纜是否優(yōu)質(zhì)? 1、填充物油膏:它是存在于松套管中的物質(zhì),主要含有纖膏與纜膏
    的頭像 發(fā)表于 12-25 10:05 ?125次閱讀

    工程師實戰(zhàn)指南:關(guān)于離子捕捉劑應(yīng)用的關(guān)鍵問題與解答

    在考慮使用離子捕捉劑時,工程師們常有一些具體的實操疑問。本文收集了最具代表性的問題,并結(jié)合東亞合成IXE系列的產(chǎn)品特性,給出清晰的技術(shù)解答,為您掃清應(yīng)用障礙。
    的頭像 發(fā)表于 12-08 16:38 ?453次閱讀
    <b class='flag-5'>工程</b>師實戰(zhàn)指南:關(guān)于離子捕捉劑應(yīng)用的<b class='flag-5'>五</b><b class='flag-5'>個</b>關(guān)鍵問題與解答

    自動駕駛中常提的“強化學習”是啥?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,有些方案中會提到“強化學習(Reinforcement Learning,簡稱RL)”,強化學習是一類讓機器通過試錯來學會做決策的技術(shù)。簡單理解
    的頭像 發(fā)表于 10-23 09:00 ?896次閱讀
    自動駕駛中常提的“強化<b class='flag-5'>學習</b>”是<b class='flag-5'>個</b>啥?

    大電磁頻譜管理監(jiān)測系統(tǒng)軟件:有哪些優(yōu)點和缺點

    大電磁頻譜管理監(jiān)測系統(tǒng)軟件:有哪些優(yōu)點和缺點
    的頭像 發(fā)表于 09-28 16:50 ?978次閱讀
    <b class='flag-5'>五</b>大電磁頻譜管理監(jiān)測系統(tǒng)軟件:有哪些<b class='flag-5'>優(yōu)點</b>和缺點

    大海上安全事件應(yīng)急處置系統(tǒng):有哪些優(yōu)點和缺點

    大海上安全事件應(yīng)急處置系統(tǒng):有哪些優(yōu)點和缺點
    的頭像 發(fā)表于 09-04 17:09 ?1203次閱讀
    <b class='flag-5'>五</b>大海上安全事件應(yīng)急處置系統(tǒng):有哪些<b class='flag-5'>優(yōu)點</b>和缺點

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】 + 04 + 機器學習YOLO體驗

    、 機器學習YOLO體驗 1.在線訓(xùn)練 Sipeed矽速科技擁有自研搭建的MaixHub平臺,可以快速簡單的完成yolo訓(xùn)練。 下面我將展示訓(xùn)練集拍攝標注和訓(xùn)練的相關(guān)圖片 數(shù)據(jù)集有直接上傳和拍攝2種
    發(fā)表于 07-24 21:35

    FPGA在機器學習中的具體應(yīng)用

    ,越來越多地被應(yīng)用于機器學習任務(wù)中。本文將探討 FPGA 在機器學習中的應(yīng)用,特別是在加速神經(jīng)網(wǎng)絡(luò)推理、優(yōu)化算法和提升處理效率方面的優(yōu)勢。
    的頭像 發(fā)表于 07-16 15:34 ?3098次閱讀

    電子硬件工程師如何從零開始學習?(文末免費分享從零開始學習資料)

    經(jīng)常有用戶咨詢,如何學習和提升電子硬件能力,有沒有適合小白學習的資料等等;電子硬件工程師是一結(jié)合理論、實踐和創(chuàng)新能力的職業(yè),需要掌握電路設(shè)計、元器件選型、PCB設(shè)計、嵌入式系統(tǒng)、測試
    的頭像 發(fā)表于 06-04 07:36 ?2764次閱讀
    電子硬件<b class='flag-5'>工程</b>師如何從零開始<b class='flag-5'>學習</b>?(文末免費分享從零開始<b class='flag-5'>學習</b>資料)

    玻璃通孔技術(shù)的獨特優(yōu)勢

    TGV(Through Glass Via)工藝之所以選擇在玻璃上打孔,主要是因為玻璃在以下方面相較于硅具有獨特優(yōu)勢。
    的頭像 發(fā)表于 05-23 16:32 ?1320次閱讀
    玻璃通孔技術(shù)的<b class='flag-5'>五</b><b class='flag-5'>個</b>獨特優(yōu)勢

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用

    閱讀心得體會:ROS2機器人視覺與地圖構(gòu)建技術(shù) 通過對本書第7章(ROS2視覺應(yīng)用)和第8章(ROS2地圖構(gòu)建)的學習,我對機器人視覺感知和自主導(dǎo)航的核心技術(shù)有了更深入的理解。以下是我的心得體會
    發(fā)表于 05-03 19:41