chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何用數(shù)學(xué)函數(shù)去理解機(jī)器學(xué)習(xí)的過(guò)程

倩倩 ? 來(lái)源:人人都是產(chǎn)品經(jīng)理 ? 2020-04-15 15:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期也是在做項(xiàng)目的過(guò)程中發(fā)現(xiàn),其實(shí)AI產(chǎn)品經(jīng)理不需要深入研究每一種算法,能了解機(jī)器學(xué)習(xí)的過(guò)程,這其中用到哪些常用算法,分別使用與解決哪些問(wèn)題和應(yīng)用場(chǎng)景,并基于了解的知識(shí),去更好的建立AI產(chǎn)品落地流程、把控項(xiàng)目進(jìn)度、風(fēng)險(xiǎn)評(píng)估,這個(gè)才是最關(guān)鍵的地方,算法研究交給專業(yè)的算法工程師,各司其職,相互配合。

基于最近看的一些文章和書(shū)籍,本文將重點(diǎn)分享,如何用數(shù)學(xué)函數(shù)去理解機(jī)器學(xué)習(xí)的過(guò)程,以及用數(shù)學(xué)原理指導(dǎo)產(chǎn)品工作的一些思考。

一、機(jī)器學(xué)習(xí)的本質(zhì)

機(jī)器學(xué)習(xí),即學(xué)習(xí)人類(lèi)的分析、判斷、解決問(wèn)題的能力。人的能力如何得來(lái)?通過(guò)長(zhǎng)期的信息輸入,再經(jīng)過(guò)大腦思考,最后輸出對(duì)事物的判斷。

那么機(jī)器如何學(xué)習(xí)?通過(guò)大量的訓(xùn)練數(shù)據(jù),學(xué)習(xí)找規(guī)律,找到問(wèn)題的理想最優(yōu)解。所以,機(jī)器學(xué)習(xí)的本質(zhì)其實(shí)是函數(shù)預(yù)測(cè),即f:x-》y。

圖片來(lái)源:網(wǎng)絡(luò)

中學(xué)時(shí)期,我們常解的數(shù)據(jù)問(wèn)題之一便是:求解方程。已知坐標(biāo)(x1,y1),(x2,y2)…(xn,yn)求解n元n次方程,再將新的x帶入方程對(duì)應(yīng)的y。機(jī)器學(xué)習(xí)的過(guò)程可以類(lèi)比方程求解過(guò)程:

樣本數(shù)據(jù):已知的坐標(biāo)集D:(x1,y1),(x2,y2)…(xn,yn);

算法:即求解函數(shù)的方法;

模型訓(xùn)練:最后求解的方程或函數(shù);

評(píng)估方法:將新的x帶入方程驗(yàn)證函數(shù)“預(yù)測(cè)”是否正確。

與普通的函數(shù)不同的是,機(jī)器學(xué)習(xí)往往很難求解出完整的方程,通過(guò)各種手段求最接近理想情況下的未知項(xiàng)取值。以人臉識(shí)別為例,預(yù)測(cè)函數(shù)為:f:X(圖片臉部特征)—》Y(身份),其中f則是通過(guò)機(jī)器學(xué)習(xí)后,具有人臉識(shí)別能力的模型。使用不同的機(jī)器學(xué)習(xí)方法訓(xùn)練的模型不同,即對(duì)應(yīng)的函數(shù)形式也不同。

機(jī)器學(xué)習(xí)解決的常見(jiàn)四類(lèi)問(wèn)題:分類(lèi)、聚類(lèi)、排序和推薦。

(1)分類(lèi)問(wèn)題:一般包括二分類(lèi)和多分類(lèi)的問(wèn)題,二分類(lèi)即非黑即白,比如垃圾郵件過(guò)濾;多分類(lèi)問(wèn)題,即有多種類(lèi)別的輸出結(jié)果,比如圖像識(shí)別。

(2)聚類(lèi)問(wèn)題:在一個(gè)集合中,將相似度高的對(duì)象組成多個(gè)類(lèi)的過(guò)程叫聚類(lèi)。比如一些新聞?lì)惖膽?yīng)用,將未標(biāo)注的數(shù)據(jù)通過(guò)聚類(lèi)算法來(lái)構(gòu)建主題。

(3)排序問(wèn)題:根據(jù)相關(guān)度、重要度、匹配度等,讓用戶在海量的信息中找到想要的信息,常見(jiàn)的應(yīng)用場(chǎng)景,如搜索引擎。

(4)推薦問(wèn)題:典型的應(yīng)用場(chǎng)景,電商行業(yè)的千人千面,根據(jù)用戶的購(gòu)買(mǎi)、收藏等行為,分析用戶的喜好,實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)。

在理解了機(jī)器學(xué)習(xí)的本質(zhì)以及常見(jiàn)的問(wèn)題類(lèi)型后,下面將介紹機(jī)器學(xué)習(xí)的過(guò)程。

二、機(jī)器學(xué)習(xí)的過(guò)程

機(jī)器學(xué)習(xí)的過(guò)程主要分為三個(gè)步驟:樣本準(zhǔn)備、算法選取、模型評(píng)估。

1. 樣本準(zhǔn)備

機(jī)器學(xué)習(xí),需要先學(xué)習(xí)才能預(yù)測(cè)判斷,樣本則是機(jī)器學(xué)習(xí)的信息輸入,樣本的質(zhì)量很大程度上決定了機(jī)器學(xué)習(xí)的效果。以人臉識(shí)別為例,其樣本是大量的人臉圖片。那么,大量的樣本如何獲取?按數(shù)據(jù)來(lái)源分類(lèi),可分為內(nèi)部樣本和外部樣本。

(1)內(nèi)部樣本

內(nèi)部樣本數(shù)據(jù),一般可基于內(nèi)部已積累的樣本數(shù)據(jù),或通過(guò)對(duì)產(chǎn)品進(jìn)行數(shù)據(jù)標(biāo)注或者埋點(diǎn),來(lái)收集更多維度的樣本數(shù)據(jù)。

(2)外部樣本

若數(shù)據(jù)的量級(jí)或豐富度不夠,則可能需要獲取一些外部樣本。比如通過(guò)搜索典型的大型公開(kāi)數(shù)據(jù)集,或者數(shù)據(jù)爬取等方式,來(lái)獲取一些指定場(chǎng)景的新樣本。

2. 算法選取

在機(jī)器學(xué)習(xí)的過(guò)程中,找到接近理想模型(函數(shù))的方法即算法。機(jī)器學(xué)習(xí)的常用算法很多,不同的算法,解決的問(wèn)題不同,適用的場(chǎng)景也不同。

如下圖,比如解決聚類(lèi)問(wèn)題,一般使用無(wú)監(jiān)督學(xué)習(xí)算法,分類(lèi)問(wèn)題,一般使用有監(jiān)督學(xué)習(xí)算法:支持向量機(jī)SVM、神經(jīng)網(wǎng)絡(luò)等,目前神經(jīng)網(wǎng)絡(luò)依然是研究熱點(diǎn)之一。

(1)神經(jīng)網(wǎng)絡(luò)原理

神經(jīng)網(wǎng)絡(luò)是一種模仿人類(lèi)思考方式的模型,就像飛機(jī)模仿鳥(niǎo)的形態(tài)一樣,神經(jīng)網(wǎng)絡(luò)也借鑒了生物學(xué)的神經(jīng)元結(jié)構(gòu)。神經(jīng)元細(xì)胞主要由樹(shù)突、軸突和細(xì)胞體構(gòu)成,樹(shù)突用于接收信號(hào)并傳遞給細(xì)胞體,細(xì)胞體處理信號(hào),軸突輸出信號(hào)。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與此類(lèi)似,一個(gè)典型的單隱含層神經(jīng)網(wǎng)絡(luò)架構(gòu)如下圖:

圖片來(lái)源:網(wǎng)絡(luò)

輸入層:接收輸入數(shù)據(jù),如圖片、語(yǔ)音特征等;

隱藏層:承載數(shù)據(jù)特征運(yùn)算;

輸出層:輸出計(jì)算的結(jié)果;

其本質(zhì)是,通過(guò)調(diào)整內(nèi)部大量處理單元的連接關(guān)系、激勵(lì)函數(shù)和權(quán)重值,實(shí)現(xiàn)對(duì)理想函數(shù)的逼近。

(2)深度學(xué)習(xí)

深度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò)的一種算法,目前在計(jì)算機(jī)視覺(jué)等領(lǐng)域應(yīng)用十分廣泛,相比單隱藏層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)是一種多隱藏層、多層感知器的學(xué)習(xí)結(jié)構(gòu)。如下圖所示,增加更多的隱藏層后,網(wǎng)絡(luò)能更深入得表示特征,以及具有更強(qiáng)的函數(shù)模擬能力,能獲得更好的分類(lèi)能力。

圖片來(lái)源:網(wǎng)絡(luò)

深度學(xué)習(xí)三類(lèi)經(jīng)典的神經(jīng)網(wǎng)絡(luò)分別是:深度神經(jīng)網(wǎng)絡(luò)DNN、卷積神經(jīng)網(wǎng)絡(luò)CNN、和循環(huán)神經(jīng)網(wǎng)絡(luò)RNN。其中DNN、CNN一般解決計(jì)算機(jī)視覺(jué)、圖像識(shí)別等分類(lèi)問(wèn)題,RNN適用于自然語(yǔ)言處理等問(wèn)題。

基于大量的樣本、選取合適的算法進(jìn)行模型訓(xùn)練后,下一步則是對(duì)模型的預(yù)測(cè)效果進(jìn)行評(píng)估。

3. 模型評(píng)估

模型評(píng)估一般可分為兩個(gè)階段:實(shí)驗(yàn)階段和上線階段,在實(shí)驗(yàn)階段能達(dá)到一定的使用標(biāo)準(zhǔn)指標(biāo),才能進(jìn)入實(shí)際上線使用階段。

(1)實(shí)驗(yàn)階段

為了評(píng)估模型的可用性,需要對(duì)模型的預(yù)測(cè)能力進(jìn)行評(píng)價(jià),其中很重要的一個(gè)評(píng)價(jià)指標(biāo)就是準(zhǔn)確率,即模型預(yù)測(cè)和標(biāo)簽一致的樣本占所有樣本的比例。即選擇不同于訓(xùn)練數(shù)據(jù)的,有標(biāo)簽數(shù)據(jù)的測(cè)試集,輸入模型進(jìn)行運(yùn)算,計(jì)算預(yù)測(cè)的準(zhǔn)確率,評(píng)估模型對(duì)于測(cè)試集的預(yù)測(cè)效果是否能模型可用指標(biāo)。

(2)上線階段

在模型投入使用后,基于上線后的真實(shí)數(shù)據(jù)反饋,評(píng)估模型的能力,并基于新的反饋數(shù)據(jù),持續(xù)迭代優(yōu)化模型,提高或保持模型的泛化能力。

三、總結(jié)與思考

作為產(chǎn)品賦能的一個(gè)“工具”,產(chǎn)品化的整個(gè)流程可總結(jié)為:業(yè)務(wù)需求-》轉(zhuǎn)化為業(yè)務(wù)函數(shù)》樣本數(shù)據(jù)獲取-》選擇合適的算法-》模型訓(xùn)練-》內(nèi)部評(píng)估-》上線驗(yàn)證迭代。

其實(shí)這個(gè)過(guò)程,最底層的邏輯還是基于數(shù)學(xué)建模原理的思路來(lái)解決問(wèn)題,也可用來(lái)指導(dǎo)一些日常產(chǎn)品工作中的問(wèn)題。比如,《增長(zhǎng)黑客》中的增長(zhǎng)杠桿、北極星指標(biāo)等方法,其本質(zhì)也是數(shù)據(jù)建模的原理。定義業(yè)務(wù)函數(shù)、確定影響因素、權(quán)重成本分析、判斷最優(yōu)解決方案,評(píng)估上線反饋形成閉環(huán)。

所有,很多問(wèn)題表面看起來(lái)各式各樣、各不相同,但抽象出來(lái)可能就是一些學(xué)科問(wèn)題,比如數(shù)學(xué)、物理、經(jīng)濟(jì)學(xué)等,聯(lián)想到我前段時(shí)間分享的一篇文章《透過(guò)《奇葩說(shuō)》論點(diǎn),看背后的多元思維模型》中提到的多元思維模型核心觀點(diǎn)——越往深層次思考,越能挖掘事物本質(zhì),越接近學(xué)科原理。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4710

    瀏覽量

    95405
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134635
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25449
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    嵌入式AI技術(shù)之深度學(xué)習(xí):數(shù)據(jù)樣本預(yù)處理過(guò)程中使用合適的特征變換對(duì)深度學(xué)習(xí)的意義

    ? 作者:蘇勇Andrew 使用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí),網(wǎng)絡(luò)的每個(gè)層都將對(duì)輸入的數(shù)據(jù)做一次抽象,多層神經(jīng)網(wǎng)絡(luò)構(gòu)成深度學(xué)習(xí)的框架,可以深度理解數(shù)據(jù)中所要表示的規(guī)律。從原理上看,使用深度
    的頭像 發(fā)表于 04-02 18:21 ?888次閱讀

    馬達(dá)控制上必要的知識(shí) 三角函數(shù)

    為了理解馬達(dá)控制技術(shù),必須理解如下基礎(chǔ)學(xué)問(wèn)。 (1) 數(shù)學(xué):三角函數(shù),指數(shù)函數(shù),復(fù)數(shù)函數(shù),微分,
    發(fā)表于 03-18 12:23

    數(shù)學(xué)專業(yè)轉(zhuǎn)人工智能方向:考研/就業(yè)前景分析及大學(xué)四年學(xué)習(xí)路徑全揭秘

    隨著AI技術(shù)的不斷進(jìn)步,專業(yè)人才的需求也日益增長(zhǎng)。數(shù)學(xué)作為AI的基石,為機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)分析等提供了理論基礎(chǔ)和工具,因此越來(lái)越多的數(shù)學(xué)
    的頭像 發(fā)表于 02-07 11:14 ?1119次閱讀
    <b class='flag-5'>數(shù)學(xué)</b>專業(yè)轉(zhuǎn)人工智能方向:考研/就業(yè)前景分析及大學(xué)四年<b class='flag-5'>學(xué)習(xí)</b>路徑全揭秘

    如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺(tái)因其彈性擴(kuò)展、高效部署、低成本運(yùn)營(yíng)等優(yōu)勢(shì),逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場(chǎng)上的云原生機(jī)器
    的頭像 發(fā)表于 12-25 11:54 ?458次閱讀

    構(gòu)建云原生機(jī)器學(xué)習(xí)平臺(tái)流程

    構(gòu)建云原生機(jī)器學(xué)習(xí)平臺(tái)是一個(gè)復(fù)雜而系統(tǒng)的過(guò)程,涉及數(shù)據(jù)收集、處理、特征提取、模型訓(xùn)練、評(píng)估、部署和監(jiān)控等多個(gè)環(huán)節(jié)。
    的頭像 發(fā)表于 12-14 10:34 ?435次閱讀

    ASR和機(jī)器學(xué)習(xí)的關(guān)系

    自動(dòng)語(yǔ)音識(shí)別(ASR)技術(shù)的發(fā)展一直是人工智能領(lǐng)域的一個(gè)重要分支,它使得機(jī)器能夠理解和處理人類(lèi)語(yǔ)言。隨著機(jī)器學(xué)習(xí)(ML)技術(shù)的迅猛發(fā)展,ASR系統(tǒng)的性能和準(zhǔn)確性得到了顯著提升。 ASR
    的頭像 發(fā)表于 11-18 15:16 ?784次閱讀

    什么是機(jī)器學(xué)習(xí)?通過(guò)機(jī)器學(xué)習(xí)方法能解決哪些問(wèn)題?

    來(lái)源:Master編程樹(shù)“機(jī)器學(xué)習(xí)”最初的研究動(dòng)機(jī)是讓計(jì)算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實(shí)現(xiàn)人工智能。因?yàn)闆](méi)有學(xué)習(xí)能力的系統(tǒng)很難被認(rèn)為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?965次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過(guò)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問(wèn)題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長(zhǎng)。NPU作為一種專門(mén)為深度學(xué)習(xí)機(jī)器
    的頭像 發(fā)表于 11-15 09:19 ?1225次閱讀

    傅里葉變換的數(shù)學(xué)原理

    傅里葉變換的數(shù)學(xué)原理主要基于一種將函數(shù)分解為正弦和余弦函數(shù)(或復(fù)指數(shù)函數(shù))的線性組合的思想。以下是對(duì)傅里葉變換數(shù)學(xué)原理的介紹: 一、基本原理
    的頭像 發(fā)表于 11-14 09:27 ?1758次閱讀

    eda在機(jī)器學(xué)習(xí)中的應(yīng)用

    機(jī)器學(xué)習(xí)項(xiàng)目中,數(shù)據(jù)預(yù)處理和理解是成功構(gòu)建模型的關(guān)鍵。探索性數(shù)據(jù)分析(EDA)是這一過(guò)程中不可或缺的一部分。 1. 數(shù)據(jù)清洗 數(shù)據(jù)清洗 是機(jī)器
    的頭像 發(fā)表于 11-13 10:42 ?907次閱讀

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】時(shí)間序列的信息提取

    本章主講時(shí)間序列的信息提取,章節(jié)中有許多概念定義和數(shù)學(xué)公式,并配有Python代碼演示,細(xì)細(xì)品讀與理解動(dòng)手演練,還是很開(kāi)拓思維視野的。下面以筆記形式進(jìn)行展開(kāi)。 時(shí)間序列的信息提取是時(shí)間序列分析的一
    發(fā)表于 08-17 21:12

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    提高機(jī)器學(xué)習(xí)模型效果與性能的過(guò)程。 而我對(duì)特征工程的理解就是從一堆數(shù)據(jù)里找出能表示這堆數(shù)據(jù)的最小數(shù)據(jù)集,而這個(gè)找出特征數(shù)據(jù)的過(guò)程就是信息提取
    發(fā)表于 08-14 18:00

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡(jiǎn)單建議

    這本書(shū)以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列分析的基礎(chǔ)知識(shí),更巧妙地展示了機(jī)器學(xué)習(xí)如何在這一領(lǐng)域發(fā)揮巨
    發(fā)表于 08-12 11:21

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 了解時(shí)間序列

    相等間隔的時(shí)間段內(nèi)依照給定的采樣率對(duì)某種潛在過(guò)程進(jìn)行觀測(cè)的結(jié)果。時(shí)間序列數(shù)據(jù)本質(zhì)上反映的是某個(gè)或者某些隨機(jī)變量隨時(shí)間不斷變化的趨勢(shì)。 因此,時(shí)間序列可以簡(jiǎn)單的理解為不同時(shí)刻采集的一串?dāng)?shù)據(jù),使用機(jī)器
    發(fā)表于 08-11 17:55

    【《大語(yǔ)言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)篇

    的內(nèi)容,閱讀雖慢,但在這一學(xué)習(xí)過(guò)程中也掌握了許多新知識(shí),為后續(xù)章節(jié)的閱讀打下基礎(chǔ),這是一個(gè)快樂(lè)的學(xué)習(xí)過(guò)程。 基礎(chǔ)篇從人工智能的起源講起,提出了機(jī)器
    發(fā)表于 07-25 14:33