chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

系統(tǒng)機(jī)器學(xué)習(xí)算法總結(jié)知識(shí)分享

zhKF_jqr_AI ? 來(lái)源:未知 ? 作者:steve ? 2017-12-15 14:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Statsbot數(shù)據(jù)科學(xué)家Daniil Korbut簡(jiǎn)明扼要地介紹了用于推薦系統(tǒng)的主流機(jī)器學(xué)習(xí)算法:協(xié)同過(guò)濾、矩陣分解、聚類、深度學(xué)習(xí)

現(xiàn)在有許多公司使用大數(shù)據(jù)來(lái)制定高度相關(guān)的建議以提高收入。數(shù)據(jù)科學(xué)家需要根據(jù)業(yè)務(wù)的限制和需求,在各種推薦算法中選擇最好的算法。

為了簡(jiǎn)化這一任務(wù),Statsbot團(tuán)隊(duì)準(zhǔn)備了一份現(xiàn)有主要推薦系統(tǒng)算法的概覽。

協(xié)同過(guò)濾

協(xié)同過(guò)濾(collaborative filtering, CF)及其改版是最常用的推薦算法之一。 即使是數(shù)據(jù)科學(xué)初學(xué)者也可以使用它來(lái)構(gòu)建他們的個(gè)人電影推薦系統(tǒng),比如用它寫一個(gè)簡(jiǎn)歷項(xiàng)目。

當(dāng)我們想向用戶推薦東西時(shí),最符合邏輯的做法是找到有相似興趣的人,分析他們的行為,然后給我們的用戶推薦相同的東西。 或者我們可以查看與用戶之前所購(gòu)類似的物品,并進(jìn)行相應(yīng)的推薦。

這正是CF的兩種基本方法:基于用戶的協(xié)作過(guò)濾和基于物品的協(xié)作過(guò)濾。

在這兩種情形下,推薦引擎分兩步:

  1. 找出數(shù)據(jù)庫(kù)中有多少用戶/物品與給定的用戶/物品類似。

  2. 評(píng)估其他用戶/物品,這一評(píng)估基于比待評(píng)估用戶/物品更相似的用戶/物品的總權(quán)重,以預(yù)測(cè)給用戶推薦相應(yīng)產(chǎn)品的評(píng)分。

算法中的“最相似”是什么意思?

假設(shè)我們有一個(gè)表示每個(gè)用戶的偏好的向量(矩陣 R的行)和一個(gè)表示用戶給每件產(chǎn)品評(píng)分的向量(矩陣 R的列)。

首先,讓我們?nèi)コ恍┰兀槐A魞蓚€(gè)向量中值均已知的元素。

例如,如果我們想比較比爾和簡(jiǎn),我們可以看到,比爾還沒(méi)有看過(guò)《泰坦尼克號(hào)》,而簡(jiǎn)到現(xiàn)在為止還沒(méi)看過(guò)《蝙蝠俠》,所以我們只能通過(guò)《星球大戰(zhàn)》來(lái)衡量他們的相似性。怎么會(huì)有人不看《星球大戰(zhàn)》,是吧?:)

最流行的衡量相似性的技術(shù)是用戶/物品向量之間的余弦相似性或加權(quán)平均數(shù)。

矩陣分解

下一個(gè)有趣的算法是矩陣分解。這是一個(gè)非常優(yōu)雅的推薦算法,因?yàn)槭褂镁仃嚪纸鈺r(shí)通常不用考慮要在結(jié)果矩陣的列和行中保留的物品。

u是第i個(gè)用戶的興趣向量,v是表示第j部電影的參數(shù)的向量。因此,我們可以使用u和v的點(diǎn)積來(lái)逼近x(第i個(gè)用戶對(duì)第j部電影的評(píng)分)。我們使用已知評(píng)分來(lái)構(gòu)建這些向量,并使用它們來(lái)預(yù)測(cè)未知評(píng)分。

例如,我們有表示用戶特德的向量(1.4; .9)和表示電影A的向量(1.4; .8),矩陣分解之后我們可以直接通過(guò)計(jì)算(1.4; .9)和(1.4; .8)的點(diǎn)積來(lái)還原電影A——特德的評(píng)分,結(jié)果為2.68。

聚類

前面兩個(gè)推薦算法非常簡(jiǎn)單,比較適合小型系統(tǒng)。到目前為止,我們將推薦問(wèn)題看作一個(gè)監(jiān)督學(xué)習(xí)任務(wù)?,F(xiàn)在到了應(yīng)用無(wú)監(jiān)督方法來(lái)解決這個(gè)問(wèn)題的時(shí)候了。

想象一下,我們正在建立一個(gè)大型推薦系統(tǒng),協(xié)同過(guò)濾和矩陣分解會(huì)花很長(zhǎng)時(shí)間。這時(shí)第一個(gè)想到的應(yīng)該是聚類(clustering)。

根據(jù)屬于同一聚類的所有客戶的偏好,每個(gè)聚類會(huì)被分配一個(gè)典型偏好。每個(gè)聚類中的客戶將收到在聚類層次計(jì)算出的推薦。

業(yè)務(wù)初期缺乏用戶評(píng)分,因此聚類會(huì)是最佳選擇。

不過(guò),單獨(dú)使用的話,聚類有點(diǎn)弱。因?yàn)橥ㄟ^(guò)聚類,我們識(shí)別出用戶群組,然后給同一群組中的每個(gè)用戶都推薦相同的物品。當(dāng)我們有足夠多的數(shù)據(jù)的時(shí)候,更好的選擇是將聚類作為第一步,用來(lái)調(diào)整相關(guān)用戶/物品選取,以供協(xié)同過(guò)濾算法使用。聚類也能提升復(fù)雜推薦系統(tǒng)的性能。

深度學(xué)習(xí)

十年來(lái),神經(jīng)網(wǎng)絡(luò)有一個(gè)巨大的飛躍。今天,神經(jīng)網(wǎng)絡(luò)被應(yīng)用到許多領(lǐng)域,正逐漸取代傳統(tǒng)的機(jī)器學(xué)習(xí)方法。我想談一下YouTube使用的深度學(xué)習(xí)方法。

毫無(wú)疑問(wèn),為這樣的服務(wù)打造推薦系統(tǒng)是一項(xiàng)非常具有挑戰(zhàn)性的任務(wù),因?yàn)檫@一服務(wù)的規(guī)模很大,語(yǔ)料庫(kù)是動(dòng)態(tài)的,還有各種難以觀察的外部因素。

根據(jù)《YouTube推薦系統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)》,YouTube推薦系統(tǒng)算法包括兩個(gè)神經(jīng)網(wǎng)絡(luò):一個(gè)用于生成候選視頻,另一個(gè)用于排名。如果你沒(méi)有足夠的時(shí)間閱讀上面的論文,我這里有一個(gè)快速總結(jié)。

接受用戶的歷史事件作為輸入,候選生成網(wǎng)絡(luò)顯著減少了視頻的數(shù)量,從一個(gè)巨大的語(yǔ)料庫(kù)抽取出一組相關(guān)性最高的視頻。生成的候選視頻是最和用戶相關(guān)的,我們即將預(yù)測(cè)用戶給候選視頻的評(píng)分。這個(gè)網(wǎng)絡(luò)的目標(biāo)只是通過(guò)協(xié)同過(guò)濾來(lái)提供一些范圍較廣的個(gè)性化候選視頻。

接下來(lái)我們需要更仔細(xì)地分析這些候選視頻,以挑選出其中最好的視頻。我們通過(guò)評(píng)分網(wǎng)絡(luò)完成這一任務(wù),評(píng)分網(wǎng)絡(luò)可以通過(guò)一個(gè)期望目標(biāo)函數(shù)給每個(gè)視頻賦值一個(gè)分?jǐn)?shù),該期望目標(biāo)函數(shù)使用描述視頻的數(shù)據(jù)和有關(guān)用戶行為的信息。評(píng)分最高的那些視頻將被推薦給用戶。

使用這一兩步方法,我們可以基于一個(gè)非常巨大的視頻語(yǔ)料庫(kù)推薦視頻,同時(shí)保證推薦的少量視頻是個(gè)性化的。這一設(shè)計(jì)也允許我們混合從其他來(lái)源生成的候選視頻。

這一推薦任務(wù)構(gòu)成了一個(gè)極端多類分類(extreme multiclass classification)問(wèn)題,基于用戶(U)和情境(C)精確地分類在給定時(shí)刻t觀看(wt)的特定視頻,這一視頻取自一個(gè)語(yǔ)料庫(kù)(V),總共有數(shù)百萬(wàn)的視頻類別(i)。

構(gòu)建你自己的推薦系統(tǒng)

  • 基于大型數(shù)據(jù)庫(kù)的在線推薦,最好的辦法是將這個(gè)問(wèn)題拆分成兩個(gè)子問(wèn)題:1)選擇排名最高的N個(gè)候選 2)對(duì)它們進(jìn)行評(píng)分。

  • 如何評(píng)估模型質(zhì)量?除了標(biāo)準(zhǔn)的質(zhì)量指標(biāo)之外,還有一些特別針對(duì)推薦問(wèn)題的指標(biāo):Recall at K和Precision at K,Average Recall at K和Average Precision at K。另外可以參考《A Survey of Accuracy Evaluation Metrics of Recommendation Task》(JMLR 10 (2009))

  • 如果使用分類算法解決推薦問(wèn)題,則應(yīng)考慮生成負(fù)樣本。如果用戶購(gòu)買了推薦的物品,不應(yīng)將其作為正樣本,也不應(yīng)將未購(gòu)買的推薦物品作為負(fù)樣本。

  • 基于在線分?jǐn)?shù)和離線分?jǐn)?shù)考量算法質(zhì)量。 僅使用歷史數(shù)據(jù)的訓(xùn)練模型可能導(dǎo)向簡(jiǎn)陋的推薦系統(tǒng),因?yàn)樵撍惴ú恢佬碌某绷骱推谩?/p>


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 聚類
    +關(guān)注

    關(guān)注

    0

    文章

    146

    瀏覽量

    14438
  • 協(xié)同過(guò)濾
    +關(guān)注

    關(guān)注

    0

    文章

    45

    瀏覽量

    9882
  • 矩陣分解
    +關(guān)注

    關(guān)注

    1

    文章

    13

    瀏覽量

    3728

原文標(biāo)題:推薦系統(tǒng)機(jī)器學(xué)習(xí)算法概覽

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺(jué)實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    。 學(xué)習(xí)建議 對(duì)于初學(xué)者,建議先通過(guò)仿真(如Gazebo)驗(yàn)證算法,再遷移到真實(shí)機(jī)器人,以降低硬件調(diào)試成本。 多參與開源社區(qū)(如ROS2的GitHub項(xiàng)目),學(xué)習(xí)前沿技術(shù)并貢獻(xiàn)代碼
    發(fā)表于 05-03 19:41

    請(qǐng)問(wèn)STM32部署機(jī)器學(xué)習(xí)算法硬件至少要使用哪個(gè)系列的芯片?

    STM32部署機(jī)器學(xué)習(xí)算法硬件至少要使用哪個(gè)系列的芯片?
    發(fā)表于 03-13 07:34

    機(jī)器學(xué)習(xí)模型市場(chǎng)前景如何

    當(dāng)今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長(zhǎng)以及計(jì)算能力的飛速提升,機(jī)器學(xué)習(xí)模型的市場(chǎng)前景愈發(fā)廣闊。下面,AI部落小編將探討機(jī)器學(xué)習(xí)模型市場(chǎng)
    的頭像 發(fā)表于 02-13 09:39 ?365次閱讀

    《具身智能機(jī)器系統(tǒng)》第10-13章閱讀心得之具身智能機(jī)器人計(jì)算挑戰(zhàn)

    是全書最“硬核”的部分,涉及不少機(jī)器人的硬件、系統(tǒng)算法等方面的知識(shí),對(duì)于我這個(gè)非相關(guān)專業(yè)的人士,閱讀起來(lái)還是有些吃力,不過(guò)好在這本書也不是講解特別深入,還是偏向于綜述性質(zhì)的概況
    發(fā)表于 01-04 01:15

    華為云 Flexus X 實(shí)例部署安裝 Jupyter Notebook,學(xué)習(xí) AI,機(jī)器學(xué)習(xí)算法

    前言 由于本人最近在學(xué)習(xí)一些機(jī)器算法,AI 算法知識(shí),需要搭建一個(gè)學(xué)習(xí)環(huán)境,所以就在最近購(gòu)買的
    的頭像 發(fā)表于 01-02 13:43 ?538次閱讀
    華為云 Flexus X 實(shí)例部署安裝 Jupyter Notebook,<b class='flag-5'>學(xué)習(xí)</b> AI,<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>算法</b>

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章中,我們介紹了機(jī)器學(xué)習(xí)的關(guān)鍵概念術(shù)語(yǔ)。在本文中,我們會(huì)介紹傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)和多種算法
    的頭像 發(fā)表于 12-30 09:16 ?1192次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    感謝 感謝電子發(fā)燒友網(wǎng)社區(qū)給予《具身智能機(jī)器系統(tǒng)》試讀機(jī)會(huì)。在這知識(shí)的盛宴中,我感受到社區(qū)的關(guān)懷與支持。定不負(fù)期望,認(rèn)真研讀,分享所學(xué),回饋社區(qū)。 一、本書大綱 《具身智能機(jī)器
    發(fā)表于 12-28 21:12

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】1.全書概覽與第一章學(xué)習(xí)

    了解具身智能機(jī)器人相關(guān)的知識(shí),我感到十分榮幸和幸運(yùn)。 全書簡(jiǎn)介 本書以循序漸進(jìn)的方式展開,通過(guò)對(duì)具身智能機(jī)器人技術(shù)的全方位解析,幫助讀者系統(tǒng)化地學(xué)
    發(fā)表于 12-27 14:50

    《具身智能機(jī)器系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

    醫(yī)療領(lǐng)域,手術(shù)輔助機(jī)器人需要毫米級(jí)的精確控制,書中有介紹基于視覺(jué)伺服的實(shí)時(shí)控制算法,以及如何利用大模型優(yōu)化手術(shù)路徑規(guī)劃。工業(yè)場(chǎng)景中,協(xié)作機(jī)器人面臨的主要挑戰(zhàn)是快速適應(yīng)新工藝流程。具身智能通過(guò)在線
    發(fā)表于 12-24 15:03

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    學(xué)習(xí)資源,以培養(yǎng)更多的專業(yè)人才。隨著具身智能機(jī)器人技術(shù)對(duì)社會(huì)的影響越來(lái)越大,該書還可以向公眾普及相關(guān)的知識(shí),以提升社會(huì)對(duì)新技術(shù)的認(rèn)知和接受度,從而為技術(shù)的發(fā)展創(chuàng)造良好的社會(huì)環(huán)境。 隨著具身智能
    發(fā)表于 12-20 19:17

    《具身智能機(jī)器系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器系統(tǒng)背景知識(shí)與基礎(chǔ)模塊

    與環(huán)境持續(xù)互動(dòng)來(lái)優(yōu)化決策策略。書中還進(jìn)一步討論了強(qiáng)化學(xué)習(xí)的基本原理,包括狀態(tài)空間、動(dòng)作空間、獎(jiǎng)勵(lì)函數(shù)的設(shè)計(jì),以及策略網(wǎng)絡(luò)的訓(xùn)練方法。 具身智能機(jī)器系統(tǒng)是一個(gè)多學(xué)科知識(shí)交叉的復(fù)雜工程體
    發(fā)表于 12-19 22:26

    什么是機(jī)器學(xué)習(xí)?通過(guò)機(jī)器學(xué)習(xí)方法能解決哪些問(wèn)題?

    來(lái)源:Master編程樹“機(jī)器學(xué)習(xí)”最初的研究動(dòng)機(jī)是讓計(jì)算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實(shí)現(xiàn)人工智能。因?yàn)闆](méi)有學(xué)習(xí)能力的
    的頭像 發(fā)表于 11-16 01:07 ?965次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過(guò)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問(wèn)題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長(zhǎng)。NPU作為一種專門為深度
    的頭像 發(fā)表于 11-15 09:19 ?1224次閱讀

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 鳥瞰這本書

    清晰,從時(shí)間序列分析的基礎(chǔ)理論出發(fā),逐步深入到機(jī)器學(xué)習(xí)算法在時(shí)間序列預(yù)測(cè)中的應(yīng)用,內(nèi)容全面,循序漸進(jìn)。每一章都經(jīng)過(guò)精心設(shè)計(jì),對(duì)理論知識(shí)進(jìn)行了詳細(xì)的闡述,對(duì)實(shí)際案例進(jìn)行了生動(dòng)的展示,使讀
    發(fā)表于 08-12 11:28

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡(jiǎn)單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列分析的基礎(chǔ)知識(shí),更巧妙地展示了
    發(fā)表于 08-12 11:21