chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

穎脈Imgtec ? 2024-11-16 01:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:Master編程


機(jī)器學(xué)習(xí)”最初的研究動機(jī)是讓計(jì)算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實(shí)現(xiàn)人工智能。因?yàn)闆]有學(xué)習(xí)能力的系統(tǒng)很難被認(rèn)為是具有智能的。目前被廣泛采用的機(jī)器學(xué)習(xí)的定義是“利用經(jīng)驗(yàn)來改善計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智能數(shù)據(jù)分析技術(shù)的創(chuàng)新源之一,并且受到越來越多的關(guān)注。

機(jī)器學(xué)習(xí)的核心在于建模和算法,學(xué)習(xí)得到的參數(shù)只是一個結(jié)果。

成功訓(xùn)練一個模型需要四個要素:數(shù)據(jù)、轉(zhuǎn)換數(shù)據(jù)的模型、衡量模型好壞的損失函數(shù)和一個調(diào)整模型權(quán)重以便最小化損失函數(shù)的算法。

機(jī)器學(xué)習(xí)里最重要的四類問題(按學(xué)習(xí)結(jié)果分類):

預(yù)測(Prediction)一般用回歸(Regression,Arima)等模型。

聚類(Clustering)如K-means方法。

分類(Classification)如支持向量機(jī)法(Support Vector Machine,SVM),邏輯回歸(Logistic Regression)。

降維(Dimensional reduction)如主成分分析法(Principal Component Analysis,PCA,即純矩陣運(yùn)算)。

如果按照學(xué)習(xí)方法,機(jī)器學(xué)習(xí)又可以分為如下幾類

  • 監(jiān)督學(xué)習(xí)(SupervisedLearning,如深度學(xué)習(xí));
  • 無監(jiān)督學(xué)習(xí)(Un-supervised Learning,如聚類);
  • 半監(jiān)督學(xué)習(xí)(Semi-supervised Learning);
  • 增強(qiáng)學(xué)習(xí)(Reinforced Learning)。

幾種常用的機(jī)器學(xué)習(xí)方法:

  • 文本分類
  • 特征提取
  • 標(biāo)注
  • 搜索與排序
  • 推薦系統(tǒng)
  • 序列學(xué)習(xí)

1、文本分類

文本分類技術(shù)在NLP領(lǐng)域有著舉足輕重的地位。文本分類是指在給定分類體系,根據(jù)文本內(nèi)容自動確定文本類別的過程。20世紀(jì)90年代以來,文本分類已經(jīng)出現(xiàn)了很多應(yīng)用,比如信息檢索、Web 文檔自動分類、數(shù)字圖書館、自動文摘、分類新聞、文本過濾單詞語義辨析、情感分析等。
分類過程主要分為兩個階段,訓(xùn)練階段和預(yù)測階段。訓(xùn)練階段根據(jù)訓(xùn)練數(shù)據(jù)訓(xùn)練得到分類模型。預(yù)測階段根據(jù)分類器推斷出文本所屬類別。訓(xùn)練階段一般需要先分詞,然后提取文本為特征,提取特征的過程稱之為特征提取。

一般來說文本分類大致分為如下幾個步驟:

1)定義階段定義數(shù)據(jù)以及分類體系,具體分為哪些類別,需要哪些數(shù)據(jù)

2)數(shù)據(jù)預(yù)處理對文檔做分詞、去停用詞等準(zhǔn)備工作。

3)數(shù)據(jù)提取特征對文檔矩陣進(jìn)行降維,提取訓(xùn)練集中最有用的特征。

4)模型訓(xùn)練階段選擇具體的分類模型以及算法,訓(xùn)練出文本分類器。

5)評測階段在測試集上測試并評價(jià)分類器的性能。

6)應(yīng)用階段應(yīng)用性能最高的分類模型對待分類文檔進(jìn)行分類。


2、特征提取

在使用分類器之前,需要對文本提取特征,而一般來說,提取特征有幾種經(jīng)典的方法:

Bag-of-words最原始的特征集,一個單詞/分詞就是一個特征。往往一個數(shù)據(jù)集就會有上萬個特征;有一些簡單的指標(biāo)可以幫助篩選掉一些對分類沒幫助的詞語,例如去停詞、計(jì)算互信息熵等。但不管怎么訓(xùn)練,特征維度都很大,每個特征的信息量太小。

統(tǒng)計(jì)特征包括Termfrequency(TF)、Inverse document frequency(IDF),以及合并起來的TF-IDF。這種語言模型主要是用詞匯的統(tǒng)計(jì)特征來作為特征集,每個特征都能夠說得出物理意義,看起來會比bag-of-words效果好,但實(shí)際效果也差不多。

  • N-Gram一種考慮了詞匯順序的模型,就是N階Markov鏈,每個樣本轉(zhuǎn)移成轉(zhuǎn)移概率矩陣,也能取得不錯的效果。

3、標(biāo)注事實(shí)上,有一些看似分類的問題在實(shí)際中卻難以歸于分類。例如,把圖所示的小女孩與狗這張圖無論分類成人還是狗看上去都有些問題。

圖里既有人又有狗。其實(shí)還不止這些,里面還有草啊、書包啊、樹啊等。與其將上圖僅僅分類為其中一類,倒不如把這張圖里面我們所關(guān)心的類別都標(biāo)注出來。比如,給定一張圖片,我們希望知道里面是否有人、是否有狗、是否有草等。給定一個輸人,輸出不定量的類別,這個就叫作標(biāo)注任務(wù)。


4、搜索與排序

在這個數(shù)據(jù)爆炸的時代,在大量數(shù)據(jù)的場景下,如何用算法幫助人們從這些無序的信息中找到人們需要的信息就成為一個剛需。搜索與排序關(guān)注的問題更多的是如何對一堆對象排序。例如在信息檢索領(lǐng)域,我們常常關(guān)注如何把海量的文檔按照與檢索條目的相關(guān)性進(jìn)行排序。在互聯(lián)網(wǎng)時代,由于谷歌和百度等搜索引擎的流行,我們更加關(guān)注如何對網(wǎng)頁進(jìn)行排序。互聯(lián)網(wǎng)時代早期,谷歌研發(fā)出一個著名的網(wǎng)頁排序算法-PageRank。該算法的排序結(jié)果并不取決于特定的用戶檢索條目,這些排序結(jié)果可以更好地為所包含的檢索條目的網(wǎng)頁進(jìn)行排序。


5、推薦系統(tǒng)

推薦系統(tǒng)和搜索排序關(guān)系緊密,并且被廣泛應(yīng)用于電子商務(wù)、搜索引擎、新聞門戶等。推薦系統(tǒng)的主要目標(biāo)是把用戶可能感興趣的東西推薦給用戶。推薦算法用到的信息種類非常多,例如用戶的自我描述、過往的購物習(xí)慣,以及對過往推薦的反饋等。


6、序列學(xué)習(xí)序列學(xué)習(xí)是一類近來備受關(guān)注的機(jī)器學(xué)習(xí)問題。在這類問題中,需要考慮順序問題輸入和輸出的長度不固定(例如翻譯,輸入的英文和翻譯出來的中文長度都是不固定的)。這類模型通??梢蕴幚砣我忾L度的輸人序列,或者輸出任意長度的序列。當(dāng)輸入和輸出都是不定長的序列時,我們把這類模型稱為seq2seq,例如QA問答系統(tǒng)、語言翻譯模型和語音轉(zhuǎn)錄文本模型。

以下列舉了一些常見的序列學(xué)習(xí)案例。


1. 語音識別

在語音識別的問題里,輸人序列通常都是麥克風(fēng)的聲音,而輸出是對通過麥克風(fēng)所說的話的文本轉(zhuǎn)錄。這類問題通常有一個難點(diǎn),例如聲音通常都在特定的采樣率下進(jìn)行采樣,因?yàn)槁曇艉臀谋局g不存在一一對應(yīng)的關(guān)系。換言之,語音識別是一類序列轉(zhuǎn)換問題。這里的輸出往往比輸人短很多。


2. 文本轉(zhuǎn)語音

這是語音識別問題的逆問題。這里的輸入是一個文本序列,而輸出才是聲音序列。因此,這類問題的輸出比輸入長。


3. 機(jī)器翻譯機(jī)器翻譯的目標(biāo)是把一段話從一種語言翻譯成另一種語言,例如把中文翻譯成英語。目前,機(jī)器翻譯技術(shù)已經(jīng)很成熟,例如國內(nèi)的科大訊飛以及百度語音在中文翻譯領(lǐng)域都有不錯的成績,不過有的時候也會出現(xiàn)一些尷尬的翻譯結(jié)果。

機(jī)器翻譯的復(fù)雜程度是非常高的,同一個詞在兩種不同語言下有時候是多對多的關(guān)系。另外,符合語法或者語言習(xí)慣的語序調(diào)整也令問題更加復(fù)雜。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7770

    瀏覽量

    92835
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8544

    瀏覽量

    136350
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23207
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    【卡酷機(jī)器人】——基礎(chǔ)學(xué)習(xí)方法

    `` 這里和大伙兒講解一下卡酷機(jī)器人基礎(chǔ)學(xué)習(xí)方法,如果有錯誤,歡迎大家指點(diǎn)喲。``
    發(fā)表于 01-09 18:01

    【下載】《機(jī)器學(xué)習(xí)》+《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》

    讀者, 本書附錄給出了一些相關(guān)數(shù)學(xué)基礎(chǔ)知識簡介.目錄:全書共16 章,大致分為3 個部分:第1 部分(第1~3 章)介紹機(jī)器學(xué)習(xí)的基礎(chǔ)知識;第2 部分(第4~10 章)討論一些經(jīng)典而常用的機(jī)器
    發(fā)表于 06-01 15:49

    深度解析機(jī)器學(xué)習(xí)三類學(xué)習(xí)方法

    機(jī)器學(xué)習(xí)(Machine learning)領(lǐng)域。主要有三類不同的學(xué)習(xí)方法:監(jiān)督學(xué)習(xí)(Supervised learning)、非監(jiān)督學(xué)習(xí)
    發(fā)表于 05-07 09:09 ?1.5w次閱讀

    什么是機(jī)器學(xué)習(xí)?機(jī)器學(xué)習(xí)能解決什么問題?(案例分析)

    隨著大數(shù)據(jù)時代的到來,機(jī)器學(xué)習(xí)成為解決問題的一種重要且關(guān)鍵的工具。不管是工業(yè)界還是學(xué)術(shù)界,機(jī)器學(xué)習(xí)都是一個炙手可熱的方向,但是學(xué)術(shù)界和工 業(yè)界對機(jī)器
    發(fā)表于 05-18 13:13 ?1.7w次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>能解</b>決什么問題?(案例分析)

    機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘:方法和應(yīng)用》

    和應(yīng)用》的介紹及下載地址 贊助本站 《機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘:方法和應(yīng)用》分為5個部分,共18章,較為全面地介紹了機(jī)器學(xué)習(xí)的基本概念,并討論了數(shù)
    發(fā)表于 06-27 18:38 ?941次閱讀

    如何學(xué)好機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)學(xué)習(xí)方法4個關(guān)鍵點(diǎn)整理概述

    。 對于想要了解或從事AI行業(yè)工作的小伙伴們來說,能夠快速、深入的掌握機(jī)器學(xué)習(xí)相關(guān)知識顯得尤為重要,小編給大家整理機(jī)器學(xué)習(xí)學(xué)習(xí)方法。
    的頭像 發(fā)表于 09-24 19:29 ?6871次閱讀
    如何學(xué)好<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的<b class='flag-5'>學(xué)習(xí)方法</b>4個關(guān)鍵點(diǎn)整理概述

    機(jī)器學(xué)習(xí)入門寶典《統(tǒng)計(jì)學(xué)習(xí)方法》的介紹

    《統(tǒng)計(jì)學(xué)習(xí)方法》可以說是機(jī)器學(xué)習(xí)的入門寶典,許多機(jī)器學(xué)習(xí)培訓(xùn)班、互聯(lián)網(wǎng)企業(yè)的面試、筆試題目,很多都參考這本書。本文根據(jù)網(wǎng)上資料用python
    的頭像 發(fā)表于 11-25 09:24 ?5290次閱讀

    面向人工智能的機(jī)器學(xué)習(xí)方法體系總結(jié)

    此處梳理出面向人工智能的機(jī)器學(xué)習(xí)方法體系,主要體現(xiàn)機(jī)器學(xué)習(xí)方法和邏輯關(guān)系,理清機(jī)器學(xué)習(xí)脈絡(luò),后續(xù)
    的頭像 發(fā)表于 12-17 15:10 ?3925次閱讀
    面向人工智能的<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)方法</b>體系總結(jié)

    區(qū)塊鏈數(shù)據(jù)集有怎樣的機(jī)器學(xué)習(xí)方法

    區(qū)塊鏈數(shù)據(jù)集提供了一個與加密貨幣資產(chǎn)行為相關(guān)的獨(dú)特的數(shù)據(jù)宇宙,因此,為機(jī)器學(xué)習(xí)方法的應(yīng)用提供了獨(dú)特的機(jī)會。
    發(fā)表于 11-26 09:49 ?1166次閱讀

    隨著人工智能的落地 自動化機(jī)器學(xué)習(xí)方法AutoML應(yīng)運(yùn)而生

    隨著概念的普及,科技公司對人工智能的要求越來越高,成本、準(zhǔn)確度、效率都影響著人工智能能否落地融入日常的使用中。對人工智能應(yīng)用的快速增長也進(jìn)而催生了對影響人工智能水平的關(guān)鍵要素——機(jī)器學(xué)習(xí)方法的需求。自動化機(jī)器
    發(fā)表于 12-02 15:03 ?1086次閱讀

    機(jī)器學(xué)習(xí)方法遷移學(xué)習(xí)的發(fā)展和研究資料說明

    近年來,遷移學(xué)習(xí)已經(jīng)引起了廣泛的關(guān)注和研究。遷移學(xué)習(xí)是運(yùn)用已存有的知識對不同但相關(guān)領(lǐng)域問題進(jìn)行求解的一種新的機(jī)器學(xué)習(xí)方法。它放寬了傳統(tǒng)機(jī)器
    發(fā)表于 07-17 08:00 ?0次下載
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)方法</b>遷移<b class='flag-5'>學(xué)習(xí)</b>的發(fā)展和研究資料說明

    深度討論集成學(xué)習(xí)方法,解決AI實(shí)踐難題

    集成學(xué)習(xí)方法是一類先進(jìn)的機(jī)器學(xué)習(xí)方法,這類方法訓(xùn)練多個學(xué)習(xí)器并將它們結(jié)合起來解決一個問題,在實(shí)踐中獲得了巨大成功,并成為
    發(fā)表于 08-16 11:40 ?1103次閱讀
    深度討論集成<b class='flag-5'>學(xué)習(xí)方法</b>,解決AI實(shí)踐難題

    水聲被動定位中的機(jī)器學(xué)習(xí)方法研究進(jìn)展綜述

    向量機(jī)、隨機(jī)森林及以卷積網(wǎng)絡(luò)層和全連接層為主要組成單元的深度神經(jīng)網(wǎng)絡(luò)。本文通過重點(diǎn)引述近幾年發(fā)表在國際期刊和會議上的相關(guān)前沿研究工作,詳細(xì)論述了將機(jī)器學(xué)習(xí)方法應(yīng)用于水聲被動定位的關(guān)鍵理論基礎(chǔ)、單水聽器和陣列前端信號
    發(fā)表于 12-24 11:18 ?970次閱讀
    水聲被動定位中的<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)方法</b>研究進(jìn)展綜述

    聯(lián)合學(xué)習(xí)在傳統(tǒng)機(jī)器學(xué)習(xí)方法中的應(yīng)用

    聯(lián)合學(xué)習(xí)在傳統(tǒng)機(jī)器學(xué)習(xí)方法中的應(yīng)用
    的頭像 發(fā)表于 07-05 16:30 ?1328次閱讀
    聯(lián)合<b class='flag-5'>學(xué)習(xí)</b>在傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)方法</b>中的應(yīng)用

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    用于開發(fā)生物學(xué)數(shù)據(jù)的機(jī)器學(xué)習(xí)方法。盡管深度學(xué)習(xí)(一般指神經(jīng)網(wǎng)絡(luò)算法)是一個強(qiáng)大的工具,目前也非常流行,但它的應(yīng)用領(lǐng)域仍然有限。與深度學(xué)習(xí)相比,傳統(tǒng)
    的頭像 發(fā)表于 12-30 09:16 ?2023次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)方法</b>和應(yīng)用指導(dǎo)