chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何解決大數(shù)據(jù)帶來關(guān)于預(yù)測技術(shù)的挑戰(zhàn)

電子工程師 ? 來源:網(wǎng)絡(luò)整理 ? 作者:工程師飛燕 ? 2018-07-01 10:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大數(shù)據(jù)分析近年來逐漸成為預(yù)測分析技術(shù)的代名詞。這使得越來越多的人以為,任何用于預(yù)測分析的系統(tǒng)都必定涉及大數(shù)據(jù);而反過來,任何大數(shù)據(jù)系統(tǒng)自然也一定會支持預(yù)測建模。

而事實上,這兩者并非一回事。盡管通過訪問海量數(shù)據(jù)與新的數(shù)據(jù)類型,開發(fā)出更好的預(yù)測模型的能力會得到顯著增強。但是分析管理人員與其團隊需要更多考慮數(shù)據(jù)的構(gòu)成,以及在大數(shù)據(jù)環(huán)境中如何管理這類基礎(chǔ)性問題。

首先,讓我們審視預(yù)測分析過程本身。在主流的預(yù)測分析過程中,會涉及到某些與業(yè)務(wù)應(yīng)用相集成的統(tǒng)計分析與模式匹配,從而推動運營決策與操作。但是,預(yù)測模型的實時需要多項步驟,其中包括:

數(shù)據(jù)準(zhǔn)備工作,清理、轉(zhuǎn)換與重組數(shù)據(jù),使其符合預(yù)測分析或機器學(xué)習(xí)算法所需的格式。包括分析數(shù)據(jù)、尋找異常、確定應(yīng)用和待修復(fù)的數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)類型、設(shè)計適合分析的數(shù)據(jù)模型,并執(zhí)行轉(zhuǎn)換,使數(shù)據(jù)集保持一致。

預(yù)測模型開發(fā),包括創(chuàng)建試用數(shù)據(jù)集,選擇特定算法進行處理,從而測試某些分析模式。這一步需要有計劃地進行,將被分析的數(shù)據(jù)分為不同的子集,包括試用數(shù)據(jù)集和一份或多份測試數(shù)據(jù)集。

測試過程,即在各模型上運行測試數(shù)據(jù)集,對性能加以評估,從而確定哪種模型能夠得到最佳效果。

集成與實施,選中的模型被納入生產(chǎn)業(yè)務(wù)流程、實際上線、并產(chǎn)生真實的分析結(jié)果,以此采取行動。

調(diào)整所選的預(yù)測模型以確保其持續(xù)有效與準(zhǔn)確,重復(fù)分析、不斷更新。

大數(shù)據(jù)帶來特定的挑戰(zhàn)

接下來,讓我們看看大數(shù)據(jù)環(huán)境中出名的3V數(shù)據(jù)——即容量,多樣性和速度——并思考在大數(shù)據(jù)環(huán)境,預(yù)測分析過程中必須解決的一些特定挑戰(zhàn)。

數(shù)據(jù)容量。除了那些顯而易見的,與管理與海量數(shù)據(jù)有關(guān)的考量因素,包括數(shù)據(jù)獲取、分段和防止延遲,你必須有精簡的流程,從而支持各不同階段的分析過程。例如,你需要能夠提取到可以使用不同算法快速分析的試用數(shù)據(jù)集,也需要能夠充分反映整體數(shù)據(jù)的那部分信息。

數(shù)據(jù)的多樣化。企業(yè)越來越多地得到各式各樣的數(shù)據(jù)輸入,從傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)到日益增長的非結(jié)構(gòu)化數(shù)據(jù)類型。而且,隨著更多的非結(jié)構(gòu)化數(shù)據(jù)流成為業(yè)務(wù)流程中不可或缺的組成部分,例如對推特信息流的持續(xù)監(jiān)測可以識別客戶情緒,非結(jié)構(gòu)化數(shù)據(jù)正成為預(yù)測模型必不可少的數(shù)據(jù)源。這意味著你必須擁有一套非常強大的流程,用于掃描、分析和處理非結(jié)構(gòu)化數(shù)據(jù),以將其轉(zhuǎn)化為可用作分析算法輸入的數(shù)據(jù)集。

數(shù)據(jù)的速度。處理大量不同數(shù)據(jù)所帶來的復(fù)雜性,與更快速的數(shù)據(jù)流輸入速度疊加。使得你不僅必須能夠處理輸入速度更快的數(shù)據(jù)源,而且需要應(yīng)對這些數(shù)據(jù)源的結(jié)構(gòu)或格式可能會發(fā)生的變化。更要命的是,這種變化通常難以預(yù)測,因此迫切需要做好數(shù)據(jù)分析與準(zhǔn)備工作。

智慧的分析策略

設(shè)計大數(shù)據(jù)系統(tǒng)預(yù)測分析策略能夠應(yīng)對上述挑戰(zhàn),以便你可以成功管理或優(yōu)化流程中的關(guān)鍵點。

例如,考慮如何將龐大的數(shù)據(jù)集合轉(zhuǎn)化為容量更為合理的試用數(shù)據(jù)塊。在某些情況下,最佳實踐是,不要隨機選擇試用數(shù)據(jù)集,而是通過過濾器來減少數(shù)據(jù)集合的大小,這樣或許會消除特例的那部分記錄。另外一些情況中,你的目標(biāo)可能是增加大數(shù)據(jù)系統(tǒng)的計算資源,使分析算法有能力處理更大的訓(xùn)練集——并且無需過濾任何記錄。

另一個例子是,解決數(shù)據(jù)在速度方面挑戰(zhàn)或許意味著擴大系統(tǒng)對數(shù)據(jù)流的吞吐能力,從而可以讓每個數(shù)據(jù)逐一進入預(yù)測模型;當(dāng)然,你同樣可以降低模型的復(fù)雜度,以便更快速地加以執(zhí)行。

當(dāng)涉及到設(shè)計、工程量、復(fù)雜性和成本這些問題時,每一次選擇都意味著相應(yīng)的取舍。一組更精確的預(yù)測模型可能需要更多的處理和存儲資源,但分析帶來的優(yōu)勢或許會超越所增加的成本。又或者,你所在的企業(yè)組織也許可以從并不復(fù)雜的模型中,以較少的處理資源,獲得大數(shù)據(jù)應(yīng)用中的預(yù)測分析能力。

預(yù)測分析必須與大數(shù)據(jù)處理相結(jié)合,從而為分析管理人員、甚至企業(yè)高層提供所期待的結(jié)果。要做到這一點,就必須弄清楚如何在預(yù)測分析帶來的收益與大數(shù)據(jù)所需的性能和管理之間做出平衡。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 預(yù)測分析
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    6515
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8960

    瀏覽量

    140214
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    云計算、大數(shù)據(jù)處理技術(shù)交流

    云計算、大數(shù)據(jù)處理技術(shù)交流圖形圖像是數(shù)據(jù)處理量最大的版塊之一,也是當(dāng)今云計算的重要課題之一,圖形圖像處理大會給大家帶來諸多名家方案,探究大數(shù)據(jù)
    發(fā)表于 09-16 14:18

    淺談大數(shù)據(jù)視頻圖像處理系統(tǒng)技術(shù)

    淺談大數(shù)據(jù)視頻圖像處理系統(tǒng)技術(shù)近年來,隨著計算機、網(wǎng)絡(luò)以及圖像處理、傳輸技術(shù)的飛速發(fā)展,視頻監(jiān)控系統(tǒng)正向著高清化、智能化和網(wǎng)絡(luò)化方向發(fā)展。視頻監(jiān)控系統(tǒng)的高清化、智能化和網(wǎng)絡(luò)化為視頻監(jiān)控圖像處理
    發(fā)表于 09-24 15:22

    探尋大數(shù)據(jù)時代的商業(yè)變革

    的多階矩陣型連接,通過創(chuàng)造革新的商業(yè)模式,為社會生產(chǎn)力帶來新的機遇,為企業(yè)帶來新的發(fā)展空間。 在新經(jīng)濟新環(huán)境下,隨著“大數(shù)據(jù)”的不斷發(fā)展壯大,更多的數(shù)據(jù)或?qū)?/div>
    發(fā)表于 05-27 17:11

    常見大數(shù)據(jù)應(yīng)用有哪些?

    預(yù)測、數(shù)據(jù)分析結(jié)果展示等,為做出正確決策提供依據(jù),其數(shù)據(jù)級別通常在PB以上,以下是常用的大數(shù)據(jù)技術(shù):一、
    發(fā)表于 03-13 16:50

    大數(shù)據(jù)運用的技術(shù)

    大數(shù)據(jù)是對海量數(shù)據(jù)進行存儲、計算、統(tǒng)計、分析處理的一系列處理手段,處理的數(shù)據(jù)量通常是TB級,甚至是PB或EB級的數(shù)據(jù),這是傳統(tǒng)數(shù)據(jù)處理手段所
    發(fā)表于 04-08 16:50

    大數(shù)據(jù)專業(yè)技術(shù)學(xué)習(xí)之大數(shù)據(jù)處理流程

    隨著互聯(lián)網(wǎng)的發(fā)展,大數(shù)據(jù)也在逐漸彰顯出自己的優(yōu)勢特點,那么關(guān)于大數(shù)據(jù)的處理流程,你是否了解?第一,數(shù)據(jù)采集定義:利用多種輕型數(shù)據(jù)庫來接收發(fā)自
    發(fā)表于 06-11 16:41

    大數(shù)據(jù)開發(fā)核心技術(shù)詳解

    數(shù)據(jù)的核心是云技術(shù)和BI。關(guān)于大數(shù)據(jù)和云計算的關(guān)系人們通常會有誤解,而且也會把它們混起來說,分別做一句話直白解釋就是:云計算就是硬件資源的虛擬化;
    發(fā)表于 07-26 16:26

    常用大數(shù)據(jù)技術(shù)課程內(nèi)容

    關(guān)于大數(shù)據(jù)的概念,指的是無法在一定時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進行抓取、管理和處理的數(shù)據(jù)集合。而大數(shù)據(jù)技術(shù),是指從各種各樣類型的
    發(fā)表于 07-26 16:27

    NLPIR系統(tǒng)KGB知識圖譜技術(shù)助力大數(shù)據(jù)深度挖掘

      大數(shù)據(jù)時代的到來,意味著海量數(shù)據(jù)的產(chǎn)生,給我們現(xiàn)有的數(shù)據(jù)存儲技術(shù)帶來了巨大的挑戰(zhàn)。而隨著時代
    發(fā)表于 12-05 11:49

    何解決全雙工通信帶來的測試挑戰(zhàn)

    何解決全雙工通信帶來的測試挑戰(zhàn)?
    發(fā)表于 06-17 06:46

    智能電網(wǎng)預(yù)測負(fù)荷波動的影響

    智能電網(wǎng)預(yù)測負(fù)荷波動和新能源出力方面在整個電網(wǎng)電量管理系統(tǒng)中,負(fù)荷所占據(jù)的比重極大,它對于整體運行安全性會帶來直接影響。當(dāng)前,電網(wǎng)數(shù)據(jù)采集范圍正在持續(xù)擴大,它也充分涉及有關(guān)于氣象信息、
    發(fā)表于 07-12 06:52

    大數(shù)據(jù)技術(shù)與應(yīng)用是學(xué)什么的?

    大數(shù)據(jù)技術(shù)與應(yīng)用是學(xué)什么的?大數(shù)據(jù)是指無法在一定時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進行抓取、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)
    發(fā)表于 07-27 07:47

    大數(shù)據(jù)技術(shù)原理與應(yīng)用

    本文介紹了關(guān)于大數(shù)據(jù)的相關(guān)概念、大數(shù)據(jù)的結(jié)構(gòu)、大數(shù)據(jù)的特點以及大數(shù)據(jù)技術(shù)的十大原理及詳細的說明了
    發(fā)表于 12-19 14:29 ?11.2w次閱讀
    <b class='flag-5'>大數(shù)據(jù)</b><b class='flag-5'>技術(shù)</b>原理與應(yīng)用

    關(guān)于AI和大數(shù)據(jù)時代所帶來的機遇與挑戰(zhàn)

    任何一家公司都不可能獨立面對AI和大數(shù)據(jù)時代所帶來的機遇與挑戰(zhàn),這需要半導(dǎo)體行業(yè)整個生態(tài)鏈的合作。應(yīng)用材料公司同樣致力于與行業(yè)生態(tài)共同合作研發(fā)在人工智能時代提升PPACt所需的新技術(shù)。
    的頭像 發(fā)表于 06-30 17:42 ?5055次閱讀

    醫(yī)療大數(shù)據(jù)面臨的挑戰(zhàn)及相應(yīng)的隱私保護技術(shù)

    受關(guān)注的重要議題。醫(yī)療大數(shù)據(jù)自身特點以及存儲環(huán)境等都為隱私倸護帶來了不小的挑戰(zhàn)。首先,介紹了醫(yī)療大數(shù)據(jù)的相關(guān)概念以及特點。然后,圍繞醫(yī)療大數(shù)據(jù)
    發(fā)表于 03-25 11:26 ?16次下載
    醫(yī)療<b class='flag-5'>大數(shù)據(jù)</b>面臨的<b class='flag-5'>挑戰(zhàn)</b>及相應(yīng)的隱私保護<b class='flag-5'>技術(shù)</b>