chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于數(shù)據(jù)挖掘原理分析及其在量化投資中的應(yīng)用介紹

MATLAB ? 來源:djl ? 2019-09-19 09:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、什么是數(shù)據(jù)挖掘

數(shù)據(jù)挖掘(Data Mining),也叫數(shù)據(jù)開采,數(shù)據(jù)采掘等,就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。

數(shù)據(jù)挖掘基于的數(shù)據(jù)庫類型主要有關(guān)系型數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、事務(wù)數(shù)據(jù)庫、演繹數(shù)據(jù)庫、時態(tài)數(shù)據(jù)庫、多媒體數(shù)據(jù)庫、主動數(shù)據(jù)庫、空間數(shù)據(jù)庫、文本型、 Internet信息庫 以及新興的數(shù)據(jù)倉庫(Data Warehouse)等。而挖掘后獲得的知識包括關(guān)聯(lián)規(guī)則、特征規(guī)則、區(qū)分規(guī)則、分類規(guī)則、總結(jié)規(guī)則、偏差規(guī)則、聚類規(guī)則、模式分析及趨勢分析等。數(shù)據(jù)挖掘是一門交叉學(xué)科,它把人們對數(shù)據(jù)的應(yīng)用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。數(shù)據(jù)挖掘在數(shù)據(jù)由數(shù)據(jù)庫轉(zhuǎn)化為知識的過程中,所處的位置如圖1所示。

關(guān)于數(shù)據(jù)挖掘原理分析及其在量化投資中的應(yīng)用介紹

圖1 數(shù)據(jù)由數(shù)據(jù)庫轉(zhuǎn)化為知識的過程

數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析(如查詢、報表、聯(lián)機(jī)應(yīng)用分析)的本質(zhì)區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(也包括大量的不公開的數(shù)據(jù))。數(shù)據(jù)挖掘使數(shù)據(jù)庫技術(shù)進(jìn)入了一個更高級的階段。數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識,甚至是違背直覺的信息或知識,挖掘出的信息越是出乎意料,就可能越有價值。能夠比市場提前知道這種信息,提前做出決策就會獲得超額利潤。

二、數(shù)據(jù)挖掘的原理

數(shù)據(jù)本來只是數(shù)據(jù),直觀上并沒有表現(xiàn)出任務(wù)有價值的知識。當(dāng)我們用數(shù)據(jù)挖掘方法,從數(shù)據(jù)中挖掘出知識后,這種知識是否值得信賴呢?為了說明這種知識是可信的, 現(xiàn)在來簡要介紹一下數(shù)據(jù)挖掘的原理。

關(guān)于數(shù)據(jù)挖掘原理分析及其在量化投資中的應(yīng)用介紹


圖2 數(shù)據(jù)挖掘與其他學(xué)科的關(guān)系

數(shù)據(jù)挖掘其實(shí)質(zhì)是綜合應(yīng)用各種技術(shù),對于業(yè)務(wù)相關(guān)的數(shù)據(jù)進(jìn)行一系列科學(xué)的處理,這這過程中需要用到數(shù)據(jù)庫、統(tǒng)計(jì)學(xué)、應(yīng)用數(shù)學(xué)、機(jī)器學(xué)習(xí)、可視化、信息科學(xué)、程序開發(fā)以及其他學(xué)科(如圖2所示)。其核心是利用算法對處理好的輸入和輸出數(shù)據(jù)進(jìn)行訓(xùn)練,并得到模型, 然后再對模型進(jìn)行驗(yàn)證,使得模型能夠在一定程度上刻畫出數(shù)據(jù)由輸入到輸出的關(guān)系, 然后再利用該模型,對新輸入的數(shù)據(jù)進(jìn)行計(jì)算,從而得到我們希望得到的新的輸出。所以雖然這種模型不容易解釋或很難看到, 但它是基于大量數(shù)據(jù)訓(xùn)練并經(jīng)過驗(yàn)證的,所以能夠反映輸入數(shù)據(jù)和輸出數(shù)據(jù)之間的大致關(guān)系,這種關(guān)系(模型)就是我們需要的知識。這就是數(shù)據(jù)挖掘的原理。從數(shù)據(jù)挖掘的原理可以看出, 數(shù)據(jù)挖掘是有一定科學(xué)依據(jù)的, 數(shù)據(jù)挖掘的結(jié)果也是值得信賴的。

三、數(shù)據(jù)挖掘在量化投資的應(yīng)用

1、宏觀經(jīng)濟(jì)分析

股市的影響因素很多,但中國股市對宏觀政策尤其敏感,從根本上說,股市的運(yùn)行與宏觀的經(jīng)濟(jì)運(yùn)行應(yīng)當(dāng)是一致的,經(jīng)濟(jì)的周期決定著股市的周期,股市周期的變化反映了經(jīng)濟(jì)周期的變動。其中經(jīng)濟(jì)周期包括衰退、危機(jī)、復(fù)蘇和繁榮四個階段。按照一般常理來說,在經(jīng)濟(jì)衰退時期,股價指數(shù)會逐漸下跌;到經(jīng)濟(jì)危機(jī)時期,股價指數(shù)跌至最低點(diǎn);當(dāng)經(jīng)濟(jì)復(fù)蘇開始時,股價指數(shù)又會逐步上升;到經(jīng)濟(jì)繁榮時,股價指數(shù)則上漲至最高點(diǎn)。由此看來宏觀經(jīng)濟(jì)走勢影響著股市的波動,但宏觀經(jīng)濟(jì)走勢與股市趨勢的變動周期也不是完全同步的。所以無論從量化投資角度還是傳統(tǒng)投資方式角度,對宏觀經(jīng)濟(jì)進(jìn)行深入的分析是必須的。

在量化投資領(lǐng)域, 數(shù)據(jù)挖掘技術(shù)可以做以下幾個方面的工作:

分析GDP對股市及個股的影響。

分析分析貨幣供應(yīng)量對股票價格的影響及對個股的影響。

分析利率對股市的影響及利率變化對個股的影響。

分析匯率對股市及個股的影響。

在宏觀經(jīng)濟(jì)分析方面, 經(jīng)常用到回歸、關(guān)聯(lián)分析、分類、預(yù)測等方法。比如利用回歸、預(yù)測等技術(shù)確定經(jīng)濟(jì)周期, 并研究不同股票于各經(jīng)濟(jì)周期的關(guān)聯(lián)性, 這樣就可以在不同的經(jīng)濟(jì)周期,制定不同的投資策略,這樣不僅可以在不同的經(jīng)濟(jì)周期實(shí)現(xiàn)持續(xù)盈利,還可以規(guī)避風(fēng)險。 比如有的投資機(jī)構(gòu)在2008年前就利用數(shù)據(jù)挖掘技術(shù)確認(rèn)當(dāng)時的經(jīng)濟(jì)周期,提前減倉,改變投資策略,不僅避免了風(fēng)險,而且實(shí)現(xiàn)了高額收益。 其實(shí),如果將08年之前的宏觀經(jīng)濟(jì)數(shù)據(jù)可視化之后(圖3所示), 就會發(fā)現(xiàn)這期間的經(jīng)濟(jì)環(huán)境了。

關(guān)于數(shù)據(jù)挖掘原理分析及其在量化投資中的應(yīng)用介紹

圖3 08年前后的宏觀經(jīng)濟(jì)趨勢圖

2、估價

國內(nèi)外大量實(shí)證研究結(jié)果表明:上市公司定期公布的財(cái)務(wù)報告具有很強(qiáng)的信息含量,但是當(dāng)期會計(jì)盈余數(shù)據(jù)的信息會在披露前后在股票市價中迅速得以體現(xiàn)。因此對于中長期投資者來說,重要的是預(yù)見未來。質(zhì)地優(yōu)良且未來具有較高盈利增長能力的公司是中長期投資者(包括普通投資者,證券投資基金和券商)普遍關(guān)注的對象,因?yàn)橹挥羞@類公司才能給投資。

通過對上市公司的價值的評估,來進(jìn)行股票的選擇。這是現(xiàn)在占據(jù)主流地位的基本面分析的基本方法。通過各種不同的方法對于上市公司的價值進(jìn)行一個評估,然后結(jié)合股票市場上的表現(xiàn)來決定市場上的價格是否被低估或者高估。如果低估則買入,如果高估則賣出。當(dāng)然,中國市場現(xiàn)在還沒有賣空的途徑,剛剛獲批的融資融券業(yè)務(wù)也只是在限定標(biāo)的的情況下進(jìn)行部分的賣空,所以中國市場還是主要以買入為主。于是,我們更多的是選擇那些價格被低估的股票。分析未來股票發(fā)行和上市價格的合理定位。

數(shù)據(jù)挖掘技術(shù)在估價方面的應(yīng)用就是去挖掘價值被低估的股票, 比如可以用最近鄰方法確定基本面相似的股票的市場估價, 然后根據(jù)實(shí)際價格很容易確定哪些股票被低估或者高估。 該方法對于新股的認(rèn)購策略也同樣非常有幫助, 因?yàn)榭梢杂脕碓u估新股的合理價格區(qū)間。

3、量化選股

量化選股是數(shù)據(jù)挖掘在量化投資領(lǐng)域研究和應(yīng)用最多的課題,畢竟選股是量化投資的最重要的內(nèi)容。像上面剛介紹的多因子選股模型,主要是靠數(shù)據(jù)挖掘中的回歸方法得到的。當(dāng)然量化選股的內(nèi)容不僅限于此,數(shù)據(jù)挖掘技術(shù)在選股上有多重應(yīng)用,有時是為策略提供決策基礎(chǔ), 有時是根據(jù)策略進(jìn)行挖掘。 比如,可以用聚類方法對股票進(jìn)行聚類,從而對股票進(jìn)行分池, 選股的時候就2可以從上漲概率比較大的池子中選擇股票。 再比如,可以用神經(jīng)網(wǎng)絡(luò)方法預(yù)測股票的漲跌概率,具體實(shí)現(xiàn)方法這里先不贅述, 這些內(nèi)容在本書中將都會進(jìn)行介紹。

4、量化擇時

量化投資領(lǐng)域中,一個好的選股策略是比較容易實(shí)現(xiàn)的。這是因?yàn)樵陂L時間跨度里能夠跑贏市場的一些投資組合一般會滿足某種特性,例如低估值、例如高成長、例如小市值、例如隱形資產(chǎn)低估等等。 但擇時就不是那么簡單了, 這里會有一個簡單的問題:大盤明天是漲還是跌?

這個看似簡單的問題其實(shí)并不好回答,尤其是從量化的角度去處理,甚至我們從傳統(tǒng)的策略研究——技術(shù)面+基本面+政策面會更加好回答一些。為什么?因?yàn)榱炕瘬駮r無法處理來自政策面的消息。還有就是量化擇時經(jīng)常會有很強(qiáng)的時域特性,太短的時域預(yù)測例如一天,太長的時域預(yù)測例如一年,量化擇時是很難處理的。

正因?yàn)閾駮r比較難處理, 所以采用數(shù)據(jù)挖掘技術(shù), 用大量的數(shù)據(jù)去尋找最佳的賣點(diǎn)相對顯得更理性些。 比如用上面剛介紹的SVM方法進(jìn)行擇時, 或采用神經(jīng)網(wǎng)絡(luò)預(yù)測近期的漲跌趨勢, 再或者采用分類方法判斷近期的最佳交易周期。

5、算法交易

算法交易(algorithmic trading),是指把一個指定交易量的買入或者賣出指令放入模型,該模型包含交易員確定的某些目標(biāo)。 根據(jù)這些特殊的算法目標(biāo),該模型會產(chǎn)生執(zhí)行指令的時機(jī)和交易額。而這些目標(biāo)往往基于某個基準(zhǔn)、價格或時間。這種交易有時候被稱“黑箱交易”。算法交易通過程序系統(tǒng)交易,將一個大額的交易拆分成數(shù)十個小額交易,以此來盡量減少對市場價格造成沖擊,降低交易成本,且還能幫助機(jī)構(gòu)投資者快速增加交易量。

算法交易系統(tǒng)的核心是通過一套計(jì)算機(jī)程序,可以在一秒鐘內(nèi)產(chǎn)生數(shù)千個交易指令,其中許多指令瞬間就可以被取消或被新的指令取代,從而把大額委托化整為零,減小對市場的沖擊,并且可以尋求最佳的成交執(zhí)行路徑,減少交易成本。但程序的核心是交易算法,而這種敢于在市場上進(jìn)行實(shí)操的算法往往都是在大量的歷史交易數(shù)據(jù)挖掘中得到的, 然后再經(jīng)過嚴(yán)格的測試,確定算法的可靠且有效后方可投入實(shí)際的算法交易。 在算法交易方面,可用到的數(shù)據(jù)挖掘技術(shù)比較廣, 往往涉及到多種方法的綜合。 在算法交易方面,目前用的比較多的數(shù)據(jù)挖掘方法是集成決策樹, 其核心是當(dāng)不同的指標(biāo)(信號)出現(xiàn)不同的情況時,給出具體的交易操作(買入或賣出),采用這種方法不僅是穩(wěn)定、靈活,而且還可以采用優(yōu)化算法對其進(jìn)行優(yōu)化,提高收益, 圖4即為采用遺傳算法優(yōu)化交易指標(biāo)的迭代效果圖。

關(guān)于數(shù)據(jù)挖掘原理分析及其在量化投資中的應(yīng)用介紹


圖4 遺傳算法優(yōu)化交易指標(biāo)的迭代效果圖

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    關(guān)于NFC鎳鋅鐵氧體片的介紹

    關(guān)于NFC鎳鋅鐵氧體片的介紹
    的頭像 發(fā)表于 12-04 10:52 ?109次閱讀
    <b class='flag-5'>關(guān)于</b>NFC鎳鋅鐵氧體片的<b class='flag-5'>介紹</b>

    RT-Thread睿賽德科技受邀參加“投資中國·2025上海城市投資推介大會”|新聞速遞

    近日,由上海市人民政府主辦的“投資中國·2025上海城市投資推介大會”在上海國際會議中心隆重舉行。上海市委書記陳吉寧出席并致辭,上海市委副書記、市長龔正作主旨推介。作為全球領(lǐng)先的嵌入式操作系統(tǒng)提供商
    的頭像 發(fā)表于 11-07 17:37 ?1130次閱讀
    RT-Thread睿賽德科技受邀參加“<b class='flag-5'>投資中</b>國·2025上海城市<b class='flag-5'>投資</b>推介大會”|新聞速遞

    關(guān)于系統(tǒng)鏈接腳本的介紹

    起來后所處于的地址,程序中的相對尋址都會遵從此虛擬地址。 四、關(guān)于ITCM和DTCM(若使用FLASH下載模式) (1) 代碼段上載到ITCM,ITCM起始地址(0x80000000)存儲的代碼就是主函數(shù)的入口。 (2)數(shù)據(jù)段上載到DTCM,DTCM起始地址(0x
    發(fā)表于 10-30 08:26

    【新啟航】深度學(xué)習(xí)玻璃晶圓 TTV 厚度數(shù)據(jù)智能分析中的應(yīng)用

    一、引言 玻璃晶圓總厚度偏差(TTV)是衡量晶圓質(zhì)量的關(guān)鍵指標(biāo),其精確分析對半導(dǎo)體制造、微流控芯片等領(lǐng)域至關(guān)重要 。傳統(tǒng) TTV 厚度數(shù)據(jù)分析方法依賴人工或簡單算法,效率低且難以挖掘數(shù)據(jù)
    的頭像 發(fā)表于 10-11 13:32 ?251次閱讀
    【新啟航】深度學(xué)習(xí)<b class='flag-5'>在</b>玻璃晶圓 TTV 厚度<b class='flag-5'>數(shù)據(jù)</b>智能<b class='flag-5'>分析</b>中的應(yīng)用

    XKCON祥控輸煤皮帶智能機(jī)器人巡檢系統(tǒng)對監(jiān)測數(shù)據(jù)進(jìn)行挖掘分析

    XKCON祥控輸煤皮帶智能機(jī)器人巡檢系統(tǒng)通過智能機(jī)器人在皮帶運(yùn)行過程中對皮帶的運(yùn)行狀態(tài)和環(huán)境狀況進(jìn)行實(shí)時檢測,應(yīng)用過程中,不但提升了巡視周期頻次,還通過大數(shù)據(jù)分析和深度學(xué)習(xí)算法,對監(jiān)測數(shù)據(jù)進(jìn)行
    的頭像 發(fā)表于 09-15 11:22 ?430次閱讀
    XKCON祥控輸煤皮帶智能機(jī)器人巡檢系統(tǒng)對監(jiān)測<b class='flag-5'>數(shù)據(jù)</b>進(jìn)行<b class='flag-5'>挖掘</b><b class='flag-5'>分析</b>

    商湯科技亮相2025中國國際投資貿(mào)易洽談會

    9月8日,第二十五屆中國國際投資貿(mào)易洽談會在福建廈門開幕。作為我國唯一以促進(jìn)投資為主題的國家級重大展會,本屆投洽會吸引了120多個國家和地區(qū)、11個國際組織的代表團(tuán)參會。本屆投洽會突出“投資中
    的頭像 發(fā)表于 09-10 09:59 ?833次閱讀

    云知聲亮相2025中國國際投資貿(mào)易洽談會

    9月8日-11日,“攜手中國 投資未來丨第二十五屆中國國際投資貿(mào)易洽談會”廈門成功舉辦。本屆投洽會聚焦“投資中國”“中國投資”“國際
    的頭像 發(fā)表于 09-09 10:49 ?758次閱讀

    如何根據(jù)設(shè)備健康狀態(tài)數(shù)據(jù)進(jìn)行分析決策?

    要根據(jù)設(shè)備健康狀態(tài)數(shù)據(jù)做好分析決策,需先明確數(shù)據(jù)核心價值,再通過 “數(shù)據(jù)預(yù)處理→多維度分析→風(fēng)險評估→決策落地” 的閉環(huán)流程推進(jìn),既依托技術(shù)
    的頭像 發(fā)表于 08-20 10:07 ?465次閱讀
    如何根據(jù)設(shè)備健康狀態(tài)<b class='flag-5'>數(shù)據(jù)</b>進(jìn)行<b class='flag-5'>分析</b>決策?

    用樹莓派挖掘5種頂級加密貨幣!

    加密貨幣是用于在線交易的數(shù)字貨幣。挖掘這些貨幣通常需要專門的硬件,如ASIC礦機(jī)或高性能GPU。然而,有些加密貨幣仍可用樹莓派來挖掘本文中,我將為您介紹可在樹莓派上
    的頭像 發(fā)表于 07-21 16:34 ?957次閱讀
    用樹莓派<b class='flag-5'>挖掘</b>5種頂級加密貨幣!

    瑞芯微模型量化文件構(gòu)建

    模型是一張圖片輸入時,量化文件如上圖所示。但是我現(xiàn)在想量化deepprivacy人臉匿名模型,他的輸入是四個輸入。該模型訓(xùn)練時數(shù)據(jù)集只標(biāo)注了人臉框和關(guān)鍵點(diǎn),該模型的預(yù)處理是放到模型外的,不在模型
    發(fā)表于 06-13 09:07

    永磁無刷電機(jī)及其驅(qū)動技術(shù)

    結(jié)構(gòu)電機(jī)以及Halbach 陣列布置的電機(jī)等。第2章簡要介紹了功率器件和它們的開關(guān)特性與損耗,整流器及逆變器。逆變 器主要介紹了其模型、開關(guān)方案及其優(yōu)缺點(diǎn)。同時介紹了四象限運(yùn)行常用的學(xué)
    發(fā)表于 03-31 15:25

    是德示波器觸發(fā)模式及其使用

    到我們能否準(zhǔn)確捕捉并分析目標(biāo)信號。以下是關(guān)于是德示波器觸發(fā)模式及其使用的簡要介紹。 一、觸發(fā)模式概述 是德示波器通常具備三種基本觸發(fā)模式:自動模式(AUTO)、常規(guī)模式(NORM)和單
    的頭像 發(fā)表于 03-17 11:42 ?1371次閱讀
    是德示波器觸發(fā)模式<b class='flag-5'>及其</b>使用

    是否可以輸入隨機(jī)數(shù)據(jù)集來生成INT8訓(xùn)練后量化模型?

    無法確定是否可以輸入隨機(jī)數(shù)據(jù)集來生成 INT8 訓(xùn)練后量化模型。
    發(fā)表于 03-06 06:45

    求助,關(guān)于ADC10D1500低溫問題求解

    1023,對比板上另外一塊正常的ADC沒有飽和,指標(biāo)正常。將輸入幅度減小不讓問題ADC飽和,發(fā)現(xiàn)問題ADC量化后的數(shù)據(jù)比正常ADC量化后的數(shù)據(jù)大3~5dB。測試序列測試FPGA采集到的
    發(fā)表于 02-12 07:26

    ADC量化位數(shù)只有兩位,將采樣結(jié)果做FFT分析后,發(fā)現(xiàn)二次諧波的幅度最大,請教是什么原因造成的?

    如題,ADC量化位數(shù)只有兩位,將采樣結(jié)果做FFT分析后,發(fā)現(xiàn)二次諧波的幅度最大,請教是什么原因造成的?
    發(fā)表于 12-26 06:23