機(jī)器學(xué)習(xí)平臺(tái)SkyDiscovery行業(yè)應(yīng)用智能金融交易

2020-06-19 23:01:57 sunmedia 1083


? ? 現(xiàn)代金融市場(chǎng)日益發(fā)展且不斷完善,金融投資的規(guī)模持續(xù)增長(zhǎng);同時(shí),人工智能技術(shù)的發(fā)展和更迭更是不容忽視。如何抓住此一現(xiàn)象的契機(jī),將人工智能合理、有效地運(yùn)用在金融投資領(lǐng)域,已成為全球關(guān)注熱點(diǎn)。在這美好的周日,最適合學(xué)習(xí)的日子,小天特別和大家分享金融事業(yè)部團(tuán)隊(duì)的研發(fā)成果和實(shí)際的案例,一起了解,當(dāng)金融遇上AI,會(huì)是什么樣子。

????金融行業(yè)中,既有很多在線免費(fèi)的數(shù)據(jù),也有付費(fèi)整理后規(guī)范化的數(shù)據(jù),信息化發(fā)展相較其他行業(yè)完善。然而,將人工智能技術(shù)有效應(yīng)用在金融市場(chǎng)的難點(diǎn)仍然存在:如何快速利用這些數(shù)據(jù),提取有價(jià)值的信息,并精準(zhǔn)的運(yùn)用到投資決策中?

????這個(gè)過程需要強(qiáng)大的計(jì)算力的支持,天數(shù)潤(rùn)科為此開發(fā)了SkyDiscovery大數(shù)據(jù)機(jī)器學(xué)習(xí)平臺(tái),以滿足金融行業(yè)對(duì)于大數(shù)據(jù)技術(shù)和人工智能應(yīng)用的需求。

????目前,公司在此平臺(tái)上已開發(fā)了一系列的交易策略,其中Quantmental中長(zhǎng)期投資組合和超短線增強(qiáng)策略已投入實(shí)盤。Quantmental中長(zhǎng)期投資組合,結(jié)合了基本面價(jià)值投資分析方法與數(shù)據(jù)挖掘分析手段:首先,以財(cái)務(wù)信息為基礎(chǔ),挖掘業(yè)績(jī)穩(wěn)定,成長(zhǎng)確定性較高,行業(yè)內(nèi)競(jìng)爭(zhēng)力較強(qiáng)的個(gè)股。其次,結(jié)合客觀技術(shù)分析與數(shù)據(jù)分析方法,在初步篩選的股票池中,動(dòng)態(tài)把握個(gè)股適合的投資時(shí)機(jī),實(shí)現(xiàn)組合的智能管理。

????以下為策略開發(fā)的詳細(xì)流程:

????01 數(shù)據(jù)存儲(chǔ)與讀取

????SkyDiscovery提供了多個(gè)數(shù)據(jù)庫組件支持全方位的金融數(shù)據(jù)的管理,包括高性能的OLAP數(shù)據(jù)庫SkyInsight、時(shí)序數(shù)據(jù)庫SkyTSDB,同時(shí)集成了GPU數(shù)據(jù)庫MapD。

????我們的金融數(shù)據(jù)包括:

????1.行情數(shù)據(jù),有l(wèi)evel2行情,支持歷史和實(shí)時(shí)存儲(chǔ);

????2.日線級(jí)別的財(cái)報(bào)數(shù)據(jù);

????3.政策性的文本數(shù)據(jù);

????我們使用SkyInsight管理所有離線數(shù)據(jù),以SkyTSDB存儲(chǔ)實(shí)時(shí)的時(shí)序數(shù)據(jù)。數(shù)據(jù)服務(wù)的架構(gòu)如下圖所示:

????此金融數(shù)據(jù)平臺(tái)能夠提供穩(wěn)定高效的數(shù)據(jù)訪問服務(wù)、標(biāo)準(zhǔn)易用的數(shù)據(jù)統(tǒng)一接口,并兼顧數(shù)據(jù)安全和橫向擴(kuò)展需求。

????SkyInsight支持表分區(qū),時(shí)間和股票種類兩個(gè)維度對(duì)數(shù)據(jù)自動(dòng)分區(qū);采用計(jì)算存儲(chǔ)分離架構(gòu),支持與Kubernetes集成,極易根據(jù)計(jì)算和存儲(chǔ)的不同需求伸縮;MPP架構(gòu),億級(jí)別數(shù)據(jù)秒級(jí)響應(yīng);支持標(biāo)準(zhǔn)SQL。

????SkyTSDB對(duì)接實(shí)時(shí)接入的tick數(shù)據(jù),基于時(shí)序特征優(yōu)化讀寫,能夠高效滿足金融時(shí)序模型對(duì)數(shù)據(jù)的需求。

????SkyETL支撐數(shù)據(jù)接入平臺(tái)和內(nèi)部服務(wù)間的數(shù)據(jù)流轉(zhuǎn),支持離線數(shù)據(jù)的批處理和流數(shù)據(jù)的實(shí)時(shí)處理。

????不同時(shí)間周期的金融數(shù)據(jù),頻率高、覆蓋廣、體量大。截至目前,策略處理的數(shù)據(jù)量已超2T,這一數(shù)字仍在每日增長(zhǎng)。實(shí)現(xiàn)快速穩(wěn)定的存、取、更新操作,是金融建模的基石。

????02 特征處理

????股票的特征提取,我們以盈利性(利潤(rùn)表)分析為例。

????首先,提取利潤(rùn)表中的指標(biāo)數(shù)據(jù),進(jìn)行比值分析,梳理出能夠反映收入、成本,利潤(rùn)主體關(guān)系的income_info以及衍生指標(biāo)income_ratios。

????在此,通過平臺(tái)可視化展示,我們能更加直觀的理解各個(gè)指標(biāo)。

????如圖,展示了利潤(rùn)表的主要構(gòu)成情況(以000002.SZ萬科為例)。圖一將營業(yè)總收入劃分為一級(jí)成本,二級(jí)成本以及營業(yè)利潤(rùn)。圖二進(jìn)一步分析了營業(yè)利潤(rùn),其他損益(金融活動(dòng))與凈利潤(rùn)之間的關(guān)系。圖三將股東利潤(rùn)劃分為,其他綜合損益,歸屬于少數(shù)股東綜合收益以及歸屬于母公司普通股東綜合收益。通過這一些列餅形圖可以直觀的觀察出該公司的收入,成本以及利潤(rùn)等詳細(xì)情況。

????上圖展示了五年來房地產(chǎn)行業(yè)的個(gè)股(挑選8只股票)的gross profit margin與netincome margin相對(duì)的發(fā)展?fàn)顩r,其中圓圈大小對(duì)應(yīng)個(gè)股的earning per share??梢灾庇^的感受個(gè)股各個(gè)指標(biāo)之間的動(dòng)態(tài)變化關(guān)系。

????我們以利潤(rùn)表為例,簡(jiǎn)單介紹了投資策略如何提取特征工程。當(dāng)然實(shí)際策略實(shí)施中需要考量更多的指標(biāo),同時(shí)還有資產(chǎn)負(fù)債表,現(xiàn)金流量表以及其他附屬信息的分析。但是提取特征的主體思路卻是保持一致的,即既要從時(shí)間序列維度出發(fā),挖掘業(yè)績(jī)長(zhǎng)期穩(wěn)定或者增長(zhǎng)的股票特征,同時(shí)也要從橫截面角度思考,在行業(yè)內(nèi)尋找有明顯競(jìng)爭(zhēng)優(yōu)勢(shì)的個(gè)股特征。當(dāng)我們篩選出成長(zhǎng)性高,行業(yè)內(nèi)競(jìng)爭(zhēng)力強(qiáng)的個(gè)股后,最終也要結(jié)合價(jià)格因素考慮,綜合評(píng)價(jià)該股是否在合理估值之內(nèi),且價(jià)格趨勢(shì)是否得到較好的確認(rèn),是否是恰當(dāng)?shù)娜雸?chǎng)時(shí)機(jī)等,都需要細(xì)致嚴(yán)謹(jǐn)?shù)牧炕P蛠砗饬俊?

????03 模型訓(xùn)練

????針對(duì)不同問題,需要選擇合適的機(jī)器學(xué)習(xí)方法。目前平臺(tái)支持常用機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)分類、回歸模型的構(gòu)建、部署、預(yù)測(cè)、分布式執(zhí)行。金融數(shù)據(jù)中,預(yù)測(cè)下個(gè)月股價(jià)與多因子的關(guān)系,我們可以采用監(jiān)督學(xué)習(xí)中的支持向量機(jī)、決策樹、隨機(jī)森林、梯度樹提升以及神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)。

????04 智能交易系統(tǒng)

????訓(xùn)練好的模型部署到平臺(tái),接入行情接口,可以實(shí)現(xiàn)有AI模型決策幫助的智能交易系統(tǒng)。風(fēng)控平臺(tái)包括驗(yàn)資驗(yàn)券、敞口管理、股票池管理、資金管理、撤補(bǔ)策略、災(zāi)備策略等措施。

????05 總結(jié)

????本文簡(jiǎn)單介紹了在SkyDiscovery大數(shù)據(jù)機(jī)器學(xué)習(xí)平臺(tái)上開發(fā)智能交易模型的整個(gè)流程,分布式數(shù)據(jù)庫實(shí)現(xiàn)數(shù)據(jù)快速的讀取。SkyCompute高性能計(jì)算引擎,能針對(duì)金融行業(yè)的龐大數(shù)據(jù)量和實(shí)時(shí)數(shù)據(jù),提供超高性能的運(yùn)算和分析能力,大幅降低企業(yè)的計(jì)算資源成本。同時(shí),SkyDiscovery 也支持用戶端的BI報(bào)表、交互式探索等可視化展示應(yīng)用。???


未知來源
免責(zé)聲明:商媒在線所提供的信息及圖片除原創(chuàng)外,有部分資訊和圖片從網(wǎng)絡(luò)等媒體收集而來,版權(quán)歸原作者及媒體網(wǎng)站所有,商媒在線力求保存原有的版權(quán)信息并盡可能注明來源;部分因?yàn)椴僮魃系脑蚩赡芤褜⒃行畔G失,敬請(qǐng)?jiān)髡哒徑猓绻鷮?duì)商媒在線所載文章及圖片版權(quán)的歸屬存有異議,請(qǐng)立即通知商媒在線,商媒在線將立即予以刪除,同時(shí)向您表示歉意!

最新資訊





















色 五月 亚洲| 欧美激情亚洲自拍| 日韩欧美中文在线| 久久国国产| 操呦呦| 白袜影院| 男人桶爽女人| 婷婷丁香五月五日| 久久久久久大香蕉| 三级片库| 免费欧美黄片| 日韩中文字幕 修| 3级毛片| 久久狼电影| 草熟妇| 欧美黄色高清在线播放| 国产视频中文字幕| 久久无码AV免费| 欧美综合激情网| 偷拍视频精品视频| 在线观看国产黄片| A 级片 少妇| 国产又色又刺激高潮免费视频| 日本种子视频一区二区| 无码丰满熟妇一区二区浪| 日日人妻av2019| 精品九九人人做人人爱| 国产对白做受| 中文字幕人妻伦伦| 亚洲综合美腿丝袜| 久久久久久精品国产观看2010| 色久悠悠只有精品| 疯狂放荡的少妇4p| 九九免费无码视频| 欧美激情吞精一区二区| 丁香五月人妻激情啪啪| AV 东京 在线播放| 欧美嫩交| 久久av色导航| 久久这里只精品国产免费99热4| 日本熟妇一区二区国|