量化研究體系 — 以7大模塊為核心

李一邨

買這商品的人也買了...

相關主題

商品描述

本書是以給廣大量化研究者建立一個一般性的量化研究流程(主要是量化策略開發,也包括其他量化研究)為主旨來展開編寫的。全部章節以流程化的形式展開,從量化研究的數據開始到最終以交易結束。數據庫、指標庫、算法庫、工具庫、可視化庫、報告和日常工作系統、交易系統這7個核心庫/系統分別解決了量化研究中某一個環節的問題。量化研究是以上述7個核心庫/系統所代表環節的一個循環,在這個循環中不斷進行的改進和研究。它將數據和思想相結合,通過交易來檢驗研究成果是否達到預期,然後改進思想和更換數據,並投入下一次交易中。這樣的循環使得每一次量化研究都更加接近理想效果。而在循環的每一個環節上,本書給出了一系列工具、算法、技術等來支撐各個核心庫/系統的功能。本書在編程語言上以Matlab和Python為主,數據庫一章用到了MySQL的基本知識,交易系統一章用到了MongoDB的知識。本書的內容十分豐富,通過閱讀本書,讀者可以對量化研究形成一個系統、全面、完整的認識,並在今後的研究工作中逐步拓展,最終形成自己的體系。

作者簡介

李一邨,浙江大學量化金融博士,現任杭州伊園科技有限公司總經理。
兼職受聘為杭州市科促會數據科學家、杭州市科促會第二屆理事會理事、杭州師範大學校外指導老師、杭州市科協專家智庫成員。曾獲證券時報和期貨日報聯合評選的第八到第十二連續5屆“中國最佳金融量化策略工程師”。
前沿量化科學領域的開創者,多年來致力於將多元學科的前沿理論嫁接融合到金融投資領域。
曾任某A股上市金融機構研究所量化研究總監,獨立開發商品指數體系,並在國內金融界市場佔有率第一的金融資訊終端萬得資訊公開發布。
擁有多年Matlab和Python編程經驗。精通量化金融領域,也對機器學習領域有較深入的研究,發表多篇金融和機器學習交叉的SCI、EI論文,撰寫過多本專著。實踐中,開發多空倉點價交易策略,實盤夏普比1.5+,年化收益率100%+。
在多年的量化金融研究工作中,從事複雜衍生品設計、套期保值方案設計、大宗商品點價交易、量化投資策略開發等多個實戰項目,為高淨值客戶提供資產管理服務,獲得可觀的業績與利潤。

目錄大綱

緒論 量化研究體系介紹 1
0.1 7大模塊 1
0.1.1 數據庫 1
0.1.2 指標庫 2
0.1.3 算法庫 2
0.1.4 工具庫 3
0.1.5 可視化庫 5
0.1.6 報告和日常工作系統 5
0.1.7 交易和風控系統 5
0.2 結束語 7

第1章 數據庫 9
1.1 股票日頻率行情數據下載腳本 13
1.2 期貨成交持倉排名數據下載腳本 21
1.3 EDB數據下載案例 26
1.4 高頻數據下載案例 30
1.5 同花順量化數據接口的融資標的股數據下載案例 38
1.6 同花順十大流通股東數據下載案例 39

第2章 指標庫 42
2.1 指標庫的設計與分類 42
2.1.1 根據投資標的進行分類 42
2.1.2 根據數據性質進行分類 42
2.1.3 根據投資市場進行分類 43
2.2 指標庫目錄管理程序的說明 43
2.3 技術指標案例 58
2.3.1 擺動指標 58
2.3.2 波動指標 64
2.3.3 超買超賣指標 72
2.3.4 成交量指標 78
2.3.5 反趨向指標 89
2.3.6 價格指標 105
2.3.7 量價技術指標 111
2.3.8 能量指標 118

第3章 算法庫 131
3.1 機器學習常見算法分類匯總 131
3.1.1 按學習方式分類 132
3.1.2 按對訓練集的使用方法分類 134
3.1.3 按形式及功能分類 135
3.2 傅里葉變換 143
3.2.1 傅里葉變換算法理論 143
3.2.2 離散傅里葉變換代碼與去噪實例 145
3.2.3 利用快速傅里葉變換對原數據進行降噪 151
3.3 ReliefF特徵選擇 1523.3.1 ReliefF算法理論 152
3.3.2 ReliefF算法實例分析 155
3.4 高斯混合聚類模型(GMM) 161
3.4.1 GMM算法理論 161
3.4.2 算法代碼及實例 169
3.5 Chi-Merge算法 175
3.5.1 Chi-Merge 算法簡介 175
3.5.2 Chi-Merge原理介紹 176
3.5.3 Chi-Merge實例分析 177
3.5.4 Chi-Merge算法代碼 182
3.6 粗糙集分類算法 188
3.6.1 粗糙集分類算法簡介 188
3.6.2 粗糙集分類算法原理介紹 189
3.6.3 粗糙集分類算法函數 196
3.6.4 粗糙集分類算法實例分析 197
3.6.5 粗糙集分類算法代碼 199

第4章 工具庫 208
4.1 數據清洗程序 208
4.1.1 自動數據清洗程序的功能概述 208
4.1.2 手動數據清洗程序的功能概述 211
4.1.3 自動數據清洗程序 213
4.1.4 手動輸入日期序列對數據進行補全的程序 217
4.2 因子回測程序 218
4.2.1 因子回測程序整體邏輯 218
4.2.2 因子回測程序流程 218
4.2.3 輸入參數 219
4.2.4 模型結構及邏輯 221
4.2.5 因子回測程序代碼 223
4.3 先後輪動關係挖掘程序 232
4.3.1 先後輪動程序介紹 232
4.3.2 先後輪動總體流程 232
4.3.3 輸入參數 233
4.3.4 模型結構及邏輯 234
4.3.5 自定義折線化函數邏輯 235
4.3.6 程序代碼 235
4.4 多品種量化回測系統 251
4.4.1 平台思路框架 251
4.4.2 公式介紹 251
4.5 中文變量與代碼變量對照表 275
4.6 函數介紹 276
4.7 實例分析 278

第5章 可視化庫 281
5.1 Matlab畫圖編程技巧總結 281
5.1.1 畫佈設置 281
5.1.2 坐標軸設置 282
5.1.3 label設置 283
5.1.4 legend設置 284
5.1.5 title設置 284
5.1.6 顏色、透明圖控制 284
5.1.7 plot函數 285
5.1.8 scatter函數 286
5.1.9 plotyy函數 288
5.1.10 極坐標與笛卡兒坐標轉換 290
5.1.11 patch函數應用 291
5.1.12 構建曲面 292
5.1.13 自製坐標軸 293
5.1.14 字體 293
5.1.15 畫圖技巧 294
5.2 形態類畫圖程序 296
5.2.1 漸變彩色折線圖 296
5.2.2 餅狀圖 298
5.2.3 彩帶圖 302
5.2.4 關係圖 304
5.2.5 火柴圖 306
5.2.6 雷達圖 309
5.2.7 面積圖 311
5.2.8 柱狀圖 314
5.3 功能性圖例 318
5.3.1 沿有效前沿的資產權重變化面積圖 318
5.3.2 資產組合的有效前沿 319
5.3.3 二資產協整關係判斷及對沖策略測試 320
5.3.4 時間序列數據的離群點可視化 324
5.3.5 數據分佈及統計性質 325
5.3.6 數據分佈的分位數觀察 327
5.3.7 二分類機器學習器的分類準確率展示 329
5.3.8 品種指標排名 334
5.3.9 時間序列與相關指標對比圖 336
5.3.10 多個價格序列及其收益率序列對比圖 341
5.3.11 策略累計收益及最大回撤 344
5.3.12 逐筆交易盈虧圖 347
5.3.13 三維聚類展示 349

第6章 報告和日常工作系統 351
6.1 Matlab中調用Microsoft Word的技巧總結 351
6.1.1 COM對象及其接口 351
6.1.2 創建和編輯Microsoft Word文件 355
6.2 實例:創建一份股票量化日報模板 363
6.2.1 建立Word文檔 363
6.2.2 第一頁內容編寫 364
6.2.3 第二頁內容編寫 372
6.2.4 第三頁內容編寫 375
6.3 量化團隊工作管理系統 378
6.3.1 量化研究環節、評價及考核 378
6.3.2 評分管理系統 380

第7章 交易系統 391
7.1 東方財富模擬交易接口 391
7.1.1 網頁結構的基礎知識及爬蟲技術操作 391
7.1.2 東方財富模擬股票交易接口 397
7.1.3 東方財富模擬期貨交易接口 411
7.1.4 東方財富模擬期權交易接口 421
7.2 VNPY交易接口 445
7.2.1 VNPY使用前的準備工作 445
7.2.2 VNPY交易接口的使用 448