股票分鍾數據存儲方案及海量數據架構方案

本文轉載自查看原文 2018-01-28 15:33 4418

場景20億分鍾K線數據的更新及查找

1，了解數據使用情況

　　這些k線數據用於回測，而對於分鍾k線回測：

　　※初始熱數據的划分需要對業務進行深入了解

　　※后續熱數據的精確划分還是要查看歷史查詢的記錄

　　統計來源：程序中添加的數據操作log；數據庫審計；數據庫中間件

2，根據數據使用頻率進行拆分

　　我將數據划分2個層級：

　　1，熱數據：熱門股票的近1個月的數據

　　2，使用頻率較低的K線數據

　　※根據熱度使2種不同的存儲方式（時間段划分）：

　　每日夜間進行更新：將過時的部分熱數據從redis中寫入數據庫

　　每周進行更新：將數據庫過時的數據存入bcolz文件中（bcolz有非常不錯的壓縮率和速度）

3，數據庫架構演變

　　1，針對於量化回測，主要的瓶頸在於讀數據（每日讀的數據遠遠大於寫的數據）

　　2，對於系統日后增長的使用量，我們將划分的數據分配獨立的服務器

　　　　※redis集群，數據庫集群，文件服務器

　　　　以上都是用中間件進行訪問控制

　　3，數據庫的讀瓶頸的演變

　　　　※綜上所述我們將數據庫中的熱門股票平均划分到N個庫中，並再進行分表

　　　　※分表規則：例如輪動策略就是某些股票會在一個策略中同時出現，因此可以放入一張表中

　　4，讀寫數據量都大的數據表方案

　　　　　　方法：進行分庫分表，加讀寫分離

　　　　　　好處：可根據自身的數據使用情況來定義中間件來控制資源訪問，從而實現資源的最大化利用

　　　　　　缺點：此方案建立於開發者對現有業務和數據使用非常了解的情況下，另外如果日后業務發生變化，變更成本較大(表結構，數據遷移，中間件變更)

　　　　　　方法：使用mongo自帶的分片功能，且只建立主鍵索引_id優化寫性能；通過ES查詢得到_id后再查詢數據

　　　　　　好處：對於日后業務的拓展變更成本低(非結構化數據)；ES對海量數據查詢效率高

　　　　　　缺點：額外的存儲，ES索引字段變更

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 海量數據存儲方案 HBase海量數據存儲海量圖片上傳及存儲方案海量數據，高並發處理方案（java） 10分鍾搞懂：億級用戶的分布式數據存儲解決方案海量數據架構下如何保證Mycat的高可用？數據存儲方案-閉包表大數據學習——有兩個海量日志文件存儲在hdfs 日均數十億請求！京東評價系統海量數據存儲高可用設計 mysql海量數據的優化