1. 股市就是個復雜系統,復雜系統是不可精細預估的。 2. 數據的作用不是讓每個人都能賺錢吧,而是讓使用數據的人在博弈中更容易戰勝不使用數據的人。例如彭博社,它的數據工具年費數萬美元,但很多人都在購買使用 3. 高頻交易更多不是大數據,而是優先於別人先一步得到信息;好多自動交易系統,是基於事件 ...
大數據在彩票預測和解決社會問題的用處 最簡單的科學決策法 書中提到有很多基於統計的判斷決策,使用簡單的幾個指標就能做得很好,再上更多的數據也不能讓判斷更准確。 作者賽斯也舉了個例子。一個燒紅的爐子,你只要觸碰一下就知道這東西危險不能碰 可是要想知道喝咖啡能不能導致頭痛,你大概要喝上幾千杯才能看出效果來。 從上面的結果看:明顯的效應只要小數據就夠了,不明顯的效應才需要大數據。 但必須用大數據才能得出 ...
2017-06-18 16:14 0 6317 推薦指數:
1. 股市就是個復雜系統,復雜系統是不可精細預估的。 2. 數據的作用不是讓每個人都能賺錢吧,而是讓使用數據的人在博弈中更容易戰勝不使用數據的人。例如彭博社,它的數據工具年費數萬美元,但很多人都在購買使用 3. 高頻交易更多不是大數據,而是優先於別人先一步得到信息;好多自動交易系統,是基於事件 ...
前言 本篇我們將總結的算法為Microsoft時序算法的結果預測值,是上一篇文章Microsoft時序算法的一個總結,上一篇我們已經基於微軟案例數據庫的銷售歷史信息表,利用Microsoft時序算法對其結果進行了預測,並且相應形成了折線預測圖和模型依賴屬性,有興趣的同學可以點擊查看,但是上篇 ...
Hadoop Hadoop是一款開源的大數據通用處理平台,其提供了3個組件,分別是HDFS分布式文件系統、YARN分布式資源調度、MapReduce分布式離線計算。 MapReduce適合大規模的數據同時對實時性要求不高的場景,不適合大量的小文件以及頻繁修改的文件。 Hadoop的特點 ...
最近開始跟隨《子雨大數據之Spark入門教程(Python版)》 學習大數據方面的知識。 這里是網頁教程的鏈接: http://dblab.xmu.edu.cn/blog/1709-2/ 在學習中遇到的一些問題,將會在這里進行總結,並貼上我的解決方法。 1、Spark獨立應用程序編程時報 ...
今日格言:了解了為什么,問題就解決了一半。 Mysql 單表適合的最大數據量是多少? 我們說 Mysql 單表適合存儲的最大數據量,自然不是說能夠存儲的最大數據量,如果是說能夠存儲的最大量,那么,如果你使用自增 ID,最大就可以存儲 2^32 或 2^64 條記錄了,這是按自增 ID ...
一、去重 去重: 用布隆過濾器,就是一個bitmap,但是有k個哈希函數,僅當一個數據的k個哈希函數找出的位置全部為1時,才表示這個數據在集合中,但是它也有一定的誤判率,會把不存在的判斷為存在,寧可錯殺1000,不肯放過一個的這種,因此他不適合作0誤判的場合,並且刪除也不方便,你還不如重建 ...
問題 一個文件中有9億條不重復的9位整數,對這個文件中數字進行排序 直接想法 9億條(9e8)數據,每個數據能用int存儲 因此所需要內存 9e8x4B = 3.6e9B = 3.6GB,這是裝載所需要的 排序復雜度一般都是nlogn 因此需要的內存更大 方法一 數據庫排序 將文本文件 ...
前提准備:利用sql篩選出每個球出現概率最高的前5個數 原理:先爬出所有的歷史數據,然后模擬搖獎機出球的機制並大量模擬計算,直到出現列表中的某一個數后即停 注意事項:由於計算過程數據量很大,需要加入內存釋放的操作 成果:目前博主最好記錄是中了3紅1藍,適合學習交流使用,信則有 ...