本博客所有文章分類的總目錄:【總目錄】本博客博文總目錄-實時更新
開源C#彩票數據資料庫系列文章總目錄:【目錄】C#搭建足球賽事資料庫與預測平台與彩票數據分析目錄
前2個月,我的系列文章:C#搭建足球賽事資料庫與預測平台(1) 基本介紹 ,【目錄】C#搭建足球賽事資料庫與預測平台與彩票數據分析目錄,對足球賽事資料庫平台的基本結構進行了介紹。我在文章中也提出了大概計划,一步步將這個我花了1年業余時間整理而成的數據資料庫進行開放。在經過2個月的業余時間努力后,將這個代碼進行了部分整理和精簡,將核心的賽事數據庫部分進行了獨立。下面就簡單對這個開源數據庫及核心代碼進行介紹。
本文原文地址: .NET足球賽事資料數據庫平台——SmartLottery正式開源
接下來我將每周一篇文章左右,來介紹如何使用該數據庫,以及做一些基礎的分析,至於預測大家入門后八仙過海各顯神通!感興趣的可以關注!
1.為什么要開源這個數據庫
全國數以百計的互聯網彩票公司,都有足球賽事資料庫系統,但是他們不共享,都是自己采集,而有大量的業余研究人員,特別是程序員玩足球的,很多都要自己采集數據,多多少少造成了很多浪費,不僅僅是精力時間的浪費,更多的是網絡資源,帶寬的浪費。如果互聯網公司的數據被人大量采集,他們也會采取相應措施,使得采集難度不斷提高。所以我開發這些數據的目的,基於以下幾點:
1.讓喜歡足球的程序員,可以直接獲取足球賽事資料數據,不用重復采集;
2.開放基礎數據庫,讓更多的人可以實現自己的思路和想法,專注業務,而不是這些沒有技術含量的數據;
3.采集數據,從某些角度上說,只要花時間,都可以做,我就是把自己花時間做的,分享出來,降低大家的門檻。
4.我們不僅開源核心的數據庫,同時也開放針對數據庫的數據訪問接口代碼(C#版本),大家有數據庫,也可以自己寫相應代碼,但前提是搞清楚數據庫的結構,可以參考上面提到的系列文章。
本文將對核心數據庫的情況和核心訪問代碼的情況,進行初步介紹,我們也將准備一些文章,來具體介紹使用方法,請大家關注博客。
2.針對核心數據庫的說明
針對有人可能會有的疑問,我對相關問題進行說明:
1.核心數據庫是單機版的Sqlite,大量分庫進行。至於架構和相關表結構,可以看這里的文章:【目錄】C#搭建足球賽事資料庫與預測平台與彩票數據分析目錄
2.總的數據量目前是1.4G左右,由於單機版文件數據庫的關系,我們不方便進行時時更新,2-3個月進行一次數據更新,開放給大家;
3.由於該項目主要是研究使用,所以不能開放核心采集代碼。原因是這樣的:我們常規采集的流量如果按照20M/天計算,如果100個人都每天采集,采集的數據源網站的流量會增加很多,長時間采集,必然會導致屏蔽IP,會導致大家都采集不到,或者難度增加。所以為了我們自己有一個穩定的數據源,也適當的考慮人家網站的壓力。我們選擇定期更新,然后如果有時時采集需求的,可以單獨和我聯系。
4.另外,由於本人不是專業開發人員,程序以及數據庫設計肯定有很多不合理的地方,能力有限,不能強求太多,如果有人對代碼進行修改,可以給我反饋,也希望大家提意見。
5.代碼中包括了籃球賽事資料的相關實體類以及一些特殊的國彩玩法實體類,可能大家暫時用不上,但相關數據也在采集,至於分析方法,八仙過海各顯神通,大家也可以交流。
3.數據內容簡介
目前該數據庫的主要數據是足球賽事的數據資料,當然我們出於長遠考慮,也采集了部分籃球賽事數據,但不完整,只是為了積累相關實時數據,供以后可能進行的研究。目前數據庫主要包括的內容有:
1.包括全世界各大洲,各個國家主要的足球賽事的比賽數據,目前共有680個賽事。基本覆蓋了全球所有的比賽類,包括洲際杯賽,聯賽,杯賽,友誼賽等;我們對賽事進行了手動分級,最高為1級,如世界杯,歐洲5大聯賽等,最低為7級,一般我們把主要分析的對象歸為1-3級別。當然也可以進行自定義,如下圖所示部分賽事數據:

2.每個賽事,都按照年度分為各個賽季,我們采集了每個聯賽最近10年,也就是10個賽季的基本比賽結果數據。2013年后的比賽才有完整的賠率數據。看下面單個賽事的賽季數據:

3.比賽場次數據,場次數據反應了主客隊的基本比較結果信息。不包括賠率,是核心內容,我們根據賽事進行了分庫,比如我們打開“德甲”數據庫,看看里面的數據結構,根據上面的理解,我們采集了10年內的比賽場次數據,限於篇幅,下面只展示了部分字段:

4.賠率數據,賠率數據根據每個類別和相關公司進行了分庫,由於內容比較多,大家看系列文章目錄的表結構和相關資料。直接查看實際數據庫,也可以知道相關的結構,比如我們分庫的名字很好理解,可以根據數據庫的名字和路徑知道分庫的信息,公司-聯賽:

4.足球賽事數據庫下載
注意,該數據庫是2015年6月18日的更新版本,該數據庫我們將持續1個月后,在合適的時候,會發布新的數據
下載地址:http://pan.baidu.com/s/1gdD6RmV 密碼:hbnz
為了避免其他網站爬蟲的影響,我們將不定期修改下載地址
如果下載地址錯誤,請到本文原始頁面下載: .NET足球賽事資料數據庫平台——SmartLottery正式開源
Sqlite數據庫打開,可以自己下載一個工具吧,不多說。
5.核心訪問程序下載
核心訪問程序是獨立的,我們刪掉了數據更新的代碼,大部分是實體類和相關訪問方法。
下載地址:http://pan.baidu.com/s/1jGku2Ho 密碼:8r6k
如果下載地址錯誤,請到本文原始頁面下載: .NET足球賽事資料數據庫平台——SmartLottery正式開源
6.程序和數據庫的基本使用
程序使用基本有2個要注意,至於其他復雜的問題,大家可以隨時在博客提問,或者通過QQ聯系我,以及參考本站其他文章:
1.任何地方使用都要在獨立線程內調用 數據庫連接字符串初始化方法。該方法在內,有一個 XX屬性,用來設置數據庫的路徑,一般給絕對路徑。
2.查詢時,注意數據的分庫,要及時切換數據庫。至於分庫的使用,很簡單,不過大家最好是看看X組件的相關內容,在博客菜單欄。
實體類.SetDbConnName(XXName);
接下來我將每周一篇文章左右,來介紹如何使用該數據庫,以及做一些基礎的分析,至於預測大家入門后八仙過海各顯神通!
可以參考代碼中的相關使用。如果大家有什么問題,或者針對性的要點不懂,可以直接留言或者郵件,我將會選擇重點進行介紹,爭取讓大家都能用上它。
由於以前的采集和寫代碼的過程中,沒有想到這么遠,所以注釋以及部分代碼不太規范。本人也不是正規軍,所以將在后續逐步改進,同時也在抓緊時間完善注釋,制作幫助文檔,以及編寫查詢使用的Demo。請大家關注本站首頁信息。
