在足球賽事數據庫以及統計分析預測平台中,有很多概念,如果不搞懂,很難進行下一步的工作。所以為了配合團隊人員的學習和任務進行,特意編寫這篇文章。如果有其他問題和不懂的,請留言,將根據情況進行更新。
本文原文地址:足彩基礎知識入門(4)賽事數據庫與預測平台基礎概念介紹(一)
1.指數1/2/3。。。。
我在 足彩基礎知識入門(3)足彩賠率的本質 一文中介紹了賠率的概念,那么指數的概念和賠率以及結果是相關的。我們舉個例子:
如上圖的比賽,前面是競彩非讓球的賠率:1.74-3.25-4.15,也就是說 主隊勝的概率是很大的,但結果呢,主隊輸了。
上圖的結果指數 就是 指數3,為什么,看看理解:
1.指數高低的概念是在某個賠率公司的前提下,不同公司開除的賠率大小排序不一樣;
2.賠率最低,說明概率最大,概率最大的,如果結果出現的確是 主隊勝,那概率最大的結果打出,我們稱之為 指數1;
3.類似,如果概率第二大的結果打出來了,稱之為 指數2;
4.概率最低的打出來了,稱之為 指數 3,當然如果有些玩法如半全場結果有9個,那么最低的就是指數9了;
5.一般來說,概率最低的1-2個結果稱為 冷門,在比分這種結果很多的情況下,我們可以將結果定義為 一級冷門,二級冷門。。。進行分類,可以便於分析;
2. 指數分布
根據賠率和結果得到每一場比賽的指數后,計算所有場次指數 的比例情況,稱之為指數分布,例如勝平負玩法,有3個結果,那么就會有指數1,指數2,指數3等3個指數類型。統計這3個類型在某個場次集合內出現的比例情況,就是指數分布。
3.遺漏分布
遺漏是彩票分析中一個非常常見的概念。某期某個結果出現的遺漏的定義是:從上一次出現這個結果開始到當前期的時間間隔。例如:
1,2,3,3,1這個結果序列;我們計算最后2個結果的遺漏:
3:前一次出現的位置是上一期,2個位置相減再減1 = 0 ,就是它的遺漏。0遺漏說明上一期也是這個結果;
1:上一次出現是在位置1,當前位置是5,5-1-1 = 3,遺漏是3,也就是相隔3期后開出某個結果
遺漏分布,就是根據某個結果出現的序列,計算其每個位置的遺漏值[前幾期沒有結果的可以默認999],然后統計某個遺漏的比例情況。
4.交易盈虧指數
交易盈虧指數表在系統源碼中有涉及。這里不討論。我們就直接舉個例子:
http://d.dacai.com/zhishu/jyyk.html?matchid=1899047
看上面網頁,今年歐冠決賽的盈虧數據情況:
后面就是盈虧指數,這個指數的理解和上面指數理解可以稍微不一樣,我們自己轉換一下,如果最小的結果打出,稱之為結果1,否則最大的結果打出,為指數3。這個指數在我們的系統中,是沒有直接得到的,因為時間段不一樣,指數也不一樣。在自己進行分析的時候,可以自己選擇一個時間節點。比如賽前2小時的指數情況,進行統計分析。