滴滴算法大賽算法解決過程 - 方案設計


回到原點

上面兩篇文章講了一些分析情況,整個模型變得很不確定了

數據分析: http://codesnippet.info/Article/Index?ArticleId=00000038
擬合算法: http://codesnippet.info/Article/Index?ArticleId=00000041

滴滴算法大賽到底需要什么樣子的答案?
我一開始的想法是建立一個模型,通過天氣,POI,交通擁堵的參數來推導出訂單數和GAP數。
但是通過現有的數據發現,這個模型很難建立。

其實看一下題目,這是一個預測題:

給定每個區域在時間片tj,tj-1...的各項數據,預測gapi,j+1, ∀di∈D。

如果不是想研究機器學習的話,其實也沒有必要(或者沒有可能)建立一個完整的模型。
我們只需要知道,數據的發展趨勢,例如這個時間點是 N ,按照經驗,后一個時間點的趨勢是上升還是下降,幅度大約多少即可。

那些因素左右訂單

前幾天一直在尋找那些因素制約着訂單數。

9點整和18點整 全區域訂單分析圖
訂單的總量在不同日期,表現出極大的不同。但是,接單量和司機數有關系,司機數則是比較穩定的,9點的司機數大約是5000人,18點為4500人。(前三個數據是 01-01 到 01-03 節假日 ,01-09 ,01-10,01-16,01-17 分別是節假日,所以早晨的需求比較少 )
通過分析,我們應該可以整理出一張司機數和時間段的對應函數。(節假日和非節假日區分開來)

9點整和18點整 全區域訂單分析圖

如果我們按照節假日和非節假日去看分時接單量

  • 節假日的早高峰和平日的早高峰項目,相差巨大。
  • 節假日和非節假日,其他時段接單量,基本持平。
  • 每天的8:30分,17:30分 是兩個最高值。

  • 根據這個統計數據,我們大概知道了每天的接單情況。可以預測未來的某個時間片的接單量。當然,如果我們能夠計算出Gap比率(GAP數/總訂單數[GAP+接單數]),Gap數也是可以預測出來的。很遺憾,Gap比率的數據統計如下:(每天訂單量起伏比較大,接單數較為固定,GAP比率則變化很大)
    日期別9:00和18:00GAP比率

預測訂單趨勢

上面說了,日期別的訂單差異量很大,但是我們是否可以考察一下,每個時段的訂單變化率是否有規律可循呢?
例如在 100個時間片上訂單時 N,則101個時間片上,根據統計一般會增加 1.5%的話,則可以預測101個時間片上的訂單時 1.05 * N;
當然如果就這么計算的話,可能會接近於正確答案,但是完全沒有使用POI,天氣,交通等數據,基本上是不可能獲獎的。。。
不過,我們可以先來試試看,是不是可以找到規律呢。從圖表上看,我們應該可以統計出,每個時間點上數據的變化率。

周三的變化:

從第一個周三到第二個周三的變化

從第一個周三到第二個周三的變化率
訂單變化率:(這個時間片 - 上個時間片)/ 上個時間片

這樣的話,我們大概可以對於各個時間片之間訂單的變化率做一個統計平均表。
假設時間片 N 的訂單數位 Order ,下一個時間片N+1的訂單數為 NextOrder,則 變化率 K = (NextOrder - Order) / Order。
我們可以計算出全區域的每個時間片的變化率,也可以算出單個區域的每個時間片的變化率。

每個區域的訂單比例

有些區域訂單多,有些區域訂單少,這個比例是否會隨着時間變化而變化呢?
放心,基本上每個區域的訂單比率很固定的。

如何解決問題

題目里面告訴了我們所需測試Gap的時間片的前三個時間片的數據。結合變化率的概念,其實我們可以計算出待預測的時間片的訂單量。
還有一個問題是接單量怎么考慮,我的想法是將這三個已知時間片的接單量的平均值作為新的接單量。
(有一種情況,例如一個時間片里 有50個訂單,但是有1個GAP,這個時候其實不能認為接單量只有49,而應該認為這個區域的基本上是公供需平衡的。1個GAP有可能是偶然因素。所以我這里認為5個GAP以下都是供需正常的。)

  • 第N+1個時間片的GAP = 第N + 1個時間片的訂單數 - 第N + 1個時間片的接單能力。
  • 第N + 1個時間片的訂單數 = 第N 個時間片的訂單數 * (訂單變化率+ 1)
  • 第N + 1個時間片的接單能力 = 第 N ,N-1, N-2 個時間片的接單能力的平均值。

最后公式是:

  • 第N+1個時間片的GAP = 第N 個時間片的訂單數 * (訂單變化率+ 1) - 第 N ,N-1, N-2 個時間片的接單能力的平均值

這種方法計算出來的結果可能接近於答案,也可能遠離答案。但是完全沒有體現出機器學習的作用,所以本人覺得肯定是有問題的。這里只是給出一種解決方案。接下來,開始思考正統的解決方案。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM