注意:每家公司的POI分類都是不同的,這里只是將百度POI做個例子,滴滴打車的POI和百度的POI定義 ...
回到原點 上面兩篇文章講了一些分析情況,整個模型變得很不確定了 數據分析: http: codesnippet.info Article Index ArticleId 擬合算法: http: codesnippet.info Article Index ArticleId 滴滴算法大賽到底需要什么樣子的答案 我一開始的想法是建立一個模型,通過天氣,POI,交通擁堵的參數來推導出訂單數和GAP數。 ...
2016-05-25 15:18 1 3966 推薦指數:
注意:每家公司的POI分類都是不同的,這里只是將百度POI做個例子,滴滴打車的POI和百度的POI定義 ...
題目分析 賽題詳情 構建一個模型,根據天氣,交通,區域里面的各種設施,以往歷史數據,預測未來的某個時間點,某個區域里,打車需求的缺口。整個算法其實就是一個有監督的機器學習的過程。 數據整理 下載后的整個壓縮數據包575M,其中包括的訂單數據大約900萬條。(其他Master表數據量很小 ...
(這里只是做分析,不提供源代碼,畢竟是一個比賽) 題目分析 賽題詳情 構建一個模型,根據天氣,交通,區域里面的各種設施,以往歷史數據,預測未來的某個時間點,某個區域里,打車需求的缺口。整個算法其實就是一個有監督的機器學習的過程。 數據整理 下載后的整個壓縮數據包575M,其中包括的訂單數 ...
按照前面文章的方法進行數據預測,完全不使用POI,天氣,交通情況的數據,可以達到0.43的成績。 不過如果想要獲得更好的成績,簡單的預測方法顯然無法滿足要求了。 GBDT 網友說可以使用GBDT的方法來進行數據預測。所以,我們先來聊聊GBDT算法的一些基礎知識。 熵 凡是說到算法,人工智能 ...
寫在前面 這次騰訊的第三屆廣告算法大賽,是我第一次參加,取得了初賽與復賽均為23名的成績,決賽16名 ,畢竟我只是初打比賽不久的小白。我想在此分享下我的基本解題思路。 賽題背景: 廣告曝光預估如何應用在實際業務中? 騰訊的效果廣告主要是展示類廣告,其背后的算法引擎本質上是一個推薦 ...
軟件方案設計一般的軟件方案設計其實和算法的設計是一樣的。如果想要你的軟件方案更加具有邏輯性,條理性,適合你的業務場景,那么可以依據算法的設計思路和論述方法來說明或者講解你的方案設計;算法都是要借助數學知識點的,一般的設計思考和解決方法的論述都是如下結構:1.定義或者說明已知條件或者提出合理的前提 ...
背景 前段時間接手了一個還處於方案設計階段的工作,我重新做了設計。覺得新方案比舊方案業務清晰明朗、解決了舊方案的缺陷。我就很高興,跟同事聊這個事情。同事就問我是怎么想到這些的呢。 我說了一些細節的,但是沒有把核心本質講出來。我覺得這是個很難回答的問題。因為一個方案怎么更合 ...
需求描述 將數據記錄持久化存儲在HBase中,需要支持如下功能: 支持高吞吐量讀寫操作,實時采集10,000條/秒; 支持動態添加字段; 支持服務端過濾; 支持部分字段修改。 設計方案 按列存儲 優點 擴展性好,支持動態添加新列; 支持服務端按列過濾 ...