原文:[比賽] (愛奇藝)2022WSDM用戶留存預測挑戰賽 數據分析

簡要記錄一下比賽情況,下周繼續努力。 賽題描述:基於愛奇藝所提供的視頻數據 用戶畫像數據 用戶啟動日志 用戶觀影和互動行為日志等等數據集,對於測試集用戶預測其 日留存分 。 比賽報告: 對數據的分析 首先,我們對於提供的數據集進行了閱讀與分析。 在user portrait中,共有 行數據,包含用戶的設備類型 device type ,設備存儲 device rom ,設備運行內存 device ...

2021-12-19 22:44 0 900 推薦指數:

查看詳情

2020中國高校計算機大賽·華為雲大數據挑戰賽-數據分析(二)

2020中國高校計算機大賽·華為雲大數據挑戰賽-數據分析(二) 哈嘍,小伙伴們好久不見,這幾個星期由於個人原因,都沒時間做比賽,直到最近幾天開始做了下,趁周日寫下分享記錄,分數雖然不高,但是分享出來一些清洗數據和特征工程的看法,希望對大家有所幫助和啟發。 這里繼續上次的分析,上一篇我們主要分析 ...

Sat Jun 26 03:15:00 CST 2021 0 156
華為雲大數據挑戰賽熱身——交通流量預測分析

1 了解題   - 題概況   - 數據概況   - 預測指標   - 分析題 1.1 題概況 本次比賽任務是利用歷史數據並結合地圖信息,預測五和張衡交叉路口未來一周周一(2019年2月11日)和周四(2019年2月14日)兩天的5:00-21:00通 ...

Fri May 22 23:30:00 CST 2020 1 1097
影片熱榜的爬取及其數據分析

一、主題式網絡爬蟲設計方案 1,主題式網絡爬蟲名稱: 爬取影片熱榜 2,主題式網絡爬蟲爬取的內容與數據特征分析: 爬取內容為:影片名稱,排名,與其點擊量 數據特征分析:將其儲存於csv或xlsx文件中 3.主題式網絡爬蟲設計方案概述(包括實現思路與技術難點) 實現思路:首先進 ...

Mon Sep 28 05:29:00 CST 2020 0 611
影片熱榜的爬取及其數據分析

一、主題式網絡爬蟲設計方案 1,主題式網絡爬蟲名稱: 爬取影片熱榜 2,主題式網絡爬蟲爬取的內容與數據特征分析: 爬取內容為:影片名稱,排名,與其點擊量 數據特征分析:將其儲存於csv或xlsx文件中 3.主題式網絡爬蟲設計方案概述(包括實現思路與技術難點) 實現思路:首先進 ...

Fri Apr 10 05:33:00 CST 2020 0 1321
爬取電影熱播榜數據分析與可視化處理

一.主題式網絡主題式網絡爬蟲設計方案 1.爬蟲名稱:爬取電影熱播榜 2.爬蟲爬取的內容:爬取電影熱播榜數據。 3.網絡爬蟲設計方案概述:實現思路:通過訪問網頁源代碼,使用soup.find_all正則表達爬取數據,對數據進行保存數據,再對數據進行清洗和處理,數據分析與可視化 ...

Mon Apr 06 02:05:00 CST 2020 0 1980
小白學數據分析----->什么才是留存率的關鍵?

最近花了很多的時間在體驗各種游戲,從火爆的卡牌,到策略,RPG等等,有一個問題在影響我,什么才是留存率的關鍵?今天就先討論一些我的想法。 留存率已經成為大家最常提到的詞匯,也是拿出來show一下的武器,不過一個困擾的問題在於,什么影響了留存,怎么優化留存。關於留存指標的描述這里不去解析,要說 ...

Fri Oct 11 02:37:00 CST 2013 7 6425
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM