原文:[比赛] (爱奇艺)2022WSDM用户留存预测挑战赛 数据分析

简要记录一下比赛情况,下周继续努力。 赛题描述:基于爱奇艺所提供的视频数据 用户画像数据 用户启动日志 用户观影和互动行为日志等等数据集,对于测试集用户预测其 日留存分 。 比赛报告: 对数据的分析 首先,我们对于提供的数据集进行了阅读与分析。 在user portrait中,共有 行数据,包含用户的设备类型 device type ,设备存储 device rom ,设备运行内存 device ...

2021-12-19 22:44 0 900 推荐指数:

查看详情

2020中国高校计算机大赛·华为云大数据挑战赛-数据分析(二)

2020中国高校计算机大赛·华为云大数据挑战赛-数据分析(二) 哈喽,小伙伴们好久不见,这几个星期由于个人原因,都没时间做比赛,直到最近几天开始做了下,趁周日写下分享记录,分数虽然不高,但是分享出来一些清洗数据和特征工程的看法,希望对大家有所帮助和启发。 这里继续上次的分析,上一篇我们主要分析 ...

Sat Jun 26 03:15:00 CST 2021 0 156
华为云大数据挑战赛热身——交通流量预测分析

1 了解题   - 题概况   - 数据概况   - 预测指标   - 分析题 1.1 题概况 本次比赛任务是利用历史数据并结合地图信息,预测五和张衡交叉路口未来一周周一(2019年2月11日)和周四(2019年2月14日)两天的5:00-21:00通 ...

Fri May 22 23:30:00 CST 2020 1 1097
影片热榜的爬取及其数据分析

一、主题式网络爬虫设计方案 1,主题式网络爬虫名称: 爬取影片热榜 2,主题式网络爬虫爬取的内容与数据特征分析: 爬取内容为:影片名称,排名,与其点击量 数据特征分析:将其储存于csv或xlsx文件中 3.主题式网络爬虫设计方案概述(包括实现思路与技术难点) 实现思路:首先进 ...

Mon Sep 28 05:29:00 CST 2020 0 611
影片热榜的爬取及其数据分析

一、主题式网络爬虫设计方案 1,主题式网络爬虫名称: 爬取影片热榜 2,主题式网络爬虫爬取的内容与数据特征分析: 爬取内容为:影片名称,排名,与其点击量 数据特征分析:将其储存于csv或xlsx文件中 3.主题式网络爬虫设计方案概述(包括实现思路与技术难点) 实现思路:首先进 ...

Fri Apr 10 05:33:00 CST 2020 0 1321
爬取电影热播榜数据分析与可视化处理

一.主题式网络主题式网络爬虫设计方案 1.爬虫名称:爬取电影热播榜 2.爬虫爬取的内容:爬取电影热播榜数据。 3.网络爬虫设计方案概述:实现思路:通过访问网页源代码,使用soup.find_all正则表达爬取数据,对数据进行保存数据,再对数据进行清洗和处理,数据分析与可视化 ...

Mon Apr 06 02:05:00 CST 2020 0 1980
小白学数据分析----->什么才是留存率的关键?

最近花了很多的时间在体验各种游戏,从火爆的卡牌,到策略,RPG等等,有一个问题在影响我,什么才是留存率的关键?今天就先讨论一些我的想法。 留存率已经成为大家最常提到的词汇,也是拿出来show一下的武器,不过一个困扰的问题在于,什么影响了留存,怎么优化留存。关于留存指标的描述这里不去解析,要说 ...

Fri Oct 11 02:37:00 CST 2013 7 6425
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM