简要记录一下比赛情况,下周继续努力。 赛题描述:基于爱奇艺所提供的视频数据 用户画像数据 用户启动日志 用户观影和互动行为日志等等数据集,对于测试集用户预测其 日留存分 。 比赛报告: 对数据的分析 首先,我们对于提供的数据集进行了阅读与分析。 在user portrait中,共有 行数据,包含用户的设备类型 device type ,设备存储 device rom ,设备运行内存 device ...
2021-12-19 22:44 0 900 推荐指数:
2020中国高校计算机大赛·华为云大数据挑战赛-数据分析(二) 哈喽,小伙伴们好久不见,这几个星期由于个人原因,都没时间做比赛,直到最近几天开始做了下,趁周日写下分享记录,分数虽然不高,但是分享出来一些清洗数据和特征工程的看法,希望对大家有所帮助和启发。 这里继续上次的分析,上一篇我们主要分析 ...
1 了解赛题 - 赛题概况 - 数据概况 - 预测指标 - 分析赛题 1.1 赛题概况 本次比赛任务是利用历史数据并结合地图信息,预测五和张衡交叉路口未来一周周一(2019年2月11日)和周四(2019年2月14日)两天的5:00-21:00通 ...
一、主题式网络爬虫设计方案 1,主题式网络爬虫名称: 爬取爱奇艺影片热榜 2,主题式网络爬虫爬取的内容与数据特征分析: 爬取内容为:影片名称,排名,与其点击量 数据特征分析:将其储存于csv或xlsx文件中 3.主题式网络爬虫设计方案概述(包括实现思路与技术难点) 实现思路:首先进 ...
一、主题式网络爬虫设计方案 1,主题式网络爬虫名称: 爬取爱奇艺影片热榜 2,主题式网络爬虫爬取的内容与数据特征分析: 爬取内容为:影片名称,排名,与其点击量 数据特征分析:将其储存于csv或xlsx文件中 3.主题式网络爬虫设计方案概述(包括实现思路与技术难点) 实现思路:首先进 ...
一.主题式网络主题式网络爬虫设计方案 1.爬虫名称:爬取爱奇艺电影热播榜 2.爬虫爬取的内容:爬取爱奇艺电影热播榜数据。 3.网络爬虫设计方案概述:实现思路:通过访问网页源代码,使用soup.find_all正则表达爬取数据,对数据进行保存数据,再对数据进行清洗和处理,数据分析与可视化 ...
数据集的结构和特征集让接下来的预测问题更加可靠。 · 完成对于数据的探索性分析,并对于数据进行一些图 ...
最近花了很多的时间在体验各种游戏,从火爆的卡牌,到策略,RPG等等,有一个问题在影响我,什么才是留存率的关键?今天就先讨论一些我的想法。 留存率已经成为大家最常提到的词汇,也是拿出来show一下的武器,不过一个困扰的问题在于,什么影响了留存,怎么优化留存。关于留存指标的描述这里不去解析,要说 ...