6.Json数据转换 **说明:**genres,keywords,production_companies,production_countries,cast,crew 这 6 列都是 json 数据,需要处理为列表进行分析。 处理方法: json 本身为字符串类型,先转换为字典列表,再将字典 ...
前言 很多电影也上映,看电影前很多人都喜欢去 豆瓣 看影评,所以我爬取 条 豆瓣 的用户观影数据,分析用户之间的关系,电影之间的联系,以及用户和电影之间的隐藏关系。 爬取观影数据 数据来源 在 豆瓣 平台爬取用户观影数据。 爬取用户列表 网页分析 为了获取用户,我选择了其中一部电影的影评,这样可以根据评论的用户去获取其用户名称 后面爬取用户观影记录只需要 用户名称 。 url中start参数是页 ...
2021-06-28 22:09 0 289 推荐指数:
6.Json数据转换 **说明:**genres,keywords,production_companies,production_countries,cast,crew 这 6 列都是 json 数据,需要处理为列表进行分析。 处理方法: json 本身为字符串类型,先转换为字典列表,再将字典 ...
王 S 聪想要在海外开拓万 D 电影的市场,这次他在考虑:怎么拍商业电影才能赚钱?毕竟一些制作成本超过 1 亿美元的大型电影也会失败。这个问题对电影业来说比以往任何时候都更加重要。 所以,他就请来了你(数据分析师)来帮他解决问题,给出一些建议,根据数据分析一下商业电影的成功是否存在统一公式?以帮助 ...
王 S 聪想要在海外开拓万 D 电影的市场,这次他在考虑:怎么拍商业电影才 能赚钱?毕竟一些制作成本超过 1 亿美元的大型电影也会失败。这个问题对电影 业来说比以往任何时候都更加重要。 所以,他就请来了你(数据分析师)来帮 他解决问题,给出一些建议,根据数据分析一下商业电影的成功是否存在统一公 ...
美国队长1 - 2011年惊奇队长 - 2019年钢铁侠1 - 2008年无敌浩克 - 2008年钢铁侠2 - 2010年雷神 - 2011年复仇者联盟 - 2012年雷神2 - 2013年钢铁侠3 ...
【原文链接】:https://blog.tecchen.tech ,博文同步发布到博客园。 由于精力有限,对文章的更新可能不能及时同步,请点击上面的原文链接访问最新内容。 欢迎访问我的个人网站:htt ...
1. 用户画像是什么 用户画像(User Profile),作为大数据的根基,它完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础,奠定了大数据时代的基石。 男,31岁,已婚,收入1万以上,爱美食,团购达人,喜欢红酒配香烟。这样一串 ...
前言 由于之后要做一个实验,需要用到大量豆瓣用户的电影数据,因此想到了从豆瓣电影的“看过这部电影 的豆瓣成员”页面上来获取较为活跃的豆瓣电影用户。 链接分析 这是看过"模仿游戏"的豆瓣成员的网页链接:http://movie.douban.com/subject/10463953 ...
在以前的文章中,我写过一篇使用selenium来模拟登录知乎的文章,然后在很长一段时间里都没有然后了。。。 不过在最近,我突然觉得,既然已经模拟登录到了知乎了,为什么不继续玩玩呢?所以就创了一个项目,用来采集知乎的用户公开信息,打算用这些数据试着分析一下月入上万遍地走、清华北大不如狗的贵乎用户 ...