前言 其实有关AES,之前发过一版的博客文章,python爬虫- js逆向解密之破解AES(CryptoJS)加密的反爬机制 而这次虽然也是AES,但是这次的变化有点大了。 这次的目标对象同样也是我的老朋友给我的,还是老规矩,地址我不会给出来的 打开网址,界面 ...
案例需求:爬取空气质量数据 URL:https: www.aqistudy.cn html city detail.html 分析思路: .页面中是有相关的查询条件,指定查询条件后点击查询按钮,就会加载出相关的数据。 查询的条件: 城市名称 查询的时间范围 当点击了查询按钮后,整张页面没有刷新,而是局部页面发生了刷新 说明:点击了查询按钮后,发起了一个ajax请求,该请求可以帮我们进行页面的局部 ...
2020-06-22 21:33 0 854 推荐指数:
前言 其实有关AES,之前发过一版的博客文章,python爬虫- js逆向解密之破解AES(CryptoJS)加密的反爬机制 而这次虽然也是AES,但是这次的变化有点大了。 这次的目标对象同样也是我的老朋友给我的,还是老规矩,地址我不会给出来的 打开网址,界面 ...
发现问题 在一次偶然中,在爬取某个公开网站(非商业型网站)时,老方法,打开调试工具查看请求方式,请求拦截,是否是异步加载,不亦乐乎,当我以为这个网站非常简单的时候,发现二级网页的地址和源码不对应 Ajax异步加载?源码也是 ...
前言 同上一篇的aes加密一样,也是偶然发现这个rsa加密的,目标网站我就不说了,保密。 当我发现这个网站是ajax加载时: 我已经习以为常,正在进行爬取时,发现返回为空,我开始用findler抓包,发现它验证了cookie,然后我带上 ...
前言 同样的,接上一篇 python爬虫 - js逆向之woff字体反爬破解 ,而且也是同一个站的数据,只是是不同的反爬 网址: aHR0cDovL3{防查找,删除我,包括花括号}d3dy5kaWFuc{防查找,删除我,包括花括号}GluZy5jb20vcmV2aWV3L{防查找,删除 ...
前言 本篇博文的主题就是处理字体反爬的,其实这种网上已经很多了,那为什么我还要写呢?因为无聊啊,最近是真没啥事,并且我看了下,还是有点难度的,然后这个字体反爬系列会出两到三篇博文,针对市面上主流的字体反爬,一一讲清楚 不多bb,先看目标站 aHR0cDo{防查找,删除 ...
有个需求爬取知乎文章,正好记录下爬取过程以及出现问题并解决方法 我是在没有登录的情况下爬取文章的 本文仅供研究与学习使用 知乎现今的 x-zse 参数的加密方法已升级成了:x-zse-96 2.0版本。 来看这篇帖子的应该都知道,这个参数动态唯一,没有就拿不到api数据。 查阅了网上有关文章 ...
一、前言 前几天看到了瓜子二手车的广告,突发奇想想要拿这个网站试试手,可每次都无法成功获取到页面。试了很多次都没有结果之后便去网上搜索方案,才知道原来还有js反爬这种东西(看来我以前选网站的运气都太好了。。。),又发现了一篇js混淆反爬破解的文章,就拿来模仿学习一下。 学习的文章:JS混淆 ...
反爬机制和破解方法汇总 一什么是爬虫和反爬虫? 爬虫:使用任何技术手段,批量获取网站信息的一种方式。 反爬虫:使用任何技术手段,阻止别人批量获取自己网站信息的一种方式。 二 Headers and referer 反爬机制 *headers进行反爬是最常见的反爬虫策略 ...