平时爱逛知乎,收藏了不少别人推荐的数据分析、机器学习相关的微信公众号(这里就不列举了,以免硬广嫌疑)。但是在手机微信上一页页的翻阅历史文章浏览,很不方便,电脑端微信也不方便。 所以我就想有什么方法能否将这些公众号文章下载下来。这样的话,看起来也方便。但是网上的方法要么太复杂(对于我这个爬虫入门 ...
注:本教程只用于学习交流用途 有时候看到写的好的文章想保存作为笔记,但是当保存完之后看图片图片却 显示 图片来自。。。。不可引用 去截图把又太烦,于是研究了一下它的原理: 步骤: .打开开发者工具可以看到对应图片中的src属性复制,在浏览器上打开是可以看到图片的,为啥复制文章看不到图呢 .鼠标点击对应图片复制图片地址,然后在浏览器中打开, 图片来自。。。。不可引用 ,到这我们我们只需要看一下同一张 ...
2020-04-01 18:07 0 1704 推荐指数:
平时爱逛知乎,收藏了不少别人推荐的数据分析、机器学习相关的微信公众号(这里就不列举了,以免硬广嫌疑)。但是在手机微信上一页页的翻阅历史文章浏览,很不方便,电脑端微信也不方便。 所以我就想有什么方法能否将这些公众号文章下载下来。这样的话,看起来也方便。但是网上的方法要么太复杂(对于我这个爬虫入门 ...
方案一:基于搜狗入口 在网上能搜索到的公众号文章采集相关的信息来看来看,这是最多、最直接、也是最简单的一种方案。 一般流程是: 搜狗微信搜索入口进行公众号搜索 选取公众号进入公众号历史文章列表 通过文章列表获取文章链接,通过文章链接获取文章内容 对文章内容进行解析入库 ...
平时我们可能需要把感兴趣的公众号的文章保存为pdf,方便离线查看,也可以避免某些文章被删除后看不到。所以我们需要把该公众号的文章批量导出为pdf。这里我们使用python来实现该功能。 1、导出该公众号的所有文章链接等信息为CSV文件。 首先我们安装chrome ...
最近在做一个案例页面,主要结构就是列表和内容,还有固定的头部和底部(方便查看价格及购买),因为之前的案例详情页是很多的固定页面,这样不太方便维护,现在其他同事需要展示不同的案例,所以就从新整理了一下这块: 1、列表页就是很普通的,请求数据,包含一张图片、一句简要说明、一个微信文章链接,图片和文 ...
1 在电脑上登录微信 2 打开fiddler抓包软件,然后打开电脑版微信,找到需要爬取的公众号, 3 点击公众号,再点击查看历史信息 4进入历史信息界面如下 5 向下滑动右侧的滚动条,同时观察fiddler上的抓包信息,这里为了便于分析 ,可以添加过滤规则 在Fiddler的filter ...
最近需要做一个公众号文章阅读奖励积分的功能,首先就得获取到文章列表,网上查了资料后,感觉微信公众平台图文编辑那的限制会少一点,可以满足需求,现在记录一下 一:首先创建一个登陆表单,包含账户和密码,点击登陆后台请求对应接口获得一个二维码图片,然后js循环刷新显示二维码直到扫码成功(账号密码为微信 ...
目前微信公众号的编辑器是不支持Markdown语法的,那怎么办呢? 有一款叫Markdown Here的插件可以解决这个问题(支持Chrome、Firefox、Safari)。 官方网站:http://markdown-here.com/ Markdown here插件下载地址(需翻墙 ...
机器能做的事就别让人来做! 目标: 抓取特定微信公众号文章 思路:利用selenium模拟浏览器行为,进行抓取(理由:搜狗已将文章链接进行处理,且页面为动态生成) 框架: 步骤: 1、登录搜狗 a、找到登录按钮并点击 3、抓取更多 ...