原文:sina微博的动态载入

最近写的爬虫就是为了抓取sina微薄的内容,结果发现 月份以后微薄改版了,改版之后一页并不是一次性现实的,而是分三次显示。第一次访问获取的内容只有 ,其余的内容分两次,通过新浪自己的STK库中的lazy load来完成动态加载的。本来以为很难解决,抓了一下包以后发现其实挺简单。 其中,第一次访问该博主主页是不需要这些参数的,从访问第二页开始需要。 end id和 k在接连浏览同一博主的不同页面时, ...

2012-01-08 01:45 6 2005 推荐指数:

查看详情

sina加入到博客园

很多博客都可以自己添加修改一些代码,但是作为博客平台来说,可能为了安全考虑,很多时候要过滤一些特性,比如:新浪的挂件是iframe形式的,但是博客园不支持iframe。经过一些尝试,最终有了下面两种解决办法: 首先先在公告中写一个空div,方便我们插入新建的iframe,省 ...

Fri Mar 09 21:59:00 CST 2012 8 1183
Python 动态载入模块

lib文件夹下有test.py文件: test.py文件内容如下: class simple(object): def __init__(self): self.name='刚田武' 在‘动态载入模块.py’文件下动态载入test.py模块的方法 ...

Sat Oct 20 23:27:00 CST 2018 0 1604
情感分析(一)

话说面世已经很久了,但对于信息的挖掘却才刚刚起步,这其中的原因当然有信息挖掘的技术还不成熟,但我觉得主要问题还是在于中文信息处理的技术还处于萌芽的阶段。中文语言本身信息量就很大,歧义性词汇多,再加上语言语义不整、媒介本体中夹杂着大量的标签,导致技术发展缓慢。在现在 ...

Sun Jul 19 05:16:00 CST 2015 0 1952
七月

2016年7月23日16:37:04 涂涂涂涂 2016年7月16日23:01:34 去信息工程大学打CCCC了 不辜负中国第二手速狗的称号,拿下全场一血,蛤蛤蛤 2016年7月9日13:0 ...

Mon Jul 04 04:00:00 CST 2016 11 460
账号注册

新浪开放平台:https://open.weibo.com/ 1.注册账号 注册新浪账号 进入首页。创建网站接入的应用:https://open.weibo.com/ 选择立即接入,进入到创建用页面 ...

Fri Oct 09 19:12:00 CST 2020 0 803
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM