最近做的爬虫一些事 标签(空格分隔): 杂乱之地 最近在做爬虫,主要是抓取淘宝商品的销量数据。在搜索页很容易就能抓到细览页的数据,主要问题难点是在抓取细览页中,页面的销量及评价数据是通过ajax来动态加载的。这一部分处理比较麻烦。同时又要解决屏蔽的问题。这几天一直在找解决访问。一般 ...
最近做的爬虫一些事 标签(空格分隔): 杂乱之地 最近在做爬虫,主要是抓取淘宝商品的销量数据。在搜索页很容易就能抓到细览页的数据,主要问题难点是在抓取细览页中,页面的销量及评价数据是通过ajax来动态加载的。这一部分处理比较麻烦。同时又要解决屏蔽的问题。这几天一直在找解决访问。一般 ...
参考文档: http://blog.sina.com.cn/s/blog_58cfda2a0101j94u.html ubuntu下载地址: http://relea ...
前言: 用ubuntu14.04也有一段时间了,感觉与之前版本相比还是在挺多方面有了改进。但刚装完还是有一些小问题需要自己动手解决。鉴于网上的内容太过零碎,有些方案也太过老旧,因此在这里为大家总结一些个人使用的优化方式跟配置方案,希望可以为刚接触ubuntu14.04的朋友提供一些帮助 ...
展示文,吐槽文,不喜欢的请Ctrl+W。。。 淘金店堂的产品完成的差不多了,已经着手上线了。但是小公司就是不能让你闲着,哪怕是给个机会让总结一下,直接步入下一个项目。这个是美容医院的一个远程服务项目 ...
使用RabbitMQ半年有余,每天跑的数据量数亿这个量级吧,期间做了些工作,也处理了些问题,稍加总结。 我们使用的场景主要是用于模块件的数据中转和分发,客户端以C++为主,php和python为辅。 工作: 基于rabbitmq-c开发了c/c++客户端,主要实现了连接管理、统一 ...
1. 没有声音的问题[ kali ] 参考:http://tieba.baidu.com/p/4343219808 用pulseaudio --start会看到一些信息,提示类似root用户之类的 我是用下面这个方法搞定的 还有吧友说是修改配置文件,这里也记录一下,备用 2. ...
前戏:入园这么久,第一次这么认真的写博客,先自我介绍下,我是一只存活在C#阵营的老菜鸟了,主要的在C#阵营瞎忽悠,然后走走其他阵营,工作已经要有6年了,目前还在苏州混,然后确没啥大的技术性突破,时间和 ...
使用了jquery easyUI和arcgis api for js3.16离线API,地图服务是自己用arcgis server10.1发布的,代码如下: 功能如下图: ...