目的
转移百度空间内所有博文
原理
1、分析空间页数
2、遍历每一页文章url
3、对每个url进行分析、采集数据
4、输出固定格式,目前只支持输入RSS2.0
项目地址 http://fengtoys.googlecode.com/svn/trunk/BaiduMove/
使用方法
编辑BaiduMove.py文件,找到if __name__==’__main__’:行,修改下一行的baidu==BaiduMove(‘fred’,’429263181′) 把429263181替换成自己的博客ID
if __name__=='__main__': baidu = BaiduMove('fred','429263181') baidu.articleToRSS('Hibaidu_fred',10)
然后在命令行运行python BaiduMove.py即可
由于是要采集到一个文件里,因此暂不支持多线程,难实现不同线程操作对一个文件写入,有什么好主意可以进一步讨论
v0.1
1、自动爬百度空间,并输出RSS文件
v0.2
1、修复部分bug
2、支持RSS切割生成
评论关闭。