按日归档: 2012/05/21

从百度空间导入到WordPress

从此这里做主博了,于是写了个导入程序把我百度空间的东西也搬了过来,下次还得写个导入相册的。。。

看了网上很多导入工具都是用的RSS来导入,会丢掉很多东西,而且一些被百度和谐掉的内容是抓取不到的,所以做了这么个工具通过采集的方式直接从HTML里抓取博客内容。

 

源文件下载:import_baiduhi.php_.zip

 

配置方法:

在程序底部修改下面两个变量的值,如果不想抓私密文章cookie留空也可以。

$account = 'meshikar'; //百度空间的URL后缀
$cookie = 'YOUR COOKIE'; //登陆后的百度COOKIE,用于抓取私密文章

附上Cookie的获取方法:

登陆后用firefox的firebug在网络选项卡中点开第一个请求,查看请求头信息把Cookie的内容复制下来就是了。

cookie的获取方法

继续阅读

Read: 1177