关于万蝶…
2009-10-09 12:07:30
关于万蝶…
万蝶没落了,
老项选错了方向,是很重要的原因.
毕竟曾经相处还算融洽,
所以,不想拆他的台.
搬家的工具,永远不会在网上流传,
这是我给他最后的承诺.
我可以采集公开或是注册用户可见的网志,
包括评论和标签.
少数私密的,就要自己按格式添了.
其实过程很简单,
采集整个页面,
用字符串查找,提取曰期,标题等,
然后加上相应的XML句子,
最后写入一个XML文件.
具体格式,从WP导出看一下就知道了.
对于一些熟人的评论,还可以加上他的邮件地址,以显示Gravatar头像
如: 查找
<wp:comment_author_email></wp:comment_author_email>
<wp:comment_author_url>http://thirteen.pdx.cn/</wp:comment_author_url>
替换为
<wp:comment_author_email>thirteensky@126.com</wp:comment_author_email>
<wp:comment_author_url>http://thirteen.pdx.cn/</wp:comment_author_url>
图片,可以查找 http://u([d]).asset.pdx.cn([^”]*?)
然后用flashget或迅雷下载回来.
另外找地方上传,再改每一个<img标签,
很麻烦.
我把我的WP导出,统计了一下,2436个引自万蝶的图片,
也就是说,如果我想改,那我需要下载2436个图片,
然后上传2436个图片,
最后再一一对应改过来.
算了,我会疯的.
Permalink : http://13jl.com/1806.html
16 Comments so far
blogcn无声无息地倒下了,万蝶也不远了。
最早的万蝶是有网志打包下载功能的,改版之后取消了。问老项,老项说新系统结构不同,没法做那个功能。被迫学了点php之后才明白,网志导出是件很简单的事,不到1K的代码就可以实现。如果担心大量的数据导出会造成数据库压力,限制每人每月导出的次数就是了。
首页链接里为啥没有我5555555555
我也要链接
啵~~~
我也要备份5555555555555
13帮帮我
就不说谢谢
链接点我名字就行了。ok了万蝶信联系我。ok?
甭废话了。帮我采集一下。你知道我是谁。谢啦。
又一个说万碟的.
是不是该庆幸曾经走过万碟盛世的时期,嘿嘿
[…] 关于万蝶… « 地狱十九重 « 零点2/白班2 « 2009/10/10 20:45:09 thirteen.com.cn/archives/1806.html – view page – cached 地狱十九重——十三少爷黯淡无光的自由世界。 — From the page […]
PDX用户流失已经很严重的了,没有吸引新奇简易的web2.0的体验,技术上没有突破,手机写博已经不是什么新鲜事儿了。之前PDX还想走论坛的路子,就更不靠谱。至于说交友。。。。。相信163或者开心校内已经足够了。
我忽然在想PDX关张的那天的时候,会不会像GEOCITIES那样,让每个用户可以下载回自己的数据包包。。。。。
CommenTwitter测试
WAP页面评论框测试
我暂时还没空去整理那些图片~
有文字就已经很不错了~
我知足了~
http://www.360doc.com/content/090620/12/5029_3969443.html(假如日本战胜了中国)
看看这文章,有趣之极。
我怕老项熬不过今年啊。
文章首页咋不留个回复框?