今天在百度上搜了一下我刚发布的几篇文章,发现一个问题:

百度收录的页面居然是带动态参数的,而我记得我的文章链接都是固定格式的,也就是到html就结束了,不会有后面的replytocom参数,百度了一下原来这是wordpress评论中的链接,具体出现在哪里我倒是没有找到,难道是文章页的评论后面的reply?

不管怎么样,用百度统计分析了一下,也报告说这个动态参数会导致重复收录:

既然百度都有意见了,那必须改正,网上大家的方法是屏蔽蜘蛛,那就要修改robots.txt文件,说到这个文件,我又郁闷了好一阵。因为我去网站目录找,看不到这个文件,但在浏览器打开可以看到文件内容。然后我就去百度求助了,居然找不到答案,只好转战google,原来是wordpress搞的鬼,在目录下没有robots.txt文件的时候,你如果要访问这个文件,wordpress是会自动生成一个的。

既然这样,我就去目录下新建一个吧:

User-agent: *
Disallow: /blog/wp-admin/
Disallow: /blog/wp-includes/
Disallow: /*?replytocom=
Sitemap: http://www.aojgame.com/sitemap.xml.gz

好了,这个replytocom的问题就到此结束。