对于一个拥有大概700万的每月流量以及136万左右的外部链接的网站来说,搜索引擎优化自然不是Twitter的关注点,单纯靠自然流量以及附属工具的过度,Twitter已经加入Alexa排名前300了。所以这篇文章纯粹的没事找事做,说说twitter的站内搜索引擎优化问题
Twitter Search的robots.txt限制了Google爬虫
Twitter搜索是个备受关注的功能,也是很多twitter衍生网站使用最多的API出处,Twitter搜索甚至被认为是挑战Google搜索的杀手级工具,但是Twitter却对其搜索结果页面限制了搜索引擎爬虫,他们的robots.txt是这样的:
User-Agent: *
Disallow: /search
Disallow: /*?
不知道是处于什么原因考虑,Twitter会这样处理被认为是twitter最有价值的搜索结果页面(我个人是这么认为滴)。Twitter的实时搜索加上Google的海量数据,这才是用户最快最好的获得信息的渠道组合,Twitter这么做对于搜索引擎用户来说说就有点郁闷了,而且对于Twitter从搜索引擎获取流量也不利。不过Twitter虽然把搜索引擎拒之门外,Google还是比较厚脸皮的把Twitter搜索的robots.txt直接忽视了。
Twitter的重复内容问题
Twitter的用户页面到达途径有很多种,譬如我个人的Twitter页面,正规的是http://twitter.com/feir,但是m.twitter.com/feir、explore.twitter.com/feir和api.twitter.com/feir也都有效,这几个页面的内容是完全相同的,而且这三个二级域名在Google里的收录也非常可观(Site:m.twitter.com 1,020,000条结果,site:explore.twitter.com 8,500,000条结果,site:api.twitter.com 1,970,000条结果)。这就是很明显的重复内容问题了。与前面的twitter限制搜索结果页面被收录比起来,更有限阻止搜索的应该是这两个二级域名。
Twitter用户页面的meta问题
Twitter在所有用户页面以及用户的tweets页面的meta description都是相同的
[html]。[/html]
我觉得至少在用户页面上应该使用用户的个人信息作为description而不是Twitter本身的介绍。
虽然说Twitter貌似不是很重视搜索引擎优化,但是twitter最近对用户页面的title更改却有点SEO的味道。Twitter把用户页面的“title从Twitter/用户名”,改为了 “用户名 on Twitter”,不能不说是个进步。以后在搜索引擎上搜索人名的时候,除了facebook、linkedin以外,Twitter也成为个人的网络名片了。
Comments on this entry are closed.