Skip to content

{ Tag Archives } 搜索引擎

如何使用robots.txt

参考:
中国雅虎搜索日志 http://ysearchblog.cn/2007/09/robotstxt.html 
Google黑板报 http://www.googlechinablog.com…..tstxt.html
点石互动 http://www.dunsh.org/2006/08/02/robotstxt/
阿里妈妈社区 http://club.alimama.com/thread-43231-1-1.html
robots.txt 文件对抓取网络的搜索引擎漫游器(称为漫游器)进行限制。这些漫游器是自动的,在它们访问网页前会查看是否存在限制其访问特定网页的 robots.txt 文件。如果你想保护网站上的某些内容不被搜索引擎收入的话,robots.txt 是一个简单有效的工具。
如何放置 Robots.txt 文件
robots.txt自身是一个文本文件。它必须位于域名的根目录中并 被命名为”robots.txt”。位于子目录中的 robots.txt 文件无效,因为漫游器只在域名的根目录中查找此文件。例如,http://www.example.com/robots.txt 是有效位置,http://www.example.com/mysite/robots.txt 则不是。
这里举一个robots.txt的例子:
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~name/
使用 robots.txt 文件拦截或删除整个网站
要从搜索引擎中删除您的网站,并防止所有漫游器在以后抓取您的网站,请将以下 robots.txt 文件放入您服务器的根目录:
User-agent: *
Disallow: /
要只从 Google 中删除您的网站,并只是防止 Googlebot 将来抓取您的网站,请将以下 robots.txt 文件放入您服务器的根目录:
User-agent: Googlebot
Disallow: /
每个端口都应有自己的 robots.txt 文件。尤其是您通过 http 和 https 托管内容的时候,这些协议都需要有各自的 robots.txt 文件。例如,要让 Googlebot 只为所有的 http 网页而不为 https 网页编制索引,应使用下面的 robots.txt 文件。
对于 http 协议 (http://yourserver.com/robots.txt):
User-agent: *
Allow: /
对于 […]

Also tagged , , ,

rel=”nofollow”

文章来自:http://www.seo1000.com/seo-res…..d=nofollow
NoFollow是什么?
NoFollow是Google在2005年1月提出的一个防止Spam的规范,很快被世界各大搜索引擎采纳。现在,为了防止Spam从其它网站的用户留言中获取不当利益,国内外主流Blog服务商(如WordPress和MovableType)和建站软件,也都对用户留言的链接自动添加了NoFollow属性,因此这些链接就不会被搜索引擎索引,从而让Spammer的SEO及Link Popularity企图落空。
什么是nofollow标签,如何使用nofollow标签
随着网络博客的流行,这类垃圾评论和垃圾链接逐渐泛滥,引起Google的重视并率先提出了反抗方案。Google的措施是通过一种新型标签有效的阻止这类垃圾评论和垃圾链接。自此一旦Google发现超链接中含有该属性(“rel=nofollow”),这类链接不会被作为某站点在搜索结果排名中的评价依据;同时该标签不会成为垃圾评论所在博客或网页的负面投票,它仅用于防止垃圾制造者博客评论,反馈表单或推荐列表等公众领域通过混淆视听而受益。
阅读(43 次)

Also tagged , , ,

从Google索引中删除网页索引

文章来源:http://www.zishu.cn/blogview.asp?logID=731
作为网站的所有者,我们总希望自已的内容能随时被搜索引擎收录,而同样有问题时,能随时从搜索引擎中删除。 Google 这一点作的非常的好,主要是通过他的“网站管理员工具”https://www.google.com/webmasters/tools/ 这个工具最早(可能三年前)用的很多,但那时的功能不是很多,最近由于业务需要,用到了其中一个“删除网址”的一个功能。感觉非常好,写出来和大家分享一下! 
首先说一下这个工具怎么使用:
1、你要有一个google的账户;
2、直接通过以下地址登录:https://www.google.com/webmasters/tools/ 
3、添加你要管理的网站!
4、验证你是网站的所有者,最简单的方法就是直接上传一个Google提供的html文件到你的网站根目录。
然后就可以了…… 这非常的简单。 
阅读(31 次)

Also tagged , , ,