注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

那些星星点点的微芒,终会成为燃烧生命的熊熊之光

 
 
 
 
 

日志

 
 

meta标签的常见用法  

2012-08-31 15:55:53|  分类: 学习在路上 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

meta主要为分HTTP标头信息(HTTP-EQUIV)和页面描述信息(NAME)。标头信息包括文档类型、字符集、语言等浏览器正确显示网页的信息及处理动作;网页描述如内容的关键字、摘要、作者和定义robots行为等,为搜索引擎索引提供信息。

meta标签在head中定义,主要参数如下
http-equiv:将content属性连接到一个http头部字段,作为http头部的成分传递
name:将content属性与一个名字连接,当请求此名字的数据时,将发送content属性的值
content:根据http-equiv或name的不同属性值提供相应的值
lang:指定此meta标记的语言

<meta http-equiv="Content-Type" Content="text/html; Charset=utf-8" />
说明网页类型和字符编码信息,W3C建议使用并放在head区的最上面。这是随http头部发送属性值(当然现在的服务器一般不发送)或者由客户端读取。尽管在XHTML标准文档声明部分包含了这些内容,但W3C也建议在meta中设置,以更好的兼容一些浏览器和搜索引擎

<meta http-equiv="Content-Language" Content="zh-CN" />
说明文档的国字语言代码。在XHTML中,可以在<html>的xml:lang和lang属性中设置,因此可以不使用。

<meta http-equiv="Refresh" Content="15; Url=http://www.cnblogs.com/tonywang711/" />
网页15秒后自动转向到url网址。谨慎使用跳转,否则可能会被搜索引擎认为作弊,不利于网站优化。如果使用meta跳转,时间最好大于10秒。

<meta http-equiv="Expires" Content="Wed, 26 Feb 1997 08:21:57 GMT" />
指定网页在缓存中的过期时间。注意:必须使用GMT的时间格式或直接设为0。

<meta http-equiv="Pragma" Content="No-cach" />
禁止浏览器从本地机的缓存中调阅页面内容

<meta http-equiv="Widow-target" Content="_top" />
强制页面在当前窗口以独立页面显示,来防止别人在框架里调用你的页面
。Content选项:_blank、_top、_self、_parent


以上是http-equiv标头信息,为用户代理提供文档信息或定义浏览器动作,下面name主要为搜索引擎提供内容描述信息和robots定义,对搜索引擎优化起一定作用。


<meta name="Keywords" Content="word1,word2..." />
描述此文档内容的关键词,宜选用稍冷的组合词,六组左右;SE对keyword比较敏感,作用不是很大,如果堆积关键词或名不符实,则可能会被搜索引擎惩罚,所以宁缺勿滥。
<meta name="Kyewords" Lang="en" Content="vacation,greece,sunshine" />
<meta name="Kyewords" Lang="FR" Content="vacances,grè:ce,soleil" />
当数个META元素提供文档语言信息时,搜索引擎会使用lang特性来过滤并通过用户的语言优先参照来显示搜索结果。
<meta name="Description" Content="网页信息的描述" />
描述网页的主要内容,有利于搜索引擎和用户了解网页摘要。因SE不同,以100字左右为宜。摘要需对不同页面给予不同的描述,明确包含标记性事实。
<meta name="Robots"Content="All|None|Index|Noindex|Follow|Nofollow" />
许多搜索引擎都通过放出robot/spider搜索来登录网站,这些robot/spider就要用到meta元素的一些特性来决定怎样登录,当然有的SE不支持这个属性。Robots用来告诉搜索机器人哪些页面需要索引,是否跟踪链接。Content的参数有all、none、index、 noindex、follow、nofollow。默认是all。

all:文件将被检索,且页面上的链接可以被查询;
none:文件将不被检索,且页面上的链接不可以被查询;(和 "noindex, nofollow" 起相同作用)
index:文件将被检索;(让robot/spider登录)
follow:页面上的链接可以被查询;
noindex:文件将不被检索,但页面上的链接可以被查询;(不让robot/spider登录)
nofollow:文件将不被检索,页面上的链接可以被查询。(不让robot/spider顺着此页的连接往下抓取)
meta robots可以逐页控制对网站的访问,还可在robots.txt文件中声明URL,控制spider对它们的抓取。

<meta name="revisit-after" CONTENT="7 days" />
重访时间。有时页面不是经常更新或减轻服务器的负担,可以设置一个搜索引擎机器人下次重访的时间,当然如果时间过短,SE bot并不会按这个时间准时重访,它只会在大于这个时间访问。
<meta name="Author" Content="xx" />
标注网页的作者或制作组,可以是名字,或Email
<meta name="Copyright" Content="本页版权归XXXX所有。All Rights Reserved" />
<meta name="Generator" Content="PCDATA|FrontPage" />
说明你所用编辑器( 说明这个做什么用? )

meta 标签常用的属性就这么多,一个页面最好有的如Content-Type,Keywords,Description,其它根据需要常用的有Robots,Refresh,Widow-target。

以上内容来至:Tony.wang

相关案例:搜搜 搜索引擎越权爬行


更多内容参考:W3C

  评论这张
 
阅读(26)| 评论(0)
推荐

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017