URL 是统一资源定位,即每个网页的网址、路径。网站文件的目录结构直接体现于 URL。清 晰简短的目录结构和规范的命名不仅有利于用户体验和网址传播,更是搜索引擎友好的体 现。
1.目录访问层次
即通过几层能够访问到最终页面,Google 最好为三层。
以 http://www.seochat.org/为例。
http://www.seochat.org/首页为第一层,百度优化为第二层, 百度如何优化为第三层。
这样的结果便于搜索引擎索引。百度如何优化 这个页面在百度和 google 里面都有收录。
问题1:如果我的网站目录层次大于三层,该怎么办?
回答:由于三层的目录,容纳的页面有限,需要多级目录。
这个时候使用前面我们讲过的二级域名的方式扩大级数。因为二级域名算独立网站,目录层次从当前二级域名算起。
例如:搜狐 ,汽车频道 auto.sohu.com
问题2:为什么有的网页在本网站层数很多,也被Google收录呢?
回答:这些页面被其他网站引用,而Google从其他页面进入这个页面也少于三层。
可以使用 link 命令查询该页的反相链接。例如:link:prod.it.com.cn/pricelist/2/1/14/534.htm 。
link 命令只能查询3个月前的历史记录,当前的外链需要3个月后查询。
问题3:所有的搜索引擎是否都和Google一样?
回答:不是
百度收录的时候相对 宽容一些,例如:我的网站 天天收藏夹, 在百度里面 收录这个页面外国驻华使馆-天天收藏夹网站目录 而这个页面从首页算起,已经是第五层了。
总结:三层目录,是最佳的目录结构。
2.目录和文件命名:
a.根据关键字无所不在的原则,可以在目录名称和文件名称中使用到关键词。但如果是关键词 组,则需要用分隔符分开。我们常用连字符“-”和下划线“_”进行分隔,URL 中还经常出 现空格码“%20”。因此,如果以“中国制造”作文件名,就可能出现以下三种分隔形式:
made-in-china.htm
made_in_china.htm
made%20in%20china.htm
连在一起之后,关键词就失去了意义。但事实上,至少在目前 Google 并不认同“_”为分隔符。对 Google 来说, made-in-china 和 made%20in%20china 都等于 made in china,但 made_in_china 就被读成了 madeinchina,
因此,目录和文件名称如果有关键词组,要用连字符“-”而不是下划线“_”进行分隔。
问题1:所有的搜索引擎是否都和Google一样?
回答:不是
在百度图片中,拼音路径比较有效的。
例如:site:www.***.cn,收录大部分都排在第一。
b.URL 应该越短越好。
有人为了单纯增加关键字而额外建多一个带有关键字的子目录,改变目 录结构。由于 URL 中含有关键字本身对排名提高帮助并不大,因而这种做法多此一举,也是搜索引擎反感的。
例如:要做英文关键词 computer,这样的目录 http://www.ibm.com/computer/computer/computer.html 是错误的。
总结:合理的目录命名,可以对网页排名是加分的。
3.绝对 URL 和相对 URL:略
绝 对 URL : 即 网 页 路 径 使 用 包 含 顶 级 域 名 在 内 的 完 整 的 URL 。 如 : www.yoursite.com/page1/index.html 是一个绝对路径,其中/page1/index.html 则为相对 路径,由浏览器自动在该链接前加上 www.yoursite.com。
总体上,Google 在排名时并不在意 URL 使用的是相对路径还是绝对路径。
4.动态 URL:略
目前很多网站都有数据库驱动生成的 URL,即动态 URL,往往表现为在 URL 中出现“?”、“= ”、 “%”,以及“&”、“$”等字符。动态 URL 极不利于搜索引擎抓取网页,严重影响网站排名, 通常是通过技术解决方案将动态 URL 转化成静态的 URL 形式,如: 将http://www.domain.com/messages.php?id=2&type=5 转化为 http://www.domain.com/messages/2/5/ 下文将会专门提到动态 URL 的解决方案。
问题1:为什么动态页面对搜索引擎不友好呢?
回答:1.因为这样会陷入死循环。这就是所谓的蜘蛛陷阱(spider traps)。