- 11-22 11:19
- Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; TencentTraveler ; .NET CLR 2.0.50727; Alexa Toolbar)
-
52
管理员
头衔 法国女王
注册 07-08-04
来自
-
搜索引擎对动态网站支持的改进
搜索引擎对动态网站支持的改进
搜索引擎一直在提高自己对于动态页面的支持。到目前为止,GOOGLE、HOTBOT和百度等开始尝试抓取动态网站页面(甚至包括URL带 "?"的页面)。但这些搜索引擎抓取动态页面时,为了避免"搜索机器人陷阱"(spider traps,脚本错误,这种错误会让搜索机器人进行无限循环的抓取,无法退出)",都只抓取从静态页面链接过去的动态页面,而从动态页面链出去的动态页面都不再抓取,即不会对动态页面中的链接进行深入访问。
对于直接使用动态的URL地址,请注意:
· 文件URL中不要有Session Id,同时不要用ID作为参数名称(特别是对于GOOGLE);
如:《网络营销基础与实践》一书,在当当网的介绍页面URL地址是:asp?product_id=493698">http://www.dangdang.com/product_detail/product_detail.asp?product_id=493698,该页就无法被读取。
·参数越少越好,尽量不要超过2个;
·尽量不要在URL中使用参数,这样可以增加动态页面被抓取的深度和数量。
附:
Google 向网站管理员提供的信息:www.google.com/webmasters/guidelines.html
百度常见站长问题:http://www.baidu.com/search/guide.html#2











