如何通过IP地址看网站日志来寻找百度蜘蛛爬行规律? -电脑资料

电脑资料 时间:2019-01-01 我要投稿
【www.unjs.com - 电脑资料】

    如何通过IP地址看网站日志来寻找百度蜘蛛爬行规律? 对于各位站长来说,百度的收录是关心的重中之重. 了解百度蜘蛛的爬行规律从而更好的...

    如何通过IP地址看网站日志来寻找百度蜘蛛爬行规律?

    对于各位站长来说,百度的收录是关心的重中之重.

    了解百度蜘蛛的爬行规律从而更好的改善收录情况也是必须要掌握的.

    很多网站目前使用的都是虚拟空间,都能够提供日志.

    日志是指在网站根目录下的logfiles文件夹里面日期.txt文本文件

    有很多介绍通过http查看返回命令的那种办法来查看蜘蛛,这里就不介绍了.

    现在更多的网站是没有提供可以通过软件来查看的日志格式.

    更多的是类似北京礼品网网站的日志格式,如下:

    03:28:34 GET /goods.php 202.108.7.205 200 34696 390

    第一 03:28:34 访问时间

    第二 GET /goods.php 访问的页面 get表示获取

    第三 202.108.7.205 访问网站的源IP

    第四 200     成功访问

    第五 34696 390 表示记录的内容大小

    都是这种格式的日志如何去分析了,一个一个看的头都大了.

    商务礼品网站www.lipin-bj.cn的日志记录每天都有1M多,上千条记录岂不是会看都头晕眼花.

    注意了,告诉大家一个窍门.经过长期观察发现,百度的蜘蛛的来源服务器IP地址都是属于

    一个域下面的通个网段.什么意思了,就是全部都是以202.108开头的IP,IP地址都是类似于

    202.108.X.X.这个网段的IP地址是位于北京网通电报大楼,属于全国互联网核心骨干机房,现在

    此IP段已经绝迹了.

    那么调出你的日志,用ctrl+f查找一下有没有这个网段的IP.有的话就在查找一下访问的时间,

    那么就可以找出来百度蜘蛛访问你网站的时间规律了.对于更新内容的作用那是杠杠的啊.

    厚诚集智 成长无限 企业大学网 www.51hlht.com

最新文章