教你查看日志中蜘蛛的访问行为:云服务器怎么快捷锁定电脑

時間:2023-12-28 11:51:49 作者:云服务器怎么快捷锁定电脑 熱度:云服务器怎么快捷锁定电脑
云服务器怎么快捷锁定电脑描述::

网站日志,是服务器端自动生成的一个文本纪实,详细记载了网站的拜访详情,做为站长的你,假如是需要察看拜访统计数据,那用51la或者百度统计工具就可以了,但是假如你想察看各搜索引擎的蜘蛛是否准时来爬行自己的网站,那就要学会自己察看网站日志文件了。交融我们自己的网站做为一个实例来做一个介绍:

首先应用FTP工具登录服务器端,一般在服务器根目录之下存在一个logs文件夹,这里面装的就是网站日志,当然差异的服务器类型,日志文件的文件夹名称和我介绍的不一样,但没关系,日志文件的开拓名是log。

进入日志文件夹,你会发明,日志文件是按每一天的拜访场合为一个文件保留的:

好吧,我的服务器只保存最近三天的日志文件,真吝啬,我还用过一个国外的服务器,人家是按月纪实,并且当月结束后会将当月的日志打包供下载,只要你不人为删除,该日志文件会永远存在,这才叫个性化,但是没设法,谁叫我们只能用内地的服务器。

OK,报怨了几句,随意下载一天的日志文件,用Windos文本工具打开该日志文件,会看到一堆酷似代码的字符,祝文件大小打开速度也差异:

留心看有底细的这一小部门,我用CTRL+F搜索性能查找bausper,好吧,为什么要查找bausper,

这里先普及一下关于搜索引擎蜘蛛的一点小知识,各大搜索引擎的蜘蛛都驰名字:

百度的叫bausper;

360的叫360Sper;

谷歌的叫Googlebot;

微软的叫bingbot;

搜狐的叫Sogou eb sper;

腾讯的叫Sososper;

由于内地主要是以百度为优化对象,我们来看看关于百度蜘蛛爬行纪实的信息解析,在日志纪实中随意找一个百度蜘蛛的信息:

422361071 - - [03Mar2017212819 +0800] GET HTTP11 200 34656 Mozilla50 (Windos NT 62) AppleWebKit53736 (KHTML, like Gecko) Chrome310165063 Safari53736 QIHU 360SE; 360Sper

怎么解读这些信息呢?蜘蛛IP--【拜访时间】“获取路径”HTTP反馈值200 反馈字节数34656 百度蜘蛛标志。

好吧,这里面获取路径与HTTP反馈值是非常重要的信息,200为正常读取,读取了5374个字节。我们再解析一条纪实:

22018151118 - - [07Sep2012095415 +0800] GET productdispphp?=93 HTTP11 301 249 - Mozilla50 (patible; Bausper20; +bausearchsper)

勤恳看获取路径这一项,由于我的网站是老域名,原来的主人被收录的路径productdispphp?=93,百度蜘蛛同样爬行,结局我的 新网站里肯定不会有这一条信息,因为HTTP反馈了301,而301典型已移动 — 请愿的数据具有新的位置且更换是永久的。其实这对于我来说是一件好事,蜘蛛爬行不通,知道这条收录纪实已经失效,缓慢就会从百度的收录数据库中删除。现在 百度正在考查我的新站点,一天爬行只有23次,也很不错了的。

好了,大家是不是可以举一反三的学会看其它搜索引擎蜘蛛的爬行纪实了呢?下次,笔者将重点再分享一下HTTP的反馈值,大家通过这个反馈值可以获悉自己网站的健康状态哦,非常重要。

当然,有朋友会说为什么不应用一些日志察看工具,人工手动查看费时费力,是的,有些不错的工具可以提供更方便的操纵,今日笔者所述内容旨在用最初等的想法教会大家学会查看自己网站的日志。但愿以上内容能对你有点辅助。

站長聲明:以上關於【教你查看日志中蜘蛛的访问行为-云服务器怎么快捷锁定电脑】的內容是由各互聯網用戶貢獻並自行上傳的,我們新聞網站並不擁有所有權的故也不會承擔相關法律責任。如您發現具有涉嫌版權及其它版權的內容,歡迎發送至:1@qq.com 進行相關的舉報,本站人員會在2~3個工作日內親自聯繫您,一經查實我們將立刻刪除相關的涉嫌侵權內容。