虚拟主机域名注册-常见问题网站推广 → 网站推广问题

什么是网页抓取、网页索引及网页日志

  什么是网页抓取

  网页抓取指的是:搜索引擎蜘蛛爬行网页链接的过程。搜索引擎蜘蛛会通过各种渠道抓取网页链接,包括刚刚发布的新网页,还有经过改动旧网页。

  每个搜索引擎的抓取频率不同,百度和谷歌的抓取频率更高一些,360搜索和搜狗搜索的抓取频率会低一些。

  需要注意的是网页抓取是一个过程,搜索引擎蜘蛛每天都会抓取大量网页,有些网页可能会存放进搜索引擎的数据库,有些网页可能不会存放进搜索引擎数据库。网页质量越高,被存放在数据库的机会越大。

  什么是网页索引

  搜索引擎蜘蛛抓取页面并将抓取到的页面存储在索引库中,这就是网页索引。网页抓取和网页索引是有区别的,网页抓取是一个过程,网页索引是一种结果。网页爬虫抓取了1000个页面,也许只有100个页面被收录进索引库。

  什么是网页日志

  网页日志也叫做网站日志,记录了网络爬虫的详细访问记录。包括访问者的:IP地址、访问时间、区域、页面链接等。我们可以通过网站后台或服务器后台下载网页日志,并对网页日志进行分析(如何查看网站日志)。




免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:bkook@qq.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。
【 双击滚屏 】 【 推荐朋友 】 【 收藏 】 【 打印 】 【 关闭 】 【 字体: 】 
上一篇:什么是网络爬虫
下一篇:什么是robots文件
  >> 相关文章
没有相关文章。
0

在线
客服

在线客服服务时间:9:00-18:00

客服
热线

19899115815
7*24小时客服服务热线

关注
微信

关注官方微信
顶部