这是关于抓取一段内容。爬网将从网站地图开始。看到这句话,我们应该想,如果网站没有网站地图,我们可能要等待爬虫跟踪互联网上的链接。不过,如果有网站地图,可以直接让爬虫过来,所以收录的效率会有很大的不同。在第二句中,爬虫程序特别关注新网站、更改和无效链接。与那些没有被修改过的旧页面相比,可能对旧页面没有太多的关注。我们需要定期更新网页,这样我们就能更快、更积极地获得的高度关注排名。另外,会注意无效链接,如果你的网站上有太多无效链接,对的印象将是负面的。
在抓取和索引网页时,会关注并跟踪信息;关键词到网站新鲜度,我觉得这里隐藏的信息是,关心的是关键词,后一个是网站新鲜度,其中可能还包含一些其他信息,比如页面类型、页面新鲜度等,但即使有没有隐藏的信息,我们可以确定排名中的因素,网站新鲜度至少占部分原因。否则,我们不需要考虑关键信号。当然,我认为更重要的是网页的新鲜度,我认为这是一个关键的信号。
接下来,出现在索引的每一页上的每个关键字都对应于一个条目,该条目被编入索引并添加到所有条目中。显然,一个网页可以被索引到许多项中,并在这些项中进行排序。所以关键的一点是,如果你想在你的页面上获得更多的关键词排名,你要想办法让内容覆盖更多的项目,同样,我认为的项目分为总项目和子项目。既然可以区分,就可以明确区分哪些内容应该在总项目中排名,哪些内容不应该排名。