其实蜘蛛池的技术并不难,难点在于大量的域名,服务器资源,以及维护成本。蜘蛛池就是一堆由域名组成的站群,在每个站点下都生成海量页面(抓一堆文本内容相互组合),页面模板与正常网页没多大区别。由于每个站点都有海量的页面,所以整个站群的蜘蛛总抓取量也是巨大的。给未收录的页面引蜘蛛,在网站开一个模板专门放需要收录的链接。这就是蜘蛛池实现促进网站收录的原理。 而蜘蛛池程序的原理,就是将进入变量模板生成网页的蜘蛛困住,让其不停地在这些页面中抓取,而将我们需要收录的URL作为蜘蛛的出口 。这样就能使用我们需要收录的URL有大量的蜘蛛抓取爬行,大大提升了页面收录的可能性南昌壹基比。
|