python

导航

python网络爬虫可以干什么?

来源 :中华考试网 2020-12-30

  从网站bai某一个页面(通常是首页)开始du,读取网页的内zhi容dao,找到在网页中的其它链zhuan接地址,shu然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。

  网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。

分享到

您可能感兴趣的文章