浅谈网络爬虫的安全性问题|tech|武汉网盾科技有限公司|湖北地区互联网混合云分布式云计算和高防IDC解决方案服务商

浅谈网络爬虫的安全性问题发布时间：2020/12/18 15:52:47 阅读次数：

网络爬虫（Web Crawler），又称网络蜘蛛（Web Spider）或网络机器人（Web Robot），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

搜索引擎使用网络爬虫抓取Web网页、文档甚至图片、音频、视频等资源，通过相应的索引技术组织这些信息，提供给搜索用户进行查询。随着网络的迅速发展，网络爬虫也为中小站点的推广提供了有效的途径，网站针对搜索引擎爬虫的优化曾风靡一时。

timg (2).jpg

传统网络爬虫从一个或若干个初始网页的URL（Universal Resource Locator统一资源定位符）开始，获得初始网页上的URL，在抓取网页的过程中，不断从当前页面上抽取新的URL放入队列，直到满足系统的一定条件停止抓取。现阶段网络爬虫已发展为涵盖网页数据抽取、机器学习、数据挖掘、语义理解等多种方法综合应用的智能工具。

网络爬虫的安全性问题

1、搜索管理员登录页面

2、搜索互联网用户的个人资料

3、搜索目录列表

4、搜索测试页面、手册文档、样本程序及可能存在的缺陷程序

返回上级菜单

浅谈网络爬虫的安全性问题发布时间：2020/12/18 15:52:47 阅读次数：

产品

新闻中心

关于我们

联系我们