Web漏洞扫描原理是什么-网络安全
Web漏洞扫描原理是什么呢?相信很多人都不清楚其中的原理是什么,作为一个独立的服务运行在产品的系统之中,它通过收发消息和外部的产品进行交互。web漏洞扫描有什么作用呢?今天就跟着小编一起来了解下关于web漏洞扫描,学会利用web漏洞扫描来提高扫描引擎的性能。
Web扫描引擎,产品通过向引擎发送一条消息来创建/暂停/停止/续扫一个任务,而引擎则通过消息告诉外界自己的状态、已经爬取的链接和已经检测到的漏洞;同时产品也可以通过消息来设置引擎的日志级别,系统使用带宽等属性。
对于某一特定的扫描任务,扫描引擎的作用可以理解为通过不断发现新的页面,将爬虫和插件的工作持续进行下去,直到整个站点被处理完或者达到某种设置的门限。Web应用漏洞扫描从大的方面可以分为页面爬取、探测点发现和漏洞检测三个阶段。Web扫描引擎将第一个阶段由爬虫独立完成,后两个阶段依赖于第一个阶段的结果,由插件独立完成。爬虫和插件之间可以同时进行,也可以等爬虫将站点爬完之后,再统一交给插件处理。
1、页面爬取
页面爬取使用智能页面爬取技术,重点在于快而全地获取整个站点的站点树。这个过程分为两步,网络访问和链接抽取。网络访问需要支持设置cookie,自定义请求头,设置代理(http,https,sock4,sock5),支持各种认证方式(basic,ntml,digest),客户端证书等。拿到响应之后,需要自动识别响应的编码方式,并将其转换为统一的UTF-8编码,供后续抽取链接等操作使用。目前支持从HTML,HTML注释,Flash,WSDL等静态内容中抽取链接之外,还用webkit实现了从DOM树,JS,Ajax等重抽取静态和动态的链接。
除了使用前文提到的各种爬取设置和智能技术之外,还需要对站点做存活性判断、主动识别页面类型(图片,外部链接,二进制文件,其它纯静态文件等)、尝试猜测一些无法从其他页面解析出来的但可能存在的目录并做好标记。存活性判断主要是为了迅速给出站点是否可达(可能跟用户的输入,配置的代理、认证信息,站点本身都有关系)的一个结论,避免做一些无用功;页面类型主要为了帮助插件区分哪些页面可能存在漏洞需要被扫,哪些页面可以直接跳过;根据一定的字典猜测可能存在的链接,一方面是为了尽可能多地发现页面,另一方面是为了方便插件直接根据猜测的标记报告敏感文件的漏洞。
通过爬取的时候获取并标记尽可能多的信息,可以极大地减少逻辑冗余,提高扫描引擎的性能。
2、探测点发现
不同的插件有针对性地在请求中寻找不同的探测点,可能的探测点有URL路径,GET方法URL中的参数,POST方法请求体中的参数,请求头中的字段,cookie中的键值,响应体等等。一般而言,插件会尝试对待扫描的URL进行解析,分解出各种可能存在漏洞的探测点,供后续进行相关的漏洞检测。
3、漏洞检测
每个具体的漏洞都有相应的一个插件来进行具体的检测。插件根据得到的探测点,有针对性地构造特殊的网络请求,使用远程网站漏洞扫描检测技术进行漏洞检测,判断是否存在相应的漏洞。除了使用到的漏洞检测技术之外,为了缓解网络访问带来的性能问题,在需要发送多种探测请求的插件中,将网络请求并发而将网络响应的处理串行起来提高扫描速度;为了避免在短时间内发送重复的网络请求(某些插件不需要重新构造请求体,使用的是和爬虫一样的网络请求),使用了页面缓存技术,旨在降低网络访问对扫描速度的影响;引擎在扫描的过程中,能够根据系统当时的负载,自动调节处理URL的并发进程数(不超过任务配置的进程数的前提下),从而获得一个最佳的系统吞吐量。