Python敏感地址扫描和爬取工具
作者:网友投稿 时间:2018-03-26 09:11
字号
为了方便信息安全测评工作,及时收集敏感地址(初衷是爬取api地址),所以写了这么个小工具。两个简单的功能(目录扫描和url地址爬取)。
0×02 使用参数: python spider.py -u url -s api -o output.txt -t thread_number #通过爬虫python spider.py -u url -s dir -f dict.txt -o output.txt #通过目录扫描
0×03 部分函数说明:
防止因末尾斜线、锚点而重复爬取(、、)

爬取规则:
第一个无法爬取页面注释中的地址(<!––>),第二个无法爬取相对路径和php?id=等类型的地址,古结合两种规则,并排除图片视频类的地址,最后再去重

补全相对地址、防止越界(可爬取子域名,其他地址除外),并验证地址是否能正常访问

地址池

爬取功能,虽然使用了多线程,但还是比较慢,输出结果是爬取完毕的地址

目录扫描和输出到文件

https://github.com/silience/spider
责任编辑:CQITer新闻报料:400-888-8888 本站原创,未经授权不得转载
继续阅读




