基本信息
源码名称:mini_spider:在调研过程中,经常需要对一些网站进行定向抓取。由于python包含各种强大的库,使用python做定向抓取比较简单。请使用python开发一个迷你定向抓取器mini_spider.py,实现对种子链接的广度优先抓取,并把URL长相符合特定pattern的网页保存到磁盘上-源码
源码大小:0.01M
文件格式:.zip
开发语言:Python
更新时间:2023-11-06
   友情提示:(无需注册或充值,赞助后即可获取资源下载链接)

     嘿,亲!知识可是无价之宝呢,但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下,绝对物超所值哦!如有下载和支付问题,请联系我们QQ(微信同号):813200300

本次赞助数额为: 2 元 
   源码介绍
#####使用python开发定向抓取器mini_spider.py,实现对种子链接的广度优先抓取,并把URL长相符合特定pattern的网页保存到磁盘上。 程序运行: python mini_spider.py -c spider.conf #####配置文件spider.conf: ...

.
├── mini_spider-master
│   ├── README.md
│   └── mini_spider
│       ├── __init__.py
│       ├── __main__.py
│       ├── engine
│       │   ├── SpiderEngine.py
│       │   ├── UrlParse.py
│       │   ├── __init__.py
│       │   └── spider_thread.py
│       ├── log.py
│       ├── spider.py
│       ├── spider_conf
│       ├── test
│       │   ├── UrlParse_test.py
│       │   ├── __init__.py
│       │   ├── spider_conf
│       │   ├── spiderengine_test.py
│       │   └── urls
│       └── urls
└── mini_spider在调研过程中,经常需要对一些网站进行定向抓取。由于python包含各种强大的库,使用python做定向抓取比较简单。请使用python开发一个迷你定向抓取器mini_spider.py,实现对种子链接的广度优先抓取,并把URL长相符合特定pattern的网页保存到磁盘上-源码_mini_spider-master.zip

4 directories, 17 files