pycharm怎么新建一个scrapy项目
scrapy是一个用python编写的爬虫系统,通过scrapy的二次开发,您几乎可以爬取世界上90%以上的网站。下面我简单介绍下scrapy系统的安装与工程的创建。
scrapy安装
- 01
由于scrapy是使用python语言编写的爬虫系统,因此它很自然是可以通过pip安装的。 在bash或者cmd中输入: pip install scrapy就可以安装scrapy了。
- 02
然后等待scrapy将所有依赖包安装完成。查看scrapy版本,目前最新的版本是v1.4.0版本
- 03
安装virtualenv(可选)这里我还安装了virtualenv。virtualenv是一个提供独立的python开发环境的工具。例如你某个scrapy工程依赖的是python2.7,而另一个依赖的是python 3.5,那么这个工具就非常有用了。
创建scrapy工程
- 01
使用scrapy startproject创建工程。 安装scrapy后,就可以使用startproject指令创建你的scrapy工程了这里,我在终端输入了scrapy startproject quotes指令创建了一个quotes工程
- 02
创建工程后,你会发现工程下面已经创建了如下文件: . ├── quotes │ ├── __init__.py │ ├── items.py │ ├── middlewares.py │ ├── pipelines.py │ ├── settings.py │ └── spiders └── scrapy.cfg 下面你要做的就是创建spider类爬取目标网站。
- 03
使用pycharm打开scrapy工程。
- 04
在sprides包中创建你的sprider 这里我参照官方教程创建了一个简单quotes类
- 05
运行scrapy在pycharm中输入scrapy crawl quotes运行你得爬虫系统