博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
PyCharm调试运行Scrapy教程
阅读量:4605 次
发布时间:2019-06-09

本文共 1194 字,大约阅读时间需要 3 分钟。

一、使用scrapy创建一个项目

这里使用scrapy官方第一个示例

scrapy startproject tutorial

使用PyCharm打开项目,在tutorial/tutorial/spiders目录下创建quotes_spider.py文件并写入,以下代码

import scrapyclass QuotesSpider(scrapy.Spider):    name = "quotes"    def start_requests(self):        urls = [            'http://quotes.toscrape.com/page/1/',            'http://quotes.toscrape.com/page/2/',        ]        for url in urls:            yield scrapy.Request(url=url, callback=self.parse)    def parse(self, response):        page = response.url.split("/")[-2]        filename = 'quotes-%s.html' % page        with open(filename, 'wb') as f:            f.write(response.body)        self.log('Saved file %s' % filename)
View Code

 

二、复制cmdline.py到项目主目录

找到scrapy下的cmdline.py文件(比如我这里是D:\Language\Miniconda3\envs\default\Lib\site-packages\scrapy\cmdline.py)

复制一份到tutorial项目的根目录下(scrapy.cfg文件的同一目录下)

 

三、编缉文件调试运行配置

 

 Name--和上边创建的spider文件相同,我这里叫quotes_spider

Script path--选择当前项目下的cmdline.py,我这里是F:\PycharmProjects\tutorial\cmdline.py

Parameters--crawl+要调试运行的spider名称,我这里是crawl quotes

Working directory--填项目所在主目录,我这里是F:\PycharmProjects\tutorial

最后要注意点“Apply”,不要直接点“OK”

 

四、调示和运行演示

选择调试,程序成功停在断点处

选择运行,程序也成功通行

 

转载于:https://www.cnblogs.com/lsdb/p/9122970.html

你可能感兴趣的文章
java 列表与集合总结
查看>>
JDK1.5 新特性
查看>>
深入理解Java虚拟机(二)自动内存管理机制
查看>>
关于NPOI导出Excel,设置表格样式(合并单元格,表格线,批注)方法
查看>>
迟滞变化
查看>>
COJ1081(集训队分组)
查看>>
php--php设计模式留存
查看>>
LeetCode 682. Baseball Game
查看>>
基础训练 阶乘计算
查看>>
Swift函数_外部参数名,
查看>>
《DSP using MATLAB》示例Example4.4
查看>>
Ubuntu下Mysql中文乱码问题解决方案
查看>>
[LeetCode] 323. Number of Connected Components in an Undirected Graph 无向图中的连通区域的个数...
查看>>
What's binary search?
查看>>
[LeetCode] 141. Linked List Cycle 链表中的环
查看>>
[kuangbin带你飞]专题十七 AC自动机
查看>>
mac和virtualbox虚拟机共享
查看>>
【Linux】Centos7 入门到放弃记录
查看>>
Defect Analysis
查看>>
字符乱码 转化
查看>>