本节包含可用内置命令的列表,其中包含说明和一些用法示例。请记住,您始终可以通过运行以获取有关每个命令的更多信息: scrapy <command> -h 你可以看到所有可用的命令: scrapy -h 有两种命令,一种只能在Scrapy项目内部工作(特定于项目的命令)和那些在没有活动的Scrapy项目(全局命令)的情况下工作的命令,尽管从项目内部运行时它们可能表现略有不同(因为他们会使用项目覆盖设置)。 全局命令: startproject genspider settings runspider shell fetch view version 仅限项目的命令: crawl ch

您可以-a 在运行蜘蛛时使用该选项为您的蜘蛛提供命令行参数: scrapy crawl quotes -o quotes-humor.json -a tag=humor 这些参数传递给Spider的__init__方法,默​​认情况下变为spider属性。 在此示例中,为参数提供的值tag将通过self.tag。您可以使用此选项使您的蜘蛛只获取具有特定标记的引号,并根据参数构建URL: import scrapy class QuotesSpider(scrapy.Spider): name = “quotes” def start_requests(self): url = ‘http://