scrapy动态的从redis队列中获取源,并启动spider
时间: 2018-01-16来源:开源中国
前景提要
HDC调试需求开发(15万预算),能者速来!>>>
需求:有个redis队列,我需要从队列中获取数据(源相关的配置规则),然后加入到scrapy的spider中,并启动。
目前的解决方法:
开启了个守护线程,使用scrapy的CrawlerRunner来启动。但是这样在windows下运行正常,在linux下,twisted使用的epoll一定时间内没有事件的话,dopoll方法进入无限等待状态,加入新的爬虫也不会爬取。
求教大神们,一般这种需求怎么搞。

科技资讯:

科技学院:

科技百科:

科技书籍:

网站大全:

软件大全:

热门排行