Heritrix抓取新浪微博
时间: 2011-07-26来源:开源中国
前景提要
HDC调试需求开发(15万预算),能者速来!>>>
最近想通过爬虫抓取新浪微博的信息,前些日子使用MetaSeeker抓取了很具有规范的微博信息。这两天了解到了一个新的工具,Heritrix。
由于我刚刚配置好heritrix,对heritrix也不熟悉。想请教下大家,对于这个网页,http://weibo.com/pub/star/gupiaogaoguan,我希望通过每个股票高管的名字(是一个链接,对应每个用户的微博首页),在heritrix的设置界面中是否能够设置“定期地抓取每个用户的微博信息”???

科技资讯:

科技学院:

科技百科:

科技书籍:

网站大全:

软件大全:

热门排行