快速入门帮助(图文实例)

时间:2010年04月20日 点击:11132

按以下步骤你可以快速建立一个简单的采集任务,v1.8版本开始,可以建智能采集任务,光填网址即可采集
本例采集网站:www.admin5.com ,站长新闻1~5页:
新建任务(Ctrl+N)
一、任务属性设置:(任务属性设置帮助
填写名称:A5站长新闻采集
采集线程数:3
其他设置默认即可
点下一步

二、初始化设置:(初始化设置帮助
开始请求网址生成模式:直接输入
请求网址列表(开始请求网址):


此部分也可以用以下方式快速设置
开始请求网址生成模式:脚本生成
请求网址列表(JS脚本):


点下一步


 三、链接采集设置:(链接采集设置帮助
点, 右边的增加按钮
1、规则说明:填采集链接
2、增加一组提取范围标记:
开始标记:列表</h3>
结束标记: <div class="clear"></div>

3、提取模式:字符标记提取
4、增加一组最终提取标记:
开始标记:</span><a href="
结束标记:"

注意:链接采集时“相对地址转绝对地址”一定要勾上
设好后点测试,看是否采到正确的内容,然后填写个规则名称,保存
点下一步

四、内容提取设置:(内容提取设置帮助
点右边增加按钮增加多组采集标记
1、规则说明:填采内容标题
2、提取模式:字符标记提取
3、增加一组最终提取标记:
开始标记:<h1>
结束标记:</h1>

4、标记清除中选中:超链接,JS脚本
5、附加选项:选中当前规则匹配不到内容,或匹配为空时跳过整条内容

6、填写规则名称:标题
测试看是否采到需要的内容,然后保存,按以上方式增加一个内容标记,或其他需要的标记

五、内容保存设置:(内容保存设置帮助
1、采集文件目录自己选一个或填默认目录
2、保存文件名称规则:点“生成文件名规则”选“采集内容结果”选“[标题]”
3、保存文件模版:[内容]

以上步骤完成后,点完成保存任务就可以采集了,
采集完成后选中任务,点目录按钮就可以打开采到文件所在的目录了
可以点以下链接,下载本例导入软件中使用或查看设置:
 A5站长新闻采集规则下载 (解压后再导入软件)

赞助商链接

相关内容

联系我们

联系方式