这里先感谢下易优用户富贵分享的采集方法
易优火车头接口文件下载:
链接: https://pan.baidu.com/s/1FSHKA5_7ZzDRb0TIpjTM-Q 提取码: s6r4
下面来自用户富贵的分享笔记
总结:
1、第一步
例如采集文章内容,先要采集对方的文章列表,把所有链接遍历出来,这样才能顺着链接拿内容,淡然第一步可以拿到对方列表的内容,比如标题,缩略图,tag标签等等,如果只能在第一步拿的就要写规则,比如缩略图,就需要。
2、第一步重点:
规则最后的空格需要删除,其次其他多余的空格可以用(*)代替,实际链接如果是相对地址,则需要在实际链接栏填完整http://www.baidu.com[参数1],如果是绝对地址则直接填[参数1]
3、第二步:
标签根据
网站模板结构填需要的内容,这个意思就是你自己定义,因为每个网站不同,需要的东西不同。刚开软件添加规则时先删除,也可以等第一步报错的时候再来删。
导入规则里面的是因为规则里面写好了需要哪些标签,只要根据这些标签填相应的内容,
这些就是发布规则里写好的。当然eyou有些标签会自动提取,比如SEO描述。。。。就可以删了。
4、第二部重点:先看清缕清自己网站需要的东西,然后需要什么加什么
5、第三步:
顺序是先勾选启用》web发布配置管理》按顺序走》添加发布配置
Tips:发布方式可以采用乱序发布,这样避免跟原来采集网站的顺序一样
6、第三步重点:顺序要对