1. 火车头采集图片集图片组的问题 采集到怎么发布
解决了吗
我也想问
2. 用火车头采集图片怎么才能直接引用别人的图片链接,而不是用下载到本地再上传的贴子在测试的时候是没问题
不晓得
3. 如何使用火车头采集器采集网页图片详细图文教程
火车头采集器采集信息分两个步骤:
1,采网址。这一步也是就告诉软件,有多少个网页需要去采,并给出具体的网页地址。
2,采内容。有了网址之后,就可以去这个网址上采集信息了,但网页上信息众多,软件不知道你想采哪些。在采内容部分,就要做规则了。告诉软件我想采什么。
1,采网址。
网页上的产品信息就是所想采的,即为目标。
在采集链接页面里,输入采集地址的列表页,这里要注意无用链接的过滤。
然后点击测试按钮测试所填信息的正确性:
测试正确以后,我们对地址进行扩展,现在我们只不过是采了一张列表页的文章地址,还有其它的列表要需要采集,其它的列表页就在它的分页上,我们观察这些分布的链接形式,找出规律,然后批量填入网址规则。
2,内容的采集
经过上面的处理,目标产品页的链接都已经能够采到,下面我们进入内容的采集。
明确好要采集的内容以后,我们开始编写采集规则,火车头采集内容是采集网页的源代码,因此我们要打开产品页的源代码,找到我们要采集信息所在的位置。比如,Description字段的采集:
找到Description的位置,找到之后,如何填写采集规则呢,很简单,只要将采集目标的开始字符串与结束字符串填入采集的对应位置。这里我们选取<span>Description:</span>作为开始字符串,</span>为结束字符串。值得注意的是,开始字符串必须在本页面是唯一的,并且在其它产品页面也存在这个字符串。本页面唯一能使软件找到要采集的位置,其它页面通用,保证软件能够采到其它页面的数据。
填完以后并不表示就能采集正确了,还需测试一下,排除一些无用数据,排除可在HTML标签排除和内容排除中进行。测试成功后,这样一个标签就制作好了。
这里我们使用通配符来实现这一要求。我们把不通用的地方用(*)通配符来表示任意。而要采集的地址我们用参数(变量)来表示。最后我们将这段内容变为:<li id="current">(*)Compare Prices(*)<a href="[参数]" onClick="(*)">Proct Details,填入模块,并测试是否成功。
如果测试没有成功,那说明你填入的内容还不符合唯一且通用的标准,还需要调试。测试成功以后,可以保存,进入标签的制作了。
这里的标签制作与上面的是一样的,找到要采集信息的所在地,填入开始结束字符串,并做好过滤,唯一的不同的在于所属页面选项里要选择刚才制作好的模块,这里就不赘述,直接显示结果了。
这样标签就制作完成了。点击更新以后,去掉发布选项,就可以进行任务的采集了。
4. 火车头采集图片教程
你用八爪鱼采集器采集图片,免费的,图片采集的操作步骤,有教程
5. 火车头免费版如何采集图片
1、打开火车头,进入采集网址规则—添加多级网址采集规则,选中手动填写链接地址规则,并将第二步骤中选中的代码粘贴进去,如图:
7、大功告成,保存后测试一下,一起顺利,缩略图顺利采集下来了。
6. 火车头采集图片后上传到网站不显示
那是因为你没有把采集过来的代码进行 编码转换,加上 你图片链接不完整,需要添加网站的根目录,才能显示图片。
7. 火车头 采集的图片如何发布
图片有多种发布方式,一是将采集的图片下载到火车头,但要发布到网站上只能自己上传了,只有收费的有FTP上传的功能,二是直接采集网站,不下载到火车头,这样就可以直接将图片的原网站链接地址采集下来
8. 火车头采集,我用迷你FTP设置好,然后在火车头那文件上传那设置好,但是不能上传到FTP空间。
首先你要确定网络和端口是否正常,服务器是否正常
然后,看说明
火车采集器(LocoySpider)是一款功能强大且易于上手的专业采集软件,强大的内容采集和数据导入功能能将您采集的任何网页数据发布到远程服务器,自定义用户cms系统模块,不管你的网站是什么系统,都有可能使用上火车头采集器,系统自带的模块文件支持:风讯文章,动易文章,动网论坛,PHPWIND论坛,Discuz论坛,phpcms文章,phparticle文章,LeadBBS论坛,魔力论坛,Dedecms文章,Xydw文章,惊云文章等的模块文件。更多cms模块请自己参照制作修改,也可到官方网站与大家交流制作。 同时您也可以使用系统的数据导出功能,利用系统内置标签,将采集到的数据对应表的字段导出到本地任何一款Access,sqlite,MySql,MS SqlServer内。
火车头采集器2010版相对旧版做了重大改进。添加了许多新功能。同时软件更稳定快速。
火车采集器添加的功能:
1.丰富的插件功能:新版中PHP插件和C#插件可以在采网址时,采内容时,采完内容后使用插件,而不限是什么插件.同时对对插件开发提供了更加详细的开发手册,可以方便用户实现自己的特殊要求.
2.任务运行日志:程序将对运行的日志进行保存,方便用户在自动更新时查看采集器的工作情况.
3.更多的数据保存方式.程序可以将数据保存在access,sqlite,mssql,mysql,oracle数据库中,更快的速度,更方便的管理.
4.更方便的升级及.程序对文件目录格式进行了重新设置,用户如果不使用升级程序,只需要复制几个文件夹就可以经松完成升级.
5.支持可选的加密狗授权方式.
6.命令行模式.可以使用参数启动程序执行任务.可以通过计划任务的来实验定时采集,在采集结束后退出程序
7.中文分词增加用户词库,可以添加用户排除的词库.可以只使用用户词库.
8.本地采集数据管理里加入了图片预览功能.
9.标签可以上下进行排序.生成CSV时,就按该排序生成csv文件.测试时,返回的结果也以标签的排序进行显示.
10.图片和flash下载排除功能.对于符合条件的文件不进行下载.
11.文件上传标签里可以针对多个标签进行文件上传.
12.采网址部分在使用2级网址时可以设置列表页包含区域
13.循环采集时可以使用提取关键字,摘要等功能。
14.列表标签可以进行编辑,如排除和过滤,下载等。
9. 用火车头采集的图片怎么可以发布到dede网站图片内容中去
这个要先设定好保存的路径/目录1/目录2/
然后是下载到本地,最后对号入座上传到网站目录中。。
10. 火车头怎么采集有图片的文章一起发布织梦后台
免费的只能用FTP传上去 ...如果是用dedecms搭建网站的话,可以用采集侠进行...则利用火车头的下载图片的功能,然后再上传到服务器,再发布内容。就可以讲...