你好,欢迎来到织梦之家,你可以免费观看大量视频教程以及大量模板下载!

织梦收罗侠|PHPCMS 、织梦视频教程帝国及织梦比拟阐明(十一)之收罗成果-织梦之家(dedehome.com)

时间:2017-09-11 06:00 来源:织梦之家作者:织梦之家 点击:
糊口小百科,ot;;return false;}}////看看返回的网页是否是text范例//function IsText(){if(ereg(amp;quot;^2amp;quot;,$this-amp;gt;GetHead(amp;quot;http-stat

篇一 : PHPCMS 、帝国及梦比拟阐明(十一)之收罗成果

提到收罗,有些站长抛出鄙夷的眼神,而好像大部门站长城市以为是CMS的标配。在落叶看来收罗只是一个成果,一个东西,要害看是采什么,采来后做什么,怎么处理惩罚采来的内容。各人都知道火车头,一般根基用来采文章,但落叶常常用来收罗邮箱,CMS间导数据,基至都用来采过QQ号。火车头的整套流程纵然对收罗法则相识不多,也很利便来采文章,那么相较之于这种客户端软件,主流CMS中的收罗模块,有哪些优缺点呢?

本文中落叶对PHPCMS、帝国CMS及DEDECMS的收罗成果作些比拟,同时也对收罗流程细节作些需求阐明。

我们知道,凡是的收罗流程都是通过列表页分页批量获取内容页网址,然后对内容页阐明,获取内容标题、文章内容等信息,因为各方针站的布局差异,收罗法则会差异,CMS不行能也不会提供通用的收罗法则,那么要考量一款CMS收罗模块是否好用根基是由整个收罗任务设置流程的易用性、收罗的不变性与效率、收罗完入库利便性等方面抉择。

1.收罗设置流程:

整体体验:

PHPCMS的任务添加流程中直接在TAB菜单的形式列出来网址收罗、内容法则设置、高级设置三步调,每一步中的布局都和火车头较量像,对火车头收罗的较量熟悉用户会以为PHPCMS的收罗设置较量明白。DEDE中流程雷同,只是没有直接将几步列出,后一步的设置的前提是前一步设置正确。帝国CMS中则是但愿用户一口吃饱,从上至下把需要的信息全部列出来。

其实整体都根基三步,没有太明明的区别是,只是三者表示方法的差异给用户的心理感觉是差异的。PHPCMS简捷明白,让用户以为收罗很简朴,三下两下就设置好了,新手愿意去实验。帝国CMS顶用户一进入收罗设置界面顿感压力,页面一直下拖,这么多设置项,首先想到的是“算了,换此外收罗”,“这么多填到什么时候,填完了能不能提交照旧一回事”,而DEDECMS中把收罗进程和设置流程整合起来,利益时可以担保每一步都设置正确,织梦模板,但对收罗较量熟悉的用户而言,效率偏低,每次都得POST提交一次测试一次。

网址收罗:

PHPCMS网址收罗通过列表页分页通配符实现列表页网址批量添加,然后设置所需收罗的网址区域,许多时候,对不熟悉HTML收罗法则查找本领的伴侣可以通过直接设置“网址中必需包括”和“网址中不得包括”这两项来实现内容页网址的收罗。DEDECMS也用*作分页通配符,不外DEDE中的利益在于可以启用多栏目通配法则,针对差异的栏目页批量设置收罗法则,这样可以利便对有沟通URL法则的多个栏目同时收罗。帝国中则壹贝偾一般的以[page]为通配符的多分页获取,相对表示平平。

织梦采集侠|PHPCMS 、织梦视频教程帝国及织梦相比阐发(十一)之采集成就

PHPCMS中提供通过填写COOKIES信息对需要登岸的网站的收罗,不外只对深度用户有用,一般用不着,DEDECMS中则提供了防盗链模式的设置,通过填入方针站内容页地点,收罗时伪造来向来到达破解简朴防盗链收罗的目的,这点照旧挺不错的。帝国CMS对相对路径的处理惩罚提供了填写“内容页地点前辍”的字段,但其实本应该做到URL自动扩充补全的。

内容法则的设置:

内容页法则的设置一般是针对每个字段提供设置匹配法则,同时举办一些名目过滤和信息替换。比拟三款CMS,PHPCMS中的字段设置更人性化些,很清晰的实现了匹配信息的提取、信息替换、名目过滤的成果,而DEDECMS和帝国CMS中都直接一个textarea给出,让用户填写正则内容,体验上稍差些。DEDECMS中也以弹出窗口的方法给出了常用名目的过滤的勾选框,直接勾选可以生成过滤法则,表示方法不足明明,不适合新手利用,帝国则好像完全是针对正则好手的,而实际用帝国的新手用户居多,我很为帝国担忧,“有人用他的收罗成果么?”

织梦采集侠|PHPCMS 、织梦视频教程帝国及织梦相比阐发(十一)之采集成就

2. 收罗不变性与效率:

收罗效率受限于处事器自己及网络情况,各CMS在技能上的差别不大,而不变性则处决于收罗流程及堕落处理惩罚。这块PHPCMS的优势很明明,支持多线程收罗,并以希望条方法展示,在收罗间断时可刷新界面断点续采,效率和不变性小我私家以为挺不错。对已收罗过的网址记录方法也模仿火车头的方法举办记录,防备反复收罗。

织梦采集侠|PHPCMS 、织梦视频教程帝国及织梦相比阐发(十一)之采集成就

DEDE则仍表此刻他的细致上,每一步做过许多细节提示,利益的可以清楚知道怎样操纵,缺点是太多需要让我思考的处所,帝国CMS好像对得反复收罗未作判断,纵然刷新或退却都存在得复收罗的环境。

3. 收罗完入库:

帝国CMS在收罗设置流程中即设置好了所收罗的信息所对应入库的栏目,收罗进程字段设置也完全与栏目的字段匹配,PHPCMS在收罗前设置好了对应的栏目,但各字段并没有绑定,在收罗完举办宣布时,可以从头选择字段的对应干系,并可对一些字段如要害词、摘要、缩略图、时间等在宣布时自动利用函数处理惩罚后填充。DEDECMS中在收罗时未绑定栏目,宣布时选择栏目导入,较量利便,但不支持字段选择。总体,落叶小我私家照旧方向于PHPCMS的地导入方法。

织梦采集侠|PHPCMS 、织梦视频教程帝国及织梦相比阐发(十一)之采集成就

作者相关文章:

帝国、PHPCMS及梦比拟(一):自界说模型成果阐明

帝国、PHPCMS及织梦比拟(二):支持SQL调用标签

帝国、PHPCMS及织梦比拟(三):自界说URL法则

帝国CMS与PHPCMS比拟(四):碎片成果阐明

帝国、PHPCMS及织梦比拟(五):标签理会方法阐明

帝国、PHPCMS及织梦比拟(六):专题成果比拟阐明

PHPCMS、帝国CMS及织梦比拟(七)之自界说表单成果阐明

PHPCMS 、织梦及帝国比拟(八)之SEO帮助成果及本性化调用阐明

PHPCMS、帝国及织梦比拟阐明(九)之关联种别属性

PHPCMS、帝国及织梦比拟阐明(十)之推荐位成果

基于CMS的黄页B2B系统模式和站群模式阐明

从PHPCMS、帝国CMS谈站长如何选择适合本身的CMS

作者:落叶(t.qq.com/guohui) 网站:

落叶原创首发jianliw,尊重版权,转载请保存作者信息及链接。

注:相关网站建树本领阅读请移步到建站教程频道。

篇二 : 织梦收罗侠:织梦收罗侠-织梦收罗侠简介,织梦收罗侠-织梦收罗侠成果和

感谢支持织梦之家,你的支持,我们的无限动力!!!
“DEDECMS教程”欢迎分享!:

相关标签:织(41)织梦采集侠2.7破解版(1)织梦采集侠官方网站(1)织梦采集规则(1)

顶一下
(0)
0%
踩一下
(0)
0%

欢迎您报错,或提出宝贵建议,我们将第一时间处理,为大家营造一个良好网上交流平台,感谢支持织梦之家!

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
验证码: 点击我更换图片