蓝锂网络

蓝锂动态

蓝锂易采集器(EasyColletor) 更新日志

时间: 2014-09-05 23:06:47 | 来源: 蓝锂网络 | 作者: 蓝锂网络 | 浏览:2103| 阅读设置: 【

声明:本文属蓝锂网络原创,欢迎转载,但请保留作者版权,作者在此表示感谢。
作者:深蓝  QQ: 1668142999
CMS技术交流QQ群:  213723527 (主要交流齐博系统采集技术,特别是地方门户和b2b系统的采集)
蓝锂官方站:https://www.lanelead.com
蓝锂技术论坛:http://bbs.lanelead.com  主要讨论如何有效利用定时自动采集结合伪原创技术, 帮助站长更好的运营网站。

【2014-09-05】

1.修复缩略图无法获取bug

2.优化远程内容获取引擎,效率更高,功能更强劲!

 

【2014-06-09】

1.优化编码自动识别函数,使之更准确高效.

 

 

【2014-06-09】

1.调整定时任务算法,以减少资源占用.

2.调整后台执行算法,提高转码准确率和效率.

3.优化后台执行算法,提高效率.

 

 

【2013-10-26】

1.修复ComLogo和picurl字段,个别情况下的获取错误.

 

 

【2013-10-10】

1.改进多线程触发参数,较大幅度提高采集性能,推荐升级.

 

 

【2013-9-29】

1.增加对Ucenter整合的支持.

 

 

【2013-9-25】

1.修正一出函数定义错误,增强兼用性.

2.稳定了批量规则功能.

 

【2013-8-28】

1.增强批量规则助手功能,支持列表url的批量替换,规则的批量编辑等.批量规则助手可以为批量维护规则带来很大方便!

2.修正了Article 入库模块的一个错误.

3.修正清空缓存功能不正常的

 

 

【2013-8-22】

1.修复部分服务器出现跳转错误.

2.优化了部分细节功能.

 

 

【2013-8-2】

1.增强了图片等远程文件获取功能,支持黄页模块公司图片的采集。可以使用字段 picDB 进行公司图片的采集.

2.优化了部分细节功能.

 

 

【2013-7-31】

1.改进了黄页模块采集时,店铺分类算法,支持自定义店铺分类。定义方法:在内容规则 - 高级规则中,结尾PHP语句: $gcDB['hyfid'] = '2,5,8'; 其中 hyfid 为特定字段,不可改变。后面的数字为你的系统中的店铺分类id,支持多个,中间用逗号隔开。

 

 

【2013-6-26】

1.增加对单独齐博分类系统的支持.

 

 

【2013-6-14】

1.增强电话采集引擎. 升级建议:建议升级,否则58同城的电话部分不能采集.

 

【2013-6-12】

1.增强采集引擎,采集通用性更强!修正1.7版本的Bug. 必须升级.

 

【2013-6-11】

1.增强采集引擎,采集通用性更强!推荐升级.

 

【2013-4-24】

1.修改内容过滤算法,修正过滤图片后,仍然采集到图片的Bug

 

 

【2013-4-18】

1.增强url地址绝对化功能,修复部分图片地址采集失败的bug 

2.版本升级为1.6 

 

 

【2013-4-12】

1.增强编码自动检测功能

2.增强url地址绝对化功能,修复部分图片地址采集失败的bug

 

 

【2013-3-12】

1.修正标题中存在特殊符号导致断行的bug.

 

【2013-3-9】

1.改进定时任务日志记录方式:定时任务日志记录在 Runtime/Logs/AutotaskLogs.php ,大家可以通过查看该文件跟踪定时任务记录情况.

 

【2013-3-8】

1.定时任务功能由原来的依赖本机触发,更改为有蓝锂网络官方服务器远程触发.有效节省了客户端服务器的运行资源.触发时间为10分钟.再次提醒大家是设置定时采集时间间隔尽量不少于1小时,这样采集效果更好,也更节约您的服务器资源.

2.改进的远程升级模式.客户更新采集器时,会智能判断更新文件,传输最少的升级包,大大提高了升级效率和稳定性.

3.鉴于以上较重大的更新,版本升级为 V1.4

 

【2013-2-26】

1.修正字符过滤功能.

2.添加对contact_tel字段电话图片的识别。

3.增加对齐博独立新闻系统的采集支持.

【2013-2-25】

1.增加对posttime字段的采集识别,会将采集到的时间自动转为时间戳.

【2013-2-22】

1.多线程采集修正错误识别模式,增强程序错误检测及处理,有效避免假死现象.

【2013-2-21】

1.修复同一字段多规则时导致采集不到内容的Bug

【2013-2-5】

1.修正列表页手动输入多页不能识别bug

2.修正采集内容关键词限制无效bug

3.修复部分url无法识别bug

【2013-1-30】

1.修正seo内链库为空时采集失败的bug

【2013-1-28】

1.修正ComLogo字段不能正确识别Bug

2.修正seo功能中,无法获取关键词的bug(原因:百度关键词标识源码改变)

3.修正采集内容中关于空格的替换规则,导致采集页面难看的bug

4.修正article文章模块入库后前台栏目不显示的bug

【2013-1-20】

1.修改获取缩略图字段程序规则,如果自定义采集缩略图picurl字段,则以自定义为准,否则默认以第一张为缩略图.

2.修复二级页面网址中带有类似"&"的特殊符号,导致无法采集内容的Bug

3.修复采集规则编辑页面因规则中含有特殊字符导致的显示错误.

4.支持相同字段的自动合并.比如规则中定义了两个content字段,则采集后自动合并.

5.修复采集规则分类名称为中文时无法添加的bug

6.增强:百姓网采集适配支持.

7.修复其他细小bug

【2013-1-17】

1.修正了远程获取图片时,出现“没有找到相关图片”错误。

2.修复了keywords,description字段不能执行字符替换bug。

【2013-1-16】

1.修正腾讯房产图片不能采集的bug

2.修正部分二级页面内容无法获取的bug

【2013-1-9】

1.修正缩略图无法正常生成bug

【2013-1-5】

1.修正定时任务程序,解决部分服务器不能执行定时任务Bug

【2012-12-8】

1.修正城市获取错误

2.修正规则保存后出现斜杠问题.

3.修正批量修改规则时导致列表页url空白问题.

【2012-12-4】

1.修正内容多页规则不通用的bug

2.添加批量修改助手功能(使用批量助手功能失败后,采集规则恢复请联系蓝锂官方.)

【2012-11-26】

1.修正缩略图生成错误的Bug.

【2012-11-25】

1.修正智能多页获取规则的Bug,请注意更改内容多页获取的规则,未做兼容升级.

【2012-11-23】

1.添加人才简历模型的入库.

【2012-11-20】

1.优化采集引擎,使之更稳定.

2.修正自动注册会员不能重复过滤的bug.

3.修正定时采集-每天定时模式无效问题.

4.因升级较多,版本升级为 V1.2

【2012-11-18】

1.改进内容多页获取规则,使多页获取更加智能.

2.版本升级为 V1.1

【2012-11-15】

1.编写规则时的字段下拉菜单助手,会自动根据选择的模块和栏目获取入库模型的字段,更准确,更方便.

2.增强了采集引擎,能够突破百姓网的限制等.

【2012-11-12】

1.修正“每天定时”模式不能运行的bug。

2.修正部分SEO伪原创关键词内链错误。

【2012-11-12】

1.修正了采集器多线程并发资源占用较多,导致反应缓慢问题.

2.修正开启伪原创后,前台显示不正常问题.

【2012-11-11】

蓝锂易采集器 EasyColletor V1.0 正式版发布!欢迎大家正式使用。
自2012-8-28日发布 V1.0 Beta版,至今已两个半月的时间。期间大家积极参与蓝锂采集器的测试,积极反馈发现的Bug,积极提供好的功能建议等,使得采集器的测试和调试进展很快,在此蓝锂团队全体成员对大家的帮助表示由衷的感谢!
因正式版比测试版做了较大的改进和功能完善,基础包不相同。因此大家升级至正式版,不能通过在线升级完成。请按照如下方法执行升级:
1.在齐博系统后台卸载原来安装的蓝锂易采集器插件。(注意:不需要删除数据库,否则将导致原来的规则丢失!)
2.删除原来的采集器文件夹,一般为 hack/LaneLead 文件。在蓝锂官方站下载正式版基础包,解压,按照原来安装方法重新执行安装。(注意:LaneLead文件夹要有可修改权限。)
3.登录您的系统后台,重新输入原来的授权码认证即可。(注意:授权码无需重新申请)

以后程序升级,除非是发布更高级的正式版,可以通过在线升级完成。升级前请注意备份您的程序和数据库文件!

分享到QQ空间
分享到: 
Tags: 责任编辑:admin
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
销售咨询:
QQ: 1668142999
Email: 1668142999@qq.com
TEL: 13884867561
联系人:深蓝