您现在的位置是:网站首页>建站学院织梦CMS
修复DEDECMS5.5采集功能的一些bug
2019-07-04来源: 【织梦CMS】 人已围观
简介 修复1:将开始标签和结束标签以在网页源码中第一次出现的位置为准 修改文件/include/dedecollection.class.php 在成员函数GetHtmlArea中的 $posend = @strpos($html,$areaRu
修复1:将开始标签和结束标签以在网页源码中第一次出现的位置为准 修改文件/include/dedecollection.class.php 在成员函数GetHtmlArea中的 $posend = @strpos($html,$areaRules[1],$posstart); 语句前增加语句: $posstart=$posstart+strlen($areaRules[0]); 将: return substr($html,$posstart+strlen($areaRules[0]),$posend-$posstart-strlen($areaRules[0])); 替换为: return substr($html,$posstart,$posend-$posstart); 修复2:下载图片时对图片的扩展名判断错误 相同文件 将 eregi("/.gif",$v) 替换为 eregi("/.gif$",$url) eregi("/.png",$v) 替换为 eregi("/.png$",$url) 修复3:采集软件地址的正则表达式不准确 /include/dedecollection.func.php 将TurnLinkTag函数中 preg_match_all("/<a(?:.*)href=['/"](.+?)['/"]([^>]+?)>(.+?)<//a>/is",$body,$match); 换为: preg_match_all("/<a(?:[^/>]+?)href//s*=//s*[/'/"]?([^//s/>/"/']+)([^/>]+?)>(.+?)<//a>/is",$body,$match); 修复4:采集图片的正则表达式不准确 相同文件 将 preg_match_all('/src=[/'"](.+?)[/'"]/is',$body,$match); $ttx = ''; if(is_array($match[1]) && count($match[1])>0) { for($i=0;isset($match[1][$i]);$i++) { $ttx .= "{dede:img text='' }".$match[1][$i]." {/dede:img}"."/r/n"; } } 改为 $patten = "/<//s*img//s.*?src//s*=//s*([/"//'])?(?(1)(.*?)//1|([^//s//>/"//']+))/isx"; preg_match_all( $patten, $body, $images ); $returnArray1 = $images[2]; $returnArray2 = $images[3]; foreach ( $returnArray1 as $key => $value ) { if ( $value ) { $ttx .= "{dede:img ddimg='$litpicname' text='图 ".($key+1)."'}".$value."{/dede:img}"."/r/n"; } else { $ttx .= "{dede:img ddimg='$litpicname' text='图 ".($key+1)."'}".$returnArray2[$key]."{/dede:img}"."/r/n"; }
很赞哦! ()
猜您喜欢
相关文章
付费说明
1、安装cms后台,费用是200,基础费用200包括后台调试以及部分页面模板修改.
2、请加我个人微信 634626966,或者扫一扫微信二维码。备注“网站”
3、系统安装只限定于帝国cms,并且支持php,虚拟主机,请选择linux系统
4、【收费说明】制作企业网站,我是这么收费的!