使用dedecms自带采集功能的文字过滤与替换的方法

1,494次阅读
没有评论

使用 dedecms 建站一般都会用到采集功能 这篇文章将为您讲述: 如何使用 dedecms 自带采集功能的文字过滤与替换的方法

1. 去除超链接,这种最常用。

{dede:trim replace=”}<a([^>]*)>{/dede:trim}

{dede:trim

replace=”}</a>{/dede:trim}

如果填成这样,那就把链接的文本也一起去掉了

{dede:trim replace=”}<a([^>]*)>(.*)</a>{/dede:trim}

2. 过滤 JS 调用广告,比如 GG 的广告,就加个这样的:

{dede:trim

replace=”}<script([^>]*)>(.*)</script>{/dede:trim}

3. 过滤 div 标签。

这个很重要,如果没过滤干净则可能使发布出来的文章版面错位,目前大多数遇到采集后错位的原因在此。

{dede:trim replace=”}<div([^.]*)>{/dede:trim}

{dede:trim

replace=”}</div>{/dede:trim}

有的时候也需要这样子过滤:

{dede:trim replace=”}<div 选择器 >(.*)</div>{/dede:trim}

4. 其它的过滤规则可以照以上规律进行推出。

5. 过滤摘要和关键字使用,经常要用到。

{dede:trim replace=”}{/dede:trim}

6. 简单替换。

{dede:trim  replace=’替换后的词语’} 要替换的词语 {/dede:trim}

采集的内容当然也要求搜索引擎收录,

过滤和替换目的是减少重复,进行伪原创,如何具体的操作,就看个人的要求与喜好了。

正文完
 0
飞翔的mouse
版权声明:本站原创文章,由 飞翔的mouse 于2015-09-19发表,共计741字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。