项目名称
入库分类
请选择
$list=M('article')->where(array('show'=>1))->select();
if($l['id']==$info['typeid']) echo 'selected="selected"';>{$l.title}
(采集后加入那个本站分类)
列表采集网址
请在下面边框内输入待采集新闻列表页网址,多个网址请用|分开
{$info.url}
列表采集规则
请配置好以下采集规则
Html选择器:
if($info['html']=='id') echo 'selected="selected"';>id
if($info['html']=='class') echo 'selected="selected"';>class
选择器值:
网页编码:
if($info['charsets']=='utf-8') echo 'selected="selected"';>utf-8
if($info['charsets']=='gb2312') echo 'selected="selected"';>gb2312
过滤规则:
网址必须包含字符串:
网址不包含字符串:
域名地址:
相对路径的网址需要填写(如/xxx.html),绝对路径的网址不需要填(如http://www.xx.com/xxx.htm)
测试获取列表URL结果
请在下面边框预览采集结果
点击进行获取URL采集测试
详细内容采集规则:
标题Html选择器:
无
if($info['content_title_html']=='id') echo 'selected="selected"';>id
if($info['content_title_html']=='class') echo 'selected="selected"';>class
选择器值:
过滤字符
keywords Html选择器:
无
if($info['content_keywords_html']=='id') echo 'selected="selected"';>id
if($info['content_keywords_html']=='class') echo 'selected="selected"';>class
选择器值:
过滤字符
description Html选择器:
无
if($info['content_description_html']=='id') echo 'selected="selected"';>id
if($info['content_description_html']=='class') echo 'selected="selected"';>class
选择器值:
过滤字符
来源 Html选择器:
无
if($info['content_source_html']=='id') echo 'selected="selected"';>id
if($info['content_source_html']=='class') echo 'selected="selected"';>class
选择器值:
过滤字符
正文内容 Html选择器:
无
if($info['content_contenttext_html']=='id') echo 'selected="selected"';>id
if($info['content_contenttext_html']=='class') echo 'selected="selected"';>class
选择器值:
过滤字符
保存远程图片到本地
删除非站内链接
提取第一张图为缩略图
内容页采集结果
请在下面边框预览采集结果
点击进行内容采集测试
保存到项目