{$Think.lang.coll_name}

网站编码

页面渲染

是否

需先配置页面渲染，可自动加载ajax内容

自动补全网址

是否

将所有页面源码中的相对地址转换成绝对地址（包含超链接、图片、JS链接等）

倒序采集

是否

以相反的顺序采集内容页网址

网址不排重

是否

默认将已采集网址排重过滤，选择“是”允许重复采集

请求头信息

开启

是否

起始网址

设置为内容页网址（不选则为列表页）

多级网址获取

多级网址规则

级别	名称	操作

内容页网址获取

从选定区域中提取网址

获取网址区域

{$Think.lang.sign_wildcard} {:cp_sign('match')} 捕获组
xpath语法
格式 a.b.c
通配符 *

{:cp_sign('match')}标签可获取匹配的数据，否则获取完全匹配的数据获取匹配节点的html代码获取匹配的json字符串

匹配内容网址

提取网址规则

{$Think.lang.sign_wildcard} {:cp_sign('match')} 捕获组
xpath语法
格式 a.b.c
通配符 *

拼接成最终网址

{:cp_sign('match','N')}

结果网址过滤

必须包含

{$Think.lang.sign_wildcard} 正则

不能包含

{$Think.lang.sign_wildcard} 正则

POST模式

开启POST

是否

开启后内容页网址中的get参数将以post形式提交

附加参数

名称	值	删除

关联页网址获取

关联页规则

名称	从页面中提取	操作

{if condition="!empty($collData)"}

{/if}

字段列表添加默认

字段	数据源	获取方式	操作	标题排重

数据处理（通用）

通用数据处理

内容分页

开启分页

是否

分页内容字段

获取分页区域

{$Think.lang.sign_wildcard} {:cp_sign('match')} 捕获组
xpath语法
格式 a.b.c
通配符 *

{:cp_sign('match')}标签可获取匹配的数据，否则获取完全匹配的数据获取匹配节点的html代码获取匹配的json字符串

分页链接规则

{$Think.lang.sign_wildcard} {:cp_sign('match')} 捕获组
xpath语法
格式 a.b.c
通配符 *

规则中无{:cp_sign('match')}标签时，自动将完全匹配的数据保存为{:cp_sign('match')}标签以供拼接调用

拼接成最终分页链接

{:cp_sign('match','N')}

分页网址过滤

必须包含

{$Think.lang.sign_wildcard} 正则

不能包含

{$Think.lang.sign_wildcard} 正则

最大分页数

填0表示不限制会自动循环抓取到最后一页，为防止出现无限循环的情况，最好设置一个数值

{if condition="!empty($collData)"}

{/if}