采集文章需要先获取文章的地址,通常我们打开的是栏目列表页面 下载此演示规则 www.phperz.com
phpcms后台---功能模块---采集器 www.phperz.com
采集匹配规则:前部分需要是唯一的。后面为紧跟着的匹配。 www~phperz~com
php程序员之家
php程序员站
http://news.sina.com.cn/china/sz/index.html 打开这个页面向里面填入信息。 www~phperz~com
phperz~com
php程序员站
phperz.com
国内全部为要获取的区域前部分 php程序员站
某篇区域内获取列表:填入这个后,可以有效的获取列表代码段。可以排除列表外,如导航链接,相关新闻链接等。 php程序员之家
www~phperz~com
php程序员站
往日新闻>>为列表结尾。 php程序员站
www~phperz~com
找到标题 php程序员之家
www.phperz.com
www~phperz~com
phperz~com
保存,开始测试 www.phperz.com
www~phperz~com
www.phperz.com
www~phperz~com
phperz~com
www.phperz.com
phperz~com
www~phperz~com
phperz.com
phperz~com
文章添加时间可以是随机时间,也可以是按照当前时间进行添加。 php程序员站
发布后, php程序员之家
到该频道下面--管理文章 php程序员之家
我们已经采集到了。不过现在文章还没有生成静态。需要生成下。 php程序员站
www~phperz~com
进入发布网页 可指定生成的开始id和结尾id phperz.com
php程序员站
最终效果如图。 www.phperz.com
www.phperz.com
|