温州青年 发表于 2019-12-20 14:53:36

dedecms 自带采集是不是不能采集HTTPS

本帖最后由 温州青年 于 2019-12-21 14:58 编辑

采集不到正确的,

比如采集https://www.diangon.com/wenku/dgjs/dgjc/index.php?page=2
有没有高手给个提示

老牛不拉破车 发表于 2019-12-20 15:01:08

开火车,很快的。

leexiaochong 发表于 2019-12-20 15:34:32

采集喜欢自己写个小程序来操作,当前这个站我的思路是这样的:
1.找到minid和maxid
https://www.diangon.com/mxxxxx.html
2.采集内容
3.通过面包屑导航获取分类

感觉这个流程采集的数据能更多一些

森林 发表于 2019-12-20 15:47:49

你规则没有写对,这种站规则不难

温州青年 发表于 2019-12-20 17:36:19

以前很简单的事,现在被难到了,也不知哪里出问题,这个采集到的链接页里面多了个奇怪的前缀,

温州青年 发表于 2019-12-21 14:36:33

请教一下,HTTPS是不是不能采集?

ytomorrow 发表于 2019-12-21 15:05:40

服务器什么环境,是不是环境没有证书

你等等 发表于 2019-12-21 17:33:58

老牛不拉破车 发表于 2019-12-20 15:01
开火车,很快的。

你们都说开火车,很快的。
问题是,设置采集规则挺费时间呀,每次设置采集规则都麻烦死了,现在都不用它,不采集了
页: [1]
查看完整版本: dedecms 自带采集是不是不能采集HTTPS