关于采集百度网盘说下思路
起因:最近这种网站很火啊
http://www.im286.net/thread-16895237-1.html
这两年出现很多网盘站,大家做站的思路不一样,我只说关于采集的部分。
我是这样做的:
从一个热的ID入手,比如这样的
http://yun.baidu.com/share/home?uk=809803785&view=fans
抓取这个ID的粉丝列表及其分享内容,如此循环下去……
网盘有防采集,买点代理ip解决。 怎么分类啊 zhdd 发表于 2015-9-2 10:54
怎么分类啊
可以根据文件后缀分类。 换个思路:到同类网站上 直接采集人家资源。。 只能帮你到这里了,
http://pan.baidu.com/pcloud/feed/getsharelist?auth_type=1&request_location=share_home&query_uk=4180647131
uk是对应的会员Id,这个可以循环遍例的。
好方法啊 换个思路:到同类网站上 直接采集人家资源。。 amwdhqc 发表于 2015-9-2 13:30
换个思路:到同类网站上 直接采集人家资源。。
我可以直接采集百度的为啥要采集别人的呢……
什么意思? 关键你要这资源干啥用?
还要担风险,采到XX你不及时处理就得喝茶去。
页:
[1]
2