你等等 发表于 2021-3-29 15:43:39

同时获取标题和浏览量

我想获取落伍的某篇帖子和浏览量,如:


有人关注过农村失能老人的养老问题吗 88

PHP中用
if($id==''){$id=substr(sha1(a),-1,1);}
                        $url = 'https://www.im286.net/forum.php?mod='.$id.'&c=100&fr=newthread';
                        $html = get_html($imurl);
               
                        $list = get_content_array($html,'<span class="icon"','</span>',0);//获取标题

请教,上面这种list只能获取到标题“有人关注过农村失能老人的养老问题吗”


我想同时获取标题和浏览量,
“有人关注过农村失能老人的养老问题吗 88”
用下面这种为何不行呢?
if($id==''){$id=substr(sha1(a),-1,1);}
                        $url = 'https://www.im286.net/forum.php?mod='.$id.'&c=100&fr=newthread';
                        $html = get_html($imurl);

                        $list = get_content_array(
                        array($html,'<a class="title"','</a>',1),
                        array($html,'<span class="icon"','</span>',0)
                        );//获取到标题和浏览量

读取空白的,
我这菜鸟,不知道怎么同时获取了:(

baihaideng 发表于 2021-3-29 15:45:05

你这很吓人啊:ohh:

talaon 发表于 2021-3-29 15:52:54

get_content_array 是自定义函数,得看这里面封装得啥东西
第一个传参是$html,你都改成数组了,肯定要出问题了

本人很傻 发表于 2021-3-29 15:54:26

你想采集落伍啊:ohh::ohh:

leexiaochong 发表于 2021-3-29 16:28:47

找到标签,获取html,去掉css,只剩下文本,然后splite分隔一下
string是查看
string是回复
开始:<div class="y" style="margin-right:5px;">

结束:</div>

获取到:查看:106 | 回复:8
然后通过splite('|')得到数组,获取想要的值即可

娃哈哈 发表于 2021-3-29 16:58:18

$url = 'https://www.im286.net/forum.php?mod='.$id.'&c=100&fr=newthread';
                        $html = get_html($imurl);

curl取的变量路径都不对,能抓到html怪了 ,抓到后在用正则去匹配下想获取的内容

你等等 发表于 2021-3-29 19:49:22

娃哈哈 发表于 2021-3-29 16:58
$url = 'https://www.im286.net/forum.php?mod='.$id.'&c=100&fr=newthread';
                        $h ...

我不是采集落伍,这个路径只是演示
主要是我说的意思,
已经能获取到标题了,
难题是
想把标题和浏览量同时获取到,怎么实现

你等等 发表于 2021-3-29 19:50:44

这么说吧,比如采集百度热门关键词,我还想把关键词的热度量都一并采集到。

day 发表于 2021-3-29 19:56:23

做站长站啊

娃哈哈 发表于 2021-3-29 22:41:54

你等等 发表于 2021-3-29 19:49
我不是采集落伍,这个路径只是演示
主要是我说的意思,
已经能获取到标题了,


内容拼接啊,先抓每个dom内容
页: [1] 2
查看完整版本: 同时获取标题和浏览量