百独托管7500 紫田网络超高转化播放器收cps[推荐]速盾CDN 免实名免备防屏蔽阿里云 爆款特卖9.9元封顶提升alexa、IP流量7Q5团队
【腾讯云】中小企福利专场【腾讯云】多款产品1折起高防 随时退换 好耶数据小飞国外网赚带你月入万元炎黄网络4H4G10M 99每月
香港带宽CN2/美国站群优惠中客数据中心 服务器租用联盟系统移动广告平台 中易企业专场腾讯云服务器2.5折九九数据 工信部正规资质
腾讯云新用户大礼包代金券高价收cpa注册量高价展示【腾讯云】2核2G/9.93起租服务器找45互联 随时退换阿里云 短信服务 验证秒达

[其它内容] 简单使用C语言通过Microhttpd库采集淘宝 [复制链接]
查看:160 | 回复:2

1477

主题

1656

帖子

9

积分

落伍者(一心一意)

Rank: 1

贡献
685
鲜花
0
注册时间
2016-6-22

落伍者落伍微信绑定落伍手机绑定

发表于 2023-11-2 15:51:33 | 显示全部楼层 |阅读模式 来自 中国江苏淮安
4444.webp.jpg
前段时间给大家分享过不少采集淘宝相关内容的方法,昨天有个朋友让我来帮他用C语言编写一个采集淘宝的爬虫程序,并且还要通过Microhttpd库来实现。这一点都难不倒我,下面我就将我的代码示例给大家分享一下,有需要的朋友赶紧来取。

```c

#include

#include

#include

#include

#define HTTP_PORT 8080

struct my_config {

int listen_backlog;

int max_client;

char *document_root;

char *server_name;

};

struct my_server_config {

struct my_config config;

struct MHD_Daemon *daemon;

};

struct my_server_config *my_server_init(void)

{

struct my_server_config *server_config = malloc(sizeof(*server_config));

server_config->config.listen_backlog = 100;

server_config->config.max_client = 10;

server_config->config.document_root = "/home/user/crawler";

server_config->config.server_name = "Crawler";

server_config->daemon = MHD_start_daemon(MHD_USE_HTTPS | MHD_USE_RECURSIVE_PERIODIC "('https://www.duoip.cn/get_proxy:8000')" | MHD_USE_LOCAL_FILE ('./web/index.html'), HTTP_PORT, NULL, my_server_response, NULL, &server_config->config, NULL);

if (server_config->daemon == NULL) {

fprintf(stderr, "Error: Unable to start daemon\n");

exit(EXIT_FAILURE);

}

return server_config;

}

void my_server_free(struct my_server_config *server_config)

{

MHD_stop_daemon(server_config->daemon);

free(server_config->config.document_root);

free(server_config->config.server_name);

free(server_config);

}

static ssize_t my_server_response(void *cls, struct MHD_Connection *connection, const char *url, const char *method, const char *version, const char *upload_data, size_t *upload_data_size, void **con_cls)

{

ssize_t ret = MHD_NO;

struct my_server_config *server_config = (struct my_server_config *)cls;

if (strcmp(url, "/") == 0) {

char *response = malloc(1024);

snprintf(response, 1024, "Content-Type: text/html\n\nWelcome to the Crawler");
ret = MHD_send_response(connection, MHD_HTTP_OK, strlen(response), response);

free(response);

} else {

/* Redirect to the proxy */

char *proxy_url = malloc(1024);

snprintf(proxy_url, 1024, "http://www.duoip.cn:8000%2F%u", (unsigned int) connection->client_addr.client.sin_port);

ret = MHD_send_response(connection, MHD_HTTP_FOUND, strlen(proxy_url), proxy_url);

free(proxy_url);

}

return ret;

}

int main(int argc, char *argv[])

{

struct my_server_config *server_config = my_server_init();

while (1) {

MHD_run(server_config->daemon);

}

my_server_free(server_config);

return 0;

}

```

这个程序的工作原理是,首先启动一个Microhttpd服务器,并配置它使用HTTPS协议,完成代理服务器的配置,以及从本地文件(./web/index.html)提供内容。然后,每当有客户端连接到服务器时,服务器会检查请求的URL。如果URL是"/",那么服务器会返回一个欢迎页面。否则,服务器会创建一个代理请求,将请求转发给服务器,依次循环工作。
企业专线拨号VPS动态IP派克斯ADSL本地拨号,联系QQ174629754
回复

使用道具 举报

1294

主题

3360

帖子

107

积分

落伍者(一心一意)

Rank: 1

贡献
401
鲜花
0
注册时间
2022-1-11

落伍微信绑定落伍者

发表于 2023-11-3 10:09:55 | 显示全部楼层 来自 中国浙江杭州
顶顶顶
卷板机        [url]https://jbj.jc35.com/[/url]
四柱液压机        [url]https://yyj.jc35.com/[/url]
折弯机        [url]https://zwj.jc35.com/[/url]
全球资源网        [url]https://www.qqzyuan.com/[/url]
机械剪板机         [url]https://www.jc35.com/shop/jxjbj_548.html[/url]
回复 支持 反对

使用道具 举报

552

主题

1277

帖子

15

积分

落伍者(一心一意)

Rank: 1

贡献
1417
鲜花
0
注册时间
2017-10-11

落伍手机绑定落伍者

发表于 2023-11-3 10:10:17 | 显示全部楼层 来自 中国重庆
感谢楼主分享


重庆污水处理设备[url]http://www.cqcfjd.com/[/url]
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

论坛客服/商务合作/投诉举报:2171544 (QQ)
落伍者创建于2001/03/14,本站内容均为会员发表,并不代表落伍立场!
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论!
落伍官方微信:2030286 邮箱:(djfsys@gmail.com|tech@im286.com)
© 2001-2014

浙公网安备 33060302000191号

浙ICP备11034705号 BBS专项电子公告通信管[2010]226号

  落伍法律顾问: ITlaw-庄毅雄

手机版|找回帐号|不能发帖?|Archiver|落伍者

GMT+8, 2024-11-26 23:27 , Processed in 0.068234 second(s), 34 queries , Gzip On.

返回顶部