程序员的一个爬虫, 把估值175亿的马蜂窝给捅了
10月21日,一篇名为《估值175亿的马蜂窝,竟是一座僵尸和水军构成的鬼城?》火了!直指旅游网站马蜂窝大量内容和评论涉嫌造假。事情是这样的:某数据团队的几个同学回国参加创业大赛,吃外卖拉了肚子,就在平台写了一段差评,结果反而被污蔑诋毁。http://5b0988e595225.cdn.sohucs.com/images/20181025/16ad9b8d34d640bebc197b121188461c.jpeg碰巧这个团队在美国学的都是数据分析,一怒之下决定训练一个模型,用于筛选餐饮评论的水军,恰巧马蜂窝成了他们的练手对象,没想到不爬则矣,一爬把马蜂窝给捅了!http://5b0988e595225.cdn.sohucs.com/images/20181025/556fd293eaea433d95efbd90f4e6c5f7.jpeg这篇文章中表示:“在马蜂窝网站上,发现了7454个抄袭账号,平均每个人从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评,合计抄袭572万条餐饮点评,1221万条酒店点评,占到官网声称总点评数的85%。”文章中还列举了几项抄袭石锤:http://5b0988e595225.cdn.sohucs.com/images/20181025/35234ddf058740e190def46327ba8ee7.jpeg还有的抄袭账号自相矛盾,性别忽男忽女,甚至有些直接调用Google翻译接口http://5b0988e595225.cdn.sohucs.com/images/20181025/55aa1a0d7cfd4f40919cb03d6d1e0a6a.jpeg马蜂窝回应22日早上,马蜂窝也随即发布了声明,表示会对涉嫌虚假的信息,进行查处。http://5b0988e595225.cdn.sohucs.com/images/20181025/e2f5e3138110403ebde6d176a0aecb94.jpeg另据最新消息,针对自媒体报道的马蜂窝数据造假一事,马蜂窝已向北京市朝阳区人民法院提起诉讼,称乎睿数据侵犯名誉权,目前已获立案。http://5b0988e595225.cdn.sohucs.com/images/20181025/02a17ad0d4a64f38b16dc8fe06aa39fc.jpeg23日,马蜂窝CEO陈罡也针对此事作出回应:马蜂窝在餐饮等点评数据方面存在部分问题,但远没有外界所表述的那么夸大。目前已经重新梳理工作流程,堵住漏洞。网友怎么说?目前,这件事已经在各大论坛都议论纷纷:http://5b0988e595225.cdn.sohucs.com/images/20181025/82652fe59bcf482fbb67ea62572374d4.jpeghttp://5b0988e595225.cdn.sohucs.com/images/20181025/8a4211e6f11a4c42a84237f0dcd67500.jpeg这件事总算让我见识到程序员的厉害之处了:http://5b0988e595225.cdn.sohucs.com/images/20181025/50897147c38e403fadd9abe0a61c37db.jpeg‘水军’和‘爬虫’一直都存在于互联网行业,因为流量和数据对于一个互联网企业不可或缺,关于数据纠纷问题在互联网更是屡见不鲜,目前此事真相还未明了,我们暂时不予置评。但通过这件事情告诉我们,惹谁也别惹程序员!尤其是有正义感又闲的技术宅。:ohh:哈哈,我是程序员我轻轻的飘过 还是不能得罪程序猿 支持一下 真的不能得罪程序员 多做事,少说话 惹谁也别惹程序员 真是这样的 请不要得罪程序员,不然后果很严重~~ :ohh::ohh::ohh::ohh::ohh::ohh::ohh::ohh:
页:
[1]
2