马蜂窝“造假门”发酵:揭发团队称将放出更多证据
作者:CQITer小编 时间:2018-10-25 09:12
蓝鲸TMT记者 陈蓉
马蜂窝数据造假事件随着对峙双方的不断发声,正在愈演愈烈。
10月21日,自媒体人“梓泉”通过其公众号发布《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》,称国内头部旅游UGC社区马蜂窝2100万点评中1800万条数据涉嫌抄袭,后者随即陷入舆论风暴。
马蜂窝回应称,“点评”这一项UGC内容仅占马蜂窝整体数据量的2.91%,该文章“部分言论歪曲事实,是有组织的攻击行为”,随后马蜂窝以侵犯名誉权为由,将深圳市乎睿数据有限公司、自媒体人丁子荃告上法庭。
自媒体人“梓泉”亦奋起应对,于23日凌晨推送最新文章,指责马蜂窝在回应中偷换概念、避实就虚,称团队后续将逐步放出经司法公证的更多证据,力证马蜂窝造假事实。乎睿数据团队也向蓝鲸TMT记者发来最新回应,后者表示,公司曝光数据造假纯属顺手为之,没有针对任何个人或企业,有如此大的反应“始料未及”。
业界对马蜂窝“造假门”事件空前关注,但意见纷纭。有人认为自媒体文章揭露行业“造假潜规则”冰山一角,为其叫好,但亦有专业人士认为,数据搬运为行业竞争现状,点评等造假或不影响其核心估值。截止发稿,马蜂窝方面未有更多回应。
造假风波乍起
马蜂窝“造假门”源于自媒体人梓泉在其公众号发布《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》文章,该文章称,作为一家主打用户生产内容的旅游网站,马蜂窝的2100万条“真实点评”接近于核心资产。
然而,经过名为乎睿数据的团队对网站进行分析,马蜂窝上存在7454个抄袭账号,合计从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了572万条餐饮点评与1221万条酒店点评。
22日马蜂窝发布相关回应称,自媒体文章所述的马蜂窝用户数量,与事实和第三方机构数据都严重不符。其表示,UGC(用户原创)内容数据中,游记和攻略占比78.91%,嗡嗡(旅行故事)占比7.92%,问答占比10.26%。“点评内容在马蜂窝整体数据量中仅占比2.91%,涉嫌虚假点评的帐号数量在整体用户中的占比更是微乎其微,马蜂窝已对这部分帐号进行清理。”
但类似回答遭遇乎睿团队质疑,在“梓泉”关于此事最新篇《我承认,我们是有组织攻击马蜂窝的》的推文中,乎睿团队直指马蜂窝“点评数仅占总体数据量2.91%”这一解释为偷换概念,将点评数据大小与绝对数量混淆;另一方面,乎睿团队认为,涉嫌虚假点评账号占总体用户比例虽小,但贡献了85%的点评,其作用不在小。并直指平台回避诸如操纵“问答”板块活跃度、暗箱操作内部员工中奖等问题。
今日(23日)凌晨,乎睿数据团队向包括蓝鲸TMT在内的媒体发来加盖公章的最新公司声明,称截至目前,乎睿团队至今的分析内容都以事实和数据为依托。
根据天眼查信息显示,深圳市乎睿数据有限公司注册于2018年1月,注册资本102万人民币,其法定代表人为吴昊。据其介绍,乎睿数据团队目前仅有三名创始成员,一名曾就职于 Instagram担任广告组技术带头人,另一位为师从某一线 NLP(Natural Language Processing,自然语言处理)学者博士生,今年春季休学回国,剩下一位为从“某十亿级 IOT 初创企业”离职员工。
乎睿团队向蓝鲸TMT记者表示,在深入分析前,团队就已发现许多尚未披露过的数据异常。一些有数千条点评的抄袭账号在个人主页中却只显示 300 条。而在今年七八月份,该 bug 突然被修复,在抄袭账号主页完整查看数千条点评内容,于是团队对大量可疑行为进行了视频录屏和截屏截图,并进行了司法公证。团队也对于确定的分析内容,以及点评消失的抄袭账号链接都进行了收录。
乎睿团队称,他们同时掌握了部分接管抄袭账号的马蜂窝内部员工的信息,由于涉及隐私并未提及。乎睿数据向蓝鲸TMT强调,曝光马蜂窝数据造假,纯属顺手为之,没有针对任何个人或企业,并表达了希望此事能促进市场规范的意愿。
业界争鸣商业竞争不合理现状
在文章发布后,争论点一度聚焦在数据造假是否合理合规,自媒体人“梓泉”表示团队意在揭露行业不正当现象,称在“大家都接受了这件事情”的情况下,“点出来皇帝没穿衣服,反而会被嘲笑 ‘不会阅读空气’”。
一位大型生活服务类互联网公司技术人士向蓝鲸TMT记者解释,由于法律漏洞的存在,互相搬运数据,这在国内互联网企业确实是司空见惯的行为。“知道的BAT都这么干过。” 而为应对竞争对手,公司都会有专门的反爬虫团队。而在乎睿数据的推文中,马蜂窝涉嫌抄袭的点评也因携程团队设置的反爬内容而暴露出错误。



