那些给人工智能打工的人
作者:CQITer小编 时间:2018-10-21 16:04

这里是中国特色的数据车间,他们遍布在河南、山东、河北等地的四五线小城里,日以继夜地为世界领先的 AI 产品服务。
越来越多的人正在加入他们的行列,成为为人工智能打工的人。
「梯子(可以移动的)」
马萌利面前出现一张欧洲户外咖啡馆的照片。她移动鼠标,绿色的画框浮现在照片上,显示备注「椅子」,她迅速在一瓶花束上补了一个绿框,标上「花(放在容器中)」。
下一张,一个日本花卉市场,几排密密麻麻的绿植中,马萌利检查了每一个标出的「花盆」。
下一张,一个美国孩子的卧室,「椅子」、「桌子」…… 她飞速删掉了「梯子」的画框——客户要求是能移动的梯子,这种高低床上已经焊死的梯子就不能算。
下一张、下一张、下一张,不管眼前是什么场景,马萌利手速不变,依次圈出「梯子」、「茶几」、「地毯」、「沙发」。
「梯子」、「茶几」、「地毯」、「沙发」。「梯子」、「茶几」、「地毯」、「沙发」…… 如此周而复始,不停重复循环。马萌利每天的工作从早晨 8 点钟开始,坐到工位,打开电脑,输入用户名和密码,移动鼠标开始标记,日复一日,每天持续 9 个小时。
屏幕上的图片很模糊,这些都是从全球社交网络上抓取的,角度混乱,像素也不高。那张韩国泡菜摊的照片,很明显来自一个角落里的摄像头。马萌利放大图片,在路人的脚边,圈出一个糊成一团的轮廓:「垃圾桶」。
旁边工位有人打开了音箱,活泼的流行歌响了起来:「燃烧我的卡路里!」
房间里有几百个屏幕,闪动着颜色不一的图片,每个人都在框选同样的内容:垃圾桶、梯子、茶几、地毯…… 这是河南省平顶山市郏县,一家叫千机数据的公司,房间看起来像一个网吧,在网络神曲伴奏下,年轻的员工们窝在柔软的沙发里,不停地拉框。马萌利是最后的审核员,她和同事要检查所有人拉的框,以保证每个画框都严丝合缝地贴着目标的边缘,图片里所有目标都要被框出来,不能有任何遗漏。
马萌利每天要检查至少 1000 张图。手头这个单子已经干了两个月,同事们标注了上万个垃圾桶、梯子、茶几、地毯……29 岁的马萌利知道,这些标好框的图片汇总后,将发回北京一家 AI 独角兽公司,变成人工智能的学习材料。
她不知道的是,这几万个「梯子(可以移动的)」标注,展示了梯子的无数个样子,再经过深度学习算法加工,最终让计算机认识,这就是梯子,可以移动的那种。
她日复一日标注的数据来自百度、京东、阿里、旷视、Momenta 等大公司,全部应用于人工智能训练。一种行业说法是,任何人类能在 5 岁之后做的事,对机器人来说都很简单,但是 5 岁之前,人类用本能就能理解的实际信息,计算机要用最笨的办法学习。这时候,就需要数以万计的马萌利们为人工智能提供标注服务了。
计算机认识沙发、梯子又有什么用?
马萌利回答不了这个问题,转头去问老板刘洋锋。刘洋锋今年 31 岁,是他去北京竞标抢到的这批活儿。他搔了搔头发,想起甲方提过一次,9 月 8 号他们要去国外参加一场世界级人工智能比赛。「这些是给那场比赛用的?」他不太确定。再往下说,他也不懂了。
为 AI 服务
我来郏县的第一顿饭,刘洋锋和合伙人刘磊带我去吃了本地一家网红饸饹面,面馆有位漂亮的女主播,靠拍餐厅各种日常,在一家短视频平台上有 88 万粉丝。中午,餐厅两层楼坐得满满当当,一半是食客,一半是慕名而来的粉丝。
我们正好遇到女孩做直播,我发现,主播本人跟视频不一样:屏幕上她皮肤变好了,眼睛大大的,下巴更尖,苹果肌更圆。
是短视频软件的滤镜把她变美了。跟自拍软件一样,直播平台的滤镜靠的是人工智能,可以实时瘦脸、大眼并磨皮。APP 之所以能识别哪儿是眼睛、哪儿是下巴,正是此前有 AI 数据标注工人标记了那些人脸的五官。
一直到我们离开,女孩仍一刻不停地招呼新进直播间的观众,对着镜头羞涩地笑:「我是单身,没有男朋友。」
「她是那家老板的儿媳妇呀。」说起女主播,马萌利一边对着一张俄罗斯餐厅图片拉框,一边哈哈大笑。郏县很小,藏不住什么秘密。她比画了一下公司的员工们:「生拉硬扯,我们都能扯上关系。」


