AI教你如何穿成“大表姐”!

作者:媒体转发 时间:2019-01-17 16:32

字号

这个项目的目标是建立一个穿衣打扮推荐系统,用户可从一些 Instagram 时尚博主的图片中进行选择,我们的算法就能推荐给他们相似风格的衣服,并且获得比图片中款式更加实惠的价格。

用户选择了照片后,我们就会在fashion-rec.com网站所有的电商中进行筛选,给你推荐对应的衣服。

时尚界的KOL增加很快,变化也很快。他们是流量的掌控者,对大家的购物行为有很强的影响力。根据mediakix的数据,广告主仅仅是为Instagram平台的广告就支付了16亿美元。

广告主会给他们广告费,让他们穿着自家品牌的衣服拍照上传到Instagram,并且要提到这个品牌。这是品牌商常用的广告方式,希望关注博主的用户会购买他们的衣服。我们的推荐系统似乎有些与此为敌的意思,但我们最终是帮助了消费者,提供更多选择。

AI教你如何穿成“大表姐”!

项目管理

我们使用了敏捷(Agile)的项目流程来完成我们的终极项目(Capstone Project) 。这包括使用机器学习模型进行训练以及不同组员同时开发 Flask 应用。

下面是把所有元素结合在一起的流程:

从梅西百货、H&M、ASOS、Bloomingdales、Fashion Nova这五个网站爬取了女士裙子和上衣的数据;信息包括产品名称、价格、产品描述以及图片

爬取了13个Instagram KOL(意见领袖)过去6个月的点赞、点评以及帖子数据

使用NLP的潜在狄利克雷分布方法,将爬取的产品描述归类为6种不同的风格

我们尝试了基于FGVC5(一个有1014544无偏衣服图片以及228个品类标签数据的kaggel图片数据库)的iMaterialist Challenge (Fashion)

我们从上面分好的6个风格类别提出图片,使用步骤4的方法找到与KOL们发的图片相似的产品

我们开发了一个Flask 应用,可以给用户提供交互功能,并能让用户无限地提交搜索请求,对KOL的图片和我们的主要产品销售渠道的库进行搜索(建在亚马逊云AWS上)

AI教你如何穿成“大表姐”!

探索式数据分析

我们有约10000个产品信息,约1000份IG(Instagram,以下简称IG)的数据。不同产品价格中位数在150美元到20美元之间。

AI教你如何穿成“大表姐”!

大多数的产品来自ASOS,基于可负担的价格区间,以及衣服的风格多样性。

AI教你如何穿成“大表姐”!

每个不同博主的帖子数据如下,平均的发帖频率在每月5到20帖子。

AI教你如何穿成“大表姐”!

每个帖子的点赞数的中位数反应了受欢迎程度,其中号称全球第一大网红的Kylie Jenner比中位数多了600万(即为平均每一张图有600万点赞),所以下图没有包括她。

AI教你如何穿成“大表姐”!

我们的数据库里点赞数很高,说明大家被博主推荐的衣服吸引,我们的平台能让大家根据他们的喜好找到类似的衣服。

机器学习模型

NLP

我们将NLP(自然语言处理技术)应用到分析产品描述上,从而发现当下市场的流行趋势。NLP发现的风格之后会用来区分不同博主的风格,并且保证它们可以在市场上购买到。

基于预测和基于频率的方式是两种最常见的NLP 方法。基于频率的方法假设文档中的词语彼此独立,只会考虑出现的频率。相反,基于预测的方法会考虑单词共同出现的情况,在处理有很强的单词间关联的文本时它有优势。

Word2Vec 和 Doc2Vec

责任编辑:CQITer新闻报料:400-888-8888   本站原创,未经授权不得转载
继续阅读
热新闻
推荐
关于我们联系我们免责声明隐私政策 友情链接