从零开始实现穿衣图像分割完整教程(附python代码演练)

技术

picture.image

向AI转型的程序员都关注了这个号 👇👇👇

机器学习AI算法工程 公众号:datayx

时装业是人工智能领域很有前景的领域。 研究人员可以开发具有一定实用价值的应用。 我已经在这里展示了我对这个领域的兴趣,在那里我开发了一个来自Zalando在线商店的推荐和标记服装的解决方案。

在这篇文章中,我们会开发一个提取连衣裙的应用。 它输入原始的图像(从网络上下载或用智能手机拍照),并提取图像中的连衣裙。 分割的难点在于原始图像中存在了大量的噪声,但是我们会在预处理期间通过一个技巧来解决这个问题。

最后,您还可以尝试将此解决方案与之前引用的解决方案合并。 这允许您通过外出和拍摄时拍摄的照片,开发一个实时推荐和标记服装的系统。

项目下载地址

关注微信公众号 datayx 然后回复 穿衣 即可获取。

AI项目体验地址 https://loveai.tech

数据集

最近有一项关于服装视觉分析和分割的Kaggle比赛。 这是一个非常有趣的比赛,但它并不适合我们。 我们的目标是从图像中提取连衣裙,因此这个数据集不太适合我们,因为它包含了比较多的冗余。 我们需要的是包含连衣裙的图像,因此最好自己来构建数据集。

我收集了网络上的一些图片,其中包含了在不同场景穿着不同类型的连衣裙的人。 然后需要创建蒙版,它在每个对象分割任务中都是必要的。

下面是我们的数据样本。 我从互联网上收集了一些原始图像,经过进一步剪切,将人与衣服分开。

picture.image

图像分割示例

因为我们要将背景、皮肤和连衣裙进行分离,首先要将它们区分出来。 背景和皮肤是本问题中最相关的噪声源,我们要尽量减少它们的干扰。

通过手动分割来创建蒙版,如下图所示,简单的对蒙版进行二值化。

picture.image

蒙版示例

最后一步,我们将所有的蒙版图像合并为三维的单个图像。 这张照片表示了原始图像的相关特征。我们的目的主要是分离背景,皮肤和连衣裙,因此这个图像非常适合!

picture.image

最终蒙版

我们对数据集中的每个图像重复这个过程,为每个原始图像提供三维的对应蒙版。

模型

我们可以很容易的建立模型,过程非常简单:

我们需要训练这样一个模型,该模型输入原始图像,可以输出它的三维蒙版,即分离皮肤、背景和衣服。 训练完成之后,当一个新的图像输入时,我们就可以将它分成三个不同的部分: 背景、皮肤和衣服。 我们只关注感兴趣区域(连衣裙),这样蒙版结合原始图像,就可以裁剪出我们需要的连衣裙。

我们使用UNet建立该模型,它经常用于类似的分割任务,而且很容易在Keras中实现。

picture.image

在开始训练之前,要对所有的原始图像进行均值标准化。

结果和预测

在预测期间,当遇到高噪声的图像(背景或皮肤模糊等)时,模型开始动荡。 这种问题可以简单地通过增加训练图像的数量进行解决。 但我们也开发了一个巧妙的方法来避免这种问题。

我们使用 OpenCV 提供的 GrubCut 算法。 该算法利用高斯混合模型分离前景和背景。 通过它可以帮助我们找到图像中的人物。

我们只实现了简单的功能。 假设感兴趣的人站在图像的中间。

python def cut(img): img = cv.resize(img,(224,224)) ¨K5K

picture.image 执行GrubCut结果

下面是结合使用GrubCut和UNet之后的结果:

picture.image

picture.image

picture.image

picture.image

picture.image

GrubCut与UNet相结合得到了优秀的结果。

总结

在这篇文章中,我们为连衣裙分割开发了一套解决方案。 为了达到这个目的,我们使用了GrubCut和UNet。 我们计划在真实照片中使用这个解决方案,并根据它构建一个视觉推荐系统。

原文链接:

https://towardsdatascience.com/dress-segmentation-with-autoencoder-in-keras-497cf1fd169a


阅读过本文的人还看了以下:

分享《深度学习入门:基于Python的理论与实现》高清中文版PDF+源代码

《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材

笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!

《神经网络与深度学习》最新2018版中英PDF+源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源!CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师,你的面试为什么过不了?

前海征信大数据算法:风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类

VGG16迁移学习,实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七):图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分?

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师(共四面)通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

搜索公众号添加: datayx

picture.image

长按图片,识别二维码,点关注

AI项目体验

https://loveai.tech

picture.image

0
0
0
0
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论