向AI转型的程序员都关注了这个号 👇👇👇
人工智能大数据与深度学习 公众号:datayx
之前也做过聚类,只不过是用经典数据集,这次是拿的实际数据跑的结果,效果还可以,记录一下实验过程。
首先:
确保自己数据集是否都完整,不能有空值,最好也不要出现为0的值,会影响聚类的效果。
其次:
想好要用什么算法去做,K-means,层次聚类还是基于密度算法,如果对这些都不算特别深入了解,那就都尝试一下吧,我就是这样做的。
好了,简单开始讲解实验的过程吧。
一些库的准备:
贴上了完整的代码,只需要改文件路径就可以了。
详细源码查看地址
https://blog.csdn.net/qq\_39662852/article/details/81535371
可以运行看一下效果,下图是使用K-means聚类出来的效果,K值设为4:
然后你可以去看输出文件分出的类别,可以尝试改变K值,直接改minK和maxK 的值就可以了。
阅读过本文的人还看了以下:
分享《深度学习入门:基于Python的理论与实现》高清中文版PDF+源代码
《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码
【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类
如何利用全新的决策树集成级联结构gcForest做特征工程并打分?
Machine Learning Yearning 中文翻译稿
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程
不断更新资源
深度学习、机器学习、数据分析、python
搜索公众号添加: datayx
长按图片,识别二维码,点关注
AI项目体验
