深度学习项目:歌词的自动生成

技术

picture.image

向AI转型的程序员都关注了这个号 👇👇👇

人工智能大数据与深度学习 公众号:datayx

我们实现的是歌词的自动生成。 主要看我在代码中的注释。

数据集获取方式

关注微信公众号 datayx 然后回复 歌词 即可获取。

AI项目体验地址 https://loveai.tech

1:我们加载所需要的模块,这里的模块都是比较常用的模块

picture.image

2:加载数据集,整理汉字和id之间的映射。从我们的txt文件中读取歌词,每一行是一首歌,因为我们的部分歌中含有应为,我们这里也做一个小小的处理,那就是将英文占比比较大的歌扔掉不用。 见下面代码,并给处理了详细的注释:

picture.image

输出是: 共36616首歌

3:整理汉字与需要的映射关系,并存到本地,因为我们把模型训练好了,拿到其他地方运行,这个映射是不能少的

picture.image

picture.image

5:接下来,我们定义模型,这里我们首先接一个Embedding,就是将输入的向量中每个词转为128维的向量,具体原理,参考下这篇博客:https://blog.csdn.net/jiangpeng59/article/details/77533309

picture.image

6:我们模型最后输出的是所有词作为下一个词的概率,我们不能单纯的取概率最大,我们这里给一个权重,让其多样性

picture.image

7: 定义一个回调函数,就是让模型每次训练完一轮后,试着去生成一段序列,看看是什么样子

picture.image

8:训练模型并保存

picture.image

9:模型训练好,我们试着调用一下以训练好的模型,让其生成文本

picture.image

最后的输出:

只剩下钢琴被我弹了一曲表演

失去故事的存在重叠入襟

要不是孩子们流浪

谁能放下好吧气

不是因为我不怕孤单

不习惯习惯睡发

街景屠水的泛泛

清流旧枝既渺重交可斟学

时光间两千男生好情可以筹码

又不是不知无限

我感到喧闹太阳下

回来就匆匆忘了

然后觉悟我

至少

我不说说诉

也许我会

甚麽不要分手

爱是寂寞的执着

用我感情谱生音

轻吻着梦的人生瞬间

天高后回想到最后一切

啊 旁条

逛来驾

静静等个黎明我俩如才能够我的承认

孤星和爱更东西

为何落力不怕你出现

生命已给我

夜雨冰凉,你要离我一直跳,在此刻很轻,温茶又笑清似断肠。

独立平庭一直;。 何以朽,因果师岭名掘互相。。 所有

我知道有人会美丽

不肯等 喔喔喔喔

令你救我 爱不爱

却在未了只能说

我不会说的

天未要准新心都是接认会得到爆倍

不介意 脚丫口巧腰都没有

多想关于我们哪个哪有起来的模样

我只好兴奋 我在一起 春天初绽回遨游

过处沙红表远

原文链接https://blog.csdn.net/shawroad88/article/details/89437839


阅读过本文的人还看了以下:

分享《深度学习入门:基于Python的理论与实现》高清中文版PDF+源代码

《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材

笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!

《神经网络与深度学习》最新2018版中英PDF+源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源!CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师,你的面试为什么过不了?

前海征信大数据算法:风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类

VGG16迁移学习,实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七):图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分?

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师(共四面)通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

搜索公众号添加: datayx

picture.image

长按图片,识别二维码,点关注

AI项目体验

https://loveai.tech

picture.image

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
边缘云打通大模型物理世界
《火山引擎边缘智能,打通大模型的物理世界》 张俊钦 | 火山引擎边缘智能资深研发工程师
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论