PaddleGAN快速让你的照片动起来

技术

picture.image

向AI转型的程序员都关注了这个号👇👇👇

本项目基于PaddleGAN实现的FirstOrder与Wav2lip,。FirstOrder是输入一个模板视频与一张照片,就可以使照片里面的人物唱出模板视频里的歌曲,前段时间很火的 「蚂蚁呀嘿」就是用这个方法做的;还有另一个方法就是使用Wav2lip,输入照片和音频就可以直接让照片根据音频的内容动起来。

picture.image

两个方案让照片动起来

方案一:FirstOrder

  1. 下载PaddleGAN代码

git clone https://gitee.com/paddlepaddle/PaddleGAN

安装所需安装包

%cd PaddleGAN/ !pip install -r requirements.txt !pip install imageio-ffmpeg %cd applications/

2.将驱动视频迁移至照片中

大家可以上传自己准备的视频和图片,并在下面的代码中source_image参数和driving_video参数分别换成自己的图片和视频路径,然后点击运行,就可以完成动作表情迁移,程序运行成功后,会在ouput文件夹生成名为result.mp4的视频文件,该文件即为动作迁移后的视频。

本项目中提供了原始图片和驱动视频供展示使用。具体的各参数使用说明如下

  • driving_video: 驱动视频,视频中人物的表情动作作为待迁移的对象

  • source_image: 原始图片,视频中人物的表情动作将迁移到该原始图片中的人物上

  • relative: 指示程序中使用视频和图片中人物关键点的相对坐标还是绝对坐标,建议使用相对坐标,若使用绝对坐标,会导致迁移后人物扭曲变形

  • adapt_scale: 根据关键点凸包自适应运动尺度

  • output:设置输出视频的存放文件夹

!export PYTHONPATH=$PYTHONPATH:/home/aistudio/PaddleGAN && python -u tools/first-order-demo.py --driving_video /home/aistudio/PlanA_FirstOrder/zhiming.mp4
--source_image /home/aistudio/PlanA_FirstOrder/trumps.png
--relative
--adapt_scale
--output /home/aistudio/PlanA_FirstOrder/output/

3.为生成的视频加上音乐

!pip install moviepy


        
#为生成的视频加上音乐  
from moviepy.editor import *  
  
videoclip_driving = VideoFileClip("/home/aistudio/PlanA\_FirstOrder/zhiming.mp4") # 打开驱动视频  
videoclip_result = VideoFileClip("/home/aistudio/PlanA\_FirstOrder/output/result.mp4") # 打开PaddleGan刚刚生成的视频  
  
audio_driving = videoclip_driving.audio # 提取驱动视频里的声音  
video = videoclip_result.set_audio(audio_driving) # 将提取出来的声音加到生成视频的音轨中  
  
video.write_videofile("/home/aistudio/PlanA\_FirstOrder/output/final\_result.mp4", audio_codec="aac") # 保存视频
    

生成的视频将放置在“PlanA_FirstOrder/output/”目录下,下载后即可查看效果~

方案二:Wav2lip

  1. 安装必要的资源包

%cd /home/aistudio/work

安装所需安装包

!mkdir sndfile %cd sndfile !wget http://www.mega-nerd.com/libsndfile/files/libsndfile- 1.0 .28 .tar.gz !tar xzvf libsndfile- 1.0 .28 .tar.gz

%cd libsndfile- 1.0 .28 !./configure --prefix=/home/aistudio/build_libs CFLAGS=-fPIC --enable-shared !make !make install

%cd /home/aistudio/PaddleGAN !pip install -r requirements.txt %cd applications/

2.根据音频直接合成唇形动作

只需在如下命令中的face参数和audio参数分别换成自己的视频和音频路径,然后运行如下命令,就可以生成和音频同步的视频。

程序运行完成后,会在当前文件夹下生成文件名为outfile参数指定的视频文件,该文件即为和音频同步的视频文件。本项目中提供了demo展示所用到的视频和音频文件。具体的参数使用说明如下:

  • face: 原始视频,视频中的人物的唇形将根据音频进行唇形合成--通俗来说,想让谁说话

  • audio:驱动唇形合成的音频,视频中的人物将根据此音频进行唇形合成--通俗来说,想让这个人说什么

!export PYTHONPATH=$PYTHONPATH:/home/aistudio/PaddleGAN && python tools/wav2lip.py --face /home/aistudio/PlanB_Wav2lip/MonaLisa.jpeg
--audio /home/aistudio/PlanB_Wav2lip/TA.mp3
--outfile /home/aistudio/PlanB_Wav2lip/output/result.mp4

效果展示

picture.image

人工智能

视频号

picture.image

长按图片,识别二维码


阅读过本文的人还看了以下文章:

TensorFlow 2.0深度学习案例实战

基于40万表格数据集TableBank,用MaskRCNN做表格检测

《基于深度学习的自然语言处理》中/英PDF

Deep Learning 中文版初版-周志华团队

【全套视频课】最全的目标检测算法系列讲解,通俗易懂!

《美团机器学习实践》_美团算法团队.pdf

《深度学习入门:基于Python的理论与实现》高清中文PDF+源码

《深度学习:基于Keras的Python实践》PDF和代码

特征提取与图像处理(第二版).pdf

python就业班学习视频,从入门到实战项目

2019最新《PyTorch自然语言处理》英、中文版PDF+源码

《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

PyTorch深度学习快速实战入门《pytorch-handbook》

【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》

《Python数据分析与挖掘实战》PDF+完整源码

汽车行业完整知识图谱项目实战视频(全23课)

李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材

笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!

《神经网络与深度学习》最新2018版中英PDF+源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源!CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师,你的面试为什么过不了?

前海征信大数据算法:风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类

VGG16迁移学习,实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七):图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分?

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师(共四面)通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

搜索公众号添加: datayx

picture.image

0
0
0
0
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论