AI 时代最引人关注或者说最具有争议的技术是什么?我想应该就是AI 换脸技术,但是毋庸置疑这种技术正以前所未有的速度渗透到我们的生活中,引起了广泛的关注和讨论。
今天我们分享的开源项目,它是一款实时视频换脸软件,可以让你在视频或者直播中进行换脸操作,它就是: Deep-Live-Cam
Deep-Live-Cam 是什么
Deep-Live-Cam 是一个创新的 AI 应用,它利用深度学习算法,通过单张照片实现视频中的人脸实时替换。这项技术的应用范围广泛,从娱乐到教育,从艺术创作到商业广告,都有着巨大的潜力。 Deep-Live-Cam 现在在 GitHub 上完全开源,在CPU上运行,可以使用 NVIDIA CUDA、Apple Silicon(CoreML)、DirectML(Windows)、OpenVINO(Intel) 进行GPU加速。
Deep-Live-Cam ,在发布后短短的一周时间内,增长超过2万star,可见大家对于它的关注。我们先来看一下效果,可以看到效果非常不错。
同时该软件的开发人员意识到其可能存在不道德的应用,并致力于采取预防措施。它有一个内置检查,可以防止程序用于一些你懂的视频。
技术原理
Deep-Live-Cam 背后的技术原理涉及到面部识别、特征提取和面部融合等多个步骤。它通过深度学习模型,如 GFPGANv1.4 和 inswapper_128_fp16.onnx,精确识别源图像和目标视频中的人脸特征,然后进行像素级的融合,生成逼真的换脸效果。
- GFPGANv1.4:GFPGAN 是一个腾讯开源的用来恢复照片中人脸的开源项目,目前在github上以及超过了35K star,它利用预训练人脸 GAN(例如StyleGAN2)中封装的丰富多样的先验来进行盲人脸修复。
- inswapper_128_fp16.onnx:inswapper提供支持的一键式换脸和修复。
Deep-Live-Cam 通过将多个技术融合,是得换脸能力可以落地到实时视频场景。
安装 Deep-Live-Cam
基本使用可以通过CPU运行,但速度也会非常慢。您可以按照基本安装的说明进行操作
1.运行需要
- python(推荐 3.10)
- pip
- git
- ffmpeg
- visual studio 2022 运行时 (windows)
2.克隆仓库
git clone https://github.com/hacksider/Deep-Live-Cam.git
3.下载模型
- GFPGANv1.4
- inswapper_128_fp16.onnx
然后将这两个文件放在 “models” 文件夹中
4.安装依赖项
我们强烈建议使用 venv
以避免出现问题。
pip install -r requirements.txt
对于 MAC OS,您必须安装或升级 python-tk 包:
brew install python-tk@3.10
完成!如果您没有任何 GPU,您应该能够使用 python run.py 命令运行 roop
。请记住,首次运行该程序时,它将下载一些模型,这可能需要一些时间,具体取决于您的网络连接。
使用 Deep-Live-Cam
执行 python run.py
命令将启动此窗口:
选择一张脸(包含所需脸部的图像)和目标图像/视频(您想要替换脸部的图像/视频),然后单击Start。打开文件资源管理器并导航到您选择输出的目录。您将找到一个名为的目录<video_title>,您可以在其中看到实时交换的帧。处理完成后,它将创建输出文件。就是这样。
只需使用您最喜欢的屏幕截图即可像 OBS 一样进行流式传输
总结
AI的发展速度确实远远超出了人们的想象,很多科幻的内容正逐渐走进生活,但是这也带来了许多的危险和挑战,像AI换脸这类技术就属于典型的双刃剑,再带来巨大益处的同时也潜藏着风险。个人觉得还是技术本无好坏,还是看人如何去使用它。
项目信息
项目名称:Deep-Live-Cam
GitHub链接:https://github.com/hacksider/Deep-Live-Cam
Star数:39.3K