AI 时代最引人关注或者说最具有争议的技术是什么?我想应该就是AI 换脸技术,但是毋庸置疑这种技术正以前所未有的速度渗透到我们的生活中,引起了广泛的关注和讨论。

今天我们分享的开源项目,它是一款实时视频换脸软件,可以让你在视频或者直播中进行换脸操作,它就是: Deep-Live-Cam

Deep-Live-Cam 是什么

Deep-Live-Cam 是一个创新的 AI 应用,它利用深度学习算法,通过单张照片实现视频中的人脸实时替换。这项技术的应用范围广泛,从娱乐到教育,从艺术创作到商业广告,都有着巨大的潜力。 Deep-Live-Cam 现在在 GitHub 上完全开源,在CPU上运行,可以使用 NVIDIA CUDA、Apple Silicon(CoreML)、DirectML(Windows)、OpenVINO(Intel) 进行GPU加速。

Deep-Live-Cam ,在发布后短短的一周时间内,增长超过2万star,可见大家对于它的关注。我们先来看一下效果,可以看到效果非常不错。

同时该软件的开发人员意识到其可能存在不道德的应用,并致力于采取预防措施。它有一个内置检查,可以防止程序用于一些你懂的视频。

技术原理

Deep-Live-Cam 背后的技术原理涉及到面部识别、特征提取和面部融合等多个步骤。它通过深度学习模型,如 GFPGANv1.4inswapper_128_fp16.onnx,精确识别源图像和目标视频中的人脸特征,然后进行像素级的融合,生成逼真的换脸效果。

  • GFPGANv1.4:GFPGAN 是一个腾讯开源的用来恢复照片中人脸的开源项目,目前在github上以及超过了35K star,它利用预训练人脸 GAN(例如StyleGAN2)中封装的丰富多样的先验来进行盲人脸修复。
  • inswapper_128_fp16.onnx:inswapper提供支持的一键式换脸和修复。

m2wxvk2n.png

Deep-Live-Cam 通过将多个技术融合,是得换脸能力可以落地到实时视频场景。

安装 Deep-Live-Cam

基本使用可以通过CPU运行,但速度也会非常慢。您可以按照基本安装的说明进行操作

1.运行需要

  • python(推荐 3.10)
  • pip
  • git
  • ffmpeg
  • visual studio 2022 运行时 (windows)

2.克隆仓库

git clone https://github.com/hacksider/Deep-Live-Cam.git

3.下载模型

  1. GFPGANv1.4
  2. inswapper_128_fp16.onnx

然后将这两个文件放在 “models” 文件夹中

4.安装依赖项

我们强烈建议使用 venv 以避免出现问题。

pip install -r requirements.txt

对于 MAC OS,您必须安装或升级 python-tk 包:

brew install python-tk@3.10

完成!如果您没有任何 GPU,您应该能够使用 python run.py 命令运行 roop。请记住,首次运行该程序时,它将下载一些模型,这可能需要一些时间,具体取决于您的网络连接。

使用 Deep-Live-Cam

m2wy3qs4.png

执行 python run.py 命令将启动此窗口:

m2wy5rd7.png

选择一张脸(包含所需脸部的图像)和目标图像/视频(您想要替换脸部的图像/视频),然后单击Start。打开文件资源管理器并导航到您选择输出的目录。您将找到一个名为的目录<video_title>,您可以在其中看到实时交换的帧。处理完成后,它将创建输出文件。就是这样。

m2wy4lyh.png

只需使用您最喜欢的屏幕截图即可像 OBS 一样进行流式传输

总结

AI的发展速度确实远远超出了人们的想象,很多科幻的内容正逐渐走进生活,但是这也带来了许多的危险和挑战,像AI换脸这类技术就属于典型的双刃剑,再带来巨大益处的同时也潜藏着风险。个人觉得还是技术本无好坏,还是看人如何去使用它。

项目信息

项目名称:Deep-Live-Cam
GitHub链接:https://github.com/hacksider/Deep-Live-Cam
Star数:39.3K

最后修改:2024 年 12 月 14 日
如果觉得我的文章对你有用,请随意赞赏o(* ̄▽ ̄*)ブ