一个不用露脸、不用社交、在家就能做的数字遗产修复项目,完整工具链+实操步骤

写在前面:为什么是这个赛道?

先给你看一组数据:

  • 90后小伙张泽伟用AI“复活”逝者,2023年成交超1000单,客单价上千到上万元
  • 澳大利亚Memories平台,已服务195个国家,托管50万+纪念空间
  • 每次清明节前后,这类需求暴增3-5倍

这个赛道的特点:

  • ✅ 高客单价(500-5000元/单)
  • ✅ 零竞争(懂技术的人看不上,不懂技术的人做不了)
  • ✅ 全线上交付(不需要见客户)
  • ✅ 情绪价值驱动(客户付费意愿极强)

你需要的能力:

  • 会基本的Python环境配置
  • 能看懂Github页面
  • 有一颗愿意帮人留住记忆的心
如果你完全零基础,别怕——本文所有工具都有“一键包”版本,按步骤操作即可。

第一部分:你需要完成的“三件套”

阶段任务核心工具难度耗时
第一层照片修复(模糊变高清)GFPGAN / CodeFormer30分钟
第二层照片动起来(静态变动态)通义万相 Animate⭐⭐1小时
第三层语音克隆(让照片“说话”)GPT-SoVITS V2⭐⭐1小时

新手策略: 先做第一层 + 第三层(照片修复+语音合成),这两项组合已经能做出让客户落泪的作品。第二层是加分项,等熟练了再学。


第二部分:工具详解与获取方式

🔧 工具1:GFPGAN(照片修复神器)

是什么? 腾讯开源的人脸修复算法,能把模糊、破损的老照片变得清晰。

获取方式:

方式A(新手推荐):访问 https://replicate.com/tencent/gfpgan
→ 上传照片 → 点击运行 → 下载结果(完全免费)

方式B(本地运行,适合批量处理):
git clone https://github.com/TencentARC/GFPGAN.git
cd GFPGAN
pip install -r requirements.txt
python inference_gfpgan.py --input inputs/test.jpg --output results

使用技巧:

  • 输入照片的人脸至少要能看清五官轮廓(完全模糊的不行)
  • 可以调整 --upscale 参数,2或4代表放大倍数
  • 黑白照片也能修复,效果很好

效果对比预期:

  • 输入:2005年手机拍的30万像素人脸
  • 输出:高清、五官清晰、皮肤纹理自然

🔧 工具2:CodeFormer(专业级人脸修复)

是什么? 比GFPGAN更强,特别擅长处理“破损”(缺眼睛、缺鼻子)的老照片。

获取方式:

方式A(在线体验):https://replicate.com/sczhou/codeformer

方式B(本地运行):
git clone https://github.com/sczhou/CodeFormer.git
cd CodeFormer
python inference_codeformer.py -i inputs/test.jpg -o results

何时用GFPGAN,何时用CodeFormer?

场景推荐工具
照片只是模糊,五官完整GFPGAN(更快)
照片有破损/遮挡/变形CodeFormer(更强)
想要最佳效果两个都跑,选最好的

🔧 工具3:GPT-SoVITS V2(语音克隆)

是什么? 仅需3-10秒语音样本,就能克隆出任何人的声音。完全开源,本地运行,数据不上云(隐私安全)。

获取方式(重点):

新手最友好的方式:下载“整合包”

1. 访问语雀:https://www.yuque.com/ (搜索“GPT-SoVITS 整合包”)
   或访问 Github Releases:https://github.com/RVC-Boss/GPT-SoVITS/releases

2. 下载对应系统的版本:
   - Windows用户:下载 .exe 安装包
   - Mac用户:下载 .dmg 文件
   - Linux用户:使用 docker 或源码安装

3. 双击运行,界面长这样(WebUI,浏览器打开)

使用步骤(超详细):

  1. 准备音频素材:找到逝者生前3-10秒的说话录音(视频也行,提取音频)

    • 质量要求:背景安静、无音乐、人声清晰
    • 格式:mp3/wav 都可以
  2. 上传到工具

    • 点击“上传音频” → 选择文件
    • 等待AI分析(约30秒)
  3. 输入你想让ta说的话

    • 在文本框输入:“妈,我在北京挺好的,别担心”
    • 点击“合成”
  4. 下载结果:几秒钟后就能听到克隆的声音

常见问题:

  • Q: 没有音频素材怎么办?

    • A: 可以退而求其次,只做照片修复服务(客单价200-500元)
  • Q: 音频只有1秒能用吗?

    • A: GPT-SoVITS最低3秒,少于3秒效果很差。可以考虑 ElevenLabs(商业API,1秒也能用)

🔧 工具4:通义万相 Wan2.2-Animate(照片变视频,进阶)

是什么? 阿里的开源模型,让静态照片模仿一段动作视频。

获取方式:

注意:这个工具有一定配置门槛,新手建议使用官方在线版

在线体验:https://tongyi.aliyun.com/wanxiang/animate

本地部署(高手向):
git clone https://github.com/modelscope/diffusers.git
cd diffusers
# 详细教程见官方文档

使用场景:

  • 客户提供一张逝者的照片
  • 你录制一段自己挥手/微笑的视频
  • AI把逝者的脸“贴”到你的动作上
  • 输出:逝者在挥手、微笑的动态视频

这是整个服务中溢价最高的项目,一个动态视频可以卖到2000-5000元。


第三部分:完整的“从0到1”操作流程(30分钟出demo)

第一步:准备素材(5分钟)

  • 找一张老照片(自己家人的,或网上下载的测试图)
  • 找一段3-10秒的语音(网上下载的名人访谈、电影片段都可以)

第二步:修复照片(10分钟)

  1. 打开 https://replicate.com/tencent/gfpgan
  2. 上传照片
  3. 点击“Run”
  4. 下载修复后的高清照片

你的第一个成果: 一张“焕然一新”的老照片

第三步:克隆声音(10分钟)

  1. 打开GPT-SoVITS V2(整合包)
  2. 上传音频样本
  3. 输入一句话:“你好,我是[名字],很高兴认识你”
  4. 点击合成,下载

你的第二个成果: 一段克隆声音

第四步:合成展示视频(5分钟)

  1. 用剪映/PR/甚至PPT,把照片和声音合成一个短视频
  2. 照片保持不动,播放声音
  3. 导出视频

你完成了: 一个“会说话的老照片”demo

第五步:发到社交媒体

  • 小红书/抖音/B站
  • 标题:“用AI让奶奶的照片重新说话了”
  • 标签:#AI修复 #情感科技 #黑科技

然后等待: 你的第一个客户会主动找上门


第四部分:新手避坑指南(血的教训)

❌ 坑1:追求完美,一直调参数

正确做法: 第一单用最简单的方式完成,先赚钱再优化。

❌ 坑2:不知道定价

参考价格(2025年市场行情):

服务项目价格区间
单张照片修复50-200元
照片修复+语音克隆(一句话)300-800元
照片修复+语音克隆(多句话/对话)800-2000元
照片动态化(让照片动起来)500-1500元
完整套餐(修复+动态+语音)2000-5000元

❌ 坑3:接单后不知道免责

必须在交付前说明:

  • “本服务仅用于情感纪念用途”
  • “AI生成内容仅供参考,不代表逝者真实意愿”
  • “请勿用于任何商业或欺骗性用途”

❌ 坑4:忽略隐私

必须做的事:

  • 收到客户素材后,口头承诺“数据仅用于本次服务,完成后删除”
  • 不要在云端存储客户照片(用本地处理或加密存储)
  • 建议签署简单的电子协议(草料二维码、腾讯电子签都可以)

第五部分:新手常见Q&A

Q: 我完全零基础,能学会吗?
A: 能。所有工具都有“在线版”,不需要配置环境。你会用鼠标就能操作。

Q: 需要花钱买工具吗?
A: 不需要。本文介绍的全部是开源/免费工具。等你月入过万后再考虑付费工具(如ElevenLabs)。

Q: 客户从哪里来?
A:

  • 小红书发demo视频(最容易)
  • 朋友圈发一次(往往有惊喜)
  • 闲鱼挂链接(搜索“老照片修复”“AI复活亲人”)

Q: 如果客户没有语音样本怎么办?
A: 退而求其次,只做照片修复服务。或者用“文字转语音”模拟(提前说明不是真实声音)。

Q: 需要和客户见面吗?
A: 不用。全程线上:客户发照片/音频 → 你处理 → 发回网盘链接。连电话都不用打,微信文字沟通即可。

Q: 这个业务能做多久?
A: 至少5-10年。随着AI技术进步,效果会越来越好,需求只会增加。这是个“情绪价值”赛道,永远有需求。


写在最后:你不需要很厉害才能开始

这可能是你离“靠技术赚钱”最近的一次。

你不需要成为AI专家,不需要会写论文里的那些复杂公式。你只需要:

  1. 花30分钟跑通本文的demo
  2. 把结果发到社交媒体
  3. 等第一个客户带着ta的老照片来找你

当第一次听到AI完美复原出逝者的声音,客户在屏幕另一端泪流满面说“谢谢你,我等这一刻等了三年”的时候——你会明白,这不仅仅是一份收入。

行动清单(今天就能做):

  • [ ] 打开GFPGAN在线版,上传一张照片
  • [ ] 下载修复后的图片
  • [ ] 打开GPT-SoVITS,克隆一段声音
  • [ ] 合成一个短视频
  • [ ] 发到朋友圈/小红书

完成这5步,你就不再是“想尝试的人”,而是“已经入场的人”。


本文工具链接和详细配置教程,会持续更新。建议收藏本文,需要时回来查阅。

遇到问题? 欢迎在评论区留言,知无不言。

标签: none

暂无评论