一个不用露脸、不用社交、在家就能做的数字遗产修复项目,完整工具链+实操步骤
写在前面:为什么是这个赛道?
先给你看一组数据:
- 90后小伙张泽伟用AI“复活”逝者,2023年成交超1000单,客单价上千到上万元
- 澳大利亚Memories平台,已服务195个国家,托管50万+纪念空间
- 每次清明节前后,这类需求暴增3-5倍
这个赛道的特点:
- ✅ 高客单价(500-5000元/单)
- ✅ 零竞争(懂技术的人看不上,不懂技术的人做不了)
- ✅ 全线上交付(不需要见客户)
- ✅ 情绪价值驱动(客户付费意愿极强)
你需要的能力:
- 会基本的Python环境配置
- 能看懂Github页面
- 有一颗愿意帮人留住记忆的心
如果你完全零基础,别怕——本文所有工具都有“一键包”版本,按步骤操作即可。
第一部分:你需要完成的“三件套”
| 阶段 | 任务 | 核心工具 | 难度 | 耗时 |
|---|---|---|---|---|
| 第一层 | 照片修复(模糊变高清) | GFPGAN / CodeFormer | ⭐ | 30分钟 |
| 第二层 | 照片动起来(静态变动态) | 通义万相 Animate | ⭐⭐ | 1小时 |
| 第三层 | 语音克隆(让照片“说话”) | GPT-SoVITS V2 | ⭐⭐ | 1小时 |
新手策略: 先做第一层 + 第三层(照片修复+语音合成),这两项组合已经能做出让客户落泪的作品。第二层是加分项,等熟练了再学。
第二部分:工具详解与获取方式
🔧 工具1:GFPGAN(照片修复神器)
是什么? 腾讯开源的人脸修复算法,能把模糊、破损的老照片变得清晰。
获取方式:
方式A(新手推荐):访问 https://replicate.com/tencent/gfpgan
→ 上传照片 → 点击运行 → 下载结果(完全免费)
方式B(本地运行,适合批量处理):
git clone https://github.com/TencentARC/GFPGAN.git
cd GFPGAN
pip install -r requirements.txt
python inference_gfpgan.py --input inputs/test.jpg --output results使用技巧:
- 输入照片的人脸至少要能看清五官轮廓(完全模糊的不行)
- 可以调整
--upscale参数,2或4代表放大倍数 - 黑白照片也能修复,效果很好
效果对比预期:
- 输入:2005年手机拍的30万像素人脸
- 输出:高清、五官清晰、皮肤纹理自然
🔧 工具2:CodeFormer(专业级人脸修复)
是什么? 比GFPGAN更强,特别擅长处理“破损”(缺眼睛、缺鼻子)的老照片。
获取方式:
方式A(在线体验):https://replicate.com/sczhou/codeformer
方式B(本地运行):
git clone https://github.com/sczhou/CodeFormer.git
cd CodeFormer
python inference_codeformer.py -i inputs/test.jpg -o results何时用GFPGAN,何时用CodeFormer?
| 场景 | 推荐工具 |
|---|---|
| 照片只是模糊,五官完整 | GFPGAN(更快) |
| 照片有破损/遮挡/变形 | CodeFormer(更强) |
| 想要最佳效果 | 两个都跑,选最好的 |
🔧 工具3:GPT-SoVITS V2(语音克隆)
是什么? 仅需3-10秒语音样本,就能克隆出任何人的声音。完全开源,本地运行,数据不上云(隐私安全)。
获取方式(重点):
新手最友好的方式:下载“整合包”
1. 访问语雀:https://www.yuque.com/ (搜索“GPT-SoVITS 整合包”)
或访问 Github Releases:https://github.com/RVC-Boss/GPT-SoVITS/releases
2. 下载对应系统的版本:
- Windows用户:下载 .exe 安装包
- Mac用户:下载 .dmg 文件
- Linux用户:使用 docker 或源码安装
3. 双击运行,界面长这样(WebUI,浏览器打开)使用步骤(超详细):
准备音频素材:找到逝者生前3-10秒的说话录音(视频也行,提取音频)
- 质量要求:背景安静、无音乐、人声清晰
- 格式:mp3/wav 都可以
上传到工具:
- 点击“上传音频” → 选择文件
- 等待AI分析(约30秒)
输入你想让ta说的话:
- 在文本框输入:“妈,我在北京挺好的,别担心”
- 点击“合成”
- 下载结果:几秒钟后就能听到克隆的声音
常见问题:
Q: 没有音频素材怎么办?
- A: 可以退而求其次,只做照片修复服务(客单价200-500元)
Q: 音频只有1秒能用吗?
- A: GPT-SoVITS最低3秒,少于3秒效果很差。可以考虑 ElevenLabs(商业API,1秒也能用)
🔧 工具4:通义万相 Wan2.2-Animate(照片变视频,进阶)
是什么? 阿里的开源模型,让静态照片模仿一段动作视频。
获取方式:
注意:这个工具有一定配置门槛,新手建议使用官方在线版
在线体验:https://tongyi.aliyun.com/wanxiang/animate
本地部署(高手向):
git clone https://github.com/modelscope/diffusers.git
cd diffusers
# 详细教程见官方文档使用场景:
- 客户提供一张逝者的照片
- 你录制一段自己挥手/微笑的视频
- AI把逝者的脸“贴”到你的动作上
- 输出:逝者在挥手、微笑的动态视频
这是整个服务中溢价最高的项目,一个动态视频可以卖到2000-5000元。
第三部分:完整的“从0到1”操作流程(30分钟出demo)
第一步:准备素材(5分钟)
- 找一张老照片(自己家人的,或网上下载的测试图)
- 找一段3-10秒的语音(网上下载的名人访谈、电影片段都可以)
第二步:修复照片(10分钟)
- 打开 https://replicate.com/tencent/gfpgan
- 上传照片
- 点击“Run”
- 下载修复后的高清照片
你的第一个成果: 一张“焕然一新”的老照片
第三步:克隆声音(10分钟)
- 打开GPT-SoVITS V2(整合包)
- 上传音频样本
- 输入一句话:“你好,我是[名字],很高兴认识你”
- 点击合成,下载
你的第二个成果: 一段克隆声音
第四步:合成展示视频(5分钟)
- 用剪映/PR/甚至PPT,把照片和声音合成一个短视频
- 照片保持不动,播放声音
- 导出视频
你完成了: 一个“会说话的老照片”demo
第五步:发到社交媒体
- 小红书/抖音/B站
- 标题:“用AI让奶奶的照片重新说话了”
- 标签:#AI修复 #情感科技 #黑科技
然后等待: 你的第一个客户会主动找上门
第四部分:新手避坑指南(血的教训)
❌ 坑1:追求完美,一直调参数
正确做法: 第一单用最简单的方式完成,先赚钱再优化。
❌ 坑2:不知道定价
参考价格(2025年市场行情):
| 服务项目 | 价格区间 |
|---|---|
| 单张照片修复 | 50-200元 |
| 照片修复+语音克隆(一句话) | 300-800元 |
| 照片修复+语音克隆(多句话/对话) | 800-2000元 |
| 照片动态化(让照片动起来) | 500-1500元 |
| 完整套餐(修复+动态+语音) | 2000-5000元 |
❌ 坑3:接单后不知道免责
必须在交付前说明:
- “本服务仅用于情感纪念用途”
- “AI生成内容仅供参考,不代表逝者真实意愿”
- “请勿用于任何商业或欺骗性用途”
❌ 坑4:忽略隐私
必须做的事:
- 收到客户素材后,口头承诺“数据仅用于本次服务,完成后删除”
- 不要在云端存储客户照片(用本地处理或加密存储)
- 建议签署简单的电子协议(草料二维码、腾讯电子签都可以)
第五部分:新手常见Q&A
Q: 我完全零基础,能学会吗?
A: 能。所有工具都有“在线版”,不需要配置环境。你会用鼠标就能操作。
Q: 需要花钱买工具吗?
A: 不需要。本文介绍的全部是开源/免费工具。等你月入过万后再考虑付费工具(如ElevenLabs)。
Q: 客户从哪里来?
A:
- 小红书发demo视频(最容易)
- 朋友圈发一次(往往有惊喜)
- 闲鱼挂链接(搜索“老照片修复”“AI复活亲人”)
Q: 如果客户没有语音样本怎么办?
A: 退而求其次,只做照片修复服务。或者用“文字转语音”模拟(提前说明不是真实声音)。
Q: 需要和客户见面吗?
A: 不用。全程线上:客户发照片/音频 → 你处理 → 发回网盘链接。连电话都不用打,微信文字沟通即可。
Q: 这个业务能做多久?
A: 至少5-10年。随着AI技术进步,效果会越来越好,需求只会增加。这是个“情绪价值”赛道,永远有需求。
写在最后:你不需要很厉害才能开始
这可能是你离“靠技术赚钱”最近的一次。
你不需要成为AI专家,不需要会写论文里的那些复杂公式。你只需要:
- 花30分钟跑通本文的demo
- 把结果发到社交媒体
- 等第一个客户带着ta的老照片来找你
当第一次听到AI完美复原出逝者的声音,客户在屏幕另一端泪流满面说“谢谢你,我等这一刻等了三年”的时候——你会明白,这不仅仅是一份收入。
行动清单(今天就能做):
- [ ] 打开GFPGAN在线版,上传一张照片
- [ ] 下载修复后的图片
- [ ] 打开GPT-SoVITS,克隆一段声音
- [ ] 合成一个短视频
- [ ] 发到朋友圈/小红书
完成这5步,你就不再是“想尝试的人”,而是“已经入场的人”。
本文工具链接和详细配置教程,会持续更新。建议收藏本文,需要时回来查阅。
遇到问题? 欢迎在评论区留言,知无不言。
暂无评论