《月入3万的冷门赛道：用AI“复活”逝者照片和声音，全套开源工具教程》

一个不用露脸、不用社交、在家就能做的数字遗产修复项目，完整工具链+实操步骤

写在前面：为什么是这个赛道？

先给你看一组数据：

90后小伙张泽伟用AI“复活”逝者，2023年成交超1000单，客单价上千到上万元
澳大利亚Memories平台，已服务195个国家，托管50万+纪念空间
每次清明节前后，这类需求暴增3-5倍

这个赛道的特点：

✅ 高客单价（500-5000元/单）
✅ 零竞争（懂技术的人看不上，不懂技术的人做不了）
✅ 全线上交付（不需要见客户）
✅ 情绪价值驱动（客户付费意愿极强）

你需要的能力：

会基本的Python环境配置
能看懂Github页面
有一颗愿意帮人留住记忆的心

如果你完全零基础，别怕——本文所有工具都有“一键包”版本，按步骤操作即可。

第一部分：你需要完成的“三件套”

阶段	任务	核心工具	难度	耗时
第一层	照片修复（模糊变高清）	GFPGAN / CodeFormer	⭐	30分钟
第二层	照片动起来（静态变动态）	通义万相 Animate	⭐⭐	1小时
第三层	语音克隆（让照片“说话”）	GPT-SoVITS V2	⭐⭐	1小时

新手策略： 先做第一层 + 第三层（照片修复+语音合成），这两项组合已经能做出让客户落泪的作品。第二层是加分项，等熟练了再学。

第二部分：工具详解与获取方式

🔧 工具1：GFPGAN（照片修复神器）

是什么？ 腾讯开源的人脸修复算法，能把模糊、破损的老照片变得清晰。

获取方式：

方式A（新手推荐）：访问 https://replicate.com/tencent/gfpgan
→ 上传照片 → 点击运行 → 下载结果（完全免费）

方式B（本地运行，适合批量处理）：
git clone https://github.com/TencentARC/GFPGAN.git
cd GFPGAN
pip install -r requirements.txt
python inference_gfpgan.py --input inputs/test.jpg --output results

使用技巧：

输入照片的人脸至少要能看清五官轮廓（完全模糊的不行）
可以调整 --upscale 参数，2或4代表放大倍数
黑白照片也能修复，效果很好

效果对比预期：

输入：2005年手机拍的30万像素人脸
输出：高清、五官清晰、皮肤纹理自然

🔧 工具2：CodeFormer（专业级人脸修复）

是什么？ 比GFPGAN更强，特别擅长处理“破损”（缺眼睛、缺鼻子）的老照片。

获取方式：

方式A（在线体验）：https://replicate.com/sczhou/codeformer

方式B（本地运行）：
git clone https://github.com/sczhou/CodeFormer.git
cd CodeFormer
python inference_codeformer.py -i inputs/test.jpg -o results

何时用GFPGAN，何时用CodeFormer？

场景	推荐工具
照片只是模糊，五官完整	GFPGAN（更快）
照片有破损/遮挡/变形	CodeFormer（更强）
想要最佳效果	两个都跑，选最好的

🔧 工具3：GPT-SoVITS V2（语音克隆）

是什么？ 仅需3-10秒语音样本，就能克隆出任何人的声音。完全开源，本地运行，数据不上云（隐私安全）。

获取方式（重点）：

新手最友好的方式：下载“整合包”

1. 访问语雀：https://www.yuque.com/ (搜索“GPT-SoVITS 整合包”)
   或访问 Github Releases：https://github.com/RVC-Boss/GPT-SoVITS/releases

2. 下载对应系统的版本：
   - Windows用户：下载 .exe 安装包
   - Mac用户：下载 .dmg 文件
   - Linux用户：使用 docker 或源码安装

3. 双击运行，界面长这样（WebUI，浏览器打开）

使用步骤（超详细）：

准备音频素材：找到逝者生前3-10秒的说话录音（视频也行，提取音频）
- 质量要求：背景安静、无音乐、人声清晰
- 格式：mp3/wav 都可以
上传到工具：
- 点击“上传音频” → 选择文件
- 等待AI分析（约30秒）
输入你想让ta说的话：
- 在文本框输入：“妈，我在北京挺好的，别担心”
- 点击“合成”
下载结果：几秒钟后就能听到克隆的声音

常见问题：

Q: 没有音频素材怎么办？
- A: 可以退而求其次，只做照片修复服务（客单价200-500元）
Q: 音频只有1秒能用吗？
- A: GPT-SoVITS最低3秒，少于3秒效果很差。可以考虑 ElevenLabs（商业API，1秒也能用）

🔧 工具4：通义万相 Wan2.2-Animate（照片变视频，进阶）

是什么？ 阿里的开源模型，让静态照片模仿一段动作视频。

获取方式：

注意：这个工具有一定配置门槛，新手建议使用官方在线版

在线体验：https://tongyi.aliyun.com/wanxiang/animate

本地部署（高手向）：
git clone https://github.com/modelscope/diffusers.git
cd diffusers
# 详细教程见官方文档

使用场景：

客户提供一张逝者的照片
你录制一段自己挥手/微笑的视频
AI把逝者的脸“贴”到你的动作上
输出：逝者在挥手、微笑的动态视频

这是整个服务中溢价最高的项目，一个动态视频可以卖到2000-5000元。

第三部分：完整的“从0到1”操作流程（30分钟出demo）

第一步：准备素材（5分钟）

找一张老照片（自己家人的，或网上下载的测试图）
找一段3-10秒的语音（网上下载的名人访谈、电影片段都可以）

第二步：修复照片（10分钟）

打开 https://replicate.com/tencent/gfpgan
上传照片
点击“Run”
下载修复后的高清照片

你的第一个成果： 一张“焕然一新”的老照片

第三步：克隆声音（10分钟）

打开GPT-SoVITS V2（整合包）
上传音频样本
输入一句话：“你好，我是[名字]，很高兴认识你”
点击合成，下载

你的第二个成果： 一段克隆声音

第四步：合成展示视频（5分钟）

用剪映/PR/甚至PPT，把照片和声音合成一个短视频
照片保持不动，播放声音
导出视频

你完成了： 一个“会说话的老照片”demo

第五步：发到社交媒体

小红书/抖音/B站
标题：“用AI让奶奶的照片重新说话了”
标签：#AI修复 #情感科技 #黑科技

然后等待： 你的第一个客户会主动找上门

第四部分：新手避坑指南（血的教训）

❌ 坑1：追求完美，一直调参数

正确做法： 第一单用最简单的方式完成，先赚钱再优化。

❌ 坑2：不知道定价

参考价格（2025年市场行情）：

服务项目	价格区间
单张照片修复	50-200元
照片修复+语音克隆（一句话）	300-800元
照片修复+语音克隆（多句话/对话）	800-2000元
照片动态化（让照片动起来）	500-1500元
完整套餐（修复+动态+语音）	2000-5000元

❌ 坑3：接单后不知道免责

必须在交付前说明：

“本服务仅用于情感纪念用途”
“AI生成内容仅供参考，不代表逝者真实意愿”
“请勿用于任何商业或欺骗性用途”

❌ 坑4：忽略隐私

必须做的事：

收到客户素材后，口头承诺“数据仅用于本次服务，完成后删除”
不要在云端存储客户照片（用本地处理或加密存储）
建议签署简单的电子协议（草料二维码、腾讯电子签都可以）

第五部分：新手常见Q&A

Q: 我完全零基础，能学会吗？
A: 能。所有工具都有“在线版”，不需要配置环境。你会用鼠标就能操作。

Q: 需要花钱买工具吗？
A: 不需要。本文介绍的全部是开源/免费工具。等你月入过万后再考虑付费工具（如ElevenLabs）。

Q: 客户从哪里来？
A:

小红书发demo视频（最容易）
朋友圈发一次（往往有惊喜）
闲鱼挂链接（搜索“老照片修复”“AI复活亲人”）

Q: 如果客户没有语音样本怎么办？
A: 退而求其次，只做照片修复服务。或者用“文字转语音”模拟（提前说明不是真实声音）。

Q: 需要和客户见面吗？
A: 不用。全程线上：客户发照片/音频 → 你处理 → 发回网盘链接。连电话都不用打，微信文字沟通即可。

Q: 这个业务能做多久？
A: 至少5-10年。随着AI技术进步，效果会越来越好，需求只会增加。这是个“情绪价值”赛道，永远有需求。

写在最后：你不需要很厉害才能开始

这可能是你离“靠技术赚钱”最近的一次。

你不需要成为AI专家，不需要会写论文里的那些复杂公式。你只需要：

花30分钟跑通本文的demo
把结果发到社交媒体
等第一个客户带着ta的老照片来找你

当第一次听到AI完美复原出逝者的声音，客户在屏幕另一端泪流满面说“谢谢你，我等这一刻等了三年”的时候——你会明白，这不仅仅是一份收入。

行动清单（今天就能做）：

[ ] 打开GFPGAN在线版，上传一张照片
[ ] 下载修复后的图片
[ ] 打开GPT-SoVITS，克隆一段声音
[ ] 合成一个短视频
[ ] 发到朋友圈/小红书

完成这5步，你就不再是“想尝试的人”，而是“已经入场的人”。

本文工具链接和详细配置教程，会持续更新。建议收藏本文，需要时回来查阅。

遇到问题？ 欢迎在评论区留言，知无不言。

登录

注册账号

《月入3万的冷门赛道：用AI“复活”逝者照片和声音，全套开源工具教程 》

写在前面：为什么是这个赛道？

第一部分：你需要完成的“三件套”

第二部分：工具详解与获取方式

🔧 工具1：GFPGAN（照片修复神器）

🔧 工具2：CodeFormer（专业级人脸修复）

🔧 工具3：GPT-SoVITS V2（语音克隆）

🔧 工具4：通义万相 Wan2.2-Animate（照片变视频，进阶）

第三部分：完整的“从0到1”操作流程（30分钟出demo）

第一步：准备素材（5分钟）

第二步：修复照片（10分钟）

第三步：克隆声音（10分钟）

第四步：合成展示视频（5分钟）

第五步：发到社交媒体

第四部分：新手避坑指南（血的教训）

❌ 坑1：追求完美，一直调参数

❌ 坑2：不知道定价

❌ 坑3：接单后不知道免责

❌ 坑4：忽略隐私

第五部分：新手常见Q&A

写在最后：你不需要很厉害才能开始

暂无评论

《月入3万的冷门赛道：用AI“复活”逝者照片和声音，全套开源工具教程》