900 元闲鱼组了一台 NAS + AI 小服务器：能跑模型，也真的有坑

3 月 1 日，我把家里的 NAS 升级了一次。

之前用的是蜗牛星际，作为入门 NAS 其实挺经典：便宜、够折腾，也能跑一些基础服务。但用久了之后问题就很明显了：4 盘位已经不太够我继续塞硬盘和折腾了。

我现在的需求已经不只是存文件、备份照片、跑几个 Docker 服务，还想顺便跑点本地小模型、TTS 语音合成，甚至做一些 LoRA 训练前的数据集预处理。

全新硬件看了一圈，预算很快就上去了。于是我把目标放到了闲鱼二手硬件上，最后花了 916 元，不含硬盘和内存，组出了一台带 8+4 盘位（8 个 3.5 寸硬盘位 + 内置 4 个 2.5 寸盘位）、搭配 Tesla P4 8GB 的 NAS / AI 小服务器。

系统方面，我这台机器跑的是 fnOS。传统 NAS 比较常见的文件存储、照片备份、影音管理这些功能就不展开讲了，这篇主要记录它作为一台低成本 NAS + 本地 AI 小服务器，到底能做哪些更折腾一点的事情。

先说结论：

这不是一台真正意义上的高性能 AI 服务器，也不是推荐大家无脑照抄的"神机"。

但如果你手里有一些闲置硬件，又愿意折腾二手配件、散热、驱动和 Docker，它确实能用很低的成本，把 NAS、本地 AI、TTS、数据集预处理这些事情整合到一台机器里。

一、硬件配置：主机部分 916 元

这套机器的配件基本都来自闲鱼。

配件	型号	价格
机箱 + 电源	傻瓜超人 S18（8 个 3.5 寸 + 内置 4 个 2.5 寸盘位）	¥260
CPU	Intel i3-9100T 拆机正式版	¥110
主板	技嘉 B365M 小雕（魔改支持志强）	¥188
散热器	利民 AXP90×47	¥58
显卡	Tesla P4 8GB	¥300
合计	不含硬盘和内存	¥916

这里必须强调一下：916 元是不含硬盘和内存的价格。

NAS 真正贵的地方往往不是主机本体，而是硬盘和内存。尤其是现在内存价格不合适的时候，如果全部重新购买，整套方案的成本会被明显拉高。

所以更准确地说，这是一套"900 元左右搭出 NAS + 轻量 AI 推理平台"的方案，而不是完整 NAS 总成本。

几件配件里，我最看重的是两点：

第一，傻瓜超人 S18 是 8+4 盘位：8 个 3.5 寸硬盘位，加上内置 4 个 2.5 寸盘位，比我之前的 4 盘位蜗牛星际更适合继续扩展。

第二，技嘉 B365M 小雕有双 M.2 位。对 NAS 来说，这点挺实用：后面可以用来放系统盘、缓存盘，或者把一些容器、数据库、AI 服务的数据放到 SSD 上，减少机械硬盘的频繁读写。

第三，Tesla P4 虽然是老的数据中心卡，但 300 元左右能买到 8GB 显存，用来跑小模型、TTS、Embedding 和一些图片预处理任务，性价比还是不错的。

不过 Tesla P4 也有一个非常明显的坑：它原本是服务器被动散热卡，不能完全按普通消费级显卡的思路来装。

我这张卡是卖家已经加装了两个小风扇，所以散热条件比裸卡好一些。否则如果直接把被动散热版 Tesla P4 塞进普通机箱，满载时温度会很难看。NAS 又是长期运行设备，所以这种卡即使便宜，也一定要认真确认散热方案。

购买凭证：

机箱+电源 - 傻瓜超人 S18 ¥260

CPU - i3-9100T ¥110

主板 - 技嘉B365M小雕 ¥188

散热器 - 利民AXP90×47 ¥58

装机后 nvidia-smi 验证：

nvidia-smi - Tesla P4 正常识别

二、它现在到底在干什么？

很多人一听本地小模型，第一反应可能是：

参数这么小，能有什么用？

如果只拿它和云端大模型比复杂推理、代码能力和长上下文，那它当然不占优势。

但如果把它放进具体工作流里，它其实能做很多实事。

目前这台机器主要承担这些任务：

NAS 文件存储；
跑一些常驻 Docker 服务；
本地测试 4B / 7B 级别小模型；
辅助 ComfyUI 生图提示词书写；
做本地翻译和文本整理；
给 Agent 提供向量检索能力；
跑中文 TTS 语音合成；
接入 Agent、小智、有声书等语音场景；
做 LoRA 训练前的数据集预处理。

对我来说，它最有价值的地方不是"本地模型有多聪明"，而是：

把大量重复、辅助、前处理类任务留在本地完成，需要大显存的时候，再把整理好的数据上传到服务器。

这比单纯问本地模型几个问题实用得多。

三、本地小模型的几个真实用途

1. ComfyUI 生图提示词辅助

生图的时候，提示词经常要反复调整。

人物、服装、光影、构图、镜头、背景、风格这些内容，如果全部手写会很麻烦。

本地小模型可以用来做中文描述转英文提示词、提示词扩写、风格词补全、负面提示词整理。

它不一定能一次写出顶级提示词，但可以快速给出基础稿，后面再人工微调。

这类任务不太需要特别强的推理能力，更需要随时可用、响应快、成本低，所以很适合本地模型。

2. 本地翻译和文本整理

一些英文模型说明、README、报错信息、配置说明，也可以交给本地模型处理。

云端大模型当然更强，但很多时候只是看个大概意思，或者整理一下参数说明，没必要每次都走外部 API。

本地模型的优势是没有额度焦虑，也不用担心频繁调用 API 的成本。

3. Agent 使用的向量模型

除了聊天模型，我还部署了 Embedding / 向量模型。

这类模型不负责直接回答问题，而是给 Agent 做检索和记忆用。

比如文档切片后做向量化、本地知识库检索、Agent 查找历史资料、给自动化工具提供语义搜索能力。

这个方向很适合常驻 NAS，因为向量模型通常不需要特别大的显存，只要部署稳定，就可以长期挂在本地给各种工具调用。

4. LoRA 训练前的数据集预处理

这是我觉得最实用的场景之一。

真正训练 LoRA 之前，最麻烦的不是点一下训练按钮，而是准备数据集。

图片需要先做识别、自动打标、去重、低质量筛选、内容合规筛查、分类、生成 caption / tag 文本。

这些步骤如果全部放到租来的 GPU 服务器上做，其实很浪费钱。

服务器租金是按时间算的，你在上面慢慢整理图片、打标、筛选，本质上是在花钱做前处理。

更合理的方式是：

在本地 NAS 上先把图片识别、打标、去重、筛选都处理好，整理成可以直接训练的数据集。真正需要大显存的时候，再把干净的数据集上传到服务器训练 LoRA。

这样可以减少服务器空转时间，也能省下一部分租用成本。

四、跑模型实测：速度可以，边界也明显

我用 Ollama 部署了一些 Gemma4 社区微调模型，包括 4B 级别的小模型，以及配套的 Embedding 模型。

Ollama 模型列表与运行状态

这类模型最大的优点是跑得快、占用低、本地部署门槛低。

但缺点也很现实：复杂推理不稳定，容易过度解释，对隐含条件理解差。

我用一个小常识题测试过：

我把钥匙放进抽屉，然后离开房间，回来后我想开门，应该先找什么？

正常思路应该是：钥匙在房间里的抽屉中，而人已经在房间外面，所以重点不是找抽屉，而是想办法先进入房间，或者找备用钥匙。

实际模型回答得很认真，也分析了很多内容，但最后重点跑偏了，甚至把答案引到了"先找抽屉的把手"。

模型翻车实录 - 过度思考的典型例子

这就是小模型很典型的问题：

它不是完全不会思考，而是经常把简单问题复杂化，然后在复杂化的过程中跑偏。

这次测试里，它生成了 962 个 token，速度大约是 27.68 tokens/s，总耗时 36 秒。

所以我对本地小模型的定位不是"代替云端大模型"，而是：

让 NAS 变成一个随时可用、低成本、能处理大量重复任务的本地 AI 工具箱。

五、TTS：AngeVoice 已经能接入真实场景

除了跑小模型，这台机器还跑了我自己的 TTS 项目：AngeVoice Studio。

AngeVoice Studio - 中文语音合成控制台

它是一个中文语音合成控制台，支持音色选择、语速调节、Web 前端操作、流式播放、参考音频克隆和本地 API 调用。

基于当前已实现能力，后续可以继续尝试接入这些方向：

接入 Agent，让文字回复变成语音；
接入类似"小智"的语音助手；
做有声书生成；
做本地语音播报；
测试参考音频克隆和流式播放。

这里我也做了一个对 NAS 用户比较重要的功能：

空闲 10 分钟后自动卸载模型，释放显存；下次调用时再自动唤醒加载。

因为 NAS 是长期在线设备，如果模型一直常驻，占用显存和功耗都不太合适。

不过本地 TTS 也有边界。

为了追求实时对话，模型不能选得太大。参数更大的模型可能音质更好、情感更自然，但延迟也会更高，对显存和 CPU 的压力也更大。

所以实时语音对话更适合优先保证延迟和稳定性；有声书这种长文本场景，可以接受慢一点，换取更稳定的输出。

后续我更想优化的是语音质量和可控性，比如模型分词器、多音字词典、自定义词典、专有名词和角色名读音，以及长文本断句和语气。

六、这套方案适合谁？

我觉得它适合这几类人：

想低成本组 NAS；
手里有闲置内存、硬盘或旧平台；
愿意折腾闲鱼二手硬件；
想体验本地小模型、TTS、Embedding；
想做 ComfyUI、LoRA、Agent 相关工作流；
不追求极致性能，更看重性价比和可玩性。

但它不适合这些人：

完全不想折腾；
想买回来就稳定用几年；
对噪音、功耗、外观非常敏感；
希望直接跑大模型；
不愿意处理 BIOS、驱动、散热、Docker 问题。

这套机器最大的价值不是性能多强，而是用很低的成本，把 NAS、本地 AI、TTS 服务和数据集预处理环境整合到了一起。

七、最后说点现实的

这台机器已购配件花了 916 元，但这不代表完整 NAS 只需要 916 元。

硬盘和内存都没算进去。

你要问我内存成本怎么办？只能说，我的非主力机器正在角落里问我：

"我怎么突然少了两条内存？"

所以这套方案更适合手头本来就有一些闲置硬件的人折腾。

如果你现在从零开始，把机箱、主板、CPU、显卡、内存、硬盘全部重新买一遍，那它就不一定还算低成本了。

我的建议是：

有闲置硬件，可以折腾；缺什么补什么，可以考虑；如果所有东西都要现买，就一定要先算清楚总账。

这篇先记录到这里。

这不是一套适合所有人的方案，也不是"900 元买到全能服务器"的神话。它更适合手里本来就有一些闲置硬件，又愿意花时间折腾的人。

对我来说，这次升级最大的意义不是性能提升了多少，而是终于从 4 盘位蜗牛星际，换成了一台更适合继续扩展、也更适合本地 AI 工作流的 NAS。