2026 年自架 AI：完整的隱私優先技術堆疊

幾年前，自架 AI 意味著在一台 3,000 美元的工作站上執行一個 7B 參數模型，然後等待 30 秒才能得到每個回應。那是一種業餘愛好者的練習，不是雲端服務的實際替代方案。

這已經改變了。更好的量化技術、更高效的模型，以及像 Ollama 這樣的工具，讓本地 AI 在消費者硬體上真正可用。而 ZeroClaw 的 4MB 佔用空間意味著代理執行環境本身幾乎不增加任何資源需求。

在 2026 年，自架 AI 是由真實顧慮驅動的實際選擇：資料主權、GDPR 合規、企業智慧財產保護，以及擁有而非租用工具的簡單願望。以下是如何建立完整的技術堆疊。

三個元件

架構是三個工具，每個都做好一件事。

ZeroClaw 是 AI 代理執行環境。它處理跨聊天頻道的訊息路由，在本地 SQLite 資料庫中管理對話記憶，並在代理需要採取行動時執行工具。它使用 4MB 記憶體，以單一二進位檔形式發布。它是將一切連結在一起的結締組織。

Ollama 是本地 LLM 伺服器。它下載和管理開放權重模型，自動處理量化，並公開 ZeroClaw 知道如何與之通訊的簡單 API。你不需要了解模型格式、量化級別或推理優化。你執行 `ollama pull llama3.1:8b` 然後它就能用了。

Tailscale 是安全網路層。它在你的裝置之間建立加密的 WireGuard 網格，讓你可以從世界任何地方的手機或筆電存取你的 AI 助理，而不需要向網路暴露任何連接埠。不需要動態 DNS，不需要防火牆規則，不需要管理 VPN 伺服器。

這三個工具一起形成一個完全私密的 AI 助理，可以從任何裝置使用，零資料離開你的網路。

選擇你的硬體

在預算端（50-100 美元），配備 8GB 記憶體的 Raspberry Pi 5 可以執行 1.5B-4B 參數範圍的小型模型。回應時間比雲端服務慢，但對於不需要前沿級推理的簡單查詢和任務，它完全可用。配備 16GB 記憶體的舊筆電可以合理地處理 7B-8B 參數模型。

在中端（200-400 美元），Mac Mini M2 很難被超越。它安靜、耗電少，可以舒適地處理 8B-13B 參數模型，而且 Apple Silicon 的統一記憶體架構使其在推理方面特別高效。配備 32GB 記憶體的二手 ThinkPad 是一個可以很好地執行 13B 模型的便攜替代方案。

對於最佳效能（500 美元以上），任何配備 NVIDIA RTX 3060 或更好顯示卡的機器都能在大型模型上提供快速推理。Mac Studio M2 Ultra 可以舒適地執行 70B 參數模型——在那個級別，本地模型品質對於大多數任務接近前沿雲端模型。

步驟一：設定 Ollama

```bash curl -fsSL https://ollama.com/install.sh | sh

ollama pull llama3.1:8b # 最佳品質/速度平衡 ollama pull qwen3:8b # 強大的多語言支援 ollama pull deepseek-r1:7b # 最適合推理任務 ```

在繼續之前驗證它是否正常工作：`ollama run llama3.1:8b "Hello"`。如果你得到回應，Ollama 就準備好了。

步驟二：安裝和設定 ZeroClaw

```bash curl -fsSL https://raw.githubusercontent.com/zeroclaw-labs/zeroclaw/main/scripts/bootstrap.sh | bash ```

設定 `~/.config/zeroclaw/config.toml`：

```toml [ai] provider = "ollama" model = "llama3.1:8b" endpoint = "http://localhost:11434"

[memory] backend = "sqlite" path = "~/.local/share/zeroclaw/memory.db"

[channels.telegram] token = "YOUR_BOT_TOKEN" allowed_users = [123456789] ```

用 `zeroclaw start` 啟動它。此時你有一個可用的私密 AI 助理——但只能從你的本地網路存取。下一步解決這個問題。

步驟三：用 Tailscale 實現安全遠端存取

Tailscale 在你的裝置之間建立加密的 WireGuard 網格。設定很簡單：

```bash # 在你的 AI 伺服器上 curl -fsSL https://tailscale.com/install.sh | sh sudo tailscale up

# 記下你的 Tailscale IP tailscale ip -4 ```

在你的手機和筆電上也安裝 Tailscale。一旦你所有的裝置都在同一個 Tailscale 網路上，它們就可以通過任何網路連線安全地相互連接——家庭 WiFi、行動數據、咖啡廳網路、企業網路。沒有連接埠暴露在網路上，沒有防火牆規則需要設定。

你的 Telegram 機器人已經可以從任何地方使用，因為 Telegram 的伺服器會轉發訊息。Tailscale 是用於從你自己的裝置直接存取 ZeroClaw 的 API 或 Web 閘道。

你實際上得到了什麼

這個技術堆疊的實際結果是一個行為像雲端服務但完全在你的硬體上執行的 AI 助理。你的提示和回應永遠不會離開你的網路。對話歷史存放在你機器上的 SQLite 檔案中——你可以隨時備份、移動、檢查或刪除它。如果你在受監管的行業，資料永遠不會離開你的管轄範圍。如果你在處理專有程式碼，它永遠不會接觸第三方伺服器。

成本比較很鮮明。ChatGPT Plus 和 Claude Pro 每人每月都是 20 美元。在 Raspberry Pi 5 上自架每月大約花費 2 美元的電費。在 Mac Mini 上，大約 5 美元。一年下來，每人節省 180-230 美元，同時給你完整的資料所有權。

維護工作量很少。ZeroClaw 用一個指令更新。Ollama 用 `ollama pull` 更新模型。Tailscale 預設自動更新。你的整個狀態是兩個檔案：`memory.db` 和 `config.toml`。備份這些，你就可以在幾分鐘內在新硬體上恢復整個設置。

這個技術堆疊適合誰

這個設置對於不想讓程式碼通過第三方伺服器的專有程式碼庫開發者最有意義。對於處理敏感客戶資料的小型企業。對於有合規要求的醫療和法律專業人員。對於任何仔細考慮過資料去向並決定寧願把它留在家裡的人。

工具已經成熟，設置大約需要 15 分鐘，結果是一個你完全擁有的 AI 助理。唯一值得問的問題是你為什麼還在把資料發送到雲端。