1월 15일, Raspberry Pi가 AI HAT+ 2를 출시했다. Pi 5의 PCIe 커넥터에 연결하는 이 애드온 보드는 Hailo-10H 가속기와 8GB 전용 LPDDR4X 메모리를 탑재하고 있다. 스펙을 보면 초대 AI HAT과는 완전히 다른 카테고리의 제품이다: INT4 추론 40TOPS. 양자화된 8B 파라미터 모델을 대화 가능한 속도로 돌릴 수 있는 성능.
이것으로 엣지 AI 에이전트의 계산이 근본적으로 바뀌었다. 초대 HAT의 Pi 5는 객체 감지나 단순 분류 정도였다. HAT+ 2를 장착한 Pi 5는 실제로 사고하는 언어 모델을 돌릴 수 있다.
ZeroClaw의 3.4MB 바이너리는 정확히 이런 종류의 하드웨어를 위해 설계되었다.
필요한 것
- •Raspberry Pi 5 (4GB 또는 8GB) — $60-80
- •Raspberry Pi AI HAT+ 2 — $130
- •MicroSD 카드 (32GB+) 또는 NVMe SSD — $10-30
- •USB-C 전원 (27W 권장) — $12
- •환기가 충분한 케이스
총합: 소매가 약 $220. Pi 5를 이미 가지고 있으면 $200 이하.
Pi 셋업
Raspberry Pi OS (64비트, Bookworm) 클린 설치에서 시작. Hailo 런타임 설치 후 ZeroClaw 원커맨드 설치:
```bash curl -fsSL https://raw.githubusercontent.com/zeroclaw-labs/zeroclaw/main/scripts/bootstrap.sh | bash ```
3.4MB 바이너리가 수초 만에 다운로드. ARM64에서 musl로 컴파일된 완전 정적 바이너리. Node.js도 Python도 의존성 지옥도 없다.
Ollama로 모델 설치 후 config.toml 설정:
```toml [provider] type = "openai-compatible" base_url = "http://localhost:11434/v1" model = "llama3.1:8b"
[agent] name = "EdgeBot" personality = "Helpful assistant running on local hardware."
[memory] type = "sqlite" path = "~/.zeroclaw/memory.db" ```
성능
Pi 5 + AI HAT+ 2에서 llama3.1:8b (Q4_K_M) 실측:
- •첫 토큰 지연: 800ms~1.2초
- •생성 속도: 12~15 토큰/초
- •유휴 RAM: ZeroClaw 4MB + Ollama ~200MB + 모델 ~5.5GB
- •피크 전력: 18~22W
- •온도: 패시브 쿨링으로 Hailo 칩 65~72°C, 팬 장착 시 55°C 안정
gemma3:4b는 22~28 토큰/초로 더 빠르다.
Telegram 채널을 추가하면 스마트폰에서 대화 가능. 데이터는 Telegram 메시지 라우팅 외에 로컬 네트워크를 벗어나지 않는다. AI 추론은 완전히 책상 위에서 일어난다.
월 $20 ChatGPT 구독을 대체. $200 초기 투자에 연간 전기료 $3~5. 1년 이내에 회수. 더 중요한 건 데이터가 자기 하드웨어에 남는다는 것이다.