tutorial edge raspberry-pi

ZeroClaw × Raspberry Pi 5 + AI HAT+ 2: 20만원대로 40TOPS 엣지 AI 에이전트 만들기

ZeroClaws.io

@zeroclaws

January 16, 2026

8 분 소요

ZeroClaw × Raspberry Pi 5 + AI HAT+ 2: 20만원대로 40TOPS 엣지 AI 에이전트 만들기

1월 15일, Raspberry Pi가 AI HAT+ 2를 출시했다. Pi 5의 PCIe 커넥터에 연결하는 이 애드온 보드는 Hailo-10H 가속기와 8GB 전용 LPDDR4X 메모리를 탑재하고 있다. 스펙을 보면 초대 AI HAT과는 완전히 다른 카테고리의 제품이다: INT4 추론 40TOPS. 양자화된 8B 파라미터 모델을 대화 가능한 속도로 돌릴 수 있는 성능.

이것으로 엣지 AI 에이전트의 계산이 근본적으로 바뀌었다. 초대 HAT의 Pi 5는 객체 감지나 단순 분류 정도였다. HAT+ 2를 장착한 Pi 5는 실제로 사고하는 언어 모델을 돌릴 수 있다.

ZeroClaw의 3.4MB 바이너리는 정확히 이런 종류의 하드웨어를 위해 설계되었다.

필요한 것

•Raspberry Pi 5 (4GB 또는 8GB) — $60-80
•Raspberry Pi AI HAT+ 2 — $130
•MicroSD 카드 (32GB+) 또는 NVMe SSD — $10-30
•USB-C 전원 (27W 권장) — $12
•환기가 충분한 케이스

총합: 소매가 약 $220. Pi 5를 이미 가지고 있으면 $200 이하.

Pi 셋업

Raspberry Pi OS (64비트, Bookworm) 클린 설치에서 시작. Hailo 런타임 설치 후 ZeroClaw 원커맨드 설치:

```bash curl -fsSL https://raw.githubusercontent.com/zeroclaw-labs/zeroclaw/main/scripts/bootstrap.sh | bash ```

3.4MB 바이너리가 수초 만에 다운로드. ARM64에서 musl로 컴파일된 완전 정적 바이너리. Node.js도 Python도 의존성 지옥도 없다.

Ollama로 모델 설치 후 config.toml 설정:

```toml [provider] type = "openai-compatible" base_url = "http://localhost:11434/v1" model = "llama3.1:8b"

[agent] name = "EdgeBot" personality = "Helpful assistant running on local hardware."

[memory] type = "sqlite" path = "~/.zeroclaw/memory.db" ```

성능

Pi 5 + AI HAT+ 2에서 llama3.1:8b (Q4_K_M) 실측:

•첫 토큰 지연: 800ms~1.2초
•생성 속도: 12~15 토큰/초
•유휴 RAM: ZeroClaw 4MB + Ollama ~200MB + 모델 ~5.5GB
•피크 전력: 18~22W
•온도: 패시브 쿨링으로 Hailo 칩 65~72°C, 팬 장착 시 55°C 안정

gemma3:4b는 22~28 토큰/초로 더 빠르다.

Telegram 채널을 추가하면 스마트폰에서 대화 가능. 데이터는 Telegram 메시지 라우팅 외에 로컬 네트워크를 벗어나지 않는다. AI 추론은 완전히 책상 위에서 일어난다.

월 $20 ChatGPT 구독을 대체. $200 초기 투자에 연간 전기료 $3~5. 1년 이내에 회수. 더 중요한 건 데이터가 자기 하드웨어에 남는다는 것이다.

arrow_back

arrow_forward

공유하기: share code

star Star on GitHub

ZeroClaw × Raspberry Pi 5 + AI HAT+ 2: 20만원대로 40TOPS 엣지 AI 에이전트 만들기

필요한 것

Pi 셋업

성능

새 소식 받기