처음 로컬 AI 에이전트를 세팅하는 사람이 가장 많이 묻는 질문은 소프트웨어가 아니라 하드웨어다. "뭘 사야 하나요?" 솔직히, 뭘 하려느냐에 달렸다.
1티어: $50 이하
Pi 4 (4GB) + 클라우드 API. ZeroClaw는 잘 돌아가지만 CPU 추론은 느리다. 클라우드 API 월 $5~15.
2티어: $150~250 — 엣지 AI 스위트 스팟
Pi 5 (8GB) + AI HAT+ 2. 40TOPS. 8B 모델 12~15 tok/s. 완전 오프라인 가능. 약 $230, 이후 비용 제로.
3티어: $300~500 — 중고 GPU
데스크톱 + 중고 RTX 3090. 24GB VRAM. 양자화 30B 모델 20+ tok/s. 8B에서 30B로의 품질 점프가 체감된다. 약 $400~450.
4티어: $500~800 — 현세대 스위트 스팟
RTX 4070 Ti Super (16GB). 32B Q4 모델 25~35 tok/s. 일상용 AI 워크스테이션.
5티어: $800+ — 로컬 성능 천장
RTX 4090 (24GB) 또는 듀얼 3090. 양자화 70B 모델 15~20 tok/s——클라우드 API 응답 속도에 필적.
ZeroClaw 팩터
모든 티어에서 ZeroClaw 오버헤드는 무시 가능. 3.4MB 바이너리, 5MB 미만 RAM. 하드웨어 예산이 전부 모델 추론에 사용되고 프레임워크 오버헤드에 낭비되지 않는다.