Google DeepMind가 Gemini 3 기술 기반의 차세대 오픈 모델 Gemma 4를 발표했다. E2B, E4B, 26B, 31B 네 가지 크기로 제공되며, 모바일·IoT부터 개인용 GPU 환경까지 폭넓은 배포를 지원한다. 매개변수당 지능 효율을 극대화한 구조로 설계되었으며, reasoning, 멀티모달, 툴 호출 기능을 통합 지원한다. Hugging Face에서 양자화 모델을 받을 수 있고, Unsloth 가이드도 제공된다.
커뮤니티 의견
- @eoeoe: “120b 루머는 아쉽게도 아니었네요”
관련 레퍼런스
💡 실무 포인트: Gemma 4 E2B/E4B 모델은 모바일·엣지 디바이스에 배포 가능한 크기로, 온디바이스 AI 기능 구현 시 유력한 후보다. temperature=1.0, top_p=0.95, top_k=64 파라미터를 권장한다.