Google DeepMind의 Gemma 4는 E2B·E4B·31B·26B A4B 4가지 모델로 구성된 멀티모달 LLM 패밀리다. 모든 변형이 이미지 입력을 지원하며, 로컬 어텐션(슬라이딩 윈도우)과 글로벌 어텐션 레이어를 교차 배치하는 구조를 공유한다. 다양한 파라미터 규모로 제공되어 로컬 배포부터 서버 배포까지 유연하게 선택할 수 있다.

💡 실무 포인트: 멀티모달 로컬 모델이 필요하다면 Gemma 4의 E2B(경량)부터 31B(고성능)까지 용도별로 선택할 수 있다. 슬라이딩 윈도우 어텐션 구조를 이해하면 긴 문맥 처리 시 성능 예측에 도움이 된다.