Gemma 4 비주얼 가이드
Google DeepMind의 Gemma 4는 E2B·E4B·31B·26B A4B 4가지 모델로 구성된 멀티모달 LLM 패밀리다. 모든 변형이 이미지 입력을 지원하며, 로컬 어텐션(슬라이딩 윈도우)과 글로벌 어텐션 …
Google DeepMind의 Gemma 4는 E2B·E4B·31B·26B A4B 4가지 모델로 구성된 멀티모달 LLM 패밀리다. 모든 변형이 이미지 입력을 지원하며, 로컬 어텐션(슬라이딩 윈도우)과 글로벌 어텐션 …
Google DeepMind가 Gemini 3 기술 기반의 차세대 오픈 모델 Gemma 4를 발표했다. E2B, E4B, 26B, 31B 네 가지 크기로 제공되며, 모바일·IoT부터 개인용 GPU 환경까지 폭넓은 …
Google 주도의 에이전트 간 통신 표준 A2A Protocol이 v1.0에 도달하면서 거의 전체가 재설계되었다. proto 파일이 정규 스펙으로 격상되고 gRPC/HTTP/JSON-RPC 멀티 바인딩을 지원하며 …
Google 주도의 에이전트 간 통신 표준 A2A Protocol이 v1.0에 도달하면서 프로토콜 거의 전체가 재설계됐다. proto 파일이 정규 스펙으로 격상되어 gRPC/HTTP/JSON-RPC 멀티 바인딩을 …
대시캠 등 영상 파일에서 자연어로 장면을 검색해 해당 구간을 자동으로 잘라내는 의미 기반 검색 시스템이다. Google Gemini Embedding 2 모델로 비디오 자체를 벡터로 임베딩하고, ChromaDB에 …
Google Research가 발표한 TurboQuant는 LLM의 KV 캐시 압축과 벡터 검색에 적용 가능한 양자화 알고리즘 세트다. PolarQuant로 데이터를 고품질 압축한 뒤 QJL 알고리즘으로 잔여 오차 …
Google의 최신 이미지 생성 모델 Gemini 3 Pro Image(코드명 Nano Banana Pro)가 건축 시각화 업계에 큰 파장을 일으키고 있다. 기존 AI 도구와 차별화되는 핵심은 도면 해독 능력 …
Google이 검색 결과에서 언론사가 작성한 뉴스 헤드라인을 AI가 생성한 제목으로 교체하는 실험을 전통적인 “10개의 파란 링크” 검색에서도 시작했다. The Verge는 자사가 작성하지 않은 헤드라인이 …
Google AI Studio가 프롬프트만으로 프로덕션급 애플리케이션을 제작할 수 있는 풀스택 환경으로 업그레이드되었다. Antigravity 코딩 에이전트 기반으로 멀티플레이어, 외부 라이브러리, Firebase …
MCP, A2A, UCP, AP2, A2UI, AG-UI 등 6가지 AI 에이전트 프로토콜을 하나의 레스토랑 공급망 에이전트 시나리오로 묶어 단계별로 설명하는 Google의 가이드다. Agent …
프롬프트만으로 프로덕션급 애플리케이션을 제작할 수 있도록 Google AI Studio가 업그레이드되었다. Google Antigravity 코딩 에이전트를 기반으로 멀티플레이어 경험, 외부 라이브러리 설치, 데이 …
Google Labs가 자연어를 고품질 UI 디자인으로 변환하는 AI 네이티브 소프트웨어 디자인 캔버스 Stitch를 전면 재구성했다. 와이어프레임 없이 비즈니스 목표나 사용자 경험을 설명하면 디자인이 생성되는 “ …
Google이 MCP, A2A, UCP, AP2, A2UI, AG-UI 등 6가지 AI 에이전트 프로토콜을 하나의 레스토랑 공급망 시나리오로 통합 설명하는 개발자 가이드를 공개했다. 각 프로토콜이 해결하는 문제를 …
Google Labs가 자연어를 고품질 UI 디자인으로 변환하는 AI 네이티브 디자인 캔버스 Stitch를 전면 재구성해 공개했다. 와이어프레임 없이 비즈니스 목표나 사용자 경험을 설명하면 디자인이 생성되는 “바이 …
Chrome DevTools MCP 서버가 코딩 에이전트가 활성 브라우저 세션에 직접 연결할 수 있도록 개선되었다. 에이전트가 로그인된 세션을 재사용하거나 DevTools의 활성 디버깅 세션에 접근할 수 있으며, …
구글지도가 Gemini 모델을 결합한 대화형 탐색(Ask Maps)과 몰입형 내비게이션을 발표, 10년 만의 최대 개편. Ask Maps는 복잡한 실제 질문에 대화형으로 답변하며, 3억 개 이상의 장소 정보와 5억 …
구글 지도가 Gemini 모델을 결합하여 대화형 탐색 기능 Ask Maps와 몰입형 내비게이션이라는 10년 만의 최대 개편을 발표했다. Ask Maps는 3억 개 이상의 장소 정보와 5억 명 이상의 기여자 리뷰를 …
Google이 텍스트, 이미지, 비디오, 오디오, 문서를 하나의 임베딩 공간에 매핑하는 최초의 완전 멀티모달 임베딩 모델을 퍼블릭 프리뷰로 공개했다. Gemini 아키텍처 기반으로 100개 이상의 언어에서 시맨틱 …
Google이 텍스트, 이미지, 비디오, 오디오, 문서를 하나의 임베딩 공간에 매핑하는 최초의 완전 멀티모달 임베딩 모델을 퍼블릭 프리뷰로 공개했다. Gemini 아키텍처 기반으로 100개 이상의 언어에서 시맨틱 …
Google Workspace API 전체를 단일 CLI로 제어할 수 있는 도구로, Drive·Gmail·Calendar·Sheets·Docs·Chat·Admin 등을 지원한다. Google Discovery …
책에 밑줄 친 문장을 촬영하면 AI(Gemini Vision)가 밑줄·형광펜 표시를 인식하여 문장을 추출하고 디지털 서재로 정리해주는 iOS 앱이다. Apple VisionKit → GPT → Gemini 순으로 …
Google 내부 직원들이 Pentagon과의 협력 확대에 우려를 표하며, 군사용 AI 프로젝트에 대한 명확한 윤리적 한계 설정을 요구하고 있다. Anthropic 사태 이후 AI 업계 전반으로 확산되는 움직임으로 …
Google이 10년 넘게 “API 키는 비밀이 아니며 공개해도 안전하다"고 안내해왔으나, Gemini API 활성화 이후 동일 키가 민감한 인증 수단으로 변모했다. 기존에 Google Maps, Firebase …
Google이 Nano Banana Pro의 고급 기능과 Gemini Flash의 속도를 결합한 Nano Banana 2를 공개했다. 고속 이미지 생성과 편집 반복이 가능하며, 세계 지식 기반 렌더링, 정확한 텍스 …
Google이 10년 넘게 API 키는 비밀이 아니며 공개해도 안전하다고 안내해 왔으나, Gemini API 활성화 이후 동일 키가 민감한 인증 수단으로 변했다. 기존에 Google Maps, Firebase 등에 …
Google의 Nano Banana Pro의 고급 기능과 Gemini Flash의 속도를 결합한 이미지 생성 모델. 고속 이미지 생성과 편집 반복이 가능하며, 세계 지식 기반 렌더링, 정확한 텍스트 표현 및 번역, …
SEO 전문가 Dan Petrovic이 Google Gemini API의 원시 데이터를 분석해 Google AI 검색(Gemini 기반)이 웹페이지에서 어떤 문장을 답변 근거(grounding snippet)로 뽑 …
Google이 10년 넘게 API 키는 비밀이 아니며 공개해도 안전하다고 안내해 왔으나, Gemini API 활성화 이후 동일 키가 민감한 인증 수단으로 변했다. 기존에 Google Maps, Firebase 등에 …
번아웃과 불안장애 치료 경험을 바탕으로 만든 2분 웹앱이다. 3개의 질문으로 막연한 불안을 구체화하고 그 생각과 거리를 둘 수 있도록 설계했다. 바닐라JS로 만들었고, AI는 Gemini를 연동했다. AI를 웰니스 …
SEO 전문가 Dan Petrovic(DEJAN)이 Google Gemini API의 원시 데이터를 분석해 Google AI 검색(Gemini 기반)이 웹페이지에서 어떤 문장을 답변 근거(grounding …