PDF 논문 RAG, 텍스트만으로 충분할까? - Gemini embedding 002 임베딩 검색 실험
Gemini embedding-2-preview의 네이티브 멀티모달 임베딩으로 학술 논문 PDF의 텍스트 임베딩과 이미지 임베딩을 비교 실험한 결과다. 같은 페이지의 텍스트-이미지 코사인 유사도 평균이 0.642로 …
Gemini embedding-2-preview의 네이티브 멀티모달 임베딩으로 학술 논문 PDF의 텍스트 임베딩과 이미지 임베딩을 비교 실험한 결과다. 같은 페이지의 텍스트-이미지 코사인 유사도 평균이 0.642로 …
법률 AI 분야에서 RAG와 온톨로지의 역할 차이를 명확히 정의한 글이다. RAG는 외부 문서 검색으로 최신 정보 접근성을 높이는 반면, 온톨로지는 검색된 자료 내 개념들을 같은 의미 체계로 정렬하고 법적 관계를 …
한국 법령 정보를 AI 에이전트가 소비하기 쉬운 JSON 형태로 제공하는 REST API 서비스다. 국가법령정보센터 제공 법령 99.9% 이상을 수록하며, 매주 토요일 최신 동기화한다. PostgreSQL + …
Gemini embedding-2-preview 네이티브 멀티모달 임베딩으로 학술 논문 PDF의 텍스트 임베딩과 이미지 임베딩을 비교 실험한 결과다. 같은 페이지의 텍스트-이미지 코사인 유사도 평균이 0.642로, …
Shopify가 수백만 개의 비정형 커머스 데이터를 구조화하기 위해 One-Shot LLM 방식에서 DSPy 기반 멀티 에이전트 아키텍처로 전환한 과정을 공유했다. GPT-4/5급 대형 모델 대신 자체 호스팅된 …
RAG와 온톨로지의 역할을 법률 AI 관점에서 구분한 글이다. RAG는 외부 문서 검색으로 최신 정보 접근성을 높이는 데 강점이 있고, 온톨로지는 검색된 자료 안의 개념들을 동일 의미 체계로 정렬하고 법적 관계를 …
기존 메모리 벤치마크(LoCoMo, LongMemEval, MemoryAgentBench 등)가 ‘과거 대화에서 답을 찾을 수 있는가’라는 검색 성능만 측정한다는 한계를 지적하고, 에이전트가 자신의 지식 상태를 인 …
고급 정비소의 전화 응답 부재로 인한 매출 손실을 해결하기 위해, RAG 기반 AI 리셉셔니스트 ‘Axle’을 개발한 사례다. 웹사이트에서 수집한 실제 서비스·가격 정보를 근거로 정확한 견적을 안내한다. 다만 커뮤 …
Claude Code 월 구독 후 3D 그래픽, RAG, 뉴스레터 자동화 등을 사전 지식 없이 몇 시간 만에 구현한 경험기다. 코드를 한 줄도 들여다보지 않아도 “돌아가는” 수준을 넘는 결과물이 나오며, 하루 종일 …
2022년 TIL 노트 앱에서 출발해, 키워드나 프롬프트를 입력하면 AI가 웹 검색과 노트 검색을 수행해 자동으로 노트를 작성하는 지식관리 플랫폼으로 진화했다. AI 에이전트가 리서치부터 작성까지 담당하는 개인 지 …
Claude Code나 OpenClaw 같은 AI 에이전트의 세션 간 기억 상실 문제를 해결하는 영구 메모리 시스템이다. MEMORY.md 단일 파일의 한계를 넘어 구조화된 메모리 관리를 제공하며, 별도 인프라 없 …
부동산 특화 AI를 구축하면서 겪은 GPT, Claude 등 모델별 성능 차이와 한계를 공유한다. 범용 LLM은 부동산 가격정보가 부정확하고, 과거 데이터를 현재인 양 제시하거나 근거 없는 정보를 사실처럼 전달하는 …
웹페이지, GitHub 레포, 논문, 유튜브 영상을 AI로 요약해 검색 가능한 형태로 저장하는 크롬 확장이다. 원래 n8n + Gemini + Obsidian으로 구축한 개인 자동화를 확장 형태로 재구현했으며, …
사내 다양한 앱의 정보를 통합 관리하는 AI 기반 검색 및 어시스턴트 플랫폼이다. Google Drive, Gmail, Slack, Confluence, Jira 등 주요 협업 도구를 연결하고, BM25 및 …
부동산 도메인 특화 AI를 개발하면서 경험한 GPT, Claude 등 모델별 차이점을 정리한 글이다. 범용 LLM은 부동산 관련 답변에서 과거 데이터를 현재인 양 제시하거나, 가격정보가 완전히 틀리는 등 도메인 특 …
사내 다양한 앱(Google Drive, Gmail, Slack, Confluence, Jira 등)의 정보를 통합 관리하는 AI 기반 검색 및 어시스턴트 플랫폼이다. BM25 및 pgvector 기반의 전문 검색 …
Meta, Google, Spotify, Airbnb 등 글로벌 테크 기업의 기술 블로그 RSS 피드를 자동으로 수집하고, AI 기반의 한국어 핵심 요약을 제공하는 서비스다. Frontend, Backend, …
Meta, Google, Spotify, Airbnb 등 글로벌 테크 기업의 기술 블로그 RSS 피드를 자동 수집하고, AI 기반 한국어 핵심 요약을 제공하는 서비스다. Frontend, Backend, Data, …
클로드 코드의 세션 간 컨텍스트 유실 문제를 해결하기 위해 로컬 검색 엔진 QMD와 /recall 스킬을 결합한 메모리 시스템을 구축한 사례다. QMD는 Obsidian 볼트를 인덱싱하는 로컬 검색 엔진으로, …
외부 도구 호출 시 대량의 원시 데이터가 컨텍스트 윈도우를 빠르게 소모하는 문제를 해결하는 MCP 서버이다. Claude Code와 도구 출력 사이에서 데이터를 압축·필터링하여 315KB를 5.4KB로 축소(98% …
SEO 전문가 Dan Petrovic이 Google Gemini API의 원시 데이터를 분석해 Google AI 검색(Gemini 기반)이 웹페이지에서 어떤 문장을 답변 근거(grounding snippet)로 뽑 …
SEO 전문가 Dan Petrovic(DEJAN)이 Google Gemini API의 원시 데이터를 분석해 Google AI 검색(Gemini 기반)이 웹페이지에서 어떤 문장을 답변 근거(grounding …