Claw-Empire — CEO의 책상에서 지휘하는 AI 에이전트 제국

Claw-Empire는 사용자가 가상 회사의 CEO가 되어 여러 AI 에이전트들을 지휘하고 협업시키는 로컬 우선(Local-first) AI 에이전트 오피스 시뮬레이터다. 단순한 채팅 UI를 넘어, 픽셀 아트 기반의 오피스 인터페이스를 통해 AI들의 업무 수행 과정을 실시간으로 모니터링할 수 있다.

커뮤니티 의견

  • @sea715: “메인테이너이신가요? Show GN이 더맞을거 같기도합니다”

💡 실무 포인트: 멀티 에이전트 오케스트레이션의 시각화 방법론을 참고할 수 있다. 에이전트 간 협업 구조를 직관적으로 보여주는 UI는 디버깅과 모니터링에 유용하다.

Gemini Embedding 2: 최초의 네이티브 멀티모달 임베딩 모델

Google이 텍스트, 이미지, 비디오, 오디오, 문서를 하나의 임베딩 공간에 매핑하는 최초의 완전 멀티모달 임베딩 모델을 퍼블릭 프리뷰로 공개했다. Gemini 아키텍처 기반으로 100개 이상의 언어에서 시맨틱 의도를 포착하며, RAG·시맨틱 검색·감성 분석·데이터 클러스터링 등에 활용 가능하다.

💡 실무 포인트: 텍스트와 이미지를 동시에 검색해야 하는 멀티모달 RAG 파이프라인을 구축할 때, 별도의 임베딩 모델을 조합할 필요 없이 단일 모델로 통합할 수 있는 기회다.

HuggingFace 오픈 LLM 리더보드 1위를 차지한 방법 — 두 개의 게이밍 GPU로, 가중치 변경 없이

David Noel Ng가 Qwen2-72B(총 80개 레이어)의 중간 7개 레이어를 복제해 재조합하는 방법으로, 어떠한 학습이나 가중치 수정 없이 2024년 HuggingFace Open LLM 리더보드 1위를 달성했다. RTX 4090 두 장으로 수행된 이 실험은 중간 레이어를 반복 실행하는 구조만 변경한 것으로, LLM 벤치마크의 신뢰성에 의문을 제기하는 동시에 트랜스포머 내부 구조에 대한 새로운 통찰을 제공한다.

커뮤니티 의견

  • @GN⁺: “‘Goliath가 작동했다는 사실 자체가 놀랍다’는 부분이 핵심. 전체 transformer 스택을 복제하는 건 좋은 아이디어가 아님을 실험적으로 확인”

💡 실무 포인트: LLM 벤치마크 점수만으로 모델을 평가하는 것은 위험하다. 실제 서비스 태스크에 대한 자체 평가 기준을 수립하고, 벤치마크는 참고 지표로만 활용하자.

Karpathy, Autoresearch로 nanochat을 2일간 자동 튜닝해 GPT-2 학습 시간 11% 단축

Karpathy가 공개한 Autoresearch 에이전트가 depth=12 모델 기준으로 약 2일간 자율적으로 약 700개의 변경을 시도하여, 검증 손실을 개선하는 약 20개의 유효한 변경사항을 발견했다. AI 에이전트가 연구 자체를 자동화하는 구조로, 학회 제출과 피어 리뷰의 피드백 루프를 자동화한 확장된 강화학습 형태로 볼 수 있다는 분석이 나온다.

커뮤니티 의견

  • @hanje3765: “오토리서치와 에이전트허브 컨셉을 결합하면 그게 진짜 학계와 연구소 아닐까. 확장된 형식의 강화학습같아보였습니다”
  • @xguru: “이 분은 뭔가 다른 삶을 사는 것 같아요”

관련 레퍼런스

💡 실무 포인트: 하이퍼파라미터 튜닝이나 모델 구조 실험을 자동화하려는 팀이라면, Autoresearch의 “자율적 변경 시도 → 검증 → 채택” 패턴을 참고하여 자체 자동 실험 파이프라인을 구축해볼 수 있다.

LangChain 스킬 공개, Claude Code 통과율 25% → 95%로 끌어올린 방법

LangChain이 코딩 에이전트의 성능을 극적으로 향상시키는 “스킬(Skills)” 세트를 공개했다. Claude Code 같은 모델이 LangChain/LangGraph/LangSmith 관련 태스크를 수행할 때, 스킬 없이 25% 정도만 성공하던 것이 스킬 장착 후 95%까지 올라갔다.

💡 실무 포인트: 코딩 에이전트에 도메인 특화 스킬(CLAUDE.md, 커스텀 프롬프트)을 장착하면 정확도가 크게 향상된다. 자체 프로젝트에도 에이전트 전용 컨텍스트 문서를 작성하는 것을 권장한다.

Meta, AI 에이전트용 소셜 네트워크 'Moltbook'의 창립자 2명을 영입

Meta가 AI 에이전트 전용 소셜 네트워크 Moltbook을 인수하며, 창립자 Matt Schlicht와 Ben Parr이 Meta Superintelligence Labs(MSL)에 합류했다. “에이전트 신원 인증 및 연결 기술"을 확보하려는 의도로 보이나, 실제 Moltbook에는 단순한 Twitter OAuth 인증만 있었다는 분석도 있다. OpenAI의 Openclaw 인수에 대한 FOMO 반응이라는 해석도 나온다.

커뮤니티 의견

  • @unqocn: “‘Facebook 피드는 대부분 AI 생성물, Moltbook 피드는 대부분 사람이 AI인 척하는 글이라 묘하게 시너지가 있음’ 촌철살인이네요”

💡 실무 포인트: AI 에이전트 간 통신과 신원 인증은 멀티 에이전트 시스템 설계 시 핵심 과제다. 에이전트 인증 표준이 아직 확립되지 않은 만큼, 자체 시스템 설계 시 인증·권한 모델을 미리 고려해야 한다.

Omni — 업무용 AI 비서 & 검색 플랫폼

사내 다양한 앱(Google Drive, Gmail, Slack, Confluence, Jira 등)의 정보를 통합 관리하는 AI 기반 검색 및 어시스턴트 플랫폼이다. BM25 및 pgvector 기반의 전문 검색과 시맨틱 검색을 결합하여 Unified Search를 제공한다.

💡 실무 포인트: 사내 지식 검색 시스템 구축 시 BM25(키워드) + pgvector(시맨틱) 하이브리드 검색 아키텍처를 참고할 수 있다.

OpenAI, Oracle과의 Stargate 데이터센터 확장 계획 철회

OpenAI가 텍사스 애빌린의 Stargate 데이터센터 확장 계획을 중단하고, 차세대 Nvidia 칩(Vera Rubin)을 사용하는 새 시설에 집중한다. Oracle은 1,000억 달러 이상의 부채 기반 투자로 AI 인프라를 확장 중이지만, Blackwell DC를 완성할 때쯤 효율이 5배 높은 Vera Rubin이 출시될 수 있다는 우려가 있다. GPU 세대 교체 속도가 DC 건설 속도를 앞지르는 상황이다.

커뮤니티 의견

  • @GN⁺: “Nvidia의 rack-scale 머신은 전원과 네트워크만 연결하면 되는 완성형 랙. Oracle이 Vera Rubin 랙을 사서 새 DC에 넣으면 해결될 수 있지만, 이미 Blackwell 계약이 있을 수 있음”

💡 실무 포인트: AI 인프라 투자 시 GPU 세대 교체 주기를 고려한 유연한 아키텍처를 설계해야 한다. 대규모 투자 전 차세대 하드웨어 로드맵을 반드시 검토하자.

page-agent — 코드 1줄로 웹페이지에 AI 에이전트 추가하기

Alibaba가 공개한 page-agent는 <script src="page-agent.js"></script> 한 줄만 삽입하면 기존 웹사이트를 AI 네이티브 앱으로 변환하는 라이브러리다. 브라우저 확장, Python, 헤드리스 브라우저 없이 동작하며, 자연어 지시로 텍스트 기반 DOM을 조작할 수 있다. 북마클릿으로 다른 사이트에서도 바로 테스트할 수 있는 기능이 포함되어 있어 SNS에서 큰 반응을 얻고 있다. 보안 측면의 보완이 필요하다는 의견도 있지만, 기존 웹앱에 AI 기능을 즉시 추가할 수 있다는 점에서 실무 활용 가능성이 높다.

커뮤니티 의견

  • @princox: “이거 SNS 상에서 난리던데.. 함 해봐야겠네요”
  • @arinaru: “대박이네요 당장 활용할수있는 부분이 정말 다양하게 많을것같습니다 보안적인 측면만 개선해서 사용하면 될것같아요”
  • @crawler: “Try on Other Sites에서 드래그하니까 북마크로 추가되네요 처음 보는데 너무 신기하다”

💡 실무 포인트: 내부 어드민 툴이나 레거시 웹앱에 빠르게 AI 인터랙션을 추가하고 싶을 때 page-agent를 PoC 도구로 활용할 수 있다. 단, 프로덕션 적용 시 DOM 접근 범위와 보안 정책을 반드시 검토해야 한다.

Prompt Cultivation: 경험이 프롬프트가 되는 AI 구조에 대한 이야기

1인 개발자가 AI의 프롬프트를 인간이 설계하는 것이 아니라, AI가 자기 경험을 통해 프롬프트를 자율적으로 생성·진화시키는 구조를 제안한 글이다. “프롬프트를 아무리 정교하게 써도 결국 인간이 주입한 것"이라는 한계에서 출발하여, 경험 기반 자기 학습 프롬프트 구조를 탐색한다.

커뮤니티 의견

  • @penza1: “agent의 대부분의 구조가 비슷합니다. claude/cursor로 openclaw라던지 카파시님이 만든 심플 에이전트를 분석해보시는걸 추천 드립니다”

💡 실무 포인트: 에이전트 시스템에서 프롬프트를 하드코딩하기보다, 실행 결과에 따라 프롬프트를 점진적으로 개선하는 피드백 루프를 설계하면 시스템의 자율성과 정확도를 높일 수 있다.

Redox OS, 기여자 서명 정책과 LLM 금지 정책 도입

Redox OS 프로젝트가 코드 기여 시 Certificate of Origin(COO) 서명 정책과 LLM 사용 금지 규정을 채택했다. 모든 코드 변경이 기여자의 명시적 서명과 책임 하에 제출되도록 요구하며, AI 생성 코드의 품질과 저작권 불확실성에 대한 우려가 배경에 있다.

💡 실무 포인트: 오픈소스 프로젝트에 기여할 때 해당 프로젝트의 AI 코드 사용 정책을 반드시 확인하자. LLM 금지 정책을 채택하는 프로젝트가 늘어나는 추세다.

Show GN: Endigest — 글로벌 테크 블로그를 AI로 자동 수집·요약해주는 서비스

Meta, Google, Spotify, Airbnb 등 글로벌 테크 기업의 기술 블로그 RSS 피드를 자동으로 수집하고, AI 기반의 한국어 핵심 요약을 제공하는 서비스다. Frontend, Backend, Infra 등 분야별로 분류하여 필요한 기술 트렌드만 빠르게 파악할 수 있다.

💡 실무 포인트: RSS + AI 요약 파이프라인은 팀 내 기술 트렌드 공유 자동화에 즉시 적용 가능한 패턴이다. 자체 구축도 어렵지 않으므로 사내 기술 뉴스레터 자동화를 검토해보자. — ## 📋 오늘의 실무 적용 포인트 종합 | 주제 | 실무 적용 포인트 | 난이도 | |——|—————–|——–| | Claude Code 리뷰 | AI 코드 리뷰를 CI/CD 파이프라인에 통합하여 리뷰 병목 해소 | ⭐⭐ | | page-agent | 내부 어드민/레거시 웹앱에 AI 인터랙션 PoC 빠르게 추가 | ⭐ | | Amazon AI 코드 승인 | AI 생성 코드 거버넌스 가이드라인 및 책임 소재 정의 | ⭐⭐ | | GPT-5.4 컨텍스트 | 롱 컨텍스트 vs compaction 비용·성능 트레이드오프 실측 | ⭐⭐ | | AI 구독 모델 위기 | 도메인 전문성 기반 서비스 차별화 전략 수립 | ⭐⭐⭐ | | Karpathy Autoresearch | 자동 실험 파이프라인(변경 시도→검증→채택) 구축 | ⭐⭐⭐ | | 문학적 프로그래밍 | AI 생성 코드에 구조화된 주석 전략 도입 | ⭐ | | Meta Moltbook | 멀티 에이전트 시스템의 인증·권한 모델 사전 설계 | ⭐⭐⭐ | | LLM 리더보드 게이밍 | 벤치마크 의존 대신 자체 태스크 기반 모델 평가 체계 구축 | ⭐⭐ | | AMI 세계 모델 | 로보틱스/시뮬레이션 분야에서 세계 모델 연구 동향 추적 | ⭐⭐⭐ | | Gemini Embedding 2 | 멀티모달 RAG에 단일 임베딩 모델 통합 적용 | ⭐⭐ | | AgentHub | 멀티 에이전트 코드 협업 프로토콜 설계 레퍼런스 참고 | ⭐⭐⭐ | | LangChain 스킬 | 에이전트 전용 컨텍스트 문서(CLAUDE.md 등) 작성 | ⭐ | | Redox OS LLM 금지 | 기여 대상 오픈소스의 AI 코드 사용 정책 사전 확인 | ⭐ | | AI 재구현과 카피레프트 | AI 코드 재구현 시 라이선스 리스크 법무 검토 | ⭐⭐ | | Omni | BM25 + pgvector 하이브리드 검색 아키텍처 적용 | ⭐⭐ | | Endigest | RSS + AI 요약 파이프라인으로 사내 기술 뉴스레터 자동화 | ⭐ | — GeekNews에서 선별한 2026-03-11 AI 데일리

누가 먹을 것인가? — Vertical AI 시대, 모든 배가 뜨지는 않는 이유

LLM 기반 AI와 에이전트 워크플로우의 부상으로 SaaS의 경제적 논리가 근본적으로 해체되고 있다. 인텔리전스 비용의 급격한 하락이 엔터프라이즈 기술 시장의 가치 흐름을 재편 중이며, AI 서비스의 비용 우위만으로는 지속 가능한 해자를 구축할 수 없다는 분석이다.

💡 실무 포인트: AI 스타트업을 기획한다면, 단순 비용 절감이 아닌 독자적 데이터·워크플로우 통합·도메인 전문성 등 구조적 해자에 기반한 포지셔닝 전략이 필수적이다.

얀 르쿤, 물리적 세계를 이해하는 AI 구축 위해 10억 달러 조달

Meta 전 최고 AI 과학자 얀 르쿤이 공동 설립한 스타트업 Advanced Machine Intelligence(AMI)가 10억 달러 이상의 투자를 유치했다. AMI는 세계 모델(world model)을 개발해 물리적 세계를 이해하고 추론·계획·기억 기능을 갖춘 AI를 구축하는 것이 목표다. LLM이 텍스트 데이터만 학습하여 실제 세계로부터 배우지 못한다는 한계를 극복하려는 시도로, AGI로 가는 핵심 병목을 해결하려는 방향이다.

커뮤니티 의견

  • @GN⁺: “LLM은 정적 텍스트만 학습하기에 진정한 창의적 발견이나 발명은 거의 불가능. 물리적 세계를 기반으로 한 시공간적 이해 학습이 AGI의 진짜 병목을 해결하려는 시도”

💡 실무 포인트: 세계 모델(world model) 기반 AI는 로보틱스, 자율주행, 시뮬레이션 분야에서 핵심 기술이 될 전망이다. 해당 분야 종사자라면 AMI의 연구 방향을 주시할 필요가 있다.

에이전트 시대에 문학적 프로그래밍을 다시 검토해야 한다

코드와 자연어 설명을 하나의 서술로 엮는 문학적 프로그래밍(Literate Programming)이 AI 코딩 에이전트 시대에 재조명되고 있다. 과거에는 코드와 설명 두 가지를 병행 유지하는 부담이 있었으나, AI 에이전트가 이 핵심 노동을 제거할 수 있다는 주장이다. LLM이 자신의 주석을 직접 남기게 하면 just-in-time 장기 기억 역할을 할 수 있다는 의견과, LLM 주석이 너무 장황해 오히려 컨텍스트를 오염시킨다는 반론이 공존한다.

커뮤니티 의견

  • @GN⁺: “LLM이 자신의 주석을 직접 남기게 하면 일종의 즉시형 장기 기억 역할을 함. PR 리뷰 시 LLM의 사고 과정을 remarks에서 직접 확인할 수 있음”
  • @xguru: “문학적 프로그래밍은 사람이 보고 이해할 수 있도록 문서를 만들듯이 프로그래밍을 하는 것이 목적”

관련 레퍼런스

💡 실무 포인트: AI 에이전트가 생성한 코드의 의도를 추적하기 어렵다면, <summary><remarks> 태그를 활용한 구조화된 주석 전략을 도입해 PR 리뷰 효율을 높여보자.

잇따른 장애 후, Amazon이 AI 지원 코드 변경에 시니어 엔지니어 승인 의무화

AI 코딩 도구 사용과 관련된 서비스 장애가 연이어 발생하자, Amazon이 모든 AI 지원 코드 변경에 대해 시니어 엔지니어의 사전 승인 절차를 도입했다. 내부 노트에 따르면 “베스트 프랙티스와 안전장치가 아직 완전히 확립되지 않은 새로운 도구"의 사용이 장애 원인으로 지목되었다. 이 정책은 AI 코드 생성의 속도와 안전성 사이의 균형에 대한 업계 전반의 논의를 촉발하고 있으며, 결국 법적 책임을 질 인간이 필요하다는 현실적 문제가 핵심에 있다.

커뮤니티 의견

  • @click: “AI 코드를 시니어가 리뷰하면 안전하다고 보장할 수 없죠. crowdstrike 사건이 AI때문은 아니었고 heartbleed도 AI가 없던 시대의 사고죠. 결론은 누군가에게는 책임을 지우겠다는 게 골자”
  • @sea715: “AI에이전트에 법적 서명같은걸 넣지 않는이상 지속될거 같아요”
  • @yeobi222: “세무사는 감방가는 역할이라고 했는데 보험사가 감방을 대신 가주진 않아서 결국은…”

💡 실무 포인트: AI 코딩 도구를 도입한 팀이라면 AI 생성 코드에 대한 리뷰 정책과 책임 소재를 명확히 정의해야 한다. Amazon의 사례를 참고하여 자체 AI 코드 거버넌스 가이드라인을 수립하는 것을 권장한다.

합법과 정당은 같은가: AI 재구현과 카피레프트의 침식

Python 문자 인코딩 감지 라이브러리 chardet가 AI를 이용해 재구현되며 LGPL에서 MIT로 라이선스가 변경된 사례가 오픈소스 윤리 논쟁을 촉발했다. AI가 명세만으로 소스코드를 재생성할 수 있게 되면서, GPL 프로젝트의 핵심 지적 자산이 “코드"에서 “명세"로 이동하고, 카피레프트 라이선스의 실효성이 약화되고 있다. Oracle vs Google API 소송과 유사한 논점이나, 이번에는 AI가 경쟁 대상이라는 점이 다르다.

커뮤니티 의견

  • @GN⁺: “이 현상이 단순히 저작권을 넘어 지식재산권(IP) 개념 자체를 무너뜨릴 수 있느냐가 핵심. IP는 ‘창의성이 어렵다’는 전제 위에 서 있음”

💡 실무 포인트: AI를 활용한 코드 재구현 시 라이선스 리스크를 반드시 법무팀과 검토하자. 합법과 정당성의 경계가 모호한 영역이므로, 오픈소스 기여 정책도 재점검이 필요하다.

30억 개 벡터 쿼리하기

Jeff Dean의 30억 개 벡터 쿼리 문제를 직접 구현해 본 기술 실험 기록이다. 768차원 float32 벡터 30억 개와 1,000개 쿼리 벡터의 dot product를 계산하는 naive 구현에서 출발해, 최적의 map-reduce 솔루션을 단계적으로 구현하는 과정을 다룬다.

💡 실무 포인트: 대규모 벡터 검색 시스템 구축 시 naive 구현의 한계를 이해하고, 분산 처리(map-reduce) 및 ANN(Approximate Nearest Neighbor) 인덱스 전략을 비교 검토해야 한다.

Agent Safehouse – macOS용 로컬 에이전트 샌드박싱 도구

macOS 네이티브 샌드박스를 통해 로컬 AI 에이전트가 시스템 외부를 변경하지 못하도록 격리하는 도구다. 모든 에이전트가 독립된 샌드박스 환경에서 실행되며, deny-first 접근 모델을 채택했다. 사실상 sandbox-exec용 정책 생성기이며, 각 에이전트가 필요한 최소 권한을 찾는 데 집중했다.

커뮤니티 의견

  • @GN⁺: “프로젝트 전체를 쓸 필요도 없음. Policy Builder만으로도 sandbox-exec 정책을 생성해 dotfiles에 넣어 쓸 수 있음”

관련 레퍼런스

💡 실무 포인트: macOS에서 Claude Code나 다른 AI 에이전트를 실행할 때, Agent Safehouse의 Policy Builder로 최소 권한 샌드박스 정책을 생성해 보안을 강화할 수 있다.

AgentHub - AI 에이전트를 위한 경량 협업 플랫폼

Karpathy가 공개한 AI 에이전트 협업 플랫폼으로, 동일한 코드베이스에서 작업하는 수많은 AI 에이전트를 위해 설계되었다. 인간 중심의 GitHub 구조를 에이전트 중심으로 재구성한 것이 핵심 컨셉이며, Autoresearch 들이 서로 협업할 수 있는 경량 인프라를 제공한다.

💡 실무 포인트: 멀티 에이전트 코드베이스 협업이 필요한 프로젝트에서 AgentHub의 설계 패턴을 참고해 에이전트 간 작업 분배와 충돌 방지 전략을 수립할 수 있다.

AGI의 목표 시점이 바뀌는 가운데, OpenAI는 자사 헌장에 따라 경쟁을 중단해야 함

OpenAI가 2018년 헌장에서 “다른 안전 중심 프로젝트가 AGI에 근접하면 경쟁을 멈추고 협력하겠다"는 자기희생 조항을 명시했으나, Sam Altman의 발언 기준 AGI 도달 예상 시점이 2033년에서 2025년으로 급격히 단축되면서 이 조항의 이행 여부가 쟁점이 되고 있다. 자본시장은 AGI 정의보다 노동과 산출의 분리 가능성에 베팅하고 있다는 분석이다.

커뮤니티 의견

  • @GN⁺: “자본은 정의가 아니라 노동과 산출의 분리 여부에 관심이 있음. AGI라는 명칭은 중요하지 않음”

💡 실무 포인트: AGI 논의의 실질적 영향은 “어떤 업무가 완전 자율화되는가"에 있다. 자사 업무 중 AI 자율화 가능 영역을 선제적으로 파악하고 대비하자.

AI 글쓰기에서 피해야 할 상투적 패턴 모음

AI가 생성한 텍스트에서 반복적으로 나타나는 글쓰기 패턴(trope)을 단어 선택, 문장 구조, 문단 구조, 톤, 포맷, 구성 등 카테고리별로 분류한 단일 마크다운 파일이다. “delve”, “tapestry” 같은 과잉 어휘부터 거짓 심오함을 만드는 문장 패턴까지 체계적으로 정리했으며, 이 파일을 AI 시스템 프롬프트에 추가하면 흔한 AI식 문체를 피하도록 유도할 수 있다. em dash(—) 사용이 AI 지표로 활용되는 점에 대해, 평소 em dash를 즐겨 쓰던 개발자가 불편함을 표현하는 등 활발한 토론이 이어졌다.

커뮤니티 의견

  • @y15un: “LaTeX으로 석사 논문 쓰던 시절에 em dash와 en dash 차이를 처음 배우고 나서 빈번히 써왔습니다. 제가 애용하는 문장 부호가 AI indicator로 사용된다니 참 싱숭생숭합니다.”
  • @hmmhmmhm: “오 한국어 버전도 나오면 좋겠네요”
  • @savvykang: “와… 너 정말, 핵심을 찔렀어.

관련 레퍼런스

💡 실무 포인트: AI 콘텐츠 생성 파이프라인의 시스템 프롬프트에 이 tropes.md 파일을 추가하면 AI 특유의 상투적 문체를 효과적으로 억제할 수 있다.

AI가 앱 구독 모델을 죽일 것이다

앱 개발 비용이 거의 제로에 수렴하면서 클론 앱 제작이 쉬워지고 구독 모델의 붕괴로 이어지고 있다. 2025년 앱스토어 신규 앱 제출 건수가 55만건으로 전년 대비 24% 증가했으며, 이는 Claude 같은 AI 도구로 개발이 쉬워진 결과다. 다만 대부분의 SaaS에서 어려운 것은 코드 작성이 아니라 “무엇을 만들어야 하는지 아는 것"이라는 반론도 제기되었다.

커뮤니티 의견

  • @colus001: “앱스토어 매출은 성장했는데, 개발자에게는 생계 유지가 어렵다니… 대체로 이런건 First Mover 어드벤테이지가 심해서 리뷰 많은 것부터 쓰게 되지 않나요?”
  • @GN⁺: “대부분의 SaaS는 CRUD 앱에 약간의 ‘영리한 부분’을 얹은 형태이고, 그 ‘영리한 부분’을 떠올리는 게 진짜 가치임”

💡 실무 포인트: AI 시대에 앱 비즈니스의 해자(moat)는 코드가 아닌 도메인 지식과 사용자 경험에 있다. 차별화된 “영리한 부분"을 먼저 검증하고 개발에 착수하자.

ChatGPT Pro에서 GPT-5.4 컨텍스트 1M을 제대로 쓰려면 설정이 필요

GPT-5.4의 컨텍스트 윈도우가 1M 토큰이라고 알려져 있지만, Codex CLI나 IDE에서 확인하면 기본값이 약 258K로 표시되는 문제가 보고되었다. 1M 컨텍스트를 사용하려면 별도의 설정 변경이 필요하며, 해당 수치 이상으로 늘리면 토큰 가격이 두 배가 된다는 점도 확인되었다. 한편 long context 사용 시 needle-in-the-haystack 태스크 성능이 50% 이하로 떨어진다는 리포트도 있어, 무조건적인 확장보다는 용도에 맞는 설정이 중요하다. Codex의 compaction 기능이 오래 걸리지 않고 compact 후에도 맥락을 잘 유지한다는 실사용 후기도 공유되었다.

커뮤니티 의견

  • @ujinyang: “저 수치 이상으로 늘어나면 토큰 가격이 두배라고 하는데 확인하시는게 좋을겁니다.”
  • @apkas: “gpt-5.4 자체가 성능은 너무 만족스럽지만 가끔 직전 메세지가 아니라 이전 메세지에 대한 대답을 생성하는 등 아주 안정적이진 않고 long context 쓰면 needle in the haystack task에서 성능이 50% 이하로 떨어진다는 리포트도 있어서 굳이 추천하진 않고싶습니다.”
  • @click: “어쩐지 저도 context windows가 너무 작다고 생각했는데 따로 설정해줘야하는거였네요.”

💡 실무 포인트: GPT-5.4의 1M 컨텍스트를 활용하려면 명시적 설정 변경이 필요하며, 비용 2배 증가와 long context 성능 저하 트레이드오프를 고려해 프로젝트 특성에 맞게 컨텍스트 크기를 조절해야 한다.

Claude Code, 코드 리뷰 기능 공개

Anthropic이 PR마다 멀티 에이전트 팀을 투입해 사람이 놓치기 쉬운 버그를 심층적으로 잡아내는 Code Review 기능을 리서치 프리뷰로 출시했다. Anthropic 엔지니어의 코드 생산량이 지난 1년간 200% 증가하면서 코드 리뷰가 병목이 되었고, 많은 PR이 깊은 리뷰 대신 훑어보기에 그치는 문제를 해결하기 위해 개발되었다. 단순 린팅이나 스타일 체크가 아닌, 로직 버그와 엣지 케이스를 집중 분석하는 방향으로 설계된 것이 특징이다. 현재 개인 플랜에서는 미지원 상태이며 팀/기업 플랜 대상으로 먼저 제공된다.

커뮤니티 의견

  • @xguru: “요즘 Anthropic의 릴리즈 속도가 미쳤네요. 개발 도구를 개선하면서, 그걸로 자기네 개발 자체도 빠르게 만드는 플라이휠 구성이 끝난듯”
  • @tested: “개인 플랜은 미지원이네요. 나중에도 안되려나?”
  • @zihado: “claude 선생님들 인간적으로 너무 빠른거 아닙니까…흑흑”

💡 실무 포인트: 팀 플랜 사용 중이라면 PR 워크플로우에 Claude Code Review를 즉시 통합해 리뷰 병목을 줄일 수 있다. 개인 플랜 사용자는 출시 확대를 대비해 PR 단위 리뷰 자동화 파이프라인을 미리 설계해두자.

LangChain 스킬 공개, Claude Code 통과율 25% → 95%로 끌어올린 방법

LangChain이 코딩 에이전트 성능을 극적으로 향상시키는 “스킬(Skills)” 세트를 공개했다. Claude Code 같은 모델이 LangChain/LangGraph/LangSmith 관련 태스크를 수행할 때, 스킬 없이 25% 정도만 성공하던 것이 스킬 장착 후 95%까지 올라갔다. 도메인 특화 지식을 구조화된 스킬로 제공하면 에이전트 성능이 비약적으로 향상될 수 있음을 보여주는 사례다.

💡 실무 포인트: 자사 라이브러리나 프레임워크용 Claude Code 스킬을 작성하면 에이전트의 코드 생성 정확도를 대폭 개선할 수 있다. CLAUDE.md와 스킬 파일을 통한 도메인 지식 주입이 핵심이다.

Minimum Lovable Product의 시대

AI로 소프트웨어 개발 비용이 급격히 하락하면서 기능만 갖춘 MVP는 더 이상 시장에서 통하지 않으며, 사용자가 감정적으로 사랑할 수 있는 MLP(Minimum Lovable Product)가 새로운 기준선이 되고 있다. 아이디어만으로 투자받던 시대는 끝났고, 머릿속에 있는 것을 코드로 만드는 것이 기본이 된 상황이다.

커뮤니티 의견

  • @xguru: “딱 맞는거 같아요. 딸깍 하면 나오는 소프트웨어들이 많아지면서, MVP라는건 구식이 되어버린거 같아요. 적어도 사용자가 ‘이거 괜찮은데’ 싶은 수준으로 만들어야 하는데”

💡 실무 포인트: 신규 제품 출시 시 기능 완성도(MVP)보다 사용자 경험과 감성적 만족도(MLP)를 기준으로 출시 바를 설정해야 한다.

OpenAI, Oracle과의 Stargate 데이터센터 확장 계획 철회

OpenAI가 텍사스 애빌린의 Stargate 데이터센터 확장 계획을 중단하고, 차세대 Nvidia 칩을 사용하는 새로운 시설에 집중하기로 했다. Oracle은 1,000억 달러 이상의 부채 기반 투자로 AI 인프라 확장을 추진 중이나, 현재 짓고 있는 Blackwell DC가 완공될 즈음이면 효율이 5배 높은 Vera Rubin이 출시될 예정이라 투자 타이밍에 의문이 제기된다. Nvidia의 rack-scale 머신(GB200-NVL72)은 전원과 네트워크만 연결하면 되는 완성형 랙이므로, Oracle이 Vera Rubin 랙으로 교체하면 문제를 해결할 수 있다는 분석도 있다.

커뮤니티 의견

  • @GN⁺: “Oracle이 ‘어제의 데이터센터’를 짓는 게 아니라 Blackwell DC를 짓고 있음. 문제는 ‘오늘의 DC’를 ‘내일’ 완성한다는 점. 한 세대 만에 5배 효율 향상은 너무 과한 것”

💡 실무 포인트: AI 인프라 투자 시 GPU 세대 교체 주기(12~18개월)를 반드시 고려해야 하며, 클라우드 기반 유연한 인프라 전략이 자체 DC 구축보다 리스크가 낮을 수 있다.

PM Skills - AI 에이전트를 PM으로 활용하기

검증된 PM 프레임워크를 AI 워크플로우에 내장해, 단순 문서 생성이 아닌 구조화된 제품 의사결정을 지원하는 오픈소스 프로젝트다. Claude Code/Cowork용 플러그인 8개와 65개 PM 스킬, 36개 체인 워크플로우를 제공한다. 디스커버리, 전략, 실행, 시장 분석 등 PM 업무 전반을 커버한다.

커뮤니티 의견

  • @m00nlygreat: “하고 많은 프레임워크들이 다 무슨 소용인가 싶습니다. 이제껏 망한 수만가지 회사가 저것들을 몰라서 망한 게 아닐텐데. 다만 공부할 때는 좋은 것 같습니다.”
  • @xguru: “각 플러그인 밑의 스킬들도 설명합니다. PM Skills Marketplace: The AI Operating System for Better Product Decisions”

💡 실무 포인트: Claude Code 스킬 시스템에 PM 프레임워크를 통합하면 기획 단계에서 구조화된 의사결정 프로세스를 자동화할 수 있다.

Prompt Cultivation: 경험이 프롬프트가 되는 AI 구조에 대한 이야기

1인 개발자가 AI를 활용한 사내 시스템을 만들면서 겪은 고민을 다룬다. 프롬프트를 아무리 정교하게 써도 결국 설계자가 주입한 것이지 AI 자체의 판단이 아니라는 문제의식에서 출발해, 경험이 자연스럽게 프롬프트로 축적되는 구조를 탐구한다.

커뮤니티 의견

  • @penza1: “agent의 대부분의 구조가 비슷합니다. claude/cursor로 openclaw라던지 카파시님이 만든 심플 에이전트를 분석해보시는걸 추천 드립니다”

💡 실무 포인트: 에이전트 시스템 설계 시 정적 프롬프트보다 경험 기반으로 컨텍스트가 축적되는 메모리 구조(CLAUDE.md, memory 파일 등)를 활용하는 것이 효과적이다.