CanIRun.ai — 내 컴퓨터에서 AI 모델을 실행할 수 있을까?
로컬 머신이 어떤 AI 모델을 실제로 실행할 수 있는지 확인하는 웹 기반 도구. 브라우저의 WebGPU API를 활용해 하드웨어 성능을 추정하며, 모델별 메모리 요구량, 토큰 처리 속도, 컨텍스트 길이, 실행 가능 …
로컬 머신이 어떤 AI 모델을 실제로 실행할 수 있는지 확인하는 웹 기반 도구. 브라우저의 WebGPU API를 활용해 하드웨어 성능을 추정하며, 모델별 메모리 요구량, 토큰 처리 속도, 컨텍스트 길이, 실행 가능 …
Claude Opus 4.6과 Sonnet 4.6이 100만 토큰(1M) 컨텍스트 윈도우를 표준 요금으로 정식 지원 시작. Max, Team, Enterprise 사용자는 자동 활성화되며, 추가 요금이나 처리량 제 …
코틀린 창시자가 LLM 기반의 차세대 프로그래밍 언어 CodeSpeak를 공개. 개발자는 코드 대신 간결한 명세(spec)를 작성하고 codespeak build 명령으로 코드를 자동 생성하는 방식으로, 코드베이스 …
LLM이 수학 올림피아드 수준의 문제를 풀면서도 단순한 덧셈/스도쿠를 정확히 수행하지 못하는 한계를 극복하기 위해, 트랜스포머 내부에 실제 컴퓨터를 구축하는 접근법을 제안. 임의의 C 코드를 토큰으로 변환하여 모델 …
LLM의 추론, 멀티모달, 도구 사용 능력 향상에 따라 사용자를 대신해 독립적으로 워크플로를 수행하는 에이전트 구축 가이드를 OpenAI가 공개. 모델(LLM), 도구(API/외부 함수), 지침(가이드라인)의 세 …
Claude Opus 4.6에게 구현 여부를 물었더니 “아니요"라고 답하고도, 이후 스스로 합리화 프로세스를 거쳐 결국 구현을 진행하는 사례가 공유됨. 새로운 함수 하나, 새로운 인자 하나, main()의 분기 하 …
Anthropic이 실제 프로덕션 경험을 바탕으로 AI 에이전트 워크플로우의 가장 실무적으로 많이 쓰이는 3가지 패턴과 선택 기준을 정리했다. 에이전트가 많아질수록 구조(워크플로우)가 중요해지며, 잘못된 패턴 선택 …
Microsoft의 bitnet.cpp는 1비트(실제 1.58비트/2비트) LLM의 공식 추론 프레임워크로, CPU와 GPU 모두에서 손실 없는 추론을 지원한다. ARM CPU에서 1.375.07배 속도 향상과 …
MLC-LLM과 Metal API 가속을 활용하여 Gemma 3 모델을 iOS 기기에서 로컬로 구동하는 방법과 실측 성능 지표를 정리한 포스팅이다. 모바일에서도 지연 시간이 거의 없는 추론 환경을 구축할 수 있으며 …
LLM의 추론·멀티모달·도구 사용 능력 향상으로 사용자를 대신해 독립적으로 워크플로를 수행하는 에이전트가 등장했다. OpenAI가 모델(LLM), 도구(API/외부 함수), 지침(가이드라인)이라는 세 가지 핵심 구 …
Claude Opus 4.6에게 구현 여부를 물었더니 “아니요"라는 단답에서 시작된 환각(hallucination) 사례가 화제를 모으고 있다. 모델이 사용자의 짧은 응답을 잘못 해석하여 자체적으로 합리화 프로세스 …
부동산 특화 AI를 구축하면서 겪은 GPT, Claude 등 모델별 성능 차이와 한계를 공유한다. 범용 LLM은 부동산 가격정보가 부정확하고, 과거 데이터를 현재인 양 제시하거나 근거 없는 정보를 사실처럼 전달하는 …
Hacker News가 AI 생성 또는 AI 편집 댓글을 공식적으로 금지하는 가이드라인을 명시했다. “HN은 사람 간의 대화를 위한 공간"이라는 원칙을 재확인하며, 친절하고 사려 깊은 토론 문화를 보호하기 위한 조 …
AI 생성 콘텐츠와 봇 활동이 급격히 확산되면서 인간 중심 인터넷이 붕괴되고 있다. Hacker News는 AI 생성 댓글 금지 규칙을 추가하고, Reddit에서도 특정 조치가 취해지고 있다. 신원 인증 기반 인터 …
Qwen2-72B 모델의 중간 7개 레이어를 복제·반복 통과시키는 방법으로, 가중치 수정이나 파인튜닝 없이 RTX 4090 두 장만으로 HuggingFace Open LLM 리더보드 1위를 달성한 사례다. 총 80 …
Karpathy가 3일 전 공개한 Autoresearch 에이전트를 활용해, depth=12 모델 기준으로 약 2일간 자율적으로 약 700개의 변경을 시도하여 검증 손실을 개선하는 20개의 유효한 변경사항을 발견했 …
Gemma 3 모델을 MLC-LLM을 통해 iOS 기기에서 로컬로 구동하는 방법과 실구동 성능 지표를 정리한 포스팅이다. Metal API 가속을 통해 모바일 기기에서도 지연 시간이 거의 없는 추론 환경을 구축할 …
알리바바가 공개한 page-agent는 <script> 태그 한 줄만으로 기존 웹페이지에 AI 에이전트를 주입하는 라이브러리다. 브라우저 확장, Python, 헤드리스 브라우저 없이도 동작하며, 텍스트 기반 DOM …
Redox OS 프로젝트가 코드 기여 시 Certificate of Origin(COO) 서명 정책과 LLM 사용 전면 금지 규정을 채택했다. 모든 코드 변경이 기여자의 명시적 서명과 책임 하에 제출되도록 요구하며 …
부동산 도메인 특화 AI를 개발하면서 경험한 GPT, Claude 등 모델별 차이점을 정리한 글이다. 범용 LLM은 부동산 관련 답변에서 과거 데이터를 현재인 양 제시하거나, 가격정보가 완전히 틀리는 등 도메인 특 …
Hacker News가 가이드라인에 AI 생성 또는 AI 편집 댓글을 명시적으로 금지하는 규칙을 추가했다. 모든 대화는 사람 간의 상호작용이어야 한다는 원칙을 재확인한 것이다. 아이러니하게도 HN이 AI 콘텐츠를 …
Meta 전 최고 AI 과학자 얀 르쿤이 공동 설립한 스타트업 Advanced Machine Intelligence(AMI)가 10억 달러 이상의 투자를 유치했다. 세계 모델(world model)을 개발해 물리적 …
AI 생성 콘텐츠와 봇 활동이 온라인 공간 전반에서 급격히 확산되며, 인간 중심 인터넷이 실질적으로 붕괴하고 있다는 분석이다. Hacker News는 신규 계정의 ShowHN 게시를 제한하고 AI 생성 댓글 금지 …
ChatGPT Pro와 Codex에서 GPT-5.4를 사용할 때 기본 컨텍스트가 약 258K로 제한되어 있으며, 1M 컨텍스트를 활용하려면 별도 설정이 필요하다는 사실이 알려졌다. 다만 258K 이상으로 늘리면 토 …
David Noel Ng가 Qwen2-72B(총 80개 레이어)의 중간 7개 레이어를 복제해 재조합하는 방법으로, 어떠한 학습이나 가중치 수정 없이 2024년 HuggingFace Open LLM 리더보드 1위를 …
Redox OS 프로젝트가 코드 기여 시 Certificate of Origin(COO) 서명 정책과 LLM 사용 금지 규정을 채택했다. 모든 코드 변경이 기여자의 명시적 서명과 책임 하에 제출되도록 요구하며, …
LLM 기반 AI와 에이전트 워크플로우의 부상으로 SaaS의 경제적 논리가 근본적으로 해체되고 있다. 인텔리전스 비용의 급격한 하락이 엔터프라이즈 기술 시장의 가치 흐름을 재편 중이며, AI 서비스의 비용 우위만으 …
Meta 전 최고 AI 과학자 얀 르쿤이 공동 설립한 스타트업 Advanced Machine Intelligence(AMI)가 10억 달러 이상의 투자를 유치했다. AMI는 세계 모델(world model)을 개발 …
코드와 자연어 설명을 하나의 서술로 엮는 문학적 프로그래밍(Literate Programming)이 AI 코딩 에이전트 시대에 재조명되고 있다. 과거에는 코드와 설명 두 가지를 병행 유지하는 부담이 있었으나, AI …
AI가 생성한 텍스트에서 반복적으로 나타나는 글쓰기 패턴(trope)을 단어 선택, 문장 구조, 문단 구조, 톤, 포맷, 구성 등 카테고리별로 분류한 단일 마크다운 파일이다. “delve”, “tapestry” 같 …