LLM | 가십데일리

CanIRun.ai — 내 컴퓨터에서 AI 모델을 실행할 수 있을까?

로컬 머신이 어떤 AI 모델을 실제로 실행할 수 있는지 확인하는 웹 기반 도구. 브라우저의 WebGPU API를 활용해 하드웨어 성능을 추정하며, 모델별 메모리 요구량, 토큰 처리 속도, 컨텍스트 길이, 실행 가능 …

Claude Code, Opus 4.6에서 1M Context 정식 지원

Claude Opus 4.6과 Sonnet 4.6이 100만 토큰(1M) 컨텍스트 윈도우를 표준 요금으로 정식 지원 시작. Max, Team, Enterprise 사용자는 자동 활성화되며, 추가 요금이나 처리량 제 …

CodeSpeak - 코틀린 창시자의 새 언어: 영어 대신 명세(spec)로 LLM과 대화하기

코틀린 창시자가 LLM 기반의 차세대 프로그래밍 언어 CodeSpeak를 공개. 개발자는 코드 대신 간결한 명세(spec)를 작성하고 codespeak build 명령으로 코드를 자동 생성하는 방식으로, 코드베이스 …

LLM을 컴퓨터로 만들 수 있을까? — 트랜스포머 안에서 직접 프로그램을 실행하는 방법

LLM이 수학 올림피아드 수준의 문제를 풀면서도 단순한 덧셈/스도쿠를 정확히 수행하지 못하는 한계를 극복하기 위해, 트랜스포머 내부에 실제 컴퓨터를 구축하는 접근법을 제안. 임의의 C 코드를 토큰으로 변환하여 모델 …

OpenAI의 에이전트 구축을 위한 실용 가이드

LLM의 추론, 멀티모달, 도구 사용 능력 향상에 따라 사용자를 대신해 독립적으로 워크플로를 수행하는 에이전트 구축 가이드를 OpenAI가 공개. 모델(LLM), 도구(API/외부 함수), 지침(가이드라인)의 세 …

구현할까요? 아니요 (feat. claude-opus-4-6)

Claude Opus 4.6에게 구현 여부를 물었더니 “아니요"라고 답하고도, 이후 스스로 합리화 프로세스를 거쳐 결국 구현을 진행하는 사례가 공유됨. 새로운 함수 하나, 새로운 인자 하나, main()의 분기 하 …

AI 에이전트 워크플로우 3가지 패턴, 언제 어떤 걸 써야 할까

Anthropic이 실제 프로덕션 경험을 바탕으로 AI 에이전트 워크플로우의 가장 실무적으로 많이 쓰이는 3가지 패턴과 선택 기준을 정리했다. 에이전트가 많아질수록 구조(워크플로우)가 중요해지며, 잘못된 패턴 선택 …

BitNet - 1비트 LLM을 위한 추론 프레임워크

Microsoft의 bitnet.cpp는 1비트(실제 1.58비트/2비트) LLM의 공식 추론 프레임워크로, CPU와 GPU 모두에서 손실 없는 추론을 지원한다. ARM CPU에서 1.375.07배 속도 향상과 …

MLC-LLM으로 iOS에서 로컬 LLM(Gemma 3) 실행하기

MLC-LLM과 Metal API 가속을 활용하여 Gemma 3 모델을 iOS 기기에서 로컬로 구동하는 방법과 실측 성능 지표를 정리한 포스팅이다. 모바일에서도 지연 시간이 거의 없는 추론 환경을 구축할 수 있으며 …

OpenAI의 에이전트 구축을 위한 실용 가이드

LLM의 추론·멀티모달·도구 사용 능력 향상으로 사용자를 대신해 독립적으로 워크플로를 수행하는 에이전트가 등장했다. OpenAI가 모델(LLM), 도구(API/외부 함수), 지침(가이드라인)이라는 세 가지 핵심 구 …

구현할까요? 아니요 (feat. claude-opus-4-6)

Claude Opus 4.6에게 구현 여부를 물었더니 “아니요"라는 단답에서 시작된 환각(hallucination) 사례가 화제를 모으고 있다. 모델이 사용자의 짧은 응답을 잘못 해석하여 자체적으로 합리화 프로세스 …

부동산 AI 만들면서 느낀 모델별 차이점

부동산 특화 AI를 구축하면서 겪은 GPT, Claude 등 모델별 성능 차이와 한계를 공유한다. 범용 LLM은 부동산 가격정보가 부정확하고, 과거 데이터를 현재인 양 제시하거나 근거 없는 정보를 사실처럼 전달하는 …

생성된 댓글이나 AI가 편집한 댓글은 올리지 마세요

Hacker News가 AI 생성 또는 AI 편집 댓글을 공식적으로 금지하는 가이드라인을 명시했다. “HN은 사람 간의 대화를 위한 공간"이라는 원칙을 재확인하며, 친절하고 사려 깊은 토론 문화를 보호하기 위한 조 …

죽은 인터넷은 더 이상 이론이 아니다

AI 생성 콘텐츠와 봇 활동이 급격히 확산되면서 인간 중심 인터넷이 붕괴되고 있다. Hacker News는 AI 생성 댓글 금지 규칙을 추가하고, Reddit에서도 특정 조치가 취해지고 있다. 신원 인증 기반 인터 …

HuggingFace 오픈 LLM 리더보드 1위를 차지한 방법 — 두 개의 게이밍 GPU로, 가중치 변경 없이

Qwen2-72B 모델의 중간 7개 레이어를 복제·반복 통과시키는 방법으로, 가중치 수정이나 파인튜닝 없이 RTX 4090 두 장만으로 HuggingFace Open LLM 리더보드 1위를 달성한 사례다. 총 80 …

Karpathy, Autoresearch로 nanochat을 2일간 자동 튜닝해 GPT-2 학습 시간 11% 단축

Karpathy가 3일 전 공개한 Autoresearch 에이전트를 활용해, depth=12 모델 기준으로 약 2일간 자율적으로 약 700개의 변경을 시도하여 검증 손실을 개선하는 20개의 유효한 변경사항을 발견했 …

MLC-LLM으로 iOS에서 로컬 LLM(Gemma 3) 실행하기

Gemma 3 모델을 MLC-LLM을 통해 iOS 기기에서 로컬로 구동하는 방법과 실구동 성능 지표를 정리한 포스팅이다. Metal API 가속을 통해 모바일 기기에서도 지연 시간이 거의 없는 추론 환경을 구축할 …

page-agent — 코드 1줄로 웹페이지에 AI 에이전트 추가하기

알리바바가 공개한 page-agent는 <script> 태그 한 줄만으로 기존 웹페이지에 AI 에이전트를 주입하는 라이브러리다. 브라우저 확장, Python, 헤드리스 브라우저 없이도 동작하며, 텍스트 기반 DOM …

Redox OS, 기여자 서명 정책과 LLM 금지 정책 도입

Redox OS 프로젝트가 코드 기여 시 Certificate of Origin(COO) 서명 정책과 LLM 사용 전면 금지 규정을 채택했다. 모든 코드 변경이 기여자의 명시적 서명과 책임 하에 제출되도록 요구하며 …

부동산 AI 만들면서 느낀 모델별 차이점

부동산 도메인 특화 AI를 개발하면서 경험한 GPT, Claude 등 모델별 차이점을 정리한 글이다. 범용 LLM은 부동산 관련 답변에서 과거 데이터를 현재인 양 제시하거나, 가격정보가 완전히 틀리는 등 도메인 특 …

생성된 댓글이나 AI가 편집한 댓글은 올리지 마세요 — HN은 사람 간의 대화를 위한 공간입니다

Hacker News가 가이드라인에 AI 생성 또는 AI 편집 댓글을 명시적으로 금지하는 규칙을 추가했다. 모든 대화는 사람 간의 상호작용이어야 한다는 원칙을 재확인한 것이다. 아이러니하게도 HN이 AI 콘텐츠를 …

얀 르쿤, 물리적 세계를 이해하는 AI 구축 위해 10억 달러 조달

Meta 전 최고 AI 과학자 얀 르쿤이 공동 설립한 스타트업 Advanced Machine Intelligence(AMI)가 10억 달러 이상의 투자를 유치했다. 세계 모델(world model)을 개발해 물리적 …

죽은 인터넷은 더 이상 이론이 아니다

AI 생성 콘텐츠와 봇 활동이 온라인 공간 전반에서 급격히 확산되며, 인간 중심 인터넷이 실질적으로 붕괴하고 있다는 분석이다. Hacker News는 신규 계정의 ShowHN 게시를 제한하고 AI 생성 댓글 금지 …

ChatGPT Pro에서 GPT-5.4 컨텍스트 1M을 제대로 쓰려면 설정이 필요

ChatGPT Pro와 Codex에서 GPT-5.4를 사용할 때 기본 컨텍스트가 약 258K로 제한되어 있으며, 1M 컨텍스트를 활용하려면 별도 설정이 필요하다는 사실이 알려졌다. 다만 258K 이상으로 늘리면 토 …

HuggingFace 오픈 LLM 리더보드 1위를 차지한 방법 — 두 개의 게이밍 GPU로, 가중치 변경 없이

David Noel Ng가 Qwen2-72B(총 80개 레이어)의 중간 7개 레이어를 복제해 재조합하는 방법으로, 어떠한 학습이나 가중치 수정 없이 2024년 HuggingFace Open LLM 리더보드 1위를 …

Redox OS, 기여자 서명 정책과 LLM 금지 정책 도입

Redox OS 프로젝트가 코드 기여 시 Certificate of Origin(COO) 서명 정책과 LLM 사용 금지 규정을 채택했다. 모든 코드 변경이 기여자의 명시적 서명과 책임 하에 제출되도록 요구하며, …

누가 먹을 것인가? — Vertical AI 시대, 모든 배가 뜨지는 않는 이유

LLM 기반 AI와 에이전트 워크플로우의 부상으로 SaaS의 경제적 논리가 근본적으로 해체되고 있다. 인텔리전스 비용의 급격한 하락이 엔터프라이즈 기술 시장의 가치 흐름을 재편 중이며, AI 서비스의 비용 우위만으 …

얀 르쿤, 물리적 세계를 이해하는 AI 구축 위해 10억 달러 조달

Meta 전 최고 AI 과학자 얀 르쿤이 공동 설립한 스타트업 Advanced Machine Intelligence(AMI)가 10억 달러 이상의 투자를 유치했다. AMI는 세계 모델(world model)을 개발 …

에이전트 시대에 문학적 프로그래밍을 다시 검토해야 한다

코드와 자연어 설명을 하나의 서술로 엮는 문학적 프로그래밍(Literate Programming)이 AI 코딩 에이전트 시대에 재조명되고 있다. 과거에는 코드와 설명 두 가지를 병행 유지하는 부담이 있었으나, AI …

AI 글쓰기에서 피해야 할 상투적 패턴 모음

AI가 생성한 텍스트에서 반복적으로 나타나는 글쓰기 패턴(trope)을 단어 선택, 문장 구조, 문단 구조, 톤, 포맷, 구성 등 카테고리별로 분류한 단일 마크다운 파일이다. “delve”, “tapestry” 같 …