LLM | 가십데일리

apfel - Mac에 이미 내장된 무료 AI를 활용하게 해주는 도구

macOS 26 이상 Apple Silicon Mac에 내장된 Apple 온디바이스 LLM을 CLI, HTTP 서버, 대화형 채팅으로 활용할 수 있게 하는 오픈소스 도구다. …

Gemma 4 비주얼 가이드

Google DeepMind의 Gemma 4는 E2B·E4B·31B·26B A4B 4가지 모델로 구성된 멀티모달 LLM 패밀리다. 모든 변형이 이미지 입력을 지원하며, 로컬 어텐션(슬라이딩 윈도우)과 글로벌 어텐션 …

Lemonade by AMD: GPU와 NPU를 활용한 빠른 오픈소스 로컬 LLM 서버

AMD 하드웨어 지원 로컬 AI 서버로, GPU와 NPU를 활용해 텍스트·이미지·음성을 빠르게 처리하는 오픈소스 플랫폼이다. OpenAI API 표준과 호환되어 VSCode Copilot이나 Open Web UI에 …

Qwen3.6-Plus: 현실 세계 에이전트를 향하여

Alibaba의 Qwen3.6-Plus가 에이전틱 코딩 능력과 멀티모달 추론 성능을 대폭 강화해 출시됐다. 1M 토큰 컨텍스트 윈도우를 지원하며 Alibaba Cloud Model Studio API를 통해 제공된 …

r/programming, LLM 프로그래밍 관련 모든 논의 금지

Reddit r/programming 운영진이 LLM 관련 포스트·기사·영상 전체를 2~4주간 금지하는 시범 정책을 시행했다. LLM 콘텐츠가 다른 주제를 압도할 만큼 대량 게시되어 고품질 기술 토론 공간의 회복이 …

Show GN: Whispree - 한국어 개발자를 위한 STT + LLM 교정 음성 입력 macOS 앱

한국어 개발자를 위한 STT + LLM 교정 음성 입력 macOS 앱이다. 기존 Superwhisper 등이 한국어 전용이 아니어서 ‘GitHub’을 ‘깃펍’으로 전사하는 등의 문제를 해결하기 위해 개발됐다. …

Lemonade by AMD: GPU와 NPU를 활용한 빠른 오픈소스 로컬 LLM 서버

AMD가 지원하는 로컬 AI 서버로, GPU와 NPU를 활용해 텍스트·이미지·음성을 처리하는 오픈소스 플랫폼이다. ROCm, Vulkan, CPU, GPU, NPU 등 다양한 백엔드를 지원하며, OpenAI 및 …

PyPI 보안팀 공식 공급망 공격 사고 보고서: LiteLLM·Telnyx 악성 패키지 사건

Trivy 의존성 취약점을 통해 API 토큰이 탈취되었고, 이를 발판으로 PyPI에 litellm과 telnyx 패키지의 악성 버전이 배포된 공급망 공격 사건의 공식 보고서이다. 악성코드는 설치 즉시 실행되어 민감 …

Qwen3.6-Plus: 현실 세계 에이전트를 향하여

Qwen3.6-Plus는 에이전트형 코딩 능력과 멀티모달 추론 성능을 대폭 강화한 대규모 업그레이드 모델이다. 1M 토큰 컨텍스트 윈도우를 지원하며, Alibaba Cloud Model Studio API를 통해 …

r/programming, LLM 프로그래밍 관련 모든 논의 금지

Reddit r/programming 운영진이 LLM 관련 포스트·기사·영상 전체를 2~4주간 금지하는 시범 정책을 4월부터 시행한다. LLM 관련 콘텐츠가 다른 기술 주제를 압도할 만큼 대량 게시되어, 고품질 기 …

Whispree - 한국어 개발자를 위한 STT + LLM 교정 음성 입력 macOS 앱

한국어 개발자를 위한 macOS 음성 입력 앱으로, STT(음성→텍스트)에 LLM 교정을 결합했다. 기존 Superwhisper 등 범용 STT에서 ‘GitHub’를 ‘깃펍’으로 인식하는 등 한국어+개발 용어 혼합 …

지금 가장 중요한 AI 아이디어들 (2026년 4월)

AI 시대의 핵심 변화로 5가지 아이디어를 제시한다: 자율적 구성 요소 개선, 의도 기반 엔지니어링, 투명성 전환, 스캐폴딩 인식, 전문지식 확산. 이 개념들이 상호 강화하며 모든 조직의 운영 방식을 근본적으로 재 …

1-bit Bonsai - 상업적으로 실용 가능한 최초의 1비트 LLM

Caltech 출신 스타트업 PrismML이 1-bit Bonsai 8B 모델을 공개했다. 기존 16비트 동급 모델 대비 약 14배 작은 1.15GB 크기로 스마트폰·엣지 디바이스에서 실용적 AI 추론이 가능하다. …

AI 이전 글쓰기 시대가 그리워진다

LLM을 이용해 초안을 다듬었지만 AI 작성물로 판정되어 게시가 거부된 경험에서 출발한 글이다. AI 도구에 의존하면서 스스로 판단할 능력을 잃은 듯한 불안감과, ‘이제는 더 이상 빈 페이지가 존재하지 않는다’는 …

Show GN: 2026년 지정학 시뮬레이션 게임: 씽크탱크

AI를 활용한 전략 시뮬레이션 게임 플랫폼으로, 2026년 현재의 지정학적 상황을 기반으로 다양한 시나리오를 탐색할 수 있다. 국가 간 긴장 관계와 전쟁 상황을 시뮬레이션하며, PC에 최적화되어 있다. 커뮤니티 의 …

Show GN: AI와 대화하며 "나"를 인터뷰 하는 서비스 - SelfView

AI와 대화하며 자기 자신을 인터뷰하고, 결과를 예쁜 아티클로 받아볼 수 있는 서비스이다. 아티클은 기본 비공개로 생성되며 작성자가 공개 범위를 설정할 수 있다. Jailbreak 프롬프트 감지 차단 기능이 구현되 …

Show GN: 반품랩탑 - AI가 다나와 데이터와 오픈마켓 반품 특가를 매핑해주는 서비스

오픈마켓의 반품 노트북 특가 정보와 다나와의 스펙 데이터베이스를 AI로 통합 매핑하는 서비스이다. 상거래 플랫폼에 흩어진 비정형 상품 정보를 LLM으로 정형화하는 접근이 핵심이다. 디자인이 쇼핑몰처럼 보인다는 피드 …

Soul Spec - AI 에이전트를 위한 페르소나 표준

AI 에이전트의 정체성을 정의하고 안전하게 보호하기 위한 페르소나 표준 프로젝트이다. 페르소나(정체성)와 거버넌스 규칙을 분리하는 구조가 핵심이며, Abliterated(탈옥) LLM의 안전성을 높일 수 있다는 실 …

데이터 사이언티스트의 역습

LLM API 등장으로 데이터 사이언티스트가 AI 출시 핵심 경로에서 배제되었지만, 실험 설계·지표 측정·확률적 시스템 디버깅 등 본질적 업무는 사라지지 않았다는 논지이다. OpenAI Codex와 Karpathy …

AI 이전 글쓰기 시대가 그리워진다

LLM을 이용해 초안을 다듬었지만 AI 작성물로 판정되어 게시가 거부된 경험을 통해 글쓰기의 진정성 문제를 제기하는 에세이다. AI 도구 의존으로 인한 자율성과 표현력 저하를 경고하며, 직접 쓰고 읽고 고치는 과정 …

Ollama, 이제 애플 실리콘에서 MLX 기반으로 구동

Ollama가 Apple MLX 프레임워크 기반 프리뷰 버전을 공개했다. Apple Silicon의 통합 메모리 아키텍처를 활용해 M5 시리즈 칩의 GPU Neural Accelerator를 통한 TTFT(첫 토큰 …

Show GN: 한국 주식시장 뉴스 분석 및 투자 리서치를 위해 특화된 7B 파라미터 에이전트 LLM

한국 증시(KOSPI+KOSDAQ) 특화 언어 모델 VELA가 공개되었다. Qwen2.5-7B-Instruct를 베이스로 SFT + DPO 파이프라인으로 파인튜닝했다. 기존 금융 LLM의 한국 시장 용어 환각과 언 …

Wikipedia, AI 글쓰기 전면 금지, 40대 2 표결의 배경

위키피디아가 수백 명의 자원봉사 에디터가 참여한 토론 끝에 40대 2라는 압도적 찬성으로 AI(LLM)를 이용한 글쓰기와 수정을 전면 금지하는 정책을 도입했다. LLM의 환각(hallucination) 문제, 출처 …

법률적 시각(Legal AI)에서 본 온톨로지(Ontology)의 개념

법률 AI 분야에서 RAG와 온톨로지의 역할 차이를 명확히 정의한 글이다. RAG는 외부 문서 검색으로 최신 정보 접근성을 높이는 반면, 온톨로지는 검색된 자료 내 개념들을 같은 의미 체계로 정렬하고 법적 관계를 …

AI 판사 도입시 디지털 변론주의의 확립: 프롬프트 합의 및 메타데이터 중립성 확보 방안

AI 판사 도입 시 판결의 정당성을 결정짓는 가장 중요한 요소는 입력 데이터의 중립성이라는 분석이다. AI는 프롬프트와 메타데이터의 맥락에 따라 전혀 다른 결론을 도출할 수 있으므로, 원·피고 대리인이 사전에 프롬 …

AI에게 글쓰기를 맡기지 말라

글쓰기는 질문을 던지고 답을 찾아가는 사고의 과정으로, 단순한 문서 작성이 아닌 이해 확장의 행위라는 주장이다. LLM이 생성한 글은 사고와 학습의 기회를 잃게 하며, 이는 대신 운동을 시키는 것과 같은 자기 성장 …

Ollama, 이제 애플 실리콘에서 MLX 기반으로 구동

Apple MLX 프레임워크를 기반으로 한 Ollama 프리뷰 버전이 공개되었다. Apple Silicon의 통합 메모리 아키텍처를 활용해 성능이 향상되며, M5 시리즈 칩의 GPU Neural …

Qwen3.5-Omni: 텍스트·이미지·오디오·영상을 모두 처리하는 완전 옴니모달 LLM 출시

Alibaba Qwen 팀이 텍스트·이미지·오디오·영상을 모두 이해하고 생성하는 최신 옴니모달 모델을 공개했다. Thinker-Talker 아키텍처에 Hybrid-Attention MoE를 적용해 전 모달리티 처리 …

Shopify의 데이터 구조화 여정: One-Shot LLM에서 DSPy 기반 에이전틱 아키텍처로

Shopify가 수백만 개의 비정형 커머스 데이터를 구조화하기 위해 One-Shot LLM 방식에서 DSPy 기반 멀티 에이전트 아키텍처로 전환한 과정을 공유했다. GPT-4/5급 대형 모델 대신 자체 호스팅된 …

Show GN: 한국 주식시장 뉴스 분석 및 투자 리서치를 위해 특화된 7B 파라미터 에이전트 LLM

한국 증시(KOSPI+KOSDAQ) 특화 언어 모델 VELA가 공개되었다. Qwen2.5-7B-Instruct를 베이스로 SFT+DPO 파이프라인으로 파인튜닝했다. 기존 금융 LLM이 한국 시장 용어에서 할루시네이 …