가십데일리
  • 전체 글
  • 검색
  • 아카이브
  • 태그
  • 소개
Home » Tags

인프라

AI 3월 3일

Show GN: 다이소 MCP - 어떤 AI든 내 주변 다이소 재고파악을 가능하도록

다이소 매장 재고를 ChatGPT, Claude에서 조회할 수 있는 MCP 서버이다. 완전 오픈소스로 Cloudflare Workers 기반 100% 서버리스로 구성되었으며, ChatGPT용 GPTs 앱도 함께 제 …

AI GeekNews MCP 원문↗ 토론↗
AI 3월 3일

TREX - Rust로 만든 PDF 테이블 추출 엔진

PDF 테이블 추출을 위한 Rust 기반 오픈소스 엔진으로, 딥러닝으로 정확도를 개선했다. 기존 Python 도구(Camelot, Tabula)의 무거운 런타임 의존성 문제를 해결하며, 단일 바이너리로 메모리 …

AI GeekNews 오픈소스 원문↗ 토론↗
AI 3월 1일

OpenAI, 사상 최대 규모 중 하나인 1,100억 달러 민간 자금 조달 완료

OpenAI가 사전 평가액 7,300억 달러 기준으로 총 1,100억 달러 규모의 민간 투자를 유치했다. Amazon이 500억 달러, Nvidia와 SoftBank가 각각 300억 달러를 투자했으며, 일부 금액은 …

AI GeekNews OpenAI 원문↗ 토론↗
AI 3월 1일

TREX - Rust로 만든 PDF 테이블 추출 엔진 (딥러닝으로 정확도 개선)

PDF 테이블 추출을 위한 Rust 기반 오픈소스 엔진이다. 기존 파이썬 도구(Camelot, Tabula, pdfplumber)가 OpenCV, Ghostscript, Java 등 무거운 런타임 의존성을 필요로 …

AI GeekNews 오픈소스 원문↗ 토론↗
AI 2월 28일

Matchlock - Linux 기반 샌드박스로 AI 에이전트 워크로드 보호

AI 에이전트의 코드 실행 보안 문제를 해결하기 위해 개발된 CLI 기반 샌드박스 실행 환경. ephemeral microVM을 활용해 격리된 Linux 환경을 1초 안에 부팅하며, 완전한 VM 수준 격리를 제공한 …

AI GeekNews 에이전트 원문↗ 토론↗
AI 2월 27일

Matchlock - Linux 기반 샌드박스로 AI 에이전트 워크로드 보호

AI 에이전트의 코드 실행 보안 문제를 해결하기 위해 개발된 CLI 기반 샌드박스 실행 환경이다. ephemeral microVM을 활용해 격리된 Linux 환경을 1초 안에 부팅하며, 완전한 VM 수준 격리를 제 …

AI GeekNews 에이전트 원문↗ 토론↗
AI 2월 27일

Next.js를 AI로 일주일 만에 재구현한 방법

vinext는 AI와 한 명의 엔지니어가 일주일 만에 만든 Next.js 호환 프레임워크로, Vite 기반에서 Cloudflare Workers에 한 줄 명령으로 배포 가능하다. 빌드 속도는 최대 4.4배 빠르고, …

AI GeekNews 코딩 원문↗ 토론↗
AI 2월 25일

AI 이후의 데이터 엔지니어링

AI가 코드 작성과 파이프라인 생성을 자동화하면서, 데이터 엔지니어링의 핵심은 단순한 데이터 이동이 아니라 의미(meaning)를 다루는 일로 이동한다. 기존 ETL(Extract, Transform, Load) …

AI GeekNews 인프라 원문↗ 토론↗
AI 2월 25일

Cloudflare, AI로 Next.js를 1주일 만에 Vite로 재구현한 vinext 공개

Cloudflare의 한 엔지니어가 AI(Claude)의 도움을 받아 복잡한 Next.js 인프라를 Vite 기반으로 완전히 새로 작성한 프로젝트 ‘vinext(vee-next)‘를 공개했다. 빌드 속도는 최대 …

AI GeekNews Claude 원문↗ 토론↗
AI 2월 25일

Vertex AI Priority PayGo, 실서비스 27,000건으로 검증해보니 Standard와 차이 없었음

Vertex AI의 Priority PayGo를 실운영 AI 챗봇에 적용하고, 약 2주간 누적된 27,000건의 데이터를 시간대별로 분석한 결과를 공유한다. 중간값(Median) 기준 응답 시간은 …

AI GeekNews Google 원문↗ 토론↗
AI 2월 24일

2026년 데이터 엔지니어링의 향방 - 5가지 주요 트렌드

데이터 엔지니어링 분야는 AI 확산과 기술 부채 누적이라는 이중 압력 속에서 양극화가 심화되고 있다. AI 활용 수준이 경쟁력의 핵심으로, 일상적 사용이 보편화되며 “AI 보조"라는 표현 자체가 사라질 전망이다. …

AI GeekNews 인프라 원문↗ 토론↗
AI 2월 24일

LLM을 칩 위에 '인쇄'하는 Taalas의 방식

Taalas는 Llama 3.1 8B 모델을 ASIC 칩에 직접 새겨 넣어 초당 17,000토큰 추론 속도를 달성한 스타트업이다. GPU 기반 시스템보다 10배 저렴하고, 10배 적은 전력, 10배 빠른 추론 성능 …

AI GeekNews LLM 원문↗ 토론↗
AI 2월 24일

ntransformer - 싱글 RTX 3090에서 Llama 3.1 70B를 실행하는 NVMe-to-GPU 추론 엔진

C++/CUDA 기반 LLM 추론 엔진으로, GPU 메모리 스트리밍과 NVMe 직접 입출력을 통해 Llama 70B 모델을 RTX 3090(24GB VRAM)에서 실행 가능하다. 3단계 적응형 캐싱 구조를 사용해 …

AI GeekNews LLM 원문↗ 토론↗
AI 2월 24일

코드 공장 시대와 미래 SRE

소프트웨어 엔지니어링의 근간이 AI와 자동화의 급격한 부상으로 재구조화되고 있다. 코드 생성이 자동화되면서 운영·안정성·보안을 담당하는 SRE/DevOps의 중요성이 상대적으로 부각된다는 관점이다. 다만 …

AI GeekNews 에이전트 원문↗ 토론↗
AI 2월 24일

美 백악관, 인도 AI 임팩트 서밋서 'AI 주권' 선언…"미국 AI가 글로벌 표준"

미국이 인도 AI 임팩트 서밋에서 “미국산 AI가 글로벌 골드 표준"이라고 선언했다. 2026년 2월 16~21일 인도 뉴델리에서 열린 서밋에서 미국의 AI 주권과 수출 전략이 발표되었으며, NIST 주도의 AI …

AI GeekNews 에이전트 원문↗ 토론↗
AI 2월 23일

2026년 데이터 엔지니어링의 향방 - 5가지 주요 트렌드

데이터 엔지니어링 분야는 AI 확산과 기술 부채 누적이라는 이중 압력 속에서 양극화가 심화되는 흐름을 보인다. AI 활용 수준이 경쟁력의 핵심으로, 일상적 사용이 보편화되며 “AI 보조"라는 표현 자체가 사라질 전 …

AI GeekNews 인프라 원문↗ 토론↗
AI 2월 23일

LLM을 칩 위에 '인쇄'하는 Taalas의 방식

Taalas는 Llama 3.1 8B 모델을 ASIC 칩에 직접 새겨 넣어 초당 17,000토큰 추론 속도를 달성한 스타트업이다. GPU 기반 시스템보다 10배 저렴하고, 10배 적은 전력, 10배 빠른 추론 성능 …

AI GeekNews LLM 원문↗ 토론↗
AI 2월 23일

ntransformer - 싱글 RTX 3090에서 Llama 3.1 70B를 실행하는 NVMe-to-GPU 추론 엔진

C++/CUDA 기반 LLM 추론 엔진으로, GPU 메모리 스트리밍과 NVMe 직접 입출력을 통해 Llama 70B 모델을 RTX 3090(24GB VRAM)에서 실행 가능하다. 3단계 적응형 캐싱 구조를 사용해 …

AI GeekNews LLM 원문↗ 토론↗
AI 2월 23일

코드 공장 시대와 미래 SRE

소프트웨어 엔지니어링의 근간이 AI와 자동화로 인해 재구조화되고 있으며, 이러한 변화는 되돌릴 수 없다. 글쓴이는 AI가 코드를 대량 생산하는 시대에 SRE/DevOps의 역할이 더욱 중요해질 것이라고 주장한다. …

AI GeekNews 에이전트 원문↗ 토론↗
« Prev 
© 2026 가십데일리 · Powered by Hugo & PaperMod