원문: openai.com | 토론: GeekNews · 댓글 1개
핵심 요약 GPT-5.4의 성능을 빠르고 효율적인 형태로 구현한 두 가지 소형 모델이 공개됐다. GPT-5.4 Mini는 코딩·추론·멀티모달 이해·도구 사용에서 GPT-5 Mini 대비 크게 향상되었으며 속도는 2배 이상 빠르다. GPT-5.4 Nano는 가장 작고 저렴한 모델로 분류·데이터 추출·랭킹·보조 코딩 작업에 최적화됐다. 속도 벤치마크에서 GPT-5.4 Mini는 평균 180~190 t/s, Nano는 약 200 t/s로 측정되어 경쟁 모델 대비 우위를 보인다. 가격은 Claude Opus 4.6 $5/$25, GPT-5.4 $2.5/$15, Gemini 3.1 Pro $2/$12 수준이다.
커뮤니티 의견
- @GN⁺: “GPT-5.4 Mini는 평균 180~190 t/s, Nano는 약 200 t/s. Gemini 3 Flash는 약 130 t/s. 다만 token/s만으로는 충분하지 않음. TTFT와 전체 latency도 함께 봐야 실제 API 사용 성능을 알 수 있음”
💡 실무 포인트: 대량 분류·추출 파이프라인에서 GPT-5.4 Nano를 도입하면 비용 대비 처리량을 극대화할 수 있다. TTFT와 latency까지 고려한 벤치마크 후 모델을 선정할 것.