원문: openai.com | 토론: GeekNews · 댓글 1개
핵심 요약 GPT-5.4의 성능을 소형화한 두 모델이 공개되었다. GPT-5.4 Mini는 코딩·추론·멀티모달·도구 사용에서 GPT-5 Mini 대비 크게 향상되었으며 속도는 2배 이상 빠르다. GPT-5.4 Nano는 가장 작고 저렴한 모델로 분류·데이터 추출·랭킹·보조 코딩에 최적화되었다. API 벤치마크에서 GPT-5.4 Mini는 180~190 t/s, Nano는 약 200 t/s를 기록하며 Gemini 3 Flash(130 t/s)를 크게 앞선다. 가격은 Claude Opus 4.6($5/$25), GPT-5.4($2.5/$15), Gemini 3.1 Pro($2/$12) 순으로, 비용 대비 성능 경쟁이 심화되고 있다.
커뮤니티 의견
- @GN⁺: “token/s만으로는 충분하지 않음. TTFT(첫 토큰 대기시간)과 전체 지연(latency)도 함께 봐야 실제 API 사용 성능을 알 수 있음. 속도만 빠르고 생각 단계(reasoning)가 길다면 오히려 느릴 수 있음”
💡 실무 포인트: 분류·추출·랭킹 등 대량 처리 파이프라인에서 Nano 모델로 교체 시 비용을 대폭 절감할 수 있다. TTFT와 reasoning 깊이까지 고려한 모델 선택이 필요하다.