LLM API 등장으로 데이터 사이언티스트가 AI 출시 핵심 경로에서 배제되었지만, 실험 설계·지표 측정·확률적 시스템 디버깅 등 본질적 업무는 사라지지 않았다는 논지이다. OpenAI Codex와 Karpathy의 auto-research 프로젝트 모두 테스트·지표·관측 스택으로 구성된 인프라 위에서 작동한다는 점이 강조된다.

💡 실무 포인트: LLM 기반 제품의 품질 관리에는 전통적인 ML 실험 설계 역량(A/B 테스트, 지표 설계, 평가 파이프라인)이 여전히 필수적이다.