HuggingFace 오픈 LLM 리더보드 1위를 차지한 방법 — 두 개의 게이밍 GPU로, 가중치 변경 없이

원문: dnhkng.github.io | 토론: GeekNews · 댓글 1개

핵심 요약 Qwen2-72B 모델의 중간 7개 레이어를 복제·반복 통과시키는 방법으로, 가중치 수정이나 파인튜닝 없이 RTX 4090 두 장만으로 HuggingFace Open LLM 리더보드 1위를 달성한 사례다. 총 80개 레이어 중 특정 중간 구간(45번대)을 반복 실행하는 구조만 변경했으며, “Goliath가 작동했다는 사실 자체가 놀랍다"는 평가가 나왔다. 생명공학에서 뇌를 연구하던 저자가 GPU 기반 AI 연구로 전환한 배경도 흥미롭다.

커뮤니티 의견
@GN⁺: “전체 transformer 스택을 복제하는 건 좋은 아이디어가 아님을 실험적으로 확인. ‘기관’을 중복 복제하는 셈이라 효율이 떨어짐”

💡 실무 포인트: 모델 아키텍처 레벨의 레이어 반복 기법은 추가 학습 없이 성능을 개선할 수 있는 저비용 실험 방법. 자체 모델 최적화에 참고.