김봉남의 개발일지 (Page 2)

김봉남의 개발일지

Sign in Subscribe

인공지능 LLM 모델 수능 성적 비교하기 - 영어 편 (1)

인공지능 LLM 모델 수능 성적 비교하기 - 영어 편 (1)

직접 해봤습니다. GPT, Claude, DeepSeek-V3와 같은 유료 모델부터 Phi-4, Qwen2.5와 같은 오픈소스 모델까지, 여러 AI 모델들의 성능을 한꺼번에 비교하는 벤치마크를 수능 문제들을 활용하여 한 번 스스로 만들어 봅니다.