728x90
SFT
-
LLM 학습 시리즈 2화 – LLM을 똑똑하게 만드는 법: 감독학습(SFT)과 그 한계기술과 산업/AI 2025. 5. 23. 08:30
LLM이 인간처럼 질문에 답하고 명령을 수행하려면 사전학습만으로는 부족합니다. 이 글에서는 '감독학습(Supervised Fine-Tuning)'의 역할과 그 구조적 한계를 깊이 있게 다룹니다. LLM이 아무리 많은 텍스트를 학습했더라도, 단순히 '많이 읽은 AI'일 뿐입니다.실제 사용자의 명령을 이해하고 그에 맞춰 정확한 반응을 하기 위해서는 추가 학습이 필요합니다.바로 그 역할을 하는 것이 감독학습(Supervised Fine-Tuning, SFT) 입니다. SFT란 무엇인가? 쉽게 설명하면…SFT는 “이 입력에는 이렇게 답하라”는 정답지를 주고 모델을 다시 훈련시키는 과정입니다.예를 들어 아래와 같은 데이터로 구성됩니다:[입력] 다음 문장을 영어로 번역하세요: "나는 밥을 먹었다." [출력] I ..