기술과 산업/AI
Whisper 시리즈 12화 – Whisper와 GPT로 만드는 자동 회의록 생성 시스템
B컷개발자
2025. 5. 9. 14:42
728x90
회의가 끝난 후 남는 건 기억뿐일까요?
회의록 작성은 여전히 수작업에 의존하는 대표적인 비효율 업무 중 하나입니다. 하지만 Whisper와 GPT를 연동하면 회의 내용이 음성으로 남는 순간부터 자동으로 회의록과 액션 아이템이 생성되는 시스템을 만들 수 있습니다.
이번 글에서는 실제 회의 음성을 Whisper로 인식하고, GPT로 요약 및 의사결정 포인트까지 자동 추출하는 AI 기반 회의록 생성 시스템의 전체 구조와 구현 예시를 소개합니다.
🎯 핵심 키워드: 자동 회의록, Whisper 회의 기록, GPT 요약, STT 업무 자동화
전체 시스템 개요
입력
- 회의 음성 파일 (혹은 실시간 스트림)
처리 흐름
[마이크 또는 녹음 파일]
↓
Whisper (음성 → 텍스트 변환)
↓
GPT (회의 요약 + 액션아이템 추출)
↓
자동 회의록 생성 및 파일 저장
출력
- 요약된 회의 내용
- 담당자별 할 일 목록 (Action Items)
- 타임스탬프별 대화 내용 (선택)
시스템 구성도
+---------------------+
| 마이크/회의녹음파일 |
+----------+----------+
↓
+----------v----------+
| Whisper 음성 인식 |
+----------+----------+
↓
+----------v----------+
| GPT 요약 및 분류 |
+----------+----------+
↓
+----------v----------+
| 회의록 파일 생성 및 저장 |
+--------------------------+
1단계: Whisper로 회의 음성 텍스트화
import whisper
model = whisper.load_model("small")
result = model.transcribe("meeting.wav")
with open("meeting_raw.txt", "w", encoding="utf-8") as f:
f.write(result["text"])
- 배경음 없는 고품질 녹음 사용 시 정확도 향상
- 가능하면 medium 이상 모델 추천
2단계: GPT로 요약 및 액션아이템 추출
import openai
def generate_minutes(text):
prompt = f"""
다음은 회의 전체 대화입니다. 회의록과 액션아이템을 구분해서 작성해줘.
1. 회의 요약 (중요 내용 중심)
2. 액션 아이템 (누가 무엇을 언제까지)
{text}
"""
response = openai.ChatCompletion.create(
model="gpt-4",
messages=[{"role": "user", "content": prompt}]
)
return response["choices"][0]["message"]["content"]
with open("meeting_raw.txt", "r", encoding="utf-8") as f:
full_text = f.read()
minutes = generate_minutes(full_text)
with open("meeting_minutes.txt", "w", encoding="utf-8") as f:
f.write(minutes)
예시 출력 포맷
📋 회의 요약:
- 신제품 출시 일정은 7월 15일로 확정
- 마케팅 예산안은 이견 없이 통과
- 고객 피드백 반영은 다음주까지 완료 예정
✅ 액션 아이템:
- [홍길동] 제품 상세 페이지 디자인 마감 (6월 25일까지)
- [이영희] 온라인 캠페인 콘텐츠 기획안 작성 (6월 20일까지)
- [김철수] 피드백 항목 정리 및 대응 방안 수립 (6월 18일까지)
3단계: 후속 자동화 옵션
- 슬랙/이메일로 회의록 자동 발송
- PDF 혹은 Google Docs 포맷 저장
- 이전 회의록과 비교 → 자동 회의 트래킹
정확도 향상을 위한 팁
- Whisper 모델 크기를 medium 이상으로 사용
- 발언자 구분(diarization)은 현재 Whisper 단독 지원은 없음
→ pyannote.audio 등과 연계 가능 - 회의 후 음성 클린업 진행 (배경음 제거, 노이즈 리덕션)
- GPT 프롬프트는 팀 용도에 맞게 커스터마이징
실무 활용 예시
용도 활용 방식
스타트업 주간 회의 | 녹음 후 자동 회의록 + 액션아이템 발송 |
법률 사무소 | 상담 기록 자동 텍스트화 및 요약 정리 |
고객사 기술 미팅 | 기술 결정사항 + 구현 과제 자동 분류 |
온라인 수업 정리 | 수업 녹음 후 요약 정리본 제공 |
결론 및 인사이트
회의록 자동 생성은 Whisper + GPT라는 조합을 통해 이제 누구나 구현 가능한 기술이 되었습니다.
기존처럼 사람이 회의 도중에 필기를 하거나, 끝난 뒤 수시간 동안 타이핑할 필요 없이,
녹음만 하면 요약 정리 + 업무 할당까지 자동으로 정리되는 시대가 열렸습니다.
이는 단순 편리함을 넘어, 조직의 기록력과 실행력에 실질적 기여를 할 수 있는 자동화의 강력한 사례입니다.
다음 예고
다음 글에서는 Whisper 경량 모델 활용법 – 빠르고 가벼운 음성 인식 프로젝트 만들기를 다룹니다.
tiny, base 모델을 활용한 로컬 환경에서의 경량 프로젝트 설계와 실전 팁을 소개합니다.
728x90