
AI 회의록 서비스에 대해 이야기하다 보면 자주 등장하는 용어가 있습니다.
바로 STT, LLM, RAG입니다.
처음 듣는 사람에게는 상당히 어려운 기술 용어처럼 들릴 수 있습니다. 하지만 실제로는 우리가 매일 사용하는 AI 서비스의 핵심 기술입니다.
AI 회의록 서비스 역시 이 세 가지 기술이 결합되어 동작합니다.
이번 글에서는 개발자가 아니더라도 이해할 수 있도록 쉽고 간단하게 설명해 보겠습니다.
AI 회의록은 세 명의 전문가가 함께 일하는 것과 같다
AI 회의록 서비스를 하나의 팀이라고 생각해보겠습니다.
회의록을 만들기 위해서는 다음 세 가지 역할이 필요합니다.
첫 번째는 듣는 사람
두 번째는 정리하는 사람
세 번째는 찾아주는 사람
AI에서는 각각을 다음과 같이 부릅니다.
- STT : 듣는 전문가
- LLM : 정리하는 전문가
- RAG : 찾아주는 전문가
이 세 가지가 함께 작동하면서 우리가 사용하는 AI 회의록 서비스가 완성됩니다.
STT란 무엇인가?
STT는 Speech To Text의 약자입니다.
쉽게 말하면 사람의 음성을 문자로 변환하는 기술입니다.
예를 들어 회의에서 다음과 같은 대화가 있었다고 가정해보겠습니다.
김대리:
“다음 주 금요일까지 제안서를 제출하겠습니다.”
이 말을 AI는 먼저 문자로 변환합니다.
즉
음성 → 텍스트
과정을 담당하는 것이 STT입니다.
우리가 스마트폰 음성 입력 기능을 사용하는 것도 같은 원리입니다.
최근에는 AI 기술 발전으로 인해 한국어 인식 정확도도 상당히 높아졌습니다.
회의록 자동화의 출발점은 바로 STT입니다.
STT만 있으면 회의록이 완성될까?
아쉽게도 그렇지 않습니다.
STT는 단순히 음성을 문자로 바꾸는 역할만 합니다.
예를 들어 1시간 회의를 진행했다고 가정해보겠습니다.
결과는 수십 페이지에 달하는 대화 내용이 됩니다.
그대로 읽으라고 하면 사실상 회의록이라고 보기 어렵습니다.
그래서 두 번째 전문가가 필요합니다.
LLM이란 무엇인가?
LLM은 Large Language Model의 약자입니다.
한국어로는 대규모 언어 모델이라고 부릅니다.
대표적인 예가 ChatGPT입니다.
LLM은 텍스트를 읽고 이해하고 정리하는 역할을 수행합니다.
예를 들어 STT가 다음 내용을 전달했다고 가정해보겠습니다.
“다음 주까지 홈페이지 수정 작업 진행”
“예산 검토 필요”
“김대리가 견적서 작성”
LLM은 이를 분석하여
주요 결정 사항
- 홈페이지 개편 진행
- 예산 추가 검토
액션 아이템
- 김대리 : 견적서 작성
- 개발팀 : 홈페이지 수정
형태로 정리합니다.
즉 LLM은 회의 내용을 사람이 읽기 쉬운 문서로 변환하는 역할을 담당합니다.
LLM만 사용하면 충분할까?
많은 사람들이 ChatGPT만 있으면 모든 것이 해결된다고 생각합니다.
하지만 실제 업무에서는 한 가지 문제가 발생합니다.
LLM은 과거 회의 내용을 기억하지 못합니다.
예를 들어
“지난달 고객사 A와 논의했던 기능이 무엇이었지?”
라고 질문했을 때
LLM은 해당 정보를 알 수 없습니다.
왜냐하면 회의록 데이터가 입력되지 않았기 때문입니다.
그래서 등장한 기술이 RAG입니다.
RAG란 무엇인가?
RAG는 Retrieval Augmented Generation의 약자입니다.
쉽게 설명하면
“필요한 자료를 먼저 찾아서 AI에게 제공하는 기술”
입니다.
예를 들어 회사에 회의록이 10,000개 있다고 가정해보겠습니다.
사용자가
“작년 고객사 미팅에서 일정 변경 관련 내용을 찾아줘”
라고 요청하면
RAG는 먼저 관련 회의록을 검색합니다.
그 후 검색 결과를 LLM에게 전달합니다.
LLM은 전달받은 자료를 바탕으로 답변을 생성합니다.
즉
검색 → AI 분석 → 답변
과정을 수행하는 기술입니다.
AI 회의록 서비스는 이렇게 동작한다
실제 AI 회의록 서비스는 다음 순서로 진행됩니다.
1단계
회의 음성 수집
↓
2단계
STT가 음성을 문자로 변환
↓
3단계
LLM이 회의 내용을 분석
↓
4단계
요약 및 액션 아이템 생성
↓
5단계
RAG를 이용해 검색 가능한 데이터 저장
↓
6단계
사용자가 과거 회의 내용 검색 가능
이 과정을 통해 단순 회의록이 아닌 기업의 지식 데이터베이스가 만들어집니다.
왜 기업들이 RAG에 관심을 가질까?
회의는 시간이 지나면 잊혀집니다.
하지만 기록은 남습니다.
문제는 기록이 너무 많아지면 찾기 어렵다는 것입니다.
수천 개의 회의록 중에서 필요한 내용을 찾는 것은 상당한 시간과 비용이 필요합니다.
RAG는 이러한 문제를 해결합니다.
예를 들어
- 고객 요구사항 검색
- 프로젝트 변경 이력 검색
- 계약 관련 논의 검색
- 담당자 업무 이력 검색
등을 몇 초 만에 수행할 수 있습니다.
그래서 최근 기업들이 RAG 기술에 큰 관심을 보이고 있습니다.
미래의 회의록은 어떻게 변할까?
과거의 회의록은 단순한 문서였습니다.
현재의 회의록은 AI가 정리하는 문서가 되었습니다.
그리고 앞으로의 회의록은 검색 가능한 기업 자산이 될 가능성이 높습니다.
회의가 끝나는 순간
- 회의록 생성
- 업무 할당
- 프로젝트 등록
- 일정 생성
- 지식 저장
까지 자동으로 처리되는 시대가 점점 가까워지고 있습니다.
마무리
AI 회의록 서비스는 단순한 프로그램이 아닙니다.
STT는 음성을 듣고,
LLM은 내용을 이해하며,
RAG는 필요한 정보를 찾아줍니다.
이 세 가지 기술이 결합되면서 회의 내용을 단순 기록이 아닌 기업의 중요한 자산으로 바꾸고 있습니다.
다음 편에서는 실제로 AI 회의록 서비스를 만들 때 어떤 기술 스택과 개발 과정이 필요한지 알아보겠습니다.