Langchain
-
LangChain + RAG 기반 문서 Q&A 챗봇 시리즈 4화 - 문서 처리의 시작(문서를 불러오고, 쪼개고, 벡터로 바꾸기)기술과 산업/AI 2025. 5. 26. 10:51
LangChain 기반 RAG 시스템에서 가장 중요한 전처리 단계는 문서를 불러오고, 의미 단위로 분할한 뒤 임베딩하는 과정입니다. 다양한 로더와 스플리터, 임베딩 전략을 소개합니다. RAG 구조를 이해했다면, 이제 실질적인 구현에 들어갈 차례입니다.그 첫 단계는 바로 문서를 시스템이 이해할 수 있는 형태로 바꾸는 일입니다.즉, 문서를 불러오고 → 잘게 쪼개고 → 의미 기반 벡터로 바꾸는 과정입니다.이 단계가 얼마나 정교하게 구성되느냐에 따라이후 검색 정확도와 응답 품질이 크게 달라집니다.따라서 이 글에서는 문서 처리의 핵심 구성 요소 3가지를 다룹니다.1. 문서 불러오기 – 다양한 Loader를 활용하자LangChain은 다양한 문서 유형을 불러올 수 있는 Loader를 지원합니다.아래는 실무에서 자주..
-
LangChain + RAG 기반 문서 Q&A 챗봇 시리즈 3화기술과 산업/AI 2025. 5. 20. 12:53
RAG(Retrieval-Augmented Generation) 완벽 이해RAG는 대규모 언어 모델이 외부 지식에 접근해 더 정확하고 신뢰할 수 있는 응답을 생성하도록 돕는 구조입니다. 문서 기반 Q&A 챗봇에서 RAG가 어떤 역할을 하는지 살펴봅니다. 문서를 AI로 읽고 대답하게 만드는 기술을 구현하려 할 때, 가장 큰 걸림돌은 “기억의 한계”입니다.GPT 계열 모델은 똑똑하지만, 한 번에 읽을 수 있는 텍스트의 양이 제한적이고, 모든 문서를 학습시키는 것도 불가능합니다.이 문제를 해결하기 위한 방법이 바로 RAG, 즉 Retrieval-Augmented Generation입니다.RAG는 2020년 Facebook AI에서 처음 제안한 개념으로,기존의 언어 생성 모델에 검색(retrieval) 기능을 ..
-
LangChain + RAG 기반 문서 Q&A 챗봇 시리즈 2화 - LangChain이란? 개념과 구조를 처음부터 이해하기기술과 산업/AI 2025. 5. 19. 18:16
LangChain은 다양한 LLM 구성 요소를 조립해 대화형 AI 파이프라인을 구성하는 프레임워크입니다. 문서 기반 Q&A 시스템에 LangChain이 중요한 이유와 핵심 개념을 알아봅니다. GPT를 API로 호출하면 간단한 대화를 나눌 수 있습니다. 예를 들어 OpenAI API 하나만 호출해도 “이 계약의 자동 갱신 조항이 뭐야?” 같은 질문에 답을 받을 수 있죠. 하지만 복잡한 현실의 문서를 대상으로 할 때는 훨씬 더 많은 작업이 필요합니다. 문서를 읽어야 하고적절히 분할하고의미를 임베딩하고검색 가능한 구조로 저장한 뒤사용자의 질문에 맞춰관련 내용을 검색해근거를 포함한 답변을 생성해야 합니다 이 모든 단계를 매끄럽게 연결해주는 것이 바로 LangChain입니다. LangChain은 GPT를 구성 가..
-
LangChain + RAG 기반 문서 Q&A 챗봇 시리즈 1화 - LangChain과 RAG는 문서 기반 AI의 ‘게임 체인저’기술과 산업/AI 2025. 5. 19. 17:31
LangChain과 RAG 기술을 활용한 AI 문서 Q&A 챗봇은 비정형 문서 처리와 대화형 검색을 결합한 실전형 AI 서비스로, GPT 시대의 새로운 정보 접근 방식을 제시합니다. 2024년 이후, GPT를 활용한 다양한 서비스가 등장하고 있습니다.하지만 여전히 많은 사람들은 이런 질문을 던집니다. “PDF로 된 정책 문서를 GPT가 정확히 읽을 수 있을까?”“계약서를 업로드하고 조항을 물어보면 AI가 답해줄까?”“우리 회사 매뉴얼을 학습시켜 Q&A 봇을 만들 수 있을까?” 이러한 요구는 단순한 챗봇이 아닌, 문서 기반의 정확한 질의응답(AI Q&A) 기능으로 발전하고 있습니다.바로 이 지점에서 등장한 기술 조합이 LangChain + RAG입니다. 문서 Q&A 챗봇이 필요한 이유 H2. 정보의 구..
-
RAG와 CAG 완벽 정리: 생성형 AI 시대의 핵심 기술 비교기술과 산업/AI 2025. 4. 22. 08:30
생성형 AI의 정확성과 맞춤형 응답을 가능하게 하는 핵심 기술, RAG(Retrieval-Augmented Generation)와 CAG(Context-Augmented Generation)의 차이점과 활용 사례를 비교 분석합니다.생성형 AI 시대, 왜 RAG와 CAG가 주목받을까?GPT나 Claude, Gemini와 같은 생성형 AI 모델이 빠르게 발전하면서 ‘지어내는 답변’이나 ‘정확하지 않은 응답’이 큰 이슈로 떠오르고 있습니다. 이런 문제를 해결하기 위해 등장한 기술이 바로 RAG와 CAG입니다.RAG는 외부 정보를 검색해 답변에 반영하고, CAG는 사용자 맥락을 인식해 개인화된 응답을 생성합니다. 이 두 기술은 LLM의 한계를 보완하는 중요한 역할을 하며, AI 기반 챗봇, 지식 검색, AI 튜..