기술과 산업/AI
-
데이터 과학 워크플로우: R vs Python 비교기술과 산업/AI 2025. 5. 21. 13:01
단계 공통 목적 R 워크플로우 Python 워크플로우Import (데이터 불러오기)CSV, Excel, DB 등 외부 데이터 가져오기readr, readxl, DBI, rvestpandas.read_csv(), read_excel(), SQLAlchemy, requests, beautifulsoupTidy/Transform (정제 및 변형)넓은 포맷 → 긴 포맷, 결측치 처리, 텍스트/시간 처리tidyr, dplyr, lubridate, stringr, forcatspandas, numpy, category_encoders, fancyimputeVisualize (시각화)데이터의 패턴과 이상값을 시각적으로 탐색ggplot2, plotly, reactablematplotlib, seaborn, plotly..
-
Apache NiFi 시리즈 6회 - Process Group과 Template으로 데이터 파이프라인 모듈화 하기기술과 산업/AI 2025. 5. 21. 12:37
Apache NiFi에서 Process Group과 Template 기능을 활용하여 복잡한 데이터 흐름을 모듈화하고 재사용할 수 있는 방법을 소개합니다. 파이프라인을 팀 단위로 공유하거나 대규모 환경에 적용하는 실전 전략까지 다룹니다.왜 모듈화가 필요한가?NiFi는 시각적인 흐름 설계가 가능해 매우 직관적이지만, 흐름이 커질수록 유지보수가 어려워집니다.수십 개의 Processor가 하나의 Canvas에 노출되어 복잡도가 증가동일한 흐름을 다른 프로젝트나 환경에 재사용하기 어려움팀 단위 협업 시 한 명이 작업 중이면 다른 사람은 접근이 어렵다는 한계이런 문제를 해결하기 위해 NiFi는 Process Group과 Template이라는 모듈화 수단을 제공합니다.Process Group이란?Process Gro..
-
Gradio 실전 시리즈 7화 – FastAPI와 Gradio 통합하기: API 기반 앱 제작 실습기술과 산업/AI 2025. 5. 21. 12:09
Gradio는 단독 데모 인터페이스로도 유용하지만, FastAPI와 통합하면 백엔드 API 기반의 실전 서비스로 확장할 수 있습니다. 본 글에서는 두 프레임워크를 함께 사용하는 구조와 예제를 정리합니다. Gradio는 머신러닝 모델을 시각화하는 데 탁월한 도구입니다.하지만 진짜 서비스를 만들기 위해선 인증, DB 연동, 로깅, 비즈니스 로직 등 다양한 기능이 필요합니다.이때 가장 강력한 조합이 바로 Gradio + FastAPI입니다.왜 FastAPI와 Gradio를 함께 쓰는가?항목 Gradio FastAPI역할프론트엔드 (UI)백엔드 (API 처리)장점빠른 인터페이스 구성고성능 비동기 API 처리한계백엔드 기능 한계 (인증, DB 등 부재)UI 직접 제공 기능 없음Gradio는 UI 중심이고, Fas..
-
LangChain + RAG 기반 문서 Q&A 챗봇 시리즈 3화기술과 산업/AI 2025. 5. 20. 12:53
RAG(Retrieval-Augmented Generation) 완벽 이해RAG는 대규모 언어 모델이 외부 지식에 접근해 더 정확하고 신뢰할 수 있는 응답을 생성하도록 돕는 구조입니다. 문서 기반 Q&A 챗봇에서 RAG가 어떤 역할을 하는지 살펴봅니다. 문서를 AI로 읽고 대답하게 만드는 기술을 구현하려 할 때, 가장 큰 걸림돌은 “기억의 한계”입니다.GPT 계열 모델은 똑똑하지만, 한 번에 읽을 수 있는 텍스트의 양이 제한적이고, 모든 문서를 학습시키는 것도 불가능합니다.이 문제를 해결하기 위한 방법이 바로 RAG, 즉 Retrieval-Augmented Generation입니다.RAG는 2020년 Facebook AI에서 처음 제안한 개념으로,기존의 언어 생성 모델에 검색(retrieval) 기능을 ..
-
LangChain + RAG 기반 문서 Q&A 챗봇 시리즈 2화 - LangChain이란? 개념과 구조를 처음부터 이해하기기술과 산업/AI 2025. 5. 19. 18:16
LangChain은 다양한 LLM 구성 요소를 조립해 대화형 AI 파이프라인을 구성하는 프레임워크입니다. 문서 기반 Q&A 시스템에 LangChain이 중요한 이유와 핵심 개념을 알아봅니다. GPT를 API로 호출하면 간단한 대화를 나눌 수 있습니다. 예를 들어 OpenAI API 하나만 호출해도 “이 계약의 자동 갱신 조항이 뭐야?” 같은 질문에 답을 받을 수 있죠. 하지만 복잡한 현실의 문서를 대상으로 할 때는 훨씬 더 많은 작업이 필요합니다. 문서를 읽어야 하고적절히 분할하고의미를 임베딩하고검색 가능한 구조로 저장한 뒤사용자의 질문에 맞춰관련 내용을 검색해근거를 포함한 답변을 생성해야 합니다 이 모든 단계를 매끄럽게 연결해주는 것이 바로 LangChain입니다. LangChain은 GPT를 구성 가..
-
LangChain + RAG 기반 문서 Q&A 챗봇 시리즈 1화 - LangChain과 RAG는 문서 기반 AI의 ‘게임 체인저’기술과 산업/AI 2025. 5. 19. 17:31
LangChain과 RAG 기술을 활용한 AI 문서 Q&A 챗봇은 비정형 문서 처리와 대화형 검색을 결합한 실전형 AI 서비스로, GPT 시대의 새로운 정보 접근 방식을 제시합니다. 2024년 이후, GPT를 활용한 다양한 서비스가 등장하고 있습니다.하지만 여전히 많은 사람들은 이런 질문을 던집니다. “PDF로 된 정책 문서를 GPT가 정확히 읽을 수 있을까?”“계약서를 업로드하고 조항을 물어보면 AI가 답해줄까?”“우리 회사 매뉴얼을 학습시켜 Q&A 봇을 만들 수 있을까?” 이러한 요구는 단순한 챗봇이 아닌, 문서 기반의 정확한 질의응답(AI Q&A) 기능으로 발전하고 있습니다.바로 이 지점에서 등장한 기술 조합이 LangChain + RAG입니다. 문서 Q&A 챗봇이 필요한 이유 H2. 정보의 구..
-
Gradio 실전 시리즈 5화 – Blocks 고급 구조: Row, Column, Tab 완전 정복기술과 산업/AI 2025. 5. 19. 15:29
Gradio의 Blocks 구조를 기반으로 복잡한 UI를 설계할 때 필수적으로 사용되는 Row, Column, Tab 등을 다루며, 실전 예제와 함께 고급 사용자 인터페이스 구성 방법을 안내합니다. Gradio가 단순한 데모 도구를 넘어 실전형 앱 제작 도구로 자리 잡을 수 있었던 핵심 이유는 Blocks 구조의 등장입니다.특히 Row, Column, Tabs는 실제 UI를 구성하는 데 있어 가장 많이 활용되는 기본 단위입니다.이번 편에서는 이 세 가지 구조를 중심으로, Gradio Blocks UI를 어떻게 실무적으로 구성할 수 있는지 상세히 설명드리겠습니다.Blocks 구조란?Gradio의 Blocks는 UI를 컴포넌트 단위로 쌓아 올리는 구조입니다.이 구조를 사용하면 다음과 같은 장점이 있습니다:다..
-
Gradio 실전 시리즈 4화 – 입출력 컴포넌트 총정리: 텍스트, 이미지, 오디오 활용법기술과 산업/AI 2025. 5. 19. 15:27
Gradio는 텍스트, 이미지, 오디오 등 다양한 컴포넌트를 통해 AI 모델 인터페이스를 구성할 수 있습니다. 본 글에서는 주요 입력/출력 컴포넌트를 분류하고 실전 예제와 함께 활용법을 소개합니다.Gradio의 강점 중 하나는 UI 컴포넌트를 구성하는 방식이 매우 직관적이라는 점입니다.복잡한 프론트엔드 지식 없이도 몇 줄의 Python 코드로 모델에 적합한 인터페이스를 만들 수 있습니다.이번 편에서는 Gradio의 핵심 컴포넌트들을 정리하고,어떤 타입을 어떤 상황에서 활용할 수 있는지 실전 중심으로 살펴보겠습니다.Gradio의 입력/출력 컴포넌트 분류Gradio의 컴포넌트는 크게 다음과 같이 분류할 수 있습니다:분류 예시텍스트 기반Textbox, Textarea, Dropdown, Radio, Check..