Apache Nifi
-
Apache NiFi 시리즈 6회 - Process Group과 Template으로 데이터 파이프라인 모듈화 하기기술과 산업/AI 2025. 5. 21. 12:37
Apache NiFi에서 Process Group과 Template 기능을 활용하여 복잡한 데이터 흐름을 모듈화하고 재사용할 수 있는 방법을 소개합니다. 파이프라인을 팀 단위로 공유하거나 대규모 환경에 적용하는 실전 전략까지 다룹니다.왜 모듈화가 필요한가?NiFi는 시각적인 흐름 설계가 가능해 매우 직관적이지만, 흐름이 커질수록 유지보수가 어려워집니다.수십 개의 Processor가 하나의 Canvas에 노출되어 복잡도가 증가동일한 흐름을 다른 프로젝트나 환경에 재사용하기 어려움팀 단위 협업 시 한 명이 작업 중이면 다른 사람은 접근이 어렵다는 한계이런 문제를 해결하기 위해 NiFi는 Process Group과 Template이라는 모듈화 수단을 제공합니다.Process Group이란?Process Gro..
-
Apache NiFi 시리즈 5회 - 다양한 파일 포맷(JSON, CSV, XML) 데이터 처리 실습기술과 산업/AI 2025. 5. 15. 19:38
Apache NiFi에서 JSON, CSV, XML 등 다양한 데이터 포맷을 읽고 변환하는 방법을 실습합니다. 데이터 통합과 변환 파이프라인 구축의 핵심을 단계별로 안내합니다. 데이터 파이프라인의 현실 – 다양한 포맷의 데이터 실무 데이터는 절대 하나의 포맷으로만 존재하지 않습니다.ERP 시스템에서는 CSV, 외부 API는 JSON, 레거시 시스템은 XML 등 다양한 형식이 혼재되어 있습니다. 데이터 엔지니어의 핵심 과제 중 하나는 이 데이터를 하나의 공통 포맷으로 통합하는 것입니다.Apache NiFi는 이 문제를 매우 직관적이고 강력하게 해결할 수 있습니다. 이번 실습에서는 CSV, XML, JSON 파일을 읽어 JSON으로 통합하는 기본 파이프라인을 구축해 보겠습니다. 실습 목표Input (CS..
-
Apache NiFi 시리즈 4회 - JSON 데이터를 분기 처리하는 방법기술과 산업/AI 2025. 5. 12. 21:00
Apache NiFi의 EvaluateJsonPath Processor를 사용하여 JSON 데이터를 읽고, 특정 조건에 따라 데이터를 자동으로 분기 처리하는 방법을 실습합니다.데이터 파이프라인에서 JSON이 중요한 이유최근 데이터는 대부분 JSON 형식으로 전달됩니다. API 응답, 로그 데이터, IoT 스트림 등 다양한 시스템이 JSON을 표준으로 사용합니다.Apache NiFi에서도 JSON 파일을 읽고, 특정 속성 값에 따라 조건 분기(Conditional Routing) 하는 기능이 매우 중요합니다.이번 회차에서는 EvaluateJsonPath Processor를 이용해 JSON 속성을 추출하고, 이를 기반으로 흐름을 분기하는 실습을 진행하겠습니다.실습 목표플로우 구성GenerateFlowFile..
-
Apache NiFi 시리즈 3회 - FlowFile과 Processor를 활용한 데이터 흐름 설계 실습기술과 산업/AI 2025. 5. 9. 15:53
Apache NiFi의 핵심 구성 요소인 FlowFile과 Processor의 개념을 이해하고, 간단한 실습을 통해 데이터 흐름을 구성하는 과정을 단계별로 소개합니다.본격적인 실습에 앞서 – 핵심 구성 요소 다시 보기Apache NiFi의 구조를 제대로 이해하려면 두 가지 개념은 반드시 짚고 넘어가야 합니다.Processor: 데이터를 수집, 처리, 변환, 전송하는 단위 기능. 각 Processor는 고유의 역할을 수행합니다.FlowFile: NiFi에서 이동하는 단위 데이터 객체. 실제 데이터(Content)와 속성(Attribute)를 함께 갖습니다.이 두 가지 요소를 조합해 다양한 데이터 흐름을 설계하는 것이 NiFi의 본질입니다.실습 목표: 간단한 데이터 흐름 만들기로컬에서 Apache NiFi가..
-
Apache NiFi 시리즈 2회 - Apache NiFi 설치 및 환경 구성 가이드기술과 산업/AI 2025. 5. 7. 16:15
Apache NiFi를 설치하고 로컬 환경에서 실행하는 방법을 OS별로 정리했습니다. GUI 기반의 첫 화면과 주요 UI 구성도 함께 설명합니다. 시작하며 – 설치는 복잡하지 않다 Apache NiFi의 장점 중 하나는 설치가 매우 간단하다는 점입니다. Apache 재단에서 배포하는 공식 바이너리를 다운로드하면, 별도의 데이터베이스나 복잡한 의존성 없이도 바로 실행이 가능합니다. Java만 설치되어 있다면 곧바로 시작할 수 있습니다. 이번 회에서는 NiFi를 로컬 환경에서 설치하고 브라우저에서 실행하는 전체 흐름을 소개합니다. 또한 웹 기반 GUI의 핵심 구성요소도 함께 살펴보겠습니다. 필수 요구사항 Java 8 이상 (JDK 8 또는 11 권장)대부분의 NiFi 버전은 Java 8~11과 호환됩니다..
-
Apache NiFi 시리즈 1회 - Apache NiFi란 무엇인가기술과 산업/AI 2025. 5. 7. 16:10
데이터가 실시간으로 폭발적으로 생성되는 시대입니다. 센서에서 수집되는 IoT 스트림, 실시간 결제 로그, 웹 사용자 행동 데이터까지 — 이런 데이터들을 수집하고, 정제하고, 분석 시스템으로 보내기 위해 많은 기업들이 고민하고 있습니다. 과거에는 이 모든 과정을 코드로 작성하거나 배치 프로그램을 통해 처리했습니다. 하지만 시간이 흐를수록 데이터 흐름 자체를 설계하고 자동화해야 할 필요성이 커졌습니다. 바로 이런 문제를 해결하기 위해 등장한 것이 Apache NiFi입니다. 데이터 흐름 자동화 플랫폼, Apache NiFi Apache NiFi는 **데이터 수집부터 분배까지 전 과정을 시각적으로 구성하고 자동화할 수 있는 오픈소스 데이터 흐름 관리 시스템(Data Flow Management System)..