Apache NiFi 시리즈 3회 - FlowFile과 Processor를 활용한 데이터 흐름 설계 실습

기술과 산업/AI

B컷개발자 2025. 5. 9. 15:53

728x90

Apache NiFi의 핵심 구성 요소인 FlowFile과 Processor의 개념을 이해하고, 간단한 실습을 통해 데이터 흐름을 구성하는 과정을 단계별로 소개합니다.

본격적인 실습에 앞서 – 핵심 구성 요소 다시 보기

Apache NiFi의 구조를 제대로 이해하려면 두 가지 개념은 반드시 짚고 넘어가야 합니다.

이 두 가지 요소를 조합해 다양한 데이터 흐름을 설계하는 것이 NiFi의 본질입니다.

로컬에서 Apache NiFi가 실행 중이어야 합니다. (http://localhost:8080/nifi)

GenerateFlowFile → LogAttribute → PutFile

이 흐름을 통해 FlowFile이 어떤 구조로 생성되고 어떻게 이동하는지 시각적으로 이해할 수 있습니다.

이 Processor는 지정한 간격마다 텍스트 데이터를 생성합니다.

이 Processor는 FlowFile의 메타데이터(속성)를 로그로 출력해줍니다.

이 Processor는 최종 데이터를 로컬 디스크에 저장합니다.

FlowFile은 크게 2가지 정보를 포함합니다:

구성 요소 설명

Content	실제 데이터 (예: 텍스트, JSON, CSV 등)
Attribute	이름-값 쌍 형태의 메타데이터 (예: 파일명, 크기, 경로 등)

이 구조 덕분에 하나의 데이터가 흐르면서 유연하게 라우팅, 변환, 필터링될 수 있습니다.

속성 이름 설명

NiFi에서는 Processor마다 다양한 속성이 자동으로 붙거나 수정되며, 이를 조건 분기 등에 활용할 수 있습니다.

이번 실습을 통해 NiFi에서 데이터가 생성 → 변환 → 저장되는 일련의 흐름을 직접 체험해보았습니다.
이처럼 NiFi는 간단한 테스트 플로우를 구성하는 것만으로도 매우 직관적인 학습 환경을 제공합니다.

데이터가 어떤 형태로 이동하고, 어떤 조건에서 분기되며, 어떤 속성을 유지하는지를 눈으로 보고 제어할 수 있다는 점에서, NiFi는 데이터 파이프라인 설계에 최적화된 도구입니다.

Apache NiFi 시리즈 4회 - JSON 데이터를 분기 처리하는 방법

728x90