728x90
python분석
-
AI/ML 기반 데이터 분석 시리즈 4화 - 데이터 수집과 탐색적 분석(EDA)의 전략과 실전기술과 산업/AI 2025. 5. 4. 11:51
데이터 분석 프로젝트의 품질은 데이터를 어떻게 ‘얻고’, ‘이해하고’, ‘정제했는지’에서 결정됩니다.그 시작점이 바로 데이터 수집(Data Acquisition) 과 탐색적 데이터 분석(EDA, Exploratory Data Analysis) 입니다.이 글에서는 AI/ML 기반 분석 프로젝트를 위한 데이터 수집 전략과 EDA 흐름을 실전 중심으로 정리합니다. 데이터는 어디서 오는가: 수집 채널의 종류 분석 대상 데이터는 다양한 방식으로 수집할 수 있습니다. 주요 채널은 다음과 같습니다. 1. 공개 데이터셋 Kaggle Datasets, UCI ML Repository, Data.gov, 공공데이터포털학습, 연구, 프로토타이핑에 적합 2. API 기반 수집 REST API, GraphQL, Web A..