AI/데이터
분야별 데이터 수집 전략 가이드 시리즈 - 2화. 공공데이터포털 완전 정복: API 인증부터 실전 수집까지
B컷개발자
2025. 5. 5. 13:50
공공데이터포털(data.go.kr)을 통해 API 인증을 받고, 인구·기후·부동산 등 주요 데이터를 Python으로 실전 수집하는 전략을 알려드립니다.
대한민국 오픈데이터의 허브, 공공데이터포털
공공데이터포털(data.go.kr)은 대한민국 행정 각 부처, 지자체, 공공기관이 보유한 데이터를 통합 제공하는 국가 플랫폼입니다.
2025년 현재 45,000건 이상의 API, CSV, XML 형식 데이터가 등록돼 있으며, API 기반 실시간 수집이 가능한 항목만 해도 7,000건이 넘습니다.
실제로 AI 학습용, 블로그 콘텐츠 자동화, 정책 리포트 작성, 트렌드 분석 등 다양한 실무에 직접 적용되고 있습니다.
공공데이터포털 활용 시 주의할 점
항목설명
라이선스 | 대부분 공공누리 제1~4유형에 따름. 상업적 사용 시 제한조건 확인 필수 |
데이터 구조 | 일부 API는 XML 기반이므로 파싱이 번거로울 수 있음 |
인증 키 | 대부분 API는 인증키(API Key) 발급 필요. 개인용/기관용 구분 |
속도 제한 | 1일 호출 수, 분당 호출 수 제한 있음. 실시간 대량 분석 시 주의 |
🔧 Step 1: API 키 발급 방법
- 공공데이터포털 로그인
- 데이터셋 검색 후 “활용신청” 클릭
- “Open API 신청” → API Key 발급 완료
- My Page > 활용신청정보 > 발급된 API Key 확인
⚠️ 인증키는 URL에 ServiceKey=YOUR_KEY 형태로 삽입됩니다.
📈 인기 있는 실전 API 예시 3가지
분야API 이름활용 사례
인구통계 | 주민등록인구통계 (행안부) | 지역별 인구 변화 추이 시각화 |
기상 | 기상청 초단기예보 API | 날씨 예측, 농업/여행 서비스 연계 |
부동산 | 실거래가 정보 (국토교통부) | 부동산 시장 분석, 지도 시각화 |
🧪 Python 실전 예제: 서울시 인구 변화 데이터 수집
API 예시: 주민등록인구통계 서비스
1. API 정보 확인
요청 URL 예시:
https://apis.data.go.kr/1741000/StanReginCd/getStanReginCdList
2. 필요한 라이브러리 설치
pip install requests pandas xmltodict
3. Python 수집 코드
import requests
import xmltodict
import pandas as pd
# 발급받은 API Key 삽입
API_KEY = "YOUR_API_KEY"
url = f"https://apis.data.go.kr/1741000/StanReginCd/getStanReginCdList?ServiceKey={API_KEY}&type=xml"
# 요청 및 응답 파싱
response = requests.get(url)
data_dict = xmltodict.parse(response.content)
# 데이터 구조 확인
items = data_dict['StanReginCd']['row']
df = pd.DataFrame(items)
# 결과 확인
print(df.head())
📝 팁: xmltodict는 XML을 dict로 바꿔줘서 Pandas로 DataFrame 변환이 쉬워집니다.
📊 활용 예시: 시각화 및 트렌드 분석
수집한 인구 데이터를 기반으로 다음과 같은 작업이 가능합니다:
- 월별/연도별 서울시 구별 인구 추세 시각화 (matplotlib, seaborn)
- 고령 인구 비중 변화 분석 → 복지 정책 블로그 콘텐츠화
- 유동 인구와 상권 데이터를 연계한 상권 입지 분석
🛠 추천 도구 및 연계 전략
목적추천 도구설명
시각화 | Plotly, Seaborn | 지도 기반 인구분포, 추세선 |
대시보드화 | Streamlit, Dash | 웹 기반 인사이트 보고서 제작 |
자동화 | Airflow, schedule | 주기적 수집 및 리포팅 |
✍️ 실무 팁: 어떤 데이터셋부터 시작할까?
목적추천 API
블로그 콘텐츠 제작 | 기상청 날씨 API, 인구통계 |
투자/부동산 분석 | 국토부 실거래가 API, DART |
ESG 분석 | 환경부 대기질 API, 수질 API |
헬스케어 분석 | 질병청 감염병 발생 통계 |
교육/진로 콘텐츠 | KOSIS 교육통계, 고용통계 |
핵심 요약
- 공공데이터포털은 대한민국의 가장 강력한 오픈데이터 허브
- API 인증키 발급 → 요청 URL 구조 이해 → XML/JSON 파싱 순으로 접근
- 실전 수집 후에는 시각화, 자동화, 콘텐츠화로 확장 가능
다음 회차 예고 – 서울 열린데이터광장 실전 수집 전략
3화에서는 서울시에서 제공하는 열린데이터광장을 기반으로, 실시간 교통정보, 버스위치, 지하철 혼잡도 등 위치 기반 분석에 유용한 데이터를 수집하고 시각화하는 방법을 다룹니다.
LIST