XGBoost
-
머신러닝 알고리즘별 개념 비교 및 초보자용 설명기술과 산업/AI 2025. 5. 21. 13:02
머신러닝 알고리즘별 개념 비교 및 초보자용 설명선형 회귀 (Linear Regression)항목 설명개념예: "광고비를 얼마나 쓰면 매출이 얼마나 나올까?"처럼 수치를 예측하는 데 사용R 예시parsnip::linear_reg()Python 예시sklearn.linear_model.LinearRegression()실습 데이터advertising.csv - TV, Radio, Newspaper 광고비와 매출의 관계초보자 설명“Y = aX + b”라는 수학식. X(광고비)가 커지면 Y(매출)이 어떻게 변하는지 ‘선’으로 설명하려고 하는 모델입니다.결정 트리 (Decision Tree)항목 설명개념"고객이 이탈할까 아닐까?", “가격대는 얼마쯤일까?”를 규칙 기반으로 나누며 예측R 예시parsnip::deci..
-
AI/ML 기반 데이터 분석 시리즈 9화 - 앙상블 학습(Ensemble Learning)과 실전 적용 전략기술과 산업/AI 2025. 5. 14. 16:24
머신러닝에서 단일 모델의 한계를 극복하는 대표적 방법이 바로 앙상블 학습(Ensemble Learning) 입니다.이번 글에서는 다양한 앙상블 기법의 개념, 대표 모델, 튜닝 포인트, 그리고 실전 코드 예제까지 폭넓게 정리합니다.실무 프로젝트에서 최고 성능을 내고 싶다면 반드시 이해해야 할 필수 영역입니다. 1. 앙상블 학습이란? 앙상블(Ensemble)은 여러 개의 모델을 조합하여 예측 성능을 높이는 전략입니다.개별 모델의 약점을 서로 보완하면서 더욱 안정적이고 강건한 예측을 만들 수 있습니다. 약한 학습기(weak learner) → 강한 학습기(strong learner) 2. 주요 앙상블 전략 2.1 배깅 (Bagging) 데이터의 샘플을 중복 추출하여 여러 모델을 학습시키고 평균을 내는 방..
-
AI/ML 기반 데이터 분석 시리즈 8화 - 회귀(Regression) 모델의 구조와 실전 예측 전략기술과 산업/AI 2025. 5. 12. 19:56
분류 모델이 ‘범주(class)’를 예측하는 것이라면, 회귀(Regression) 모델은 연속적인 숫자 값을 예측하는 데 사용됩니다.가격 예측, 수요 예측, 에너지 사용량 예측, 온도 예측, 매출 예측 등 거의 모든 산업 영역에서 회귀 문제는 필수적인 AI 분석 기법입니다.이번 글에서는 회귀 문제의 정의, 대표 알고리즘, 평가 지표, 실전 구현 방법까지 통합적으로 다룹니다.1. 회귀 문제란 무엇인가?회귀 모델은 데이터를 기반으로 숫자형 목표 변수(target) 를 예측합니다.실제로 비즈니스에서는 범주형보다 연속형 예측이 더 많이 요구됩니다.예시입력 데이터 타겟 값평수, 방 수, 위치아파트 가격고객 나이, 구매 횟수예상 구매 금액주가 과거 데이터내일 종가 예측2. 회귀 문제의 주요 특징출력값이 정해진 값이..