R을 사용한 로지스틱 회귀분석 (Logistic regression in R) 로지스틱 회귀분석이란? (Logistic regression) 로지스턱 회귀분석은 선형 회귀분석과 달리 결과 변수(종속 변수)가 범주형 데이터인 경우에 사용되는 기법입니다. 선형 회귀분석 모델에서는 설명 변수를 입력하면 수치형 결과를 얻게 되는데요, 신장, 시험 성적, 연간 소득 따위를 예측하고 싶을 때는 선형 회귀분석을 사용하면 됩니다. 하지만 내가 예측하고자 하는 것이 수치화 하기 힘든 변수, 예를 들면 어떤 고객이 부도를 낼 것인지의 여부, 타이타닉 호에서 살아남을 것인지의 여부, 어떤 학생의 최종 학력 (초등학고, 중학교, 대학교, 대학원 이상) 일 경우에는 선형 회귀분석 대신 로지스틱 회귀분석을 사용하게 됩니다. 회귀분석이기 때문에 기본적으로 지도 학습 (Supervised Learning) 으로 분류 되며, 다양한 분야에서 분류 및 예측을 위한 기법으로 사용되고 있습니다. 제가 근무하고 있는 라이엇 게임즈에서도 플레이어 이탈을 예측하기 위한 모델링 과정에서 로지스틱 회귀 분석을 비롯한 다양한 지도 학습 기법을 사용한 바 있습니다. 로지스틱 회귀분석 in R. R을 사용하면 아주 간단히 로지스틱 회귀분석 모델을 만들고, 이 모델을 이용해서 신규 데이터가 주어졌을 때 결과 값을 예측하는 작업을 할 수 있습니다. UCLA에서 제공하는 데이터 셋을 불러와서 데이터의 구조를 확인하면 아래와 같은 결과를 얻을 수 있습니다.
Комментариев нет:
Отправить комментарий