iSLR3 Chapter 04. 분류(Classification) - 실습 4.6 Lab: 로지스틱 회귀, LDA, QDA4.6.1 주식시장 자료ISLR 라이브러리 안에 Smarket이라는 자료가 있다. 이 자료는 2001 - 2005년까지 1, 250일에 걸친 S&P 500 주가지수의 수익률로 구성되며, 각 날짜에 그날 이전 5일의 각 거래일 Lag1에서 Lag5에 대한 수익률이 기록되어 있다. 또한, Volume(전날에 거래된 주식 수), Today(당일의 수익률), 그리고 Direction(당일 주가지수가 Up(상승) 또는 Down(하락)인지의 여부)이 기록되어 있다. library(ISLR)names(Smarket) # 행이름 [1] "Year" "Lag1" "Lag2" "Lag3" "Lag4" [6] "Lag5" "V.. AI/ISLR 2024. 9. 2. Chapter 04. 분류(Classification) - 이론 2 4.4 선형 판별 분석(Linear Discriminant Analysis)로지스틱 회귀는 로지스틱 함수를 사용하여 두 개의 반응변수 클래스에 대해 $pr(Y=k|X=x)$를 직접 계산하고 예측한다. 통계 용어로 주어진 설명 변수 $X$에 대해 반응 변수 $Y$의 조건부 분포(conditional distribution)을 모델링한다. 조건부 분포(conditional distribution): $Y$는 이진 반응 변수(예: "Yes" 또는 "No")일 수 있고, $X$는 여러 설명 변수들의 집합일 수 있다. 이때 $X$가 특정한 값일 때 $Y$가 "Yes" 또는 "No"가 될 확률을 설명한다. 대안적 기법에서는 반응변수 $Y$의 각 클래스에서 설명 변수 $X$의 분포를 모델링하고, 그다음에 베이즈 정리.. AI/ISLR 2024. 8. 28. Chapter 04. 분류(Classification) - 이론 1 선형 회귀 모델과 질적 변수정의: 선형회귀 모델은 반응 변수 Y가 양적(quantitative)이라고 가정한다. 그러나 많은 경우, 반응 변수가 질적(qualitative)이다.예시: 눈의 색깔은 파란색, 갈색 또는 녹색의 값을 가지는 질적 변수(categorical)이다.분류와 회귀의 관계: 관측치에 대해 질적 반응 변수를 예측하는 것을 분류라고 한다. 이는 관측치를 범주 또는 클래스로 할당하는 과정이기 때문이다. 분류에 사용되는 방법(Logistic Regression)들은 질적 변수의 각 범주에 대한 확률을 예측하고, 이를 바탕으로 분류를 수행한다. 이런 의미에서 분류 방법은 회귀 방법처럼 동작할 수 있다.4.1 분류의 개요예시응급실 환자의 의료 상태 분류응급실에 오는 환자는 3가지 의료 상태 중 .. AI/ISLR 2024. 8. 21. 이전 1 다음