본문 바로가기

R 과 데이터분석/기초 문법 ~ 머신러닝19

[R 데이터분석] 18장. 연관분석 # chap18_AssociationAnalysis # 연관분석(Association Analysis) # 1. 연관규칙 평가 척도 (지지도, 신뢰도, 향상도) # 2. 트랜잭션 객체 생성 # 3. 연관규칙 시각화 # 4. 식료품점 파일 예제 # 군집분석 : 그룹핑 하는 작업 # ↓ # 연관분석 : 그룹에 대한 특성 분석(장바구니 분석) #-------------------------------------------------- # 연관분석은 군집분석에 의해서 그룹핑된 cluster를 대상으로 해당 # 그룹에 대한 특성을 분석하는 방법으로 장바구니 분석으로 알려짐 # 즉 유사한 개체들을 클러터로 그룹화하여 각 집단의 특성 파악 # 대용량 데이터베이스에서는 전체 데이터를 유사한 클러스터로 묶어서 관찰 및 .. 2019. 9. 13.
[R 데이터분석] 17장. 군집분석 # chap17_ClusteringAnalysis # 군집분석(Clustering) # 1. 유클리드 거리 # 2. 계층적 군집분석(탐색적 분석) # 3. 계층형 군집분석에 그룹수 지정 # 4. 비계층적 군집분석(확인적 분석) # + 군집 수 결정 방법 # 고객DB -> 알고리즘 -> 군집 # 알고리즘을 통해서(패턴으로) 근거리 모형으로 군집형성 - 규칙(rule) # 변수에 의해서 그룹핑되다. # 변수 적용 : 상품카테고리, 구매금액, 총거래금액 # 유사성 거리에 의한 유사객체를 묶어준다. # 거리를 측정하여 집단의 이질성과 동질성을 평가하고, 이를 통해서 군집을 형성한다. # 유사성 거리 : 유클리드 거리 # y변수가 없는 데이터 마이닝 기법 # 예) 몸, 키 관점에서 묶음 -> 3개 군집 2019. 9. 13.
[R 데이터분석] 16장. 분류분석 # chap16_1_DecisionTree # 분류분석 install.packages("rpart") # 분류모델 제공 패키지 library(rpart) # rpart() : 분류모델 생성 install.packages("rpart.plot") library(rpart.plot) # prp(), rpart.plot() : rpart 시각화 install.packages('rattle') library('rattle') # fancyRpartPlot() : node 번호 시각화 # 단계1. 실습데이터 생성 data(iris) set.seed(415) idx = sample(1:nrow(iris), 0.7*nrow(iris)) train = iris[idx, ] # 훈련셋 test = iris[-idx, ].. 2019. 9. 13.
[R 데이터분석] 15장. 회귀분석 # Chap15_1_LinearRegression & Chap15_2_LogisticRegression # 선형회귀분석(LinearRegration) # 1. 단순회귀분석 : 독립변수(x) : 1 -> 종속변수(y) # 2. 다중회귀분석 : 독립변수(x) : n -> 종속변수(y) # 3. 변수선택법 # 4. 다중공선성과 기계학습 # 5. 선형회귀분석 잔차검정과 모형진단 # 로지스틱 회귀분석(Logistic Regression) # 1. 오즈비(odds ratio) # 2. 로짓변환 # 3. sigmoid function ######################### ## 1. 단순회귀분석 ######################### # 독립변수와 종속변수가 1개인 경우 ### 사용된 파일은 https.. 2019. 9. 13.