R 과 데이터분석24 [R 데이터분석] 공동주택 가격현황분석 - (1) 개요 R을 이용해 공동주택 가격에 대한 통계분석을 시도해보았습니다. 이번 게시물에서는 1. 공동주택에 대한 설명 2. 사용한 데이터에 대한 소개 3. 데이터 전처리 4. EDA 5. 가격의 통계분석 6. 교차분석 7. 추가상관분석 & 회귀분석 에 대해 다뤄보겠습니다. 1. 공동주택이란? - 건축물의 벽 · 복도 · 계단이나 그 밖의 설비 등의 전부 또는 일부를 공동으로 사용하는 각 세대가 하나의 건축물 안에서 각각 독립된 주거생활을 할 수 있는 구조로 된 주택 - 「건축법」에서는 공동주택의 종류와 범위를 아파트, 연립주택, 다세대주택 및 기숙사로 규정하고 있다. ① 아파트 : 주택으로 쓰는 층수가 5개 층 이상인 주택 ② 연립주택, 다세대주택 : 주택으로 쓰는 1개 동의 바닥면적 합계가 660m2를 초과하고,.. 2019. 11. 28. [R 데이터분석] 18장. 연관분석 # chap18_AssociationAnalysis # 연관분석(Association Analysis) # 1. 연관규칙 평가 척도 (지지도, 신뢰도, 향상도) # 2. 트랜잭션 객체 생성 # 3. 연관규칙 시각화 # 4. 식료품점 파일 예제 # 군집분석 : 그룹핑 하는 작업 # ↓ # 연관분석 : 그룹에 대한 특성 분석(장바구니 분석) #-------------------------------------------------- # 연관분석은 군집분석에 의해서 그룹핑된 cluster를 대상으로 해당 # 그룹에 대한 특성을 분석하는 방법으로 장바구니 분석으로 알려짐 # 즉 유사한 개체들을 클러터로 그룹화하여 각 집단의 특성 파악 # 대용량 데이터베이스에서는 전체 데이터를 유사한 클러스터로 묶어서 관찰 및 .. 2019. 9. 13. [R 데이터분석] 17장. 군집분석 # chap17_ClusteringAnalysis # 군집분석(Clustering) # 1. 유클리드 거리 # 2. 계층적 군집분석(탐색적 분석) # 3. 계층형 군집분석에 그룹수 지정 # 4. 비계층적 군집분석(확인적 분석) # + 군집 수 결정 방법 # 고객DB -> 알고리즘 -> 군집 # 알고리즘을 통해서(패턴으로) 근거리 모형으로 군집형성 - 규칙(rule) # 변수에 의해서 그룹핑되다. # 변수 적용 : 상품카테고리, 구매금액, 총거래금액 # 유사성 거리에 의한 유사객체를 묶어준다. # 거리를 측정하여 집단의 이질성과 동질성을 평가하고, 이를 통해서 군집을 형성한다. # 유사성 거리 : 유클리드 거리 # y변수가 없는 데이터 마이닝 기법 # 예) 몸, 키 관점에서 묶음 -> 3개 군집 2019. 9. 13. [R 데이터분석] 16장. 분류분석 # chap16_1_DecisionTree # 분류분석 install.packages("rpart") # 분류모델 제공 패키지 library(rpart) # rpart() : 분류모델 생성 install.packages("rpart.plot") library(rpart.plot) # prp(), rpart.plot() : rpart 시각화 install.packages('rattle') library('rattle') # fancyRpartPlot() : node 번호 시각화 # 단계1. 실습데이터 생성 data(iris) set.seed(415) idx = sample(1:nrow(iris), 0.7*nrow(iris)) train = iris[idx, ] # 훈련셋 test = iris[-idx, ].. 2019. 9. 13. 이전 1 2 3 4 5 6 다음