본문 바로가기
R 과 데이터분석/기초 문법 ~ 머신러닝

[R 데이터분석] 14장. 상관분석

by JoyfulS 2019. 9. 13.

 

# chap14_Correlation

# 상관분석(Correlation Analysis)

# 1. 상관계수     

#    - 피어슨의 r : 상관분석의 척도로 사용 ( -1 <= r <= 1)

# 2. 상관계수 시각화 

# 3. 공분산(CoVariance) 

 


### 사용된 파일은 https://joyfuls.tistory.com/4 에서 다운 받으실 수 있습니다.
getwd()
setwd("C:/2_Rwork/Part-III")

product <- read.csv("product.csv")
str(product)
# 'data.frame': 264 obs. of  3 variables:
# $ 제품_친밀도: 1~5
# $ 제품_적절성: 1~5
# $ 제품_만족도: 1~5

# 형식) cor(x, y, method)

# 1. 상관계수
cor(product$제품_친밀도, product$제품_적절성) # 0.4992086
cor(product$제품_친밀도, product$제품_만족도) # 0.467145
cor(product$제품_적절성, product$제품_만족도) # 0.7668527
cor(product)
#              제품_친밀도 제품_적절성 제품_만족도
# 제품_친밀도   1.0000000   0.4992086   0.4671450
# 제품_적절성   0.4992086   1.0000000   0.7668527
# 제품_만족도   0.4671450   0.7668527   1.0000000

# 2. 상관계수 시각화
install.packages("PerformanceAnalytics")
library(PerformanceAnalytics)

chart.Correlation(product)


# 3. 공분산(CoVariance)
# - 두 변인 X, Y의 관계를 나타내는 양

cor(product) # 상관계수 행렬
cov(product) # 공분산 행렬

# 상관계수 vs 공분산
# 상관계수 : 두 변수의 관계를 크기와 방향(+,-)으로 나타냄
# 공분산 : 두 변수의 관계를 크기로 나타냄


댓글