본문 바로가기

R 과 데이터분석24

[R 데이터분석] 11장. 기술통계분석 # chap11_Descriptive Statistics # 기술통계(Descriptive Statistics) # 1. 척도별 기술통계량 # 2. 대푯값 # 3. 산포도 # 4. 비대칭도 # 5. 기술통계량 보고서 작성법 # 대푯값 : 평균(Mean), 합계(Sum), 중위수(Median), 최빈수(mode), 사분위수(quartile) 등 # 산포도 : 분산(Variance), 표준편차(Standard deviation), 최소값(Minimum), 최대값(Maximum), 범위(Range) 등 # 비대칭도 : 왜도(Skewness), 첨도(Kurtosis) ### 사용된 파일은 https://joyfuls.tistory.com/4 에서 다운 받으실 수 있습니다. # 실습파일 가져오기 setwd("C:.. 2019. 9. 13.
[R 데이터분석] 10장. 통계분석절차와 통계지식 # chap10_Hypothesis_Test # 통계분석절차와 통계지식 # 통계분석 절차 (feat. 논문/보고서 작성을 위한 통계분석 절차) - 연구조사 -> 가설 설정 -> 유의수준 결정 -> 측정도구 선정 -> 데이터 수집 -> 데이터 코딩/프로그래밍 -> 통계분석 수행(R,SPSS,SAS 등 활용) 0. 연구조사 - 연구문제 선정 : 연구의 독창성, 검증가능성, 결과의 실용성, 구체성, 경제성(소요비용, 노력) 등을 선정 기준으로 삼음 - 예비조사 : 연구 문제에 대한 사전 지식 획득, 변수 규명, 가설 도출 등을 위해 실시하는 조사(문헌조사, 전문가 조사, 사례 조사 등) - 연구모형 : 연구문제에서 개념과 변수를 식별하는 과정으로 독립변수와 종속변수 형태로 기술 1. 가설 설정 - 가설(Hyp.. 2019. 9. 13.
[R 데이터분석] 9장. 정형(DB데이터)과 비정형 데이터 처리 # Chap09_1_Formal # 정형 데이터(DB Data) 처리 # Oracle or MySQL(MariaDB) # Maria DB 정형 데이터 처리 # 패키지 설치 # - RJDBC 패키지를 사용하기 위해서는 우선 java를 설치해야 한다. #install.packages("rJava") # R + JAVA install.packages("DBI") install.packages("RJDBC") # JDBC()함수 제공 # 패키지 로딩 library(DBI) Sys.setenv(JAVA_HOME='C:\\Program Files\\Java\\jre1.8.0_144') library(rJava) library(RJDBC) # rJava에 의존적이다. ################ MariaDB or.. 2019. 9. 13.
[R 데이터분석] 8장. 고급시각화 # chap08_VisualizationAnalysis # 고급시각화 # 1. lattice # 2. ggplot2 # 3. ggmap 패키지 # 1. lattice # - 격자 형태의 그래프 제공 install.packages("lattice") library(lattice) install.packages("mlmRev") library(mlmRev) # Chem97 데이터 제공 Chem97 str(Chem97) # 'data.frame': 31022 obs. of 8 variables: # score : 화학점수 # gender : 성별(M,F) # gcsescore : 입학점수 head(Chem97) table(Chem97$score) # 1) histogram # histogram(~x, data.. 2019. 9. 13.