본문 바로가기

R 과 데이터분석/기초 문법 ~ 머신러닝19

[R 데이터분석] 10장. 통계분석절차와 통계지식 # chap10_Hypothesis_Test # 통계분석절차와 통계지식 # 통계분석 절차 (feat. 논문/보고서 작성을 위한 통계분석 절차) - 연구조사 -> 가설 설정 -> 유의수준 결정 -> 측정도구 선정 -> 데이터 수집 -> 데이터 코딩/프로그래밍 -> 통계분석 수행(R,SPSS,SAS 등 활용) 0. 연구조사 - 연구문제 선정 : 연구의 독창성, 검증가능성, 결과의 실용성, 구체성, 경제성(소요비용, 노력) 등을 선정 기준으로 삼음 - 예비조사 : 연구 문제에 대한 사전 지식 획득, 변수 규명, 가설 도출 등을 위해 실시하는 조사(문헌조사, 전문가 조사, 사례 조사 등) - 연구모형 : 연구문제에서 개념과 변수를 식별하는 과정으로 독립변수와 종속변수 형태로 기술 1. 가설 설정 - 가설(Hyp.. 2019. 9. 13.
[R 데이터분석] 9장. 정형(DB데이터)과 비정형 데이터 처리 # Chap09_1_Formal # 정형 데이터(DB Data) 처리 # Oracle or MySQL(MariaDB) # Maria DB 정형 데이터 처리 # 패키지 설치 # - RJDBC 패키지를 사용하기 위해서는 우선 java를 설치해야 한다. #install.packages("rJava") # R + JAVA install.packages("DBI") install.packages("RJDBC") # JDBC()함수 제공 # 패키지 로딩 library(DBI) Sys.setenv(JAVA_HOME='C:\\Program Files\\Java\\jre1.8.0_144') library(rJava) library(RJDBC) # rJava에 의존적이다. ################ MariaDB or.. 2019. 9. 13.
[R 데이터분석] 8장. 고급시각화 # chap08_VisualizationAnalysis # 고급시각화 # 1. lattice # 2. ggplot2 # 3. ggmap 패키지 # 1. lattice # - 격자 형태의 그래프 제공 install.packages("lattice") library(lattice) install.packages("mlmRev") library(mlmRev) # Chem97 데이터 제공 Chem97 str(Chem97) # 'data.frame': 31022 obs. of 8 variables: # score : 화학점수 # gender : 성별(M,F) # gcsescore : 입학점수 head(Chem97) table(Chem97$score) # 1) histogram # histogram(~x, data.. 2019. 9. 13.
[R 데이터분석] 7장. EDA & 데이터 전처리 1. EDA란? - 탐색적 데이터 분석 (Exploratory Data Analysis) - 수집 데이터를 다양한 각도에서 관찰하고 이해하는 과정 - 그래프나 통계적 방법으로 자료를 직관적으로 파악하는 과정 2. EDA의 필요성 - 데이터의 분포와 통계를 파악하여 데이터가 가지고 있는 특성을 이해하고 잠재적인 문제 발견 - 분석 전에 다양한 문제점을 발견하고, 이를 바탕으로 기존 가설 수정 또는 새로운 가설 수립 3. EDA 과정 - 분석의 목적과 변수 특징 확인 -> 데이터셋 확인 및 전처리 -> 데이터 개별 변수 값 관찰 -> 변수 간의 관계에 초점을 맞춰 변수 패턴 발견 ------------------------------------------------------------------------.. 2019. 9. 13.