R 과 데이터분석24 [R 데이터분석] 7장. EDA & 데이터 전처리 1. EDA란? - 탐색적 데이터 분석 (Exploratory Data Analysis) - 수집 데이터를 다양한 각도에서 관찰하고 이해하는 과정 - 그래프나 통계적 방법으로 자료를 직관적으로 파악하는 과정 2. EDA의 필요성 - 데이터의 분포와 통계를 파악하여 데이터가 가지고 있는 특성을 이해하고 잠재적인 문제 발견 - 분석 전에 다양한 문제점을 발견하고, 이를 바탕으로 기존 가설 수정 또는 새로운 가설 수립 3. EDA 과정 - 분석의 목적과 변수 특징 확인 -> 데이터셋 확인 및 전처리 -> 데이터 개별 변수 값 관찰 -> 변수 간의 관계에 초점을 맞춰 변수 패턴 발견 ------------------------------------------------------------------------.. 2019. 9. 13. [R 데이터분석] 6장. 데이터 조작 # chap06_Datahandling # 데이터 조작 # 1. dplyr 패키지 ( filter, arrange, select, mutate, summarise, group_by 등) # 2. reshape2 ( dcast, melt ) ########################### ## 1. dplyr 패키지 ########################### install.packages("dplyr") library(dplyr) # 1) %>% 기호 : 함수 나열 기능 # 형식) df %>% func1() %>% func2() iris %>% head() %>% filter(Sepal.Length >= 5.0) # head(iris) # 2) tbl_df()함수 : 콘솔 크기에 맞는 데이터 구성.. 2019. 9. 13. [R 데이터분석] 5장. 데이터 시각화 # chap05_DataVisualization # 데이터 시각화 # 1. 이산변수 시각화 (막대차트, 점차트, 파이차트) # 2. 연속변수 시각화 (상자그래프, 히스토그램, 산점도) # 3. 변수간의 비교 시각화 # 4. 3차원 산점도 # 5. 차트 파일 저장 # 1. 이산변수 시각화 # - 정수형 변수(예:자녀수, 자동차 수) # - 막대차트, 점차트, 파이차트 # 차트 데이터 생성 chart_data 2019. 9. 13. [R 데이터분석] 4장. 제어문과 함수 # chap04_Control # 제어문과 함수 # 산술연산자, 관계연산자, 논리연산자 # 1. 조건문 ( if, ifelse, switch ) # 2. 반복문 ( for, while ) ############################### ## 제어문 : 조건문 + 반복문 ############################### # 산술연산자 num1 2019. 9. 13. 이전 1 2 3 4 5 6 다음