R 과 데이터분석/[활용] 공동주택 가격 분석

[R 데이터분석] 공동주택 가격현황분석 - (1) 개요

JoyfulS 2019. 11. 28. 15:28

 

 

R을 이용해 공동주택 가격에 대한 통계분석을 시도해보았습니다.

이번 게시물에서는

 

1. 공동주택에 대한 설명

2. 사용한 데이터에 대한 소개

3. 데이터 전처리

4. EDA

5. 가격의 통계분석

6. 교차분석

7. 추가상관분석 & 회귀분석

 

에 대해 다뤄보겠습니다.

 


1.  공동주택이란?

 

 

- 건축물의 벽 · 복도 · 계단이나 그 밖의 설비 등의 전부 또는 일부를 공동으로 사용하는 각 세대가 하나의 건축물 안에서 각각 독립된 주거생활을 할 수 있는 구조로 된 주택

- 「건축법」에서는 공동주택의 종류와 범위를 아파트, 연립주택, 다세대주택  기숙사로 규정하고 있다.

① 아파트 : 주택으로 쓰는 층수가 5개 층 이상인 주택

② 연립주택, 다세대주택 : 주택으로 쓰는 1개 동의 바닥면적 합계가 660m2를 초과하고, 층수가 4개 층 이하인 주택

③ 기숙사 : 학교 또는 공장 등의 학생 또는 종업원 등을 위하여 쓰는 것으로서 1개 동의 공동취사시설 이용 세대 수가 전체의 50% 이상인 것(학생복지주택 포함)

- 「주택법」에서는 공동주택을 건축물의 벽 · 복도 · 계단이나 그 밖의 설비 등의 전부 또는 일부를 공동으로 사용하는 각 세대가 하나의 건축물 안에서 각각 독립된 주거생활을 할 수 있는 구조로 된 주택으로 정의하고, 그 종류와 범위는 「건축법」에 의한 아파트, 연립주택 및 다세대주택의 규정에 따르고 있다.

 

출처 : [네이버 지식백과] 공동주택 (토지이용 용어사전)

 

- 주택 유형별 주거 비율을 살펴보았을 때, 공동주택에 해당하는 주택 유형이 약 74% 정도

- 따라서 공동주택이 상당한 양의 국내 주택을 이루고 있으므로, 공동주택 가격 데이터만 살피더라도 유의미한 주택 가격 통계 자료로 사용할 수 있을 것이라 생각함

 

 

 

2. 사용한 데이터 소개

- 괄호 안은 임의로 부여한 파일명

- 총 4개의 데이터를 사용했으나, 주된 분석은 gongdong과 gongdong_price, gongdong_price2 자료만 가지고 진행

 

 

>> 사용 데이터 파일은 다음 링크를 통해 다운 받으실 수 있습니다.

https://drive.google.com/file/d/1DzOminjLAGnGlEPIj7RkbtYG_U3VMO3y/view?usp=sharing

 

공동주택 빅데이터.zip

 

drive.google.com

 

데이터의 형태,  데이터 살펴보기

- 'K-ICT빅데이터센터'에 업로드 된 '공간과 가치'가 제공하는 공동주택 관련 데이터

- 위치정보가 주된 정보이고, 주택 구분과 건축년도를 알 수 있음

 

 

- 'K-ICT빅데이터센터'에 업로드 된 '공간과 가치'가 제공하는 공동주택 관련 데이터

- 주택의 가격과 평수를 알 수 있음
- 앞의 자료와 연결되는, 공통된 '고유코드', '공동주택명' 필드를 가지고 있음

 

 

- 지역별 연령별 인구수가 담긴 데이터

- 출처 : 통계청

 

- 지역별 부동산임대업 소상공인의 수를 알 수 있는 데이터

- 출처 : K-ICT빅데이터센터

 

 

 

데이터 사용 방향

- 'gongdong' 데이터에서 위치 및 지역정보를 얻고, 'gongdong_price' 데이터에서 가격정보를 얻는다

- 두 데이터는 공통된 칼럼('고유코드')으로 조인하여 사용한다.

- 'gongdong'과 'gongdong_price' 데이터를 '고유코드'로 결합하여 사용한다.
- 공동주택 가격을 결정하는 요소를 찾기 위해 가격과 여러 변수들의 상관관계를 분석한다.

  ( 가격 & 평수, 위치, 주택형태 등)

 

 

>> 다음 게시물

[R 데이터분석] 공동주택 가격현황분석 - (2) 데이터 전처리