본문 바로가기
R 과 데이터분석/[활용] 공동주택 가격 분석

[R 데이터분석] 공동주택 가격현황분석 - (1) 개요

by JoyfulS 2019. 11. 28.

 

 

R을 이용해 공동주택 가격에 대한 통계분석을 시도해보았습니다.

이번 게시물에서는

 

1. 공동주택에 대한 설명

2. 사용한 데이터에 대한 소개

3. 데이터 전처리

4. EDA

5. 가격의 통계분석

6. 교차분석

7. 추가상관분석 & 회귀분석

 

에 대해 다뤄보겠습니다.

 


1.  공동주택이란?

 

 

- 건축물의 벽 · 복도 · 계단이나 그 밖의 설비 등의 전부 또는 일부를 공동으로 사용하는 각 세대가 하나의 건축물 안에서 각각 독립된 주거생활을 할 수 있는 구조로 된 주택

- 「건축법」에서는 공동주택의 종류와 범위를 아파트, 연립주택, 다세대주택  기숙사로 규정하고 있다.

① 아파트 : 주택으로 쓰는 층수가 5개 층 이상인 주택

② 연립주택, 다세대주택 : 주택으로 쓰는 1개 동의 바닥면적 합계가 660m2를 초과하고, 층수가 4개 층 이하인 주택

③ 기숙사 : 학교 또는 공장 등의 학생 또는 종업원 등을 위하여 쓰는 것으로서 1개 동의 공동취사시설 이용 세대 수가 전체의 50% 이상인 것(학생복지주택 포함)

- 「주택법」에서는 공동주택을 건축물의 벽 · 복도 · 계단이나 그 밖의 설비 등의 전부 또는 일부를 공동으로 사용하는 각 세대가 하나의 건축물 안에서 각각 독립된 주거생활을 할 수 있는 구조로 된 주택으로 정의하고, 그 종류와 범위는 「건축법」에 의한 아파트, 연립주택 및 다세대주택의 규정에 따르고 있다.

 

출처 : [네이버 지식백과] 공동주택 (토지이용 용어사전)

 

- 주택 유형별 주거 비율을 살펴보았을 때, 공동주택에 해당하는 주택 유형이 약 74% 정도

- 따라서 공동주택이 상당한 양의 국내 주택을 이루고 있으므로, 공동주택 가격 데이터만 살피더라도 유의미한 주택 가격 통계 자료로 사용할 수 있을 것이라 생각함

 

 

 

2. 사용한 데이터 소개

- 괄호 안은 임의로 부여한 파일명

- 총 4개의 데이터를 사용했으나, 주된 분석은 gongdong과 gongdong_price, gongdong_price2 자료만 가지고 진행

 

 

>> 사용 데이터 파일은 다음 링크를 통해 다운 받으실 수 있습니다.

https://drive.google.com/file/d/1DzOminjLAGnGlEPIj7RkbtYG_U3VMO3y/view?usp=sharing

 

공동주택 빅데이터.zip

 

drive.google.com

 

데이터의 형태,  데이터 살펴보기

- 'K-ICT빅데이터센터'에 업로드 된 '공간과 가치'가 제공하는 공동주택 관련 데이터

- 위치정보가 주된 정보이고, 주택 구분과 건축년도를 알 수 있음

 

 

- 'K-ICT빅데이터센터'에 업로드 된 '공간과 가치'가 제공하는 공동주택 관련 데이터

- 주택의 가격과 평수를 알 수 있음
- 앞의 자료와 연결되는, 공통된 '고유코드', '공동주택명' 필드를 가지고 있음

 

 

- 지역별 연령별 인구수가 담긴 데이터

- 출처 : 통계청

 

- 지역별 부동산임대업 소상공인의 수를 알 수 있는 데이터

- 출처 : K-ICT빅데이터센터

 

 

 

데이터 사용 방향

- 'gongdong' 데이터에서 위치 및 지역정보를 얻고, 'gongdong_price' 데이터에서 가격정보를 얻는다

- 두 데이터는 공통된 칼럼('고유코드')으로 조인하여 사용한다.

- 'gongdong'과 'gongdong_price' 데이터를 '고유코드'로 결합하여 사용한다.
- 공동주택 가격을 결정하는 요소를 찾기 위해 가격과 여러 변수들의 상관관계를 분석한다.

  ( 가격 & 평수, 위치, 주택형태 등)

 

 

>> 다음 게시물

[R 데이터분석] 공동주택 가격현황분석 - (2) 데이터 전처리

댓글