본문 바로가기

Python 과 머신러닝/II. 데이터처리 문법8

[Python 머신러닝] 2장. 차트 시각화 - (1)matplot 1. matplot 이용해서 차트 그리기 """ 차트 그리기 1. 기본 차트 그리기 2. 산점도 그리기 3. subplot 이용 차트 그리기 4. 차트 크기 지정 5. ggplot 이용 차트 그리기(multi plots) """ # 차트 생성 import matplotlib.pyplot as plt # 한글 지원하는 라이브러리 추가 from matplotlib import font_manager, rc font_name = font_manager.FontProperties(fname="c:/Windows/Fonts/malgun.ttf").get_name() rc('font', family=font_name) # 차트 축 이름 x1 x2 = fig.add_subplot(2,2,2) x3 = fig.add_.. 2019. 10. 17.
[Python 머신러닝] 1장. Pandas - (2) 기술통계, DataFrame 병합 3. 기술 통계 (Descriptive Statistics) 4. DataFrame 병합 3. 기술 통계 (Descriptive Statistics) """ 1. DataFrame 요약통계량 2. 변수 간의 상관성 분석 """ import pandas as pd product = pd.read_csv("../data/product.csv") product.info() product.head() product.tail() # 기술통계량 구하기 product.describe() # R에서 사용한 summary( )와 유사 ''' a b c count 264.000000 264.000000 264.000000 mean 2.928030 3.132576 3.094697 std 0.970345 .. 2019. 10. 16.
[Python 머신러닝] 1장. Pandas - (1) Series와 DataFrame 1. Series 2. DataFrame 1. Series """ Series 객체 특징 - pandas 1차원 자료구조 : vector - 수학/통계 함수 제공 - 범위 수정, 블럭 연산 - indexing 기능 - 시계열 데이터 처리 """ import pandas as pd # 사용법 : pd.Series() from pandas import Series # 사용법 : Series() # 1. Series 생성 # 1) list이용 price = pd.Series( [4000, 3000, 3500, 2000] ) print(price) ''' 0 4000 1 3000 2 3500 3 2000 ''' print(price.index) # RangeIndex(start=0, stop.. 2019. 10. 16.
[Python 머신러닝] 아나콘다 설치 & 스파이더 환경설정 아나콘다(Anaconda)란? - 아나콘다는 패키지 관리와 디플로이(deploy)를 단순하게 하고자 데이터 분석처리 등과 관련된 패키지, 파이썬, R을 묶어놓은 오픈 소스 배포판이다. ( 파이썬 배포판 ) - 따라서 Python 설치 및 분석 관련 라이브러리를 제공한다. - 데이터 과학, 기계 학습 애플리케이션, 대규모 데이터 처리, 예측 분석 등이 목적일 때 유용하게 사용할 수 있다. - 패키지 버전들은 패키지 관리 시스템 conda를 통해 관리된다. - 아나콘다 배포판은 1300만 명 이상의 사용자들이 사용하며 윈도우, 리눅스, macOS에 적합한 1,400개 이상의 유명 데이터 과학 패키지가 포함되어 있다. - 아나콘다의 주요 라이브러리 : pandas, numpy, matplotlib, stati.. 2019. 10. 15.