본문 바로가기

2. <Pandas> Group 간에 함수적용하기 agg() In [2]: #본 실습내용은 출판사 O'REILLY의 Pyton for Data Analisys를 참고하여 만들었음을 말씀드립니다. from numpy.random import randn import numpy as np import os import matplotlib.pyplot as plt from pandas import Series, DataFrame import pandas as pd In [6]: tips = pd.read_csv('tips.csv') tips = tips.sample(10) tips Out[6]: total_bill tip sex smoker day time size 111 7.25 1.00 Female No Sat Dinner 1 134 18.26 .. 더보기
1. <Pandas> Gruopby 그룹연산의 기초 In [1]: #본 실습내용은 출판사 O'REILLY의 Pyton for Data Analisys를 참고하여 만들었음을 말씀드립니다. from numpy.random import randn import numpy as np import os import matplotlib.pyplot as plt from pandas import Series, DataFrame import pandas as pd GroupBy mechanics¶ 그룹 간 순회하기 칼럼 또는 칼럼의 일부만 선택하기 사전과 Series 에서 묶기 함수로 묶기 색인 단계로 묶기 그룹연산: 분리 - 적용 - 결합 객체 안의 데이터를 하나 이상의 색인을 기준으로 분리 함수를 각 그룹에 적용하여 새로운 값 생성 함수를 적용한 결과를 하나의.. 더보기
1. 파이썬 아나콘다 (Python Anaconda) 설치하기 & 환경설정 1. 데이터 시각화의 툴은 R, Python 등으로 다양한데요. 저는 파이썬 아나콘다(Anaconda)를 이용하여 데이터 시각화를 하려고 합니다. 만약 이 글을 보시고 도움을 얻고자 하시는 분이 있다면 먼저 아나콘다를 설치해주세요. 아래 링크를 따라 들어가시면 다양한 선택지에 당황하실 수 있는데, 저는 파이썬 3.x 버젼을 사용합니다. 그리고 나머지 32/64bit 이냐는 개인 컴퓨터의 설정에 따라 골라서 다운받아 주시면 됩니다. 혹여 확인을 어떻게 하는지 까먹으신 분은 내컴퓨터의 속성을 확인하시면 알 수 있을거에요. 저는 64bit이므로 3.대 버젼의 초록색 버튼을 눌렀습니다:) 다운로드 링크) https://www.anaconda.com/distribution/ 2. 설치는 한가지만 주의하시고 그냥 .. 더보기