시리즈
시리즈 : 데이터가 순차적으로 나열된 1차원 배열의 형태
데이터프레임
데이터프레임: 2차원 배열 (행렬)
시리즈
import pandas as pd
dict_data = {'a':1, 'b':2, 'c':3}
pd = pd.Series(dict_data)
print(type(pd))
print('\n')
print(pd)
<class 'pandas.core.series.Series'>
a 1
b 2
c 3
dtype: int64
데이터 프레임
import pandas as pd
dict_data = {'c0':[1,2,3], 'c1':[4,5,6], 'c2':[7,8,9], 'c3':[10,11,12], 'c4':[13,14,15]}
df = pd.DataFrame(dict_data)
print(type(df))
print('\n')
print(df)
<class 'pandas.core.frame.DataFrame'>
c0 c1 c2 c3 c4
0 1 4 7 10 13
1 2 5 8 11 14
2 3 6 9 12 15
type()으로 뽑아보면
<class 'pandas.core.frame.DataFrame'>
데이터프레임을 확인할 수 있다.
행 인덱스/열 이름 설정
import pandas as pd
df = pd.DataFrame([[15,'남','덕영중'],[17,'여','수리중']],
index = ['준서',"예은"],
columns = ['나이','성별','학교'])
print(df)
print('\n')
print(df.index)
print('\n')
print(df.columns)
나이 성별 학교
준서 15 남 덕영중
예은 17 여 수리중
Index(['준서', '예은'], dtype='object')
Index(['나이', '성별', '학교'], dtype='object')
행 인덱스/열 이름 설정 :
행 인덱스 변경: df.index = rename
열 이름 변경: df.columns = rename
실습해보자.
df.index = ["학생1","학생2"]
df.columns = ["연령","남녀","소속"]
print(df)
print('\n')
print(df.index)
print('\n')
print(df.columns)
결과값
나이 성별 학교
준서 15 남 덕영중
예은 17 여 수리중
Index(['준서', '예은'], dtype='object')
Index(['나이', '성별', '학교'], dtype='object')
연령 남녀 소속
학생1 15 남 덕영중
학생2 17 여 수리중
Index(['학생1', '학생2'], dtype='object')
Index(['연령', '남녀', '소속'], dtype='object')
행 인덱스/열 이름 설정
rename() 함수를 통해서도 가능하다.
행 인덱스 변경 : df.rename(index={기존: 새})
열 이름 변경 : df.rename(columns = {기존: 새})
import pandas as pd
df = pd.DataFrame([[15,'남','덕영중'],[17,'여','수리중']],
index = ['준서','예은'],
columns = ['나이','성별','학교'])
print(df)
print('\n')
df.rename(columns={'나이':'연령','성별':'남녀','학교':'소속'},inplace = True)
df.rename(index = {'준서':'학생1','예은':'학생2'},inplace = True)
print(df)
나이 성별 학교
준서 15 남 덕영중
예은 17 여 수리중
연령 남녀 소속
학생1 15 남 덕영중
학생2 17 여 수리중
행 / 열 삭제
df.drop(행 / 배열, axis= 0 or 1)