'데이터분석/1~2장 - 데이터 입출력' 카테고리의 글 목록

데이터분석/1~2장 - 데이터 입출력

판다스 데이터분석 1~2장 2023.02.18

판다스 데이터분석 1~2장

2023. 2. 18. 00:03

시리즈

시리즈 : 데이터가 순차적으로 나열된 1차원 배열의 형태

데이터프레임

데이터프레임: 2차원 배열 (행렬)

시리즈

import pandas as pd

dict_data = {'a':1, 'b':2, 'c':3}

pd = pd.Series(dict_data)

print(type(pd))
print('\n')
print(pd)

<class 'pandas.core.series.Series'>


a    1
b    2
c    3
dtype: int64

데이터 프레임

import pandas as pd

dict_data = {'c0':[1,2,3], 'c1':[4,5,6], 'c2':[7,8,9], 'c3':[10,11,12], 'c4':[13,14,15]}

df = pd.DataFrame(dict_data)

print(type(df))
print('\n')
print(df)


<class 'pandas.core.frame.DataFrame'>
   c0  c1  c2  c3  c4
0   1   4   7  10  13
1   2   5   8  11  14
2   3   6   9  12  15

type()으로 뽑아보면

<class 'pandas.core.frame.DataFrame'>

데이터프레임을 확인할 수 있다.

행 인덱스/열 이름 설정

import pandas as pd

df = pd.DataFrame([[15,'남','덕영중'],[17,'여','수리중']],
                  index = ['준서',"예은"], 
                  columns = ['나이','성별','학교'])

print(df)
print('\n')
print(df.index)
print('\n')
print(df.columns)


    나이 성별   학교
준서  15  남  덕영중
예은  17  여  수리중


Index(['준서', '예은'], dtype='object')


Index(['나이', '성별', '학교'], dtype='object')

행 인덱스/열 이름 설정 :

행 인덱스 변경: df.index = rename

열 이름 변경: df.columns = rename

실습해보자.

df.index = ["학생1","학생2"]
df.columns = ["연령","남녀","소속"]

print(df)
print('\n')
print(df.index)
print('\n')
print(df.columns)

결과값

    나이 성별   학교
준서  15  남  덕영중
예은  17  여  수리중


Index(['준서', '예은'], dtype='object')


Index(['나이', '성별', '학교'], dtype='object')
     연령 남녀   소속
학생1  15  남  덕영중
학생2  17  여  수리중


Index(['학생1', '학생2'], dtype='object')


Index(['연령', '남녀', '소속'], dtype='object')

행 인덱스/열 이름 설정

rename() 함수를 통해서도 가능하다.

행 인덱스 변경 : df.rename(index={기존: 새})

열 이름 변경 : df.rename(columns = {기존: 새})

import pandas as pd

df = pd.DataFrame([[15,'남','덕영중'],[17,'여','수리중']],
                  index = ['준서','예은'],
                  columns = ['나이','성별','학교'])
print(df)
print('\n')

df.rename(columns={'나이':'연령','성별':'남녀','학교':'소속'},inplace = True)
df.rename(index = {'준서':'학생1','예은':'학생2'},inplace = True)

print(df)


    나이 성별   학교
준서  15  남  덕영중
예은  17  여  수리중


     연령 남녀   소속
학생1  15  남  덕영중
학생2  17  여  수리중

행 / 열 삭제

df.drop(행 / 배열, axis= 0 or 1)

PREV 이전 1 NEXT 다음

인공재환

데이터분석/1~2장 - 데이터 입출력

판다스 데이터분석 1~2장

+ Recent posts

티스토리툴바