SW/Python

[ Pandas] DataFrame tutorial

Fun with x 2024. 1. 28. 15:13

df 만들기

import pandas as pd
import numpy as np
import math as m

a=[i for i in range(1,82)]
b=[i*j for i in range(1,10) for j in range(1,10)]
c=[n**2 if n%2 == 0 else n**3 for n in range(1,82)]

df = pd.DataFrame({"a":a, "b":b, "c":c})
# df = pd.DataFrame([a,b,c],index = ["a", "b", "c"])
# df = pd.DataFrame(np.array([a,b,c]).T,columns=['a', 'b', 'c'])

 
원하는 행열의 데이터 찾기

//b열 가져오기
df.loc[:,'b'] //열 이름으로
df.iloc[:,1] //열 번호로
ix는 비추라 함

 
인덱스 찾기

df.a.idxmax() #a열에서 max의 인덱스
df.loc[df.a.idxmax()]
df.loc[df.a.idxmin(),'a']

 
행열 제거

df=df.drop(index=2) #2번 행 제거
df=df.drop(columns='a') #a열 제거

 
csv read / write

import os
os.getcwd()
PATH = os.getcwd()  #현재폴더 위치 가져오기

df.to_csv(PATH+'/test.csv', index = False) #csv로 저장, index행이름 같이 저장?

read = pd.read_csv(PATH+'/test.csv') #csv파일 읽어오기

 
.cumsum()
앞에꺼 계속 더하기
.diff()
미분하기