파이썬 Pandas 라이브러리를 사용해보자

2023. 4. 15. 17:33Python(파이썬) 공부

판다스 라이브러리 데이터 구조

 

1. 시리즈(Series) : 1차원의 자료구조

-   인덱스를 이용해 값을 얻을 수 있다.

 

2. 데이터프레임(DataFrame) : 2차원의 자료구조

-   인덱스와 열을 이용해 값을 얻을 수 있다.

 

 

 

 

 

먼저 판다스 라이브러리를 임포트 하자

 

 

 

 

이제 시리즈(1차원의 자료구조) 객체를 생성해보자

실수형 배열을 넣고 index값을 a, b, c, d, e로 설정했다.

이렇게 key - value 형태의 시리즈가 완성 되었고 datatype은 float64(실수형)이 출력 되었다.

 

 

 

 

 

 

이번엔 시리즈객체의 원소에 접근하는 방법을 알아 보자

두가지 방법이 있는데 인덱스에 저장한 키값으로 반환받을수도 있고 인덱스 번호로도 반환받을 수 있다.

 

 

 

 

 

 

이번엔 값 여러개를 반환 해보자!

여러개를 받을 때도 키값으로 받을수 있고 인덱스 번호로도 반환 받을 수 있다.

 

 

 

 

그리고 연산 기호와 인덱스값을 이용해 시리즈를 출력할 수 있다.

 

 

 

그리고 두개의 시리즈를 설정해 인덱스 값을 똑같이 한 뒤 

+연산자를 사용하면 인덱스마다의 값을 +연산해 출력해 준다.

 

 

 

 

 

이번에는 시리즈의 요약 정보를 출력해보는 함수 describe()를 사용해보자

변수에다가 시리즈를 앞에서 다뤘던 numpy.arange()를 이용해 값을 저장한 후

변수명.describe()를 사용해보자

이렇게 간단한 정보들을 알아서 연산해서 시리즈 형식으로 알려주는데

여기서 키 값을 이용해 값을 받아 올 수 있다.

mean 키 값의 밸류값인 14.5를 가져온 것을 볼 수 있다.

 

 

 

 

 

 

이번엔 데이터프레임을 생성해보자!

 

일단 이렇게 2차원 배열을 정의했다.

 

 

 

 

이제 판다스라이브러리를 이용해 DataFrame()함수를 사용해보자

훨씬 보기좋게 2차원의 표가 나타났다!

데이터가 많아질수록 DataFrame() 함수를 이용해 데이터를 한 눈에 알아보기 쉽게 할 수 있을것이다.