[#[DataScientist]DataFrame을 인덱싱하자##]

Notice

Recent Posts

Tags more

Archives

관리 메뉴

Dende

Data Scientist

Dende 2022. 9. 20. 13:42

판다스에서 데이터를 행단위로 가져오려면 판다스에서 제공하는 함수를 사용해야 합니다.

제공하는 함수는 아래와 같이 두가지입니다.

두가지 함수를 이해하기 위해서는 먼저 인덱스와 행번호 개념을 아셔야 하는데요.

둘은 비슷한 듯 하지만 확연히 다른 행 구분자입니다.

현재 위와 같은 데이터프레임이 있다고 가정하자.

1) 0번 인덱스의 데이터 모두를 받아오기(인덱스는 row, 행, 레코드 개념이다.)

- df.loc[0] (데이터타입을 염두하자 , '0'은 안된다.)

Unnamed: 0    Swimming
Male               103
Female             178
Name: 0, dtype: object

2) 여러개의 인덱스 데이터를 한 번에 가져오기

=> 리스트에 원하는 인덱스를 담는다

- df.loc[[0,1,2]]

3) 특정 인덱스 데이터의 특정 컬럼만 받아와보자.

=> loc[인덱스, 컬럼] 식으로 처리가 가능하다.

- df.loc[[01,2,3], 'Male']

0    103
1    363
2    151
3    154
Name: Male, dtype: int64

[Data Scientist] Seaborn을 통한 고급 데이터시각화 (0)	2022.09.21
[Data Scientist] 조건을 만족하는 데이터프레임 (1)	2022.09.21
[Data Scientist]데이터 처리 라이브러리 - 판다스(Pandas) (1)	2022.09.21
Hadoop의 정의 (0)	2022.08.17
데이터 저장 - 데이터 웨어하우스와 데이터 레이크 비교 (0)	2022.08.17

'Data Scientist' Related Articles