Dende
[DataScientist]DataFrame을 인덱싱하자 본문
판다스에서 데이터를 행단위로 가져오려면 판다스에서 제공하는 함수를 사용해야 합니다.
제공하는 함수는 아래와 같이 두가지입니다.
| 속성 | 설명 |
| loc | 인덱스 기준으로 행 데이터 읽기 |
| iloc | 행 번호를 기준으로 행 데이터 읽기 |
두가지 함수를 이해하기 위해서는 먼저 인덱스와 행번호 개념을 아셔야 하는데요.
둘은 비슷한 듯 하지만 확연히 다른 행 구분자입니다.
- loc로 행 데이터 추출하기

현재 위와 같은 데이터프레임이 있다고 가정하자.
1) 0번 인덱스의 데이터 모두를 받아오기(인덱스는 row, 행, 레코드 개념이다.)
- df.loc[0] (데이터타입을 염두하자 , '0'은 안된다.)
Unnamed: 0 Swimming
Male 103
Female 178
Name: 0, dtype: object
2) 여러개의 인덱스 데이터를 한 번에 가져오기
=> 리스트에 원하는 인덱스를 담는다
- df.loc[[0,1,2]]

3) 특정 인덱스 데이터의 특정 컬럼만 받아와보자.
=> loc[인덱스, 컬럼] 식으로 처리가 가능하다.
- df.loc[[01,2,3], 'Male']
0 103
1 363
2 151
3 154
Name: Male, dtype: int64
'Data Scientist' 카테고리의 다른 글
| [Data Scientist] Seaborn을 통한 고급 데이터시각화 (0) | 2022.09.21 |
|---|---|
| [Data Scientist] 조건을 만족하는 데이터프레임 (1) | 2022.09.21 |
| [Data Scientist]데이터 처리 라이브러리 - 판다스(Pandas) (1) | 2022.09.21 |
| Hadoop의 정의 (0) | 2022.08.17 |
| 데이터 저장 - 데이터 웨어하우스와 데이터 레이크 비교 (0) | 2022.08.17 |