상세 컨텐츠

본문 제목

판다스 - 02 (Pandas)

데이터분석

by 아리벱 2024. 5. 28. 15:44

본문

idol2.csv
0.00MB
idol.csv
0.00MB

 

판다스 01에 이어서 판다스 라이브러리 활용에 대해 더 알아보겠습니다.

 

 

11. 데이터프레임 합치기

 

 

# left

# right

# inner

# cross

문제

  • df_right 데이터프레임에 아래와 같은 데이터를 추가하고 df1과 merge하여 출력
  • "이름: 김사과, 연봉: 7000, 가족수: 10"
  • 단, how=right로 함

12. 등수 매기기

 

13. 날짜타입 사용하기

 

14. apply 사용하기

  • Series나 DataFrame에 구체적인 로직을 적용하고 싶을 때 사용
  • apply를 적용하기 위해서는 별도의 함수를 먼저 정의해야 함
  • 작성된 함수를 apply에 매개변수로 전달함

 

15. map 사용하기

  • 딕셔너리를 통해 데이터와 같은 키의 값을 적용

 

16. 데이터프레임의 산술연산

 

17. select_dtypes

 

 

문자열을 가지고 있는 컬럼의 이름만 저장하여 출력

 

 

18. 원 핫 인코딩(One Hot Encoding)

  • 원 핫 인코딩은 한 개의 요소는 1, 나머지 요소는 0으로 만들어 카테고리형을 표현하는 방법
  • 예) df['혈액형']
    • 머신러닝/딥러닝 알고리즘에 넣어 데이터를 예측하려고 한다면 라벨 인코딩을 하여 수치 데이터로 변환
    • 컴퓨터는 값들간의 관계를 스스로 형성하게 될 수 있음
    • 만약 B형은 1, AB형이 2라는 값을 가지고 있다면 컴퓨터는 'B형 + AB형 = 0형'라는 이상한 관계를 맺을 수 있음
    • 별도의 column들을 형성해주고 1개의 column에는 1, 나머지 column에는 0으로 넣어줌으로 'A, B, AB, 0'형의 관계는 서로 독립적이다'라는 카테고리로 표현하는 방식(원 핫 인코딩)

'데이터분석' 카테고리의 다른 글

가상 온라인 쇼핑몰 데이터  (0) 2024.05.31
Matplotlib  (0) 2024.05.28
판다스 - 01 (Pandas)  (0) 2024.05.28
크롤링(Crawling)  (0) 2024.05.27
Numpy(넘파이)  (0) 2024.05.24

관련글 더보기