Danny's IT

  • 홈
  • 태그
  • 방명록

fillna() 1

DataFrame 결손 값 처리하기, apply lambda

결손 데이터 처리하기 판다스에서의 결손 데이터는 데이터가 없는 경우(Null)를 의미하며 이것을 넘파이의 NaN으로 표시한다. NaN값은 aggregation 함수의 연산과 머신러닝 알고리즘에서 제외되므로 이를 적용하기 전에 NaN을 다른 값으로 대체해야 한다. DataFrame에서 isna()를 적용하면 모든 칼럼의 값이 NaN인지 아닌지를 True 또는 False 값으로 반환한다. 반환된 결과에 sum()함수를 호출하면 True값(NaN 값)을 1로 계산하여 총 몇 개의 행이 비어있는지를 구할 수 있다. import pandas as pd titanic_df = pd.read_csv('train.csv') print(titanic_df.isna().sum()) titanic_df.head(2) 실행 ..

머신러닝(MachineLearning)/판다스(Pandas) 2022.07.14
1
더보기
프로필사진

  • 분류 전체보기 (25)
    • Mathematics (8)
      • 선형대수(Linear Algebra) (8)
    • 파이썬(Python) (7)
      • 그리디 (3)
      • 완전 탐색 (0)
      • DFS, BFS 탐색 (1)
      • 자료구조 (1)
      • 기타 (2)
    • 머신러닝(MachineLearning) (10)
      • 넘파이(NumPy) (2)
      • 판다스(Pandas) (6)
      • 사이킷런(scikit-learn) (2)

Tag

넘파이, cross_val_score(), 결손 값 처리하기, 코드업 3120, 모델 평가, 파이썬 lambda, loc[ ], dataframe, apply lambda, DataFrame 수정하기, iloc[ ], 판다스, numpy, DataFrame 정렬, PANDAS, 타이타닉 문제, CodeUp 3120, fillna(), 그리디 알고리즘, reset_index(),

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

Copyright © Kakao Corp. All rights reserved.

티스토리툴바