Danny's IT

  • 홈
  • 태그
  • 방명록

stratified kfold 1

교차검증

교차검증 데이터를 단순히 학습 데이터와 테스트 데이터로만 분리하여 머신러닝 모델의 성능을 평가하는 것은 과적합(Overfit)에 취약점을 가질 수 있다. 과적합은 모델이 학습 데이터와 테스트 데이터에만 과도하게 최적화되어, 다른 데이터로 예측을 수행할 때 성능이 떨어지는 것을 말한다. 이러한 문제점을 해결하기 위해 교차 검증을 이용해 다양한 학습과 평가를 수행해야 한다. 교차 검증은 별도의 여러 세트로 구성된 학습 데이터 세트와 검증 데이터 세트에서 학습과 평가를 수행하는 것이다. 학습용 데이터 세트를 다시 학습용 데이터 세트와 검증용 데이터 세트로 분리하여 1차적으로 학습과 평가를 한 후에 테스트 데이터 세트에 적용을 하는 것이다. KFold 교차 검증 말 그대로 종이를 접어서 k등분 하듯이, 데이터 ..

머신러닝(MachineLearning)/사이킷런(scikit-learn) 2022.07.22
1
더보기
프로필사진

  • 분류 전체보기 (25)
    • Mathematics (8)
      • 선형대수(Linear Algebra) (8)
    • 파이썬(Python) (7)
      • 그리디 (3)
      • 완전 탐색 (0)
      • DFS, BFS 탐색 (1)
      • 자료구조 (1)
      • 기타 (2)
    • 머신러닝(MachineLearning) (10)
      • 넘파이(NumPy) (2)
      • 판다스(Pandas) (6)
      • 사이킷런(scikit-learn) (2)

Tag

cross_val_score(), 그리디 알고리즘, PANDAS, numpy, reset_index(), iloc[ ], 결손 값 처리하기, loc[ ], 타이타닉 문제, apply lambda, 넘파이, 모델 평가, 코드업 3120, dataframe, 파이썬 lambda, CodeUp 3120, 판다스, DataFrame 정렬, fillna(), DataFrame 수정하기,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

Copyright © Kakao Corp. All rights reserved.

티스토리툴바