PANDAS 3

Index 객체

판다스의 Index는 DataFrame, Series의 레코드(행)을 고유하게 식별하는 객체이다. import pandas as pd # 타이타닉 데이터 파일 불러오기 titanic_df = pd.read_csv('train.csv') # Index 객체를 indexes 변수에 저장 indexes = titanic_df.index print('Index 객체:', indexes) print('Index 객체 array 값: \n', indexes.values) 실행 결과 Index 객체는 ndarray와 유사하게 슬라이싱이 가능하지만, 레코드를 구별하는 고유값이기 때문에 수정은 할 수 없다. print(type(indexes.values)) print(indexes.values.shape) print(i..

DataFrame 데이터셋 수정하기

DataFrame과 리스트, 딕셔너리, 넘파이 ndarray 상호변환 ndarray를 DataFrame으로 변환하기 array = np.array([[90, 85, 78],[95, 60, 85], [80, 100, 88]]) df_array = pd.DataFrame(array, columns=['A', 'B', 'C']) print(df_array) 실행 결과 리스트를 DataFrame으로 변환하기 import pandas as pd lst = [[90, 85, 78],[95, 60, 85], [80, 100, 88]] # 2차원 리스트 df_lst = pd.DataFrame(lst, columns=['A', 'B', 'C']) # columns에 열 이름 입력 print(df_lst) 실행 결과 딕셔..

DataFrame으로 데이터 불러오기

판다스(Pandas)는 데이터 처리, 특히 행과 열로 이뤄진 2차원 데이터를 효율적으로 가공, 처리할 수 있는 기능을 제공하는 라이브러리다. 판다스 모듈 임포트하기 import pandas as pd 캐글(Kaggle)에서 데이터 파일 다운받기 캐글은 머신러닝 경연에 사용되는 많은 예제들을 포함하는 사이트이다. 타이타닉 탑승자 중 생존자 예측하기는 그중에서 가장 대표적인 예제이다. 캐글에 로그인을 한 후에 아래 링크에 들어가서 Download All 버튼을 눌러 타이타닉 탑승자에 대한 데이터를 다운받을 수 있다. https://www.kaggle.com/competitions/titanic/data Titanic - Machine Learning from Disaster | Kaggle www.kaggl..