pandas 3

데이터프레임 기본 [2/2]

행 선택 행 데이터를 선택하기 위해서 loc와 iloc 인덱서를 사용한다. 인덱스 이름(예: '홍길동', '이순신' 등)을 기준으로 행을 선택할 때는 loc를 사용 정수형 위치 인덱스(예: 1,2,3,4 등)를 사용알 때는 iloc를 사용 # 행 인덱스를 사용하여 행 1개 선택 label1 = df.loc['서준'] position1 = df.iloc[0] print(label1) print(position1) ----------------------------------------------------------------------------------------------- 수학 90 영어 98 음악 85 체육 100 Name: 서준, dtype: int64 수학 90 영어 98 음악 85 체육 1..

머신러닝/Pandas 2022.04.27

데이터프레임 기본 [1/2]

데이터프레임은 2차원 배열이다. 행과 열로 만들어지는 2차원 배열 구조는 엑셀과 RDBMS등 다양한 컴퓨터 분양에서 사용중 데이터프레임의 열은 각각 시리즈 객체. 시리즈를 열벡터(vector)라고 하면, 데이터프레임은 여러개의 열벡터들이 같은 행 인덱스를 기준으로 줄지어 결합된 2차원 벡터 또는 행렬(matrix) 데이터프레임은 행과 열을 나타내기 위해 두 가지 종류의 주소를 사용 행 인덱스(row index) 와 열 이름(column name 또는 column label) 데이터프레임의 열은 공통의 속성을 갖는 일련의 데이터를 나타내고, 행은 개별 관측대상에 대한 다양한 속성 데이터들의 모음인 레코드가 된다. 데이터프레임 만들기 데이터프레임을 만들기 위해서는 같은 길이(원소의 개수가 동일한)의 1차원 ..

머신러닝/Pandas 2022.04.23

판다스 기초

파이썬 데이터 처리를 위한 라이브러리 시리즈와 데이터프레임이라는 구조화된 데이터 형식을 제공 파이썬 클래스로 만들어지고, 서로 다른 종류의 데이터를 한곳에 담는 그릇이 됨 시리즈는 1차원 배열이고, 데이터프레임이 2차원 배열 판다스의 1차적인 목적 서로 다른 여러 가지 유형의 데이터를 공통의 포맷으로 정리하는 것 특히 행과 열로 이루어진 2차원 구조의 데이터프레임은 데이터 분석 실무에서 자주 사용됨. 먼저 시리즈에 대해 알아보자. 시리즈(Serise)란 시리즈는 데이터가 순차적으로 나열된 1차원 배열의 형태 인덱스는 데이터 값과 일대일 대응이 되고 키(k)와 값(v)이 '{k : v}' 형태로 짝을 이루는 딕셔너리와 비슷한 구조 시리즈 만들기 딕셔너리와 시리즈 구조가 비슷하기 때문에 딕셔너리를 시리즈로 ..

머신러닝/Pandas 2022.04.22