Python 4

파이썬 (Python) Pandas 초보 튜토리얼 (칼럼, 인덱스 이름 변경)

내용구성 0. Pandas로 Dataframe 생성 1. df.columns와 df.index 로 칼럼 이름과 인덱스 이름 변경 2. rename()을 사용하여 칼럼 이름과 인덱스 이름 변경 3. lambda 를 이용하여 모든 칼럼 이름과 인덱스 이름 규칙 기반으로 변경 0. Pandas로 Dataframe 생성 import pandas as pd import numpy as np # Dictionary를 이용하여 Dataframe 생성 df=pd.DataFrame({"Name":['Jack','Peter','Jake','Blake'], "Age":[16,36,19,48]}) 1. df.columns와 df.index 로 칼럼 이름과 인덱스 이름 변경 먼저 df.columns와 df.index를 이용하여..

파이썬 Pandas 2023.10.15

[데이터분석] Columnar Database 는 무엇일까?

다양한 Database 의 형태를 보다 보면 Columnar Database라는 내용이 적혀있는 경우가 있다. 그렇다면 Columnar Database는 무엇일까? Columnar Database는 "데이터를 Row 기반이 아닌 Column 기반으로 저장하는 형태" 를 뜻하며 Column-oriented Database 라고도 불린다. 아래 예시를 통해 비교해 보자. 일반적인 Dataframe의 경우 아래와 같은 모양으로 데이터가 저장되어 있다. 여러 개의 칼럼이 각 범주를 담당하며 Row에 각 범주에 맞는 값들이 저장된다. 여기에서 만약 우리가 원하는 쿼리가 "Postcode가 11238인 값을 모두 찾아줘" 이라고 가정해 보자. Row-based database라면 데이터의 형태가 아래와 같은 방식으..

데이터 분석 2023.10.04

파이썬 (Python) Pandas 초보 튜토리얼 (Dataframe 생성)

파이썬을 이용해 데이터 분석을 할 때는 Pandas라는 library를 많이 사용한다. 통계 분석 전용 툴인 R 같은 소프트웨어도 있지만, 일반적인 데이터 분석 작업이라면 파이썬의 Pandas로도 충분히 다양한 작업을 할 수 있다. 이번 포스팅에서는 Pandas의 Dataframe을 다뤄보려고 한다. 내용 구성 0. Pandas - Series와 Dataframe 1. Dataframe 생성 1-1. List 로 Dataframe 만들기 1-2. List 안의 List로 Dataframe 만들기 1-3. Dictionary로 Dataframe 만들기 1-4. Dataframe 생성 시 Index를 원하는 대로 넣기 1-5. Dictionay를 포함하는 List로 Dataframe 만들기 0. Pandas..

파이썬 Pandas 2023.09.06

초보를 위한 마크다운(Markdown) 사용법 정리

데이터 분석 코딩을 하다 보면 마크다운을 써서 중간에 문서처럼 작성하면서 전체적으로 내용을 정리를 하게 됩니다. Tistory에서도 마크다운 형태로 글 쓰는 방식을 지원합니다. 읽고 쓰기 어려운 HTML 태그방식과는 달리, 읽기도 편하고 쓰기도 편한 마크다운을 한번 알아보겠습니다. 0. Jupyter 노트북에서 마크다운 사용하기 Jupyter 노트북에서 마크다운 사용하는 건 아주 간단합니다. 마크다운 형태로 바꾸고 싶은 셀의 왼쪽 빈 영역을 누르고(셀 선택), 위의 Code라고 되어 있는 Dropdown 메뉴를 눌러 Markdown으로 변경해 주면 됩니다. 추가로, 셀의 왼쪽 빈 영역을 눌러서 셀을 선택한 후 키보드에서 "M" 을 눌러도 마크다운 형태로 변경이 되니 번거롭게 Dropdown 메뉴를 계속 ..

데이터 분석 2023.09.03