전체 글 8

[데이터분석] Marketing Mix Modeling | 마케팅 믹스 모델 (2) - 워크플로우

MMM (Marketing Mix Model)에 대해서 공부해 보자. 전체 시리즈 목차 1. MMM (Marketing Mix Model) 소개 2. MMM의 워크플로우 - 이번 글의 주제 3. MMM을 위한 데이터 4. 데이터 전처리 & 변경 5. 모델링 6. 최적화 7. 예측분석 2. MMM (Marketing Mix Model)의 워크플로우 일반적인 데이터 분석의 워크플로우(Workflow) 와 MMM의 워크플로우가 어떻게 구성되어 있는지 확인해 보려고 한다. 데이터 분석 프로젝트를 진행할 때, 분석 프로세스의 신뢰성과 재현성을 유지하기 위해서는 기본적인 워크플로우를 정해놓고 따르는 것이 좋다. 워크플로우를 만들고 따르는 것의 장점은 프로젝트의 재현성을 높여주고, 새로운 데이터도 구조화하여 쉽게 반..

데이터 분석 2023.12.10

[데이터분석] Marketing Mix Modeling | 마케팅 믹스 모델 (1)

MMM (Marketing Mix Model)에 대해서 공부해 보자. 전체 시리즈 목차 1. MMM (Marketing Mix Model) 소개 - 이번 글의 주제 2. MMM의 워크플로우 3. MMM을 위한 데이터 4. 데이터 전처리 & 변경 5. 모델링 6. 최적화 7. 예측분석 1. MMM (Marketing Mix Model) 소개 MMM이란 제품 판매를 위해 사용된 마케팅 비용이나 영업 활동 등의 과거 데이터에 통계적인 분석을 반영함으로써, 각 활동과 비용이 실제 매출에 얼마나 영향을 주었는지 분석하는 모델링 방식이다. 이 분석 방식을 통해 알아볼 수 있는 내용은 크게 아래와 같다. 매출을 증대시키는 요인 파악 (Discover Sales Driver) 투자대비수익률 측정 및 이해 (Unders..

데이터 분석 2023.12.05

파이썬 (Python) Pandas 초보 튜토리얼 (칼럼, 인덱스 이름 변경)

내용구성 0. Pandas로 Dataframe 생성 1. df.columns와 df.index 로 칼럼 이름과 인덱스 이름 변경 2. rename()을 사용하여 칼럼 이름과 인덱스 이름 변경 3. lambda 를 이용하여 모든 칼럼 이름과 인덱스 이름 규칙 기반으로 변경 0. Pandas로 Dataframe 생성 import pandas as pd import numpy as np # Dictionary를 이용하여 Dataframe 생성 df=pd.DataFrame({"Name":['Jack','Peter','Jake','Blake'], "Age":[16,36,19,48]}) 1. df.columns와 df.index 로 칼럼 이름과 인덱스 이름 변경 먼저 df.columns와 df.index를 이용하여..

파이썬 Pandas 2023.10.15

[데이터분석] Columnar Database 는 무엇일까?

다양한 Database 의 형태를 보다 보면 Columnar Database라는 내용이 적혀있는 경우가 있다. 그렇다면 Columnar Database는 무엇일까? Columnar Database는 "데이터를 Row 기반이 아닌 Column 기반으로 저장하는 형태" 를 뜻하며 Column-oriented Database 라고도 불린다. 아래 예시를 통해 비교해 보자. 일반적인 Dataframe의 경우 아래와 같은 모양으로 데이터가 저장되어 있다. 여러 개의 칼럼이 각 범주를 담당하며 Row에 각 범주에 맞는 값들이 저장된다. 여기에서 만약 우리가 원하는 쿼리가 "Postcode가 11238인 값을 모두 찾아줘" 이라고 가정해 보자. Row-based database라면 데이터의 형태가 아래와 같은 방식으..

데이터 분석 2023.10.04

파이썬 (Python) Pandas 초보 튜토리얼 (Dataframe 생성)

파이썬을 이용해 데이터 분석을 할 때는 Pandas라는 library를 많이 사용한다. 통계 분석 전용 툴인 R 같은 소프트웨어도 있지만, 일반적인 데이터 분석 작업이라면 파이썬의 Pandas로도 충분히 다양한 작업을 할 수 있다. 이번 포스팅에서는 Pandas의 Dataframe을 다뤄보려고 한다. 내용 구성 0. Pandas - Series와 Dataframe 1. Dataframe 생성 1-1. List 로 Dataframe 만들기 1-2. List 안의 List로 Dataframe 만들기 1-3. Dictionary로 Dataframe 만들기 1-4. Dataframe 생성 시 Index를 원하는 대로 넣기 1-5. Dictionay를 포함하는 List로 Dataframe 만들기 0. Pandas..

파이썬 Pandas 2023.09.06

초보를 위한 마크다운(Markdown) 사용법 정리

데이터 분석 코딩을 하다 보면 마크다운을 써서 중간에 문서처럼 작성하면서 전체적으로 내용을 정리를 하게 됩니다. Tistory에서도 마크다운 형태로 글 쓰는 방식을 지원합니다. 읽고 쓰기 어려운 HTML 태그방식과는 달리, 읽기도 편하고 쓰기도 편한 마크다운을 한번 알아보겠습니다. 0. Jupyter 노트북에서 마크다운 사용하기 Jupyter 노트북에서 마크다운 사용하는 건 아주 간단합니다. 마크다운 형태로 바꾸고 싶은 셀의 왼쪽 빈 영역을 누르고(셀 선택), 위의 Code라고 되어 있는 Dropdown 메뉴를 눌러 Markdown으로 변경해 주면 됩니다. 추가로, 셀의 왼쪽 빈 영역을 눌러서 셀을 선택한 후 키보드에서 "M" 을 눌러도 마크다운 형태로 변경이 되니 번거롭게 Dropdown 메뉴를 계속 ..

데이터 분석 2023.09.03

티스토리(Tistory)에 코드 넣는 방법 (코드블럭, Jupyter Notebook)

데이터 분석 공부를 하면서 Tistory에 Pandas 관련 정보를 기록하려고 한다. 그래서 티스토리에 코드를 넣는 방식을 알아보았다. (1) 티스토리에서 제공되는 코드 블록 사용하기 티스토리 글쓰기에 들어온 후 우측 상단에 점 3개 메뉴를 누르면 코드블럭을 추가할 수 있다. 코드블럭을 클릭하면, 아래와 같이 코드블럭을 삽입할 수 있는 창이 뜨고, 원하는 언어를 선택할 수 있다. 원하는 코드 내용을 넣고 삽입하면 코드블럭이 삽입된다. 코드블럭이 이뻐 보이지 않는다면, 플러그인을 사용해서 디자인을 바꿀 수도 있다. 블로그 관리 페이지에서 플러그인을 클릭하고, Syntax Highlight를 검색해 보자. 테마에서 다른 옵션을 선택하면 코드블럭의 모양이 바뀌는 것을 확인할 수 있는데, 글쓰기 상태에서는 바뀌..

데이터 분석 2023.09.01

[기본] 데이터의 종류와 유형 (정량적, 정성적, 정형, 반정형, 비정형 데이터)

데이터는 특성에 따라 크게 두가지 유형으로 구분 할 수 있다. 정량적 데이터 (Quantitative) 정성적 데이터 (Qualitative) 정형 데이터 객관적 데이터 수치적 통계 분석이 용이함 예시) 매출, 무게, 나이, 수량, 방문 횟수 등 비정형 데이터 주관적 데이터 수치적 통계분석이 어려움 저장, 검색, 분석에 비용이 많이 소모 됨 예시) 문서, 노트, 녹음, 감정, 지역 이름 등등 그렇다면 정형 데이터, 비정형 데이터는 무엇일까? (1) 정형 데이터 (Structured Data) 정해놓은 구조에 맞춰 저장된 데이터. 엑셀 스프레드시트와 같이 정해진 칼럼에 정해진 데이터가 저장되는 방식이며, 대표적으로 관계형 데이터 베이스 (Relational Database) 나 CSV 파일 처럼 테이블의 ..

데이터 분석 2023.08.31