우당탕탕 개발공부

[커널 아카데미] 데이터 분석 부트캠프 18기_ 1주차 학습일지 본문

⌛ BootCamp/[커널아카데미] 데이터분석 부트캠프

[커널 아카데미] 데이터 분석 부트캠프 18기_ 1주차 학습일지

냥냥서 2025. 2. 28. 17:51

0224
 

[커널 아카데미] 데이터 분석 부트캠프 18기_ 엑셀 기초

엑셀 기초 이해하기 값- 텍스트 : 문자 데이터 (계산 X), 왼쪽 정렬-  숫자 : 숫자 데이터 (계산 O), 오른쪽 정렬 수식- 계산식 : 사칙연산/논리연산 등- 함수 : 데이터를 입력하면 특정 결과를 출력

rlory.tistory.com

 

0225 

[ 빅데이터 이해와 데이터 리터러시 함양하기 ]

더보기

박서희 강사님께서 온라인으로 빅데이터에 대해 설명해 주신 날이었다.

생활 속 인공지능이라는 수업에서 배웠던 내용과 유사해서 듣는데 재미가 있었다! 또, 같은 내용이더라도 새로운 형태의 AI가 등장하기 때문에 새롭게 듣는 기분이었다.

실제 채용공고를 기반으로 설명을 해주시니까.. 더욱 와닿았던 강의였던 것 같다. 매 번 혼자서 찾고 어떤 내용인지 궁금했는데 강사님이 쉽게 설명해 주셔서 이해가 잘 되는 기분!

 

 

💡  데이터 기반 의사결정

- 근거(수치로 된 데이터) 도출할 수 있는 것

- 의사 결정을 설득하기 위한 도구!

 

💡 기존 기업의 변화

금융

- 마이 데이터를 활용한 고객 자산관리 변화 -> 새로운 마케팅 전략 수립

유통, 커머스

- 신규 매장 위치, 고객 분석( 구매 추천 알고리즘), 마케팅 전략 수립

제조

- 제조 공정 과정 이상 유무 판단, 공장 자동화 및 관리 감독

 

💡 빅데이터 기반 직무 변화

데이터를 읽고 이해하는 능력은 선택이 아닌 필수 !

 


💡 데이터 문해력

1. 숫자로 확인하고, 설명/증명하는 연습

2. 가설을 수립하고 데이터로 설명/증명하는 것

3. 사실에 근접하게 보는 연습, 가설이 틀렸을 가능성 열어두기

 

 

💡 필요한 Skill

- 분석 툴에 대한 이해 ( excel, python, SQL, Tableau )

- 도메인 지식 : 분석하고자 하는 비즈니스에 대한 이해. 이에 따라 가설 설정, 분석 지표가 다 다르기 때문

- 문제 정의, 문제 해결 능력 : 데이터 분석 전 문제를 정의하고, 해결 방안 제시 능력 필요

- 논리적 사고, 보고서 작성 능력 : 분석한 내용을 논리적으로 설명할 수 있는 능력과 시각화, 보고서 작성 능력 필요

 


 

💡 데이터 관력 직무

데이터를 활용한 다양한 직무들 ( 비즈니스 분석가, 그로스해커, 퍼포먼스 마케터, *데이터 분석가 등등.. )

 -> 직무명보다는 필요 역량, 세부 사항 확인하기!!

 

* 데이터 분석가
1. 분석 대상 데이터 준비
2. 데이터 분석을 통해 인사이트 도출 ( 리뷰 텍스트 분석, A/B 테스트, 코호츠 분석)
3. 데이터 시각화 및 리포트 작성

데이터 정제, 문제 정의, 데이터 정량적 분석, 인사이트 도출
서비스 분석 (A/B테스트),  유저 분석

 

 

💡 데이터 분석가가 사용하는 분석 방법론

A/B 테스트

: 두 가지 이상의 버전을 비교하여 어떤 버전이 성과를 내는지 확인하는 실험

 

퍼널 분석 ( Log 데이터 기반으로 분석 )

: 사용자가 특정 목표를 달성하기까지의 과정을 단계별로 분석하여,

각 단계에서 발생하는 이탈이 발생하는지 파악하는 데 사용

 

코호트 분석

: 사용자의 가입 시기, 구매 시점 등 유사한 특성을 가진 사용자를 하나의 그룹으로 정의

각 그룹(코호트)의 행동 패턴을 시간의 흐름에 따라 분석하는 방법

이 분석은 사용자이 재방문율(리텐션율) 및 사용자 가치를 평가하는데 유용

 

0227

[ 실무 엑셀 데이터 분석 ]

더보기

온라인 강의 수업으로 듣다가 오늘은 실시간으로 이동훈 강사님의 엑셀 수업이 진행되었다.  온라인에서 미리 만나서 그런지 뭔가 친근한(?) 느낌이 들었다. 그리고 .. 강사님이 경력이 있으셔서 그런지 강의가 진짜 매끄럽고 집중이 잘 될 수 있도록 하는 힘이 있으신 것 같다 !ㅋㅋ 
좋은 강사는 쉬는 시간을..많이 준다는 말씀에..ㅋㅋㅋ강사님 덕분에 여유로운 점심시간을 보낼 수 있었다🍀 

내일 수업도 기대 !!!

 

 

💡  4차 산업 시대의 가장 중요 가치 -> 데이터

데이터 리터러시 : 단순히 데이터를 읽고, 쓸 수 있는 것만이 아닌.

데이터를 구조적, 상황적 등 다양한 관점에서 이해하고 활용할 수 있는 역량

- 기술적 데이터 리터러시

- 해석적 데이터 리터러시

 

 

💡 데이터 분석의 목적

1. 다양한 데이터

2. 분석 기법 활용

3. 문제 발견

4. 원인 파악

5. 해결 방안 모색

6. 인사이트 도출

 

 

💡 데이터 분석의 과정

1. 문제 정의 및 분석 목적 설정

2. 데이터 수집

3. 데이터 탐색

4. 데이터 전처리

5. 데이터 분석

6. 검증 및 평가

7. 데이터 시각화


 

💡 EDA (탐색적 데이터 분석)

기존의 통계학이 정보의 추출 과정에서 가설 검정 등에 치우쳐 자료가 가지고 있는 본연의 의미를 찾는데 어려움이 있어, 이를 보완하고자 주어진 자료만 가지고도 충분한 정보를 찾을 수 있도록 하는 자료 분석 방법

>> 즉, 탐색적 데이터 분석을 잘 수행해야 전반적인 데이터 분석 또한 잘 수행할 수 있음!

 

피벗 테이블  중요하니 꼬옥 기억하자!

: 표의 데이터를 요약하는 통계표

 


 

내가 생각하는 나만의 데이터 분석에 대한 정의는 ?

-> 항상 생각하는 정의 중 하나. 언젠간 나도 나만의 정의가 생기길 바라며👊! (25.02.27)

 

0228

[ 실무 엑셀 데이터 분석2 ]

더보기

💡 결측치

: 데이터에 값이 없는 것

 

💡 결측치 처리 방법

: 결측치의 유형 및 비율에 따라 적절한 결측치 처리 방법을 결정해야 함

 

 

💡 이상치

: 정상 범위 데이터보다 엄청 크거나, 작은 경우

일반적으로 -3 σ (표준편차) 미만, +3 σ 초과인 값을 이상치로 판정

 


💥 상관 분석에서 가장 유의해야 할 점

인과 관계를 가지고 있는 두 변수는 항상 강한 상관 관계를 가지고 있지만,

강한 상관 관계를 가지고 있다고 해서 두 변수가 반드시 인과 관계를 가지는 것은 아니다!

 

 


 

🔥 데이터 전처리 🔥

: 데이터의 분석 목적과 방법에 맞게 데이터를 가공 또는 처리하는 과정

-> 가장 많은 시간과 비용이 필요한 과정!

 

Garbage In, Garbage Out

 

 


💡 VLOOKUP과 MATCH 함수

온라인 강의에서도 따라 해 봤지만 실시간으로 실습하니까 더 이해가 잘 되는 것 같다! 

 

참조!!!!!!!!!!!!!!!!! MATCH함수 쓰는 게 헷갈린다면.. 다른 곳에 먼저 쓴 후 복붙해서 가져오면 된다 (굿굿)