데이터 리터러시
데이터를 읽고 쓸 줄 아는 능력
Q. 그래서 데이터 리터러시와 엑셀은 무슨 상관이 있을까?
A. 액셀은 데이터를 다루는 데 굉장히 효과적인 도구.
따라서 데이터 리터러시에 상당한 도움이 됨.
목차
- 함수
- 텍스트
- 조건문
- Vlookup
- 가설검정
- p값
- z-검정
- t-검정
- f-검정
마무리...
엑셀 기본 (표시 형식 / 단축키)
표시 형식
- 왼쪽 정렬: 문자
- 오른쪽 정렬: 숫자, 날짜, 시간 (숫자로 나타나는 것들)
- 날짜는 ("-", "." , "/")의 기호를 사용
기본단축키
F4 | 이전작업반복 |
ctrl+z | 이전작업 취소 |
ctrl+shift+z | 취소한 작업 다시 실행 |
ctrls+s | 저장 |
F2 | 셀 내용 편집 |
범위이동 관련 단축키
Ctrl+ 방향키 | - 연속된 데이터의 끝으로 이동 - 중간에 빈칸이 있으면 끝으로 이동 x |
Shift+방향키 | 범위를 방향키 방향으로 확장 |
Ctrl+Shift+방향키 | 범위를 연속된 데이터의 끝까지 확장 |
셀 삽입 관련 단축키
Ctrl + "+" (키보드에 +랑 =가 같이 있으면 shift도) |
-셀추가 -범위선택이 되어있으면 그만큼 추가 |
Ctrl + "-" | -셀 제거 -범위 선택이 되어있으면 그만큼 제거 |
찾기 / 바꾸기 / 빠른 채우기
Ctrl+F | 찾기 |
Ctrl+H | 바꾸기 |
Ctrl+E | 빠른 채우기 |
추가단축키
Ctrl+Shift+L | -자동필터 적용/해제 -범위 지정을 따로 하지 않으면 연속된 범위 전부 필터 적용 |
Ctrl+Alt+V | -선택하여 붙여넣기 -수식이 아닌 값 형태도 붙여넣기 가능 |
Alt+W+F+F | 틀 고정 |
셀 서식 관련 단축키
Ctrl+Shift+1 | 1000단위 구분 기호가 포함된 숫자 서식으로 변경 |
Ctrl+Shift+3 | 날짜 서식으로 변경 |
Ctrl+Shift+5 | 백분율 서식으로 변경 |
함수 & 텍스트 & 조건문 & Vlookup
간단한 기본 함수
SUM(범위) | 지정한 범위 합계 구하기 |
AVERAGE(범위) | 지정한 범위 평균 구하기 |
MAX(범위) | 지정한 범위 내에서 가장 큰 수를 찾는 함수 |
LARGE(범위,k) | 지정한 범위 내에서 k번째로 큰 수를 찾는 함수 |
SMALL(범위, k) | 지정한 범위 내에서 k번째로 작은 수를 찾는 함수 |
COUNT(범위) | 지정한 범위 내에서 숫자가 포함된 셀을 세는 함수 |
COUNTA(범위) | 지정한 범위 내에서 빈칸이 아닌 모든 셀을 세는 함수 |
텍스트
left(셀, k) | 왼쪽부터 k개의 글자를 가져옴 |
right(셀, k) | 오른쪽부터 k개의 글자를 가져옴 |
mid(셀, n, k) | n번째 글자부터 k개의 글자를 가져옴 |
& | 텍스트 붙이기 |
replace(셀, n, k, 바꿀 문자열) | n부터 k개의 글자를 바꿀 문자열로 교환 |
조건문
=if(조건문, True일 때 결과, False일 때 결과)
다중조건일 때
- if 안에 if
- and(조건1, 조건2, ...)
- or(조건1, 조건2, ...)
조건에 맞는 셀 카운팅
- countif(범위, 조건)
- countifs(범위1, 조건1, 범위2, 조건2,...)
조건에 맞는 값들을 합계 구하기
- sumif(조건 범위, 조건, 합계를 구할 범위)
- sumifs(합계를 구할 범위, 범위1, 조건1, 범위2, 조건2,...)
ㅇㅇ에 대한 데이터 추출
VLOOK UP
범위에서 내가 찾고 싶은 것에 대한 데이터 추출
eg.카페라떼의 3번째 값
VLOOKUP (찾을 값, 데이터 범위, 추출할 열의 번호, 일치 옵션)
일치옵션
- 1(True): 유사하게 일치
- 0(False): 정확하게 일치
보통은 0으로 한다.
다른 시트의 정보를 가져오고 싶은 경우
수식 작성 도중 그냥 다른 시트로 넘어가서 가져오면 된다.
단, 절대 참조 주의!!
변수1 | 변수2 | 변수3 |
이런 형태에서 사용 가능한 함수
XLOOKUP( 찾을 값 , 찾는 값이 있는 열 , 추출할 열)
eg. XLOOKUP(G8,A:A,D:D)
열번호를 셀 필요가 없다는 것이 장점!
엑셀과 통계 개념
통계란?
어떤 현상을 알아보기 쉽게
일정한 체계에 따라 숫자로 나타낸 것
가설검정
표본 조사로 얻은 데이터를 활용하여 목적에 따른 가설을 세우고, 가설을 입증하기 위한 과정이다.
- 귀무가설: 기각될 것을 상정하고 세우는 가설
- 대립가설: 귀무가설과 반대되는 가설(내 가설)
가설검정에서는 귀무가설을 기각시키기 위해 노력한다.
p값(P-value)
- 귀무가설의 채택여부를 결정하는 기준 값 (귀무가설이 맞을 확률)
- p값이 높을 수록, 귀무가설이 맞을 가능성이 크다
- P값이 0.05(5%) 미만이면, 귀무가설을 기각하고 대립가설을 채택한다.
간단히 말하자면, 귀무가설이 옳다고 할 수 없으니 대립가설이 맞을 가능성이 크다! 이런 흐름
Z검정
- 언제 사용? 모집단의 표준편차를 알고 있거나, 표본 크기가 충분히 클 때(n>30)
- 검정 통계량: 표준정규분포
모집단에 대한 정보를 미리 알고 있어야하기 때문에 현실적으로 사용하기가 어렵다
T검정
"두 집단의 평균에 통계적으로 유의미한 차이가 있는가?"
- 분산이 같다는 가정: 등분산 검정
- 분산이 다르다는 가정: 이분산 검정
- 검정통계량: t분포
모집단의 표준편차를 모를 때, 표본 크기가 작을 때 사용한다.
f-검정을 통해 분산에 차이가 있는지를 알아보고 적절한 t-검정을 선택한다.
등분산과 이분산은 말 그대로 분산의 동일 여부에 따라 달라지는데,
이를 알아야함은 그에 따라 계산식이 달라지기 때문이다.
F검정(ANOVA)
"두 집단의 분산에 통계적으로 유의미한 차이가 있는가?"
보통 t-test 전에 시행한다.
- 귀무가설: 두 집단의 분산에 유의미한 차이가 없다.
- 대립가설: 두 집단의 분산에 유의미한 차이가 있다.
p<0.05
- 귀무가설 기각
- 두 집단의 분산에 유의미한 차이가 있다.
p>0.05
- 귀무가설 채택
- 두 집단의 분산에 유의미한 차이가 없다.
단측검정 & 양측검정
단측검정
- 대립가설이 ~보다 크다/작다일 때
- 한쪽에만 관심 있음
양측검정
- 대립가설이 ~와 같지 않다 일 때.
- 차이가 있다는 것을 보고 싶을 때 사용한다.
- 양쪽 다 관심 있다.
Metric(NSM / OMTM)
Metric
- 조직이나 개이닝 성과를 측정하기 위한 특정한 기준 또는 지표
- 목표 달성을 위한 진행 상황을 모니터링하고 평가하는 데 사용한다
- 메트릭은 명확한 목표를 설정하고 및 추적하는 데에 도움을 준다
- 데이터를 기반으로 한 의사 결정에 도움을 준다
- 성과를 지속적으로 모니터링하고 개선할 수 있는 영역을 식별하는 데에 도움을 줌
NSM(North Star Metric / 북극성 지표)
"회사의 장기적인 성공과 성장을 나타내는 가장 중요한 지표"
회사의 핵심 목표와 고객이 제품이나 서비스를 통해 얻는 가치를 반영한다
모든 팀과 부사가 동일한 방향으로 나아갈 수 있도록 돕는 나침반 역할
eg.
넷플릭스: 시청시간
사용자가 실질적으로 이용한 시간을 평가하고 콘텐츠의 매력도 파악한다
에어비앤비: 예약 완료 건수
숙박 예약 건수를 통해 플랫폼의 활발한 이용 여부와 사용자 만족도 평가
OMTM (One Metric That Matters)
"지금 잘하고 있는가?"
특정 시점에서 가장 중요한 지표
회사의 특정 문제를 해결하거나 단기적인 목표를 달성하기 위한 지표
eg.
넷플릭스: 신규 가입자 수
- 상황: 새로운 시즌의 인기 시리즈나 독점 콘텐츠 출시 시
- 목적: 신규 가입자를 빠르게 확보하여 시장 점유율을 높히고 콘텐츠 투자 수익 극대화
스타벅스: 모바일 주문 비율
- 상황: 모바일 앱을 통해 주문을 장려하는 캠페인 기간 동안
- 목적: 주문 프로세스 효율화 및 매장 내 대기 시간 감소
마무리
- 만약에 단축키가 안 먹으면 한 키보드에 두가지 버튼이 지정되어있지는 않은지 확인하기
- 처음 셀 클릭, shift 누르고 마지막 셀 클릭, Ctrl+D 그러면 자동으로 수식이 다 채워진다
- 툴을 쓰는 것은 사실 기술적인 부분이라고 생각한다.
그보다는 각 통계 방법을 쓰는 목적/ 조건/ 방법 등을 잘 정리해둬야겠다.
(+) 개인 추가 학습
html 바로가기 만들기
<a href="#네비게이션코드"> 여기를 누르면 이동합니다 </a>
<p id= "네비게이션코드" data-ke-size~><b>여기로 도착합니다</b></p>
내내 바로가기 링크 만들기를 탐내다가 드디어 만들다......
'성동2기 데이터분석가' 카테고리의 다른 글
[성동2기 전Z전능 데이터 분석가] DAY 29-엑셀과 데이터리터러시(3) (0) | 2024.06.26 |
---|---|
[성동2기 전Z전능 데이터 분석가] DAY 28-엑셀과 데이터리터러시(2) (0) | 2024.06.25 |
[성동2기 전Z전능 데이터 분석가] DAY 26-개인 포트폴리오 정리 (0) | 2024.06.22 |
[성동2기 전Z전능 데이터 분석가] DAY 25-파이썬 실무프로젝트(6) & 특강 (0) | 2024.06.20 |
[성동2기 전Z전능 데이터 분석가] DAY 24-파이썬 실무프로젝트(5) (0) | 2024.06.20 |