[성동2기 전Z전능 데이터 분석가] DAY 11
2024.05.28 ☀️
데이터와 데이터분석가-박은비 멘토님
데이터란?
- 이론을 세우는데 기초가 되는 사실, 바탕이 되는 자료
- 관찰이나 시럼 조사로 얻은 사실이나 자료
- 컴퓨터가 처리할 수 있는 문자, 소리, 그림 따위의 자료
Data(단순사실)에 의미를 부여해서 Info(정보)가 된다.
통계학이론은 근간으로 사용되는 경우가 많아서 알아두면 좋다.
간단하게 분류하자면,
기술통계 : 모수와 관련됨(eg.평균)
추론통계: 모집단 특성 추정
데이터마이닝: 데이터가 가진 패턴/특징을 찾아내는 것
최근에 hot한 것은 데이터마이닝과 회귀분석이다.
이걸 할거냐 말거냐로 또 직무가 갈리게 된다.
IT회사 분석 프로세스
- 데이터 생성
- 데이터 수집
- 가공 후 저장 (ETL)(추출/변환/로드)
- 데이터 분석 및 시각화(BI)(Business Intelligence Tool)
시각화
눈에 보이는 결과(X)
어떠한 인사이트(O)
데이터의 종류
user:가입 시 적는 정보
Transaction:어떤 액션을 취할 때 생성되는 데이터
eg.언제 봉구비어에서 얼마나 결제함
데이터 분석시
고객으로부터 데이터생성 | 데이터 수집, 처리, 가공 저장관리 추출 | 시가화 및 분석에 활용 | ||
프론트엔드 엔지니어 | 백엔드 엔지니어 | 데이터 엔지니어 | 데이터 사이언티스트 ML.엔지니어 |
데이터 아날리스트 |
데이터엔지니어의 경우 개발자, 데이터 사이언티스트는 대용량 처리 추출 및 처리를 하고, 데이터아날리스트는 좀 더 비즈니스 인사이트를 제공한다. 그걸 위해서 SQL, 통계도구, 도메인지식(내가 일할 분야의 지식)이 필요하다.
Product: 설득
Data: 개선 시도
데이터베이스
데이터베이스는 중복없이 통일된 형식으로 저장된 것이다.
DBMS(데이터베이스 관리시스템)
중복되지 않도록 데이터를 관리한다.
데이터 종속성과 데이터 중복성이 중요하다.
따라서, 데이터를 공유하고 중복을 최소화하기 위한 시스템이다.
정확한 무결성을 지니며 일관성을 유지하기에 용이하다.
데이터베이스 구조의 개념
외부단계(집주인관점)
개념단계(관리인관점)
내부단계(건설업체관점)
*개념스키마(스키마=설계도)
데이터 모델링
- 개념적 데이터모델(사용자에 가까움)
- 논리적 데이터 모델
- 물리적 데이터모델(컴퓨터에 가까움)
업무데이터를 이해하는 것
겉의 업무처리/ 공정과 분리하여 그 안에서 데이터가 어떻게 발생하고 흐르는지, 데이터간의 선행관계 등을 파악하는 것이다.
이게 바로 데이터 리터러시
이번주는 팀별 스프린트가 아니라 개인 스프린트를 진행한다.
주제를 하나 선정하고 다음을 작성한 뒤 서로 의견을 교류했다.
미션/비전/핵심가치
기업명/서비스명
장기목표
핵심질문
고객여정지도
타겟고객
확실히 혼자하니까 이게 나만의 생각이 아닌지, 조금 의심되는 부분도 있긴 했다.
하지만 이전에 스프린트를 해본 경험이 있다보니 시간이 단축된 것 같기는 하다.
마무리
이번주는 개인프로젝트 스프린트로 기존의 팀이 아닌 다른 분들과 교류하면서 진행하게 되었다.
기존에 수행했던 팀 주제로 계속할까 아니면 주제를 변경할까 하다가 변경해서 평소 관심이 있던 F&B 산업의 서비스 개선을 주제로 잡아서 진행하고자 한다. 처음 스프린트 주제를 정할 때 들고갔던 주제와 비슷하나 방향성을 변경하여 주제를 선정했다.
수익성 개선 및 실질적으로 이 서비스가 필요한지 여부는 내일을 비롯해서 남은 시간 동안 차차 검증해보고자 한다.
관심있는 주제라서 재미있는 것 같기는 하다.
이번에 새로 팀원이 된 분들 모두 좋은 분들인 것 같아서 기대도 많이 된다.