본문 바로가기

코멘토

(20)
[성동2기 전Z전능 데이터 분석가] DAY 39 함수기능예시설명RANK중복 순위 개수만큼 다음 순위 값을 증가시킴SELECT RANK() OVER (ORDER BY 열 DESC) AS 별명FROM 열을 기준으로 순위를 결정하고 순번을 부여한다.(별명 붙인 열 생성)CTEs일반 테이블   LAG2개의 행간의 차이 구하기(앞 행에서 값을 반환)  LEAD2개의 행간의 차이 구하기(뒷 행에서 값을 반환)  CREAT VIEW가상의 테이블 생성CREATE VIEW 이름 AS SELECT  FROM 테이블테이블을 가져와서 가상의 테이블 생성  INDEX전체 테이블을 검색하는 게 아니라 일부분만 검장점: 속도가 빠르다  옵티마이저가장 효율적인 방법으로 SQL을 수행할 최적의 처리 경로를 생성해주는 DBMS의 핵심 엔진 데이터추출하기1. 데이터 전체 선택 및 엑셀..
[성동2기 전Z전능 데이터 분석가] DAY 36 단축키ctrl+enter : 커서에 위치하는 쿼리 실행ctrl+/: 주석 SELECT 기본형식SELECT추출하고자 하는 열DISTINCT중복 제거, 같은 값이면 하나만 출력FROM질의에서 필요로 하는 테이블 또는 테이블 역할을 하는 것(뷰, 가상테이블 등)WHERE데이터 필터링행을 제한하거나 join조건을 기술GROUP BY그룹핑 칼럼을 기준으로 한 그룹으로 묶어서 합계, 평균, 최대, 최소, COUNT 등에 사용HAVING그룹핑 기준 칼럼이나 그룹함수에 조건을 줄 때 사용ORDER BYSELECT에서 추출하는 데이터의 정렬(기본은 asc, 역순은 desc) TYPE = 자료형Interger정수형Char고정길이 문자열형VarChar가변 길이 문자형DATE날짜값을 저장하는 자료형TIME시간을 저장할 수 있..
[성동2기 전Z전능 데이터 분석가] DAY 35 오전에 중간평가를 보았다 목차1. DB와 SQL2. 관계형 데이터베이스3. CRUD 맛보기  1. DB와 SQL 데이터 분석가데이터를 분석 & 정리하여 비즈니스적인 결정을 할 때 도움을 주는 데이터 분석 보고서를 만드는 역할 데이터베이스조직체의 응용 시스템들이 공유해서 사용하는 운영 데이터들이 구조적으로 통합된 모임데이터베이스의 구조는 사용되는 데이터 모델에 의해 결정됨  데이터베이스 스키마전체적인 데이터베이스 구조를 뜻하며, 자주 변경되지 않음데이터베이스의 모든 가능한 상태를 미리 정의내포(intension)이라고 부름 데이터베이스 상태특정 시점의 데이터베이스의 내용을 의미하며, 시간이 지남에 따라 계속해서 바뀜외연(extension)이라고 부름 데이터베이스에 들어가 있는 데이터의 형태릴레이션: 2차원..
[성동2기 전Z전능 데이터 분석가] DAY 22-파이썬 실무프로젝트(3) Daily Scrum금요일에 오지 못한  분들께 정보를 전달하면서 진행했다. 지난주 완료한 작업지난주, 데이터 수집 및 클리닝 완료데이터 수집표 작성 완료기간별로 주가를 관찰하고 싶어서 멘토님께 질문오늘 해야할 일주가에 영향을 줄 수 있는 다른 소식들 찾기그래프 보면서 비교어떤 지표를 기준으로 영향을 받았는지 정하기  개인별로 가설을 3개 세우고 검증해봤으면 좋겠다는 멘토님의 말씀에기존에 세웠던 개인 가설을 다듬고 새로 세웠다. 가설여자아이돌의 열애설이 남자아이돌의 열애설보다 주가에 큰 영향을 줄 것이다.Why: 대중의 경우 여자 아이돌에게 좀 더 엄격한 경향이 있기 때문이다결별의 경우 열애설과 달리 주가에 영향을 주지 못할 것이다.Why: 결별의 경우 광고주 해지 등 다른 이슈와 이어지지 않기 떄문에 ..
[성동2기 전Z전능 데이터 분석가] DAY 21-파이썬 실무프로젝트(1) 파이썬 실무프로젝트 파이썬을 활용해서 5일간 실무프로젝트를 진행한다. 이번 프로젝트에서 보여주고자 하는 것 3가지데이터를 조회, 분석하는 스킬(파이썬)실제 데이터를 분석해서 나온 결과가 반영되는데 필요한 논리적 사고도메인 내 함께 일하는 사람과의 커뮤니케이션이 역량 3가지를 증명하는 과제 및 결과물을 보여주면 된다.  데이터 전처리의 단계문제 정의가설 수립데이터 수집과 정리패턴 인식가설 검증결론과 의사 결정  Daily Scrum날마다 하는 짧은 회의(매일 현재 상태를 업데이트하고 조율하는 것) Daily Scrum 규칙지난 Daily Scrum부터 지금까지 내가 완수한 것 공유다음 Daily Scrum까지 내가 하기로 한 것 공유현재 장애가 되고 있는 것(곤란하고 어려운 것) 공유 1. 문제정의주어진 ..
[성동2기 전Z전능 데이터 분석가] DAY 20- Python(7) 2024.06.12 데이터분석 프로젝트: 한국인의 삶을 파악하라한국복지패널 데이터를 분석해보았다. 데이터 분석 절차 살펴보기1. 변수 검토 및 전처리분석에 활용할 변수 전처리- 변수의 특징 파악, 이상치와 결측치 정제- 변수의 값을 다루기 편하게 바꾸기분석에 활용할 변수 각각 전처리2. 변수 간 관계 분석변수 간 관계 분석- 데이터 요약 표, 그래프 만들기- 분석 결과 해석 다양한 문제를 풀었지만 일단 하나만 예시로 기록해두고자 한다. 연령대에 따른 월급 차이나이 데이터 전처리-나이 변수 살펴보기연령대를 구한다연령대에 따른 월급 막대 그래프로 생성# 나이 변수 살펴보기welfare['age'].head()# 연령대 변수 만들기welfare=welfare.assign(ageg=np.where(welfare..
[성동2기 전Z전능 데이터 분석가] DAY 20- Python(6), 면접합격특강 보호되어 있는 글입니다.
[성동2기 전Z전능 데이터 분석가] DAY 18- Python(4) 2024.06.07☁️ 데이터 분석 기초시작하기/ 데이터를 파악할 때 사용하는 명령어/ 변수명 바꾸기변수 만들기/ 삭제하기/ 조건에 맞는 판정하는 변수 만들기데이터 전처리(1) 원하는 형태로 데이터 가공하기(2) 조건에 맞는 데이터 추출하기(3) 필요한 변수만 추출하기(4) 순서대로 정렬하기 넘파이그래프 만들기(막대그래프)파이썬에서 괄호의 사용    데이터 분석 기초 시작하기import pandas as pdmpg=pd.read_csv('mpg.csv')  데이터를 파악할 때 사용하는 명령어.head( ): 데이터의 앞부분 출력.tail( ): 데이터의 뒷부분 출력.shpe( ): 데이터의 행, 열 개수 출력info( ): 변수 속성출력describe( ): 요약 통계량 출력 변수명 바꾸기1. 데이터프레..
[성동2기 전Z전능 데이터 분석가] DAY 17- Python(3)(반복문, 함수/ 패키지, 데이터프레임) 2024.06.05 ☁️ 반복문특정한 구문을 반복해서 수행forwhile While무한 루프 또는 특정 조건이 만족할 때까지 반복주로 파일을 읽고 쓸 떄 많이 사용 for반복횟수가 정해져있는 경우구하고자 하는 값의 조건이 명확할 경우리스트를 사용할 경우While i 조건이 참이라면, While문 아래 문장이 반복해서 수행된다. i=0while i0123456789  i=0while i12345678910   While은 조건을 만족할 때까지 반복하기에, 답정너를 만드는 것이 가능하다. s1=""while s1 != "아스파라거스가 좋아": print("끝내려면 '아스파라거스가 좋아'를 입력하세요.") s1=input()끝내려면 '아스파라거스가 좋아'를 입력하세요. 베이컨이 좋아끝내려면 '아스파..
[성동2기 전Z전능 데이터 분석가] DAY 16- Python(2)(마크다운, 리스트) / 데이터분석과 법률 이슈 2024.06.04 ☀️   데이터분석과 법률 이슈  데이터분석을 할 때 법률을 알아야하는 이유수많은 정보가 쏟아지는 지금, 정보를 분류해서 추출해내는 것이 중요하다. 그러기 위해서 또는 법률적 문제를 예방하기 위해, 비즈니스 관련된 일을 하거나 창업을 할 때 어떤 게 법적이슈가 될 수 있겠구나 생각을 해두는 것만으로도 도움이 된다.  데이터수집 방식과 관련한 법률 이슈부정사용행위크롤링개인정보 데이터관련 법률 리스트개인정보보호법소프트웨어 진흥법정보통신망 이용촉진 및 정보보호 등에 관한 법률공공데이터의 제공 및 이용 활성화에 관한 법률데이터 산업진흥 및 이용 촉진에 관한 법률    개인정보 Q&AQ. 회사에서 데이터분석 업무를 수행하는데, 개인정보가 포함되어있는 것 같다. 누구의 잘못일까?A. 회사의 잘못..