성동2기 데이터분석가
[성동2기 전Z전능 데이터 분석가] DAY 22-파이썬 실무프로젝트(2)
성동2기_YJ
2024. 6. 14. 18:05
Daily Scrum
전날 하지 못한 것들을 검토하는 시간을 가졌다.
주제와 가설이 일치하지 않는 것 같다는 의견과, 주제가 명확하지 않다는 의견이 있어 구체화해서 좀 더 다시 정했다.
다만, 오늘 뭘할지는 정하지 못해서 아쉽다.
팀프로젝트 개요 발표
각 팀의 문제선정 및 이유를 발표했다.
멘토님의 피드백을 들으면서 깨달은 것은 논리적으로 좁혀나갔다는 증거를 남기는 게 좋다는 것이다.
그것이 바로 차후 설득력이 되기 때문이다.
오늘은 데이터를 직접 수집하고 이를 바탕으로 데이터베이스를 만들었다.
엑셀시트에 테이블러 형태로 직접 데이터를 구축하는 식으로 작업했다.
2019년부터 2024년까지 SM엔터테인먼트 소속 아이돌의 스캔들을 모두 조사하고 해당 사건들을 라벨링하였다.
(열애설: 0, 결별: 1, 사생활논란:2, 군입대:3, 계약문제: 4)
분석데이터의 설명을 작성하고 라벨링을 했다.
결별을 열애설에 포함시킬까 고민했지만 열애설과 결별을 구분하기로 하였다.
또한, 사생활 논란으로 인해 계약을 해지했을 시에도 고민하기는 했지만 일단 사생활논란이 큰 원인이라고 생각하여 포함시켰다.
처음에는 막막했지만 우선 데이터를 정리하고 나니까 그래도 감이 잡히는 것 같다.
일단은, 정량화를 어떻게 할지 고민을 해야할 것 같다.