GoldenGenie

2021년 상반기 회고 - 데이터 분석가로 커리어 전환을 꿈꾸다 본문

Work==Life/커리어

2021년 상반기 회고 - 데이터 분석가로 커리어 전환을 꿈꾸다

시엔쩐 2022. 1. 3. 00:56

2022년을 앞두고 저는 혼자 내츄럴와인과 함께 나홀로 종무식 & 회고록 작성 중입니다.

나홀로 종무식,, 당신의 눈동자에,,,☆

 

 

2021년의 가장 큰 변화

2021년은 제 인생에서 가장 큰 변곡점이 된 한 해 였습니다.

가장 큰 변화는 "면세점 해외마케팅팀 퇴사 & 데이터 분석가로의 도전" 입니다.

대부분의 심적, 환경적 변화가 이 커다란 변화에서 파생된 것 같습니다.

 

IN & OUT

제 삶에 새롭게 등장하고, 또 사라진 요소들에 대해 빠르게 되짚어 봅니다.

IN OUT
Python으로 처음 코딩에 입문했습니다. 2년 넘게 잘 다니던 회사를 퇴사했습니다.
데이터 분석가 되기 위해 배워야하는 것을 익히고 있습니다. 중국 유통마케터로 일하던 경력은 잠시 접어두었습니다.
잠을 줄여가며 새벽 코딩을 즐기고 해가 떠있을 때 일어납니다. 일찍 잠들고, 7시 50분까지 출근하는 루틴이 없어졌습니다.
잊고 지냈던 친구와 우연한 계기로 가까워집니다. 친하다고 생각한 친구와 이해할 수 없는 이유로 멀어집니다.
여전히 계획을 사랑하지만, 충동적인 계획에서 기쁨을 찾기도 합니다. 계획이 틀어지면 스트레스 받는 파워 J 습성을 줄여갑니다.
작업내내 노래를 들어서 생긴 외이도염 때문에 헤드셋을 사용합니다. 플레이리스트가 풍요로워졌습니다. 헤드셋을 끼고 노트북을 들고 다녀서 좀 더 개발자같이 보이는 것 같습니다. 주로 출퇴근 시 노이즈캔슬링이 되는 커널형 이어폰으로 노래를 들었지만, 지금은 외이도염때문에 거의 쓰지 못합니다.

 

돌아보니 참 바쁘게 살았던 거 같습니다.
기록을 올해가 가기 전에 부지런히 해두지 않으면 정말 잊을 수도 있겠어요.

캘린더와 사진첩을 열고 1월부터 어떻게 살았는지 회고해봅니다.

 

1월

데이터 분석이 내 적성에 맞는 게 아닌가 생각한지 1달이 흘렀습니다.

매일 매출 로데이터를 다운받아 엑셀 매크로를 돌려 대시보드를 만들고 우리 구성원에게 특이사항을 리포팅하는 일,

루틴해보일 수 있지만 저에게는 매일이 새로운 재미있는 지표 업무였습니다.

제가 담당했던 중국 페이먼트, OTA 제휴 업무 그리고 왕홍 기획 업무 보다도 제 애정이 남달랐던 업무였습니다.

12월에 한창 2021년 월별 브랜드별 매출 계획을 짤 때 였을 거에요,
전 정말 제대로 이 매출을 예측해보고 싶었습니다.

내가 쓸 수 있는 것은, 올해의 매출 데이터 (물론 내년에 새로 입점하거나 퇴점하는 브랜드도 있습니다만..) 그리고 엑셀...

제가 세울 수 있는 최선의 로직은 브랜드별로 월별로 추이를 지수로 나타내고 내년도 KPI 인상률에 맞춰 곱하는 것이었습니다.

SQL로 저도 데이터베이스에 접근해서 내가 원하는 양식으로 데이터를 가공하고
또 신규 입점 브랜드는 타오바오 티몰 브랜드별 판매량을 크롤링해서 기존 브랜드와 비교해서 추정하고
엑셀 매크로를 벗어나서 더 효율적인 업무 자동화와 더 보기 좋은 시각화툴을 사용한 리포팅이 하고 싶었습니다. 

SQLD 합격 후기에도 적었었지만.....

철이 없었죠.....ㅎㅎㅎ이런 이유로 퇴사했다는게........(최준 모먼트)

ESTJ인 나 (갑자기 MBTI 공개) 는 본격적으로 이 결정이 합리적인지 판단해보기로 합니다.

데이터분석? 이 분야에 필요한 역량은 무엇인가?

코딩 독학을 구글링해보니, HTML 과 CSS가 나오더군요.
프로모션 상세페이지 만들 때 이 정보를 알았더라면, 더 수정 요청을 효율적으로 했을 수 있겠다는 생각이 들었습니다.
조금 공부해보니, 왜 웹퍼블리셔 분들이 이 부분이 어렵다고 했는지, 제 기획의도와 다른 결과가 나왔는지 이해가 되었습니다.

Python 그리고 SQL도 언급이 되더군요,
일단 Hello, world를 성공하고 그 느낌에 따라서 이 길이 내 길인지 판단할 수 있다는 Meme을 발견했습니다.

그리고 성공한 Hello, world,,,,

그 기분은 제게 꽤 자극적이었습니다.

항상 제가 선택한 이 직업이 지금은 정말 즐겁게 열심히 하는데,
정말 이게 나의 최선일까?? 를 항상 고민하던 저에게
마치 게임에서 레벨업해서 새로운 맵을 깬 것처럼, 새로운 영역을 찾은 기분이었습니다.

독학과 출근을 병행하다가,
Hello world 파워를 경험한 저는 "나 잘 할 거 같은데?" 라는 확신이 서게 됩니다.

그리고 2년 반 다닌 면세점을 퇴사하기로 결심합니다.

2월

엄청난 양의 인수인계를 야근을 해가면서 진행한 2월 초가 지나고 퇴사날이 다가옵니다.

저는 패스트캠퍼스 라는 학원의 <데이터사이언스 스쿨>의 면접을 앞두고 있었습니다.

학원에는 3차례 전화를 해두었습니다....
저 퇴사하기로 했다..물러날 곳이 없다....

다행히 학원의 합격 소식을 받았고
2월 15일, 퇴사를 하게 됩니다.

물론 정확하게 일주일 뒤인 2월 22일 패스트캠퍼스의 개강일이었기에,
퇴사와 동시에 공부에 돌입하게 됩니다.

Python 기본기를 익히고 매일 퀴즈에 참여하며 개강날만을 기다렸습니다.

3월

매일 아침 8시 이전에 학원에 도착했습니다.

학원 근처로 출퇴근하시는 아빠 덕분에 같이 출근하는 습관을 들였고,
덕분에 아침에 일찍이 공부하는 습관을 기를 수 있었습니다.

아무도 없는 강의실에서 강의 전에 노래를 들으면서 예복습을 하는 기분은
정말 너무 좋았기에, 질리지 않고 early bird 공부법을 지속할 수 있었던 것 같습니다.

매일 Python 기본 문법과 예제를 외우고, 학원에서 내주는 퀴즈에 참여했습니다.

매일같이 야근을 일삼던 직장인이었던 삶보다 더 잠이 고팠고 힘들었습니다.

그래도 내가 원하는 것을 직접 선택해서 익힌다는 것이 얼마나 즐거운 일인지 다시금 느꼈던 한 달 입니다.

학원 클래스매니저님이 맺어준 인연인 K님과 팀을 이뤄 첫 번째 프로젝트인 EDA 를 진행하게 됩니다.

4월

첫 번째 EDA 프로젝트는 <제주도 소비 및 상권 분석> 이었습니다.

 

GitHub - YoungAndJin96/EDA_Jeju: The Analysis of Consumption & Commercial District in Jeju

The Analysis of Consumption & Commercial District in Jeju - GitHub - YoungAndJin96/EDA_Jeju: The Analysis of Consumption & Commercial District in Jeju

github.com

부제는 "제주도 어디에서 어떤 사업을 하면 성공할까?"로
퇴사 전 한창 제주도에서 나만의 가게가 있는 사장님에 대한 로망이 있기도 했고,
면세점에서 소비, 결제 데이터를 매일 보던 저는 무심결에 이 주제가 끌렸습니다.

Dacon 제주도 업종별 데이터금융 생활 데이터,
그리고 제주데이터허브에서 얻은 읍면동별 카드 이용 데이터를 사용했습니다.

EDA 프로젝트인 만큼, 데이터를 다각도로 살펴보고
최대한 다양하게 시각화를 해보는데 의의를 두었습니다.

matplotlib, seaborn 도 깔끔하고 좋지만,
예쁘고 인터렉티브한 시각화를 선호하는 저는 이 프로젝트를 하면서 plotly를 애용하게 되었습니다

제주 읍면동별-업종별 매출액 (소매업 한정)

가설을 4개 정도 세우고, 정답을 찾아나가며
제주도 관광도시여서 도민과 관광객이 모두 분포하여 재미있는 데이터가 많다고 느꼈습니다.

두 유형은 소비 패턴이나 지역이 다를 수 있다고 생각하고,
제주도민은 거주지, 관광객은 숙박업소로 나누어 밀집도를 파악해보기도 했습니다.
그만큼 데이터 분석 시에 고려해야 할 점이 많았지만, 그래서 더 재미있었어요!

또 기억에 나는 업종으로는 "정장" 이 있습니다.
처음엔 웬 정장??? 매출이 이렇게 높지 했는데,
알고보니 제주도는 역시 신혼부부와 커플의 성지이다보니 웨딩 촬영용 맟춤 정장이나 대여 서비스가 활성화되어있어서 였어요!

folium 으로 그린 제주도 사업 인기 업종과 특화 지역

python을 배운 지 한 달 남짓 안에 제가 표현하고 싶은 것을 코드로 시각화 하는 게 뿌듯하고 재미있었던 기억이 나네요 :)

 

5월

첫 번째 프로젝트가 끝나는 날, 바로 두 번째 프로젝트 <회귀 분석을 통한 국가별 기대수명 예측>이 시작되었습니다.

 

GitHub - YoungAndJin96/Regression_LifeExpectancy: Regression for factors affecting Life Expectancy

Regression for factors affecting Life Expectancy. Contribute to YoungAndJin96/Regression_LifeExpectancy development by creating an account on GitHub.

github.com

모델링을 통해서 예측을 한다?!! 너무 기대가 되었습니다.

작년 12월에 겪었던 매출 추정 업무를 할 때 예측을 제대로 해보고 싶다는 페인 포인트가 있었기에..
이러니 내가 예측 이라는 단어에 설레, 안 설레!!!!

그러나 바로 고통을 겪게 되는데...
바로 kaggle 원래 데이터에 결측치가 매우 많음..
다행히도 World Data에 대체할 수 있는 데이터가 많이 있어서, 나름의 로직을 정해 결측치를 처리할 수 있었다.

모델링보다도 결측치 처리를 포함한 전처리가 1주일 쯤 소요되었던 거 같다.

컨플루언스에 남아있는 고민의 흔적

머신러닝 수업 시간에 배운 다양한 모델들을 파이프라인을 구성해서 직접 써보고,
파라미터 튜닝을 해가며 정확도를 높이기도 했습니다.

배운 모델을 모두 GridSearchCV로 결과 비교
역시 plotly! 회귀분석의 결과도 한 눈에 잘 보인다

모델링도 중요하지만, 국가별 데이터는 역시 시각화에 딱이니, 여러가지 시각화 시도도 해보았습니다.

진한 색이 선진국, 연한 색이 개발도상국으로 국가별로 feature별 분포를 살펴보았습니다.
기대수명과 양의 상관관계인 교육과 자원의 소득 구성비 (ICR)은 선진국이 압도적으로 상위권인 반면에,
음의 상관관계인 성인/유아 사망률은 압도적으로 개발도상국이 상위권이며, 선진국과의 그 격차가 매우 큰 것을 볼 수 있습니다.

 

6월

여태 진행했던 프로젝트 중에 가장 규모있는 일을 벌리게 됩니다.

기존 2명에서 4명으로 마음 맞는 분들과 인원을 늘려 팀을 이루고,
한국관광공사와 카카오가 주관하는 <관광데이터 활용 공모전>에 참여하기로 합니다.

공모전 홈페이지

학원에서 계획해준 크롤링 그리고 머신러닝 프로젝트를 1개의 융합 과제로 수행하겠다고 의견을 전달한 후,
본격적으로 서비스의 윤곽을 잡고, 공모전에 제출하기 위한 기획서를 작성해나갔습니다.

패스트캠퍼스 수강기간도 7월까지라 숨가쁘게 달려왔음에도 더욱 마음이 조급했던 때 였습니다.

학원 측에서 말한 난이도나 규모를 넘는 프로젝트였고, 기획과 개발을 병행하며 지치기도 했던 것 같습니다. 

고 3때도 밤을 새거나, 잠을 줄인 적 없을 정도로 잠이 많은데도 이미 잠을 4~5시간 이하로 잔 지 2달 째 였습니다.

코로나로 학원 분위기가 뒤숭숭할 때도 있었지만,
항상 열정 넘치는 수강생 동기들과 민형기, 박두진 두 강사님 덕분에 끝까지 힘을 얻어 진행할 수 있었습니다.


정말 제 1년을 되돌아본다는 마음으로 사진첩, 깃헙, 노션, 컨플루언스 등등 이것저것 보다보니
쓰고 싶은 말이 너무 많아서..간단한 회고록이 아니라 정말 제가 2021년 동안 어떤 활동을 해왔는지 자세히 적게 되었네요.

공모전에 제출한 저희 서비스에 대한 소개와 결과는 21년 회고록 2탄에서 이어가보겠습니다!!

 

'Work==Life > 커리어' 카테고리의 다른 글

데이터 분석가 커리어 전환 도전기  (0) 2022.05.20