Project10 3/12 - 실전 프로젝트; 프로젝트 종료 [프로젝트]프로젝트명: Looker Ecommerce 한국 진출 프로젝트선택 주제: 커머스 데이터 품질 검사최종 주제: Looker 브랜드의 한국 진출을 위한 사업 방향 제시목적: 기존 데이터 정합성 검사 내 ‘소프트 스킬’을 강조한 스토리텔링을 가미목표: Looker 가상 브랜드의 한국 진출을 위한 데이터 분석과 사업 방향 제안진척도: 100% 완료데이터 출처: Looker Ecommerce BigQuery Dataset프로젝트 진행 현황데이터 분석 전략To-do LIST회의: 총 5차 진행 (미기록 포함)결과물[배운 점]생각보다 태블로 시각화와 PPT 시각화에 많은 시간이 걸렸다.더군다나 프로젝트 기간 중 SQLD 시험일이 겹쳐 있어 버거웠다. (사실 시험 일정 때문에 주말까지 총 4일을 확보했음에도.. 2024. 3. 22. 2/20 - 심화 프로젝트; 프로젝트 종료 [심화 프로젝트] 프로젝트명: 서울 상경 프로젝트 선택 주제: 서울시 전세 가격 예측 모델링 변형 최종 주제: 서울시 보증금 유형별 가격 적정치 모델링 – 페르소나 중심 목적: 서울시에서 치안이 좋고 보증금이 적정대인 적합한 자치구 선정 목표: 직접 설정한 페르소나에게 적합한 집을 후보 4개로 제시 진척도: 100% 완료 데이터 출처 카테고리 데이터명 출처 사용 용도 정부 (1) 서울시 등록인구 서울열린데이터광장 서울시 청년 인구 파악 (2) 서울시 상권 분석서비스 (상주인구 - 자치구/행정동) 서울열린데이터광장 서울시 청년 인구 파악 (3) 서울시 상권 분석서비스 (직장인구 - 자치구/행정동) 서울열린데이터광장 서울시 연령대별 직장인구 파악 (4) 역세권 공동주택 실거래정보 국가교통 데이터 오픈마켓 유.. 2024. 2. 20. 2/13 - 심화 프로젝트; 데이터 전처리 및 프로젝트 진행 현황 [심화 프로젝트 진행 현황] 데이터 분석 부문: 80% 완료 (데이터 전처리 100% 완료 / 명일 시각화 예정) 모델링 부문: 50% 완료 (서울 부동산 데이터 기준, 기타 데이터의 법정동-행정동 매칭 완료) 명일 해야할 사항 - 데이터 분석 부문: 시각화 집중 - 모델링 부문: 1) 2차 데이터 전처리(연도별/분기별 집계 함수 사용 예정, 컬럼 검수 필요) 2) 선형회귀 or 로지스틱회귀 모델링 [배운 점] 예측 모델링이 반드시 미래를 예측하는 모델링은 아니다. 모델링의 방법은 여러 가지가 있다. 사실 특정 변수의 적정 값이 맞는지 체크하는 모델링은 선형회귀와 로지스틱회귀를 사용하면 되는 아주 단순한 사실을 깨달았다. 팀원들의 능력이 상향평준화 되어 있어 일하기가 매우 편하다. 팀 합이 좋아서 다행이.. 2024. 2. 13. 2/7 - 심화 프로젝트; 데이터 1차 가공 및 프로젝트 진행 현황 [심화 프로젝트] 이미 우리 팀은 지난 주부터 세팅에 들어가기도 했고, 다들 머리 회전력이 좋아서 결정이 빨리 됨. 그리하여, 장황한 우리 팀의 프로젝트 진행 현황은 아래와 같음. 구글 스프레드 시트에 써뒀던 계획 그대로 노션에 옮겨둠. 캠프 내부에서 멘토링 받으라고 문서 샘플을 따로 줬는데, 굳이 이걸 써야 되나 싶음. 시간 아까움. 그래서 남들 다 보는 잡담방에 그대로 우리팀은 공식적으로 쓰지 않겠다고 담당 매니저한테 못 박아 둠. 팀 별로 튜터들이 배정됐는데, 처음엔 우리 팀이 정한 주제가 우리 팀을 제외하고 없었음. 그런데 갑자기 B07조에서 우리 팀과 같은 주제로 변경함. 무엇? 양아취들이신지? 전략가가 2명이나 있는 팀은 어떻게 분석하는지 제대로 보여줘야겠음. 이건 실력이 아니라 머리 싸움이다.. 2024. 2. 7. 1/24 - 심화 프로젝트; 진행 현황 [심화 프로젝트] 19시 50분부터 아이스브레이킹하다가 어쩌다 보니 1시간 30분을 넘게 수다를 떨어버림. 전략적으로 차주 월요일 or 화요일부터 주제 및 데이터셋을 서치하기로 함. 예상 소요 기간은 3일. 따라서 마감일은 2/1(목)까지임. 2/2(금)에 본격적인 심화 프로젝트 착수 전, 주제 및 방향성을 선정하기 위해 팀원들과 오프라인 만남을 가질 것 같다. 다만 차주에 개인 과제가 하나 더 나오면 큰일난다. 그렇게 되면 사이드 프로젝트 일정과도 꼬이게 돼서 골치 아파짐. 이번 심화 프로젝트는 도메인(주요 업계)끼리 묶여 있어서, 마케팅 전체 전략까지 짜는 플랜으로 가지 않을까 싶은데, 머신러닝까지 듣고 하는 거다 보니 데이터 분석에 힘을 실어야 할 것 같다. [배운 점] 새로운 사람을 알아간다는 건.. 2024. 1. 24. 1/19~23 - Side Project; 진행 현황 [1/19; Side Project] 대략적인 전략 전체 방향성이 나와서, 이 방향 토대로 내일 전략을 개요판/상세판 두 버전으로 빠르게 짜기로 했다. 팀원들끼리 대화하다 욕심이 생겨서, 엑셀 버전의 기획안을 PPT로 만들어 보기로 했다. (대신 full ver.아니라 약식 ver.인 걸로) 그래서 엑셀 파일은 다음주 월요일까지 변동 없이 마감일을 지키고, PPT는 다음주 주중에 일자를 잡아서 알려드리기로 함. [1/22; Side Project] 오늘 마감일이었는데, 집에 일이 생겨서 취합을 하지 못했다. 그래서 튜터님과 팀원들에게 양해를 구하고, 내일 오후 4시까지 최종 취합하는 것으로 협의 완료. 사실 온라인 마케팅 전략 짜는 건 이미 머릿 속에 다 있어서 그렇게 오래 걸리지 않았다. 내일 오전 중.. 2024. 1. 19. 1/18 - SQL 기초 Project (발표) [우리 팀의 정보] [발표 전략] 사실 넷플릭스 OTT 플랫폼은 작년 12월 미니 프로젝트에서 매우 많이 다뤄진 주제였기에, 이 주제를 선택한다면 한 단계 더 심화된 버전으로 갈 필요가 있었다. 그래서 전 팀원 협의 하에 '마케팅 전략'이라는 단계가 들어갔고, 이 부분은 내가 전문가이니 전담하기로 했다. (사실 전략 짜는 건 5년 넘게 해 왔던 일이라, 반나절도 안 돼서 1~2시간 만에 짜낸 거임.) 부팀장님이 생각보다 긴장을 많이 하는 타입인지라, 후반부에 마케팅 전략과 Q&A 부분까지 내가 전담해서 발표를 진행했다. 팀의 대표로서 발표를 하는 의미도 있었지만, 무엇보다 마케팅 전문가로서 발표한 의미가 크다. 다행히 부팀장님은 연습 발표 영상 때보다 조금 더 천천히, 차분하게 발표해 줘서 무사히 내게 .. 2024. 1. 18. 1/17 - SQL 기초 Project (마무리 작업) [본 Project] 오늘 아침 7시부터 PPT 초안 작업을 만지느라 정신 없이 달렸다. 팀 전체 회의를 4번 정도 한 것 같은데, PPT 플로우 관련된 논의라서 기억이 다 나질 않는다. (그만큼 바빴다는 뜻.) 초안 작업을 마치면 강의를 들으려 했는데, 초안 작업이 끝나고 디자인 적용된 최종본을 검토해야 해서 시간이 없었다. 어제 할 걸 미룬 내 자신...오늘 정식 기획안까지 모두 써내려갔다. 과제 제출 폼에 파일이 하나밖에 추가가 되질 않아, 제출을 두 번이나 하는 공수를 들였다. 팀원들 모두 회의할 때마다 의견을 적극적으로 내고, 서포트 필요한 부분은 즉시 적용해줘서 그나마 빠르게 제출했다. (팀원 분들에게 무한 감사를) 배정된 튜터님께도 최종 검토를 받았는데, 흐름은 매우 좋고 기획안처럼 잘 짰다.. 2024. 1. 17. 1/12 - SQL 기초 Project & 마케팅 Side Project; 진행 현황 [본 Project] 팀원들 모두 데이터 분석에 들어가니, 열의가 상당하다. 오히려 내가 기 빨리는 중. 지금 넷플릭스 이용자 분석과 연령대 별로 수익이 얼마인지 구해야 하는데, 카드사 매출과 연결시키고 있다. 그런데 이 흐름에서 두 가지 data risk가 있다. 이는 곧 데이터 신뢰도와 직결되는 문제라 고민이 많다. 1) 넷플릭스 raw data 자체가 한국 데이터가 아니라는 점 2) 카드사 매출에서 OTT가 넷플릭스를 포함한 타 OTT 플랫폼도 포함된다는 점 그래서 오늘 물어본 튜터님 말고도, 차주 월요일(1/15) 오전에 다른 튜터님들에게 의견을 물어볼 생각이다. 생각보다 raw data에서 인사이트를 뽑기 쉽지 않다. 인사이트가 뽑혀야 전략이 나오는데, raw data 간의 신뢰도가 문제인지라,.. 2024. 1. 12. 이전 1 2 다음