본문 바로가기

SQL27

3/12 - 실전 프로젝트; 프로젝트 종료 [프로젝트]프로젝트명: Looker Ecommerce 한국 진출 프로젝트선택 주제: 커머스 데이터 품질 검사최종 주제: Looker 브랜드의 한국 진출을 위한 사업 방향 제시목적: 기존 데이터 정합성 검사 내 ‘소프트 스킬’을 강조한 스토리텔링을 가미목표: Looker 가상 브랜드의 한국 진출을 위한 데이터 분석과 사업 방향 제안진척도: 100% 완료데이터 출처: Looker Ecommerce BigQuery Dataset프로젝트 진행 현황데이터 분석 전략To-do LIST회의: 총 5차 진행 (미기록 포함)결과물[배운 점]생각보다 태블로 시각화와 PPT 시각화에 많은 시간이 걸렸다.더군다나 프로젝트 기간 중 SQLD 시험일이 겹쳐 있어 버거웠다. (사실 시험 일정 때문에 주말까지 총 4일을 확보했음에도.. 2024. 3. 22.
3/22 - SQL 기초; 그룹별 집계 함수_서브 쿼리 활용 [기억할 개념] 1. 서브 쿼리문에서 먼저 나이, 성별, 수익 합계, 평균 수익을 먼저 내고, 2. 그 다음, 연령대 별로 성별 분류해주기 3. 위 쿼리문에서 나이, 성별, 수익 합계, 평균 수익을 한번 더 불러줘야 함. select Age,Gender,sum_revenue, avg_revenue, case when (Age between 10 and 19) and Gender='Male' then "10대 남자" when (Age between 10 and 19) and Gender='Female' then "10대 여자" when (Age between 20 and 29) and Gender='Male' then "20대 남자" when (Age between 20 and 29) and Gender=.. 2024. 3. 22.
3/22 - SQLD 자격증 대비반; 기본 개념 [기억할 개념] 1. 속성의 개념 - 인스턴스가 가진 어떠한 성질(성격) - 업무에서 필요로 하는 인스턴스로, 관리하고자 하는 의미상 더 이상 분리되지 않는 최소의 데이터 단위 2. 엔터티, 인스턴스, 속성, 속성값의 관계 - 한 개의 엔터티는 두 개 이상의 인스턴스의 집합이어야 한다. - 한 개의 엔터티는 두 개 이상의 속성으로 구성이어야 한다. - 한 개의 속성은 한 개의 속성값을 갖는다. 3. 속성의 특징 1) 업무에서 필요로 한다. - 아무 요소나 모두 속성이 되지 않고 업무에 관련된 어떤 특징이 속성이 될 수 있다. - 업무에서 관리하고자 하는 정보이어야 한다. 2) 속성은 그 자체로 독립성을 유지한다. - 가장 작은 단위로 의미를 지닌다. 3) 엔터티를 설명하고 인스턴스와 구성요소가 된다. -.. 2024. 3. 22.
3/22 - DBeaver에서 파일 불러오기 오류 해결 안됨 [배운 점] DBeaver에서 csv 파일 import 시에 인코딩란에 euc-kr로 지정해줘야 한글이 깨지지 않음 SQL 가공이 필요할 때, csv 파일 모두 한글이라면 전처리가 되지 않음. (계속 오류 뜸) 일단 오늘 Pandas에서 SQL 처리하려 했는데 이것도 실패. DBeaver를 열어보니 업데이트하라고 또 오류. 프로그램 삭제하고 다시 다운 받음. 어찌어찌 DBeaver 실행하니 이젠 csv 파일이 말썽임. 오늘 발견한 SQL 오류만 체감 몇 만개임. 구글링해본 결과, csv 파일 모두 한글로 돼있어서 컬럼명 없다고 프로그램에서 ZiRal 염병 떠는 거 같음. (Jonna 예민 보스임) 1) SQL Error [1264] [22001]: Data truncation: Out of range v.. 2024. 3. 22.
2/7 - 심화 프로젝트; 데이터 1차 가공 및 프로젝트 진행 현황 [심화 프로젝트] 이미 우리 팀은 지난 주부터 세팅에 들어가기도 했고, 다들 머리 회전력이 좋아서 결정이 빨리 됨. 그리하여, 장황한 우리 팀의 프로젝트 진행 현황은 아래와 같음. 구글 스프레드 시트에 써뒀던 계획 그대로 노션에 옮겨둠. 캠프 내부에서 멘토링 받으라고 문서 샘플을 따로 줬는데, 굳이 이걸 써야 되나 싶음. 시간 아까움. 그래서 남들 다 보는 잡담방에 그대로 우리팀은 공식적으로 쓰지 않겠다고 담당 매니저한테 못 박아 둠. 팀 별로 튜터들이 배정됐는데, 처음엔 우리 팀이 정한 주제가 우리 팀을 제외하고 없었음. 그런데 갑자기 B07조에서 우리 팀과 같은 주제로 변경함. 무엇? 양아취들이신지? 전략가가 2명이나 있는 팀은 어떻게 분석하는지 제대로 보여줘야겠음. 이건 실력이 아니라 머리 싸움이다.. 2024. 2. 7.
1/22 - SQLD 자격증 대비반 강의 & 마케팅 Side Project [기억할 개념] - 속성 1. 속성의 특징에 따른 분류 기본 속성 (Basic Attribute) 업무로부터 추출된 모든 속성이며 속성 중에서 가장 많은 종류를 차지 설계 속성 (Designed Attribute) 데이터 모델링,업무의 규칙화 등을 위해 새로 만들거나 변형하여 정의하는 속성 파생 속성 (Derived Attribute) - 다른 속성에 영향을 받아 발생하는 속성으로 보통 계산된 형태의 값 - 데이터의 정합성(정확성)을 유지하기 위해서는 가급적 파생적 속성을 적게 정의 필요 2. 엔터티 구성 방식에 따른 분류 PK(Primary Key) 속성 엔터티를 식별할 수 있는 속성 ex. 주민번호, 상품번호 FK(Foreign Key) 속성 다른 엔터티와의 관계에 포함된 속성 일반 속성 PK, FK.. 2024. 1. 22.
2024.01.19 부트캠프 5주차 - 주간 회고록 [5주차 기간]: 2024.01.15 ~ 01.19(5일) [5주차 진척도]: A01팀, 프로젝트 발표 완료 [기초 프로젝트 진척도]: 100% [기초 프로젝트 주제]: 한국 OTT 콘텐츠 및 이용자 특성 분석을 통한 광고 전략 제시 – 예능 콘텐츠 특화 [프로젝트 개요] : 데이터에 진심인 저희 팀은 집에서 심심하면 틀어보는 다양한 OTT 플랫폼이 궁금해졌습니다. 어느 연령대가 어떤 콘텐츠를 자주 볼까요? 주요 연령대가 어떤 요금제를 자주 쓰는지도 궁금해졌습니다. 국내에서 TOP5 안에 드는 OTT 플랫폼은 어디일까요? 그중 가장 인지도가 낮은 플랫폼 대상으로 아주 작고 소중한 광고 전략을 제안한다면, 좀 더 도움이 되지 않을까 하여 전략까지 도출해 봅니다. [마케팅 광고 전략] 목적 30대 여성의 연.. 2024. 1. 19.
1/17 - SQL 기초 Project (마무리 작업) [본 Project] 오늘 아침 7시부터 PPT 초안 작업을 만지느라 정신 없이 달렸다. 팀 전체 회의를 4번 정도 한 것 같은데, PPT 플로우 관련된 논의라서 기억이 다 나질 않는다. (그만큼 바빴다는 뜻.) 초안 작업을 마치면 강의를 들으려 했는데, 초안 작업이 끝나고 디자인 적용된 최종본을 검토해야 해서 시간이 없었다. 어제 할 걸 미룬 내 자신...오늘 정식 기획안까지 모두 써내려갔다. 과제 제출 폼에 파일이 하나밖에 추가가 되질 않아, 제출을 두 번이나 하는 공수를 들였다. 팀원들 모두 회의할 때마다 의견을 적극적으로 내고, 서포트 필요한 부분은 즉시 적용해줘서 그나마 빠르게 제출했다. (팀원 분들에게 무한 감사를) 배정된 튜터님께도 최종 검토를 받았는데, 흐름은 매우 좋고 기획안처럼 잘 짰다.. 2024. 1. 17.
1/16 - SQL 기초 Project (역할 담당 설정 및 PPT 작업 일대기) [배운 점]1. 구글 프레젠테이션은 썩었다. 프레젠테이션에서 구글 스프레드 시트를 연동하면, 원본 데이터(스프레드 시트)에서 차트 생성이 된다. 이 말은 즉슨, 아래와 같다.스프레드 시트에서만 차트 수정이 가능함.시트에서 생성된 차트를 프레젠테이션에 복사-붙여넣기를 하면 이미지로 변환됨.고로, pptx로 변환해서 다시 다운을 받으면 차트 수정이 안된다는 말씀. (진짜 개빡치는 부분.)구글 스프레드 시트, 독스만 협업하기 좋고, 나머지는 쓰레기다. => 진짜 협업 툴 개선 좀 하세요. 너무 화가 나네요. 왜 이렇게 만드셨습니까? 구글 운영자들 들립니까? [본 Project] 지금 썩은 구글 프레젠테이션 때문에 초안 작업 속도가 밀려서, 디자인 작업과 스크립트 작업을 못 하고 있다.내일은 발표 자료를 내야 .. 2024. 1. 16.