본문 바로가기

분류 전체보기50

3/12 - 실전 프로젝트; 프로젝트 종료 [프로젝트]프로젝트명: Looker Ecommerce 한국 진출 프로젝트선택 주제: 커머스 데이터 품질 검사최종 주제: Looker 브랜드의 한국 진출을 위한 사업 방향 제시목적: 기존 데이터 정합성 검사 내 ‘소프트 스킬’을 강조한 스토리텔링을 가미목표: Looker 가상 브랜드의 한국 진출을 위한 데이터 분석과 사업 방향 제안진척도: 100% 완료데이터 출처: Looker Ecommerce BigQuery Dataset프로젝트 진행 현황데이터 분석 전략To-do LIST회의: 총 5차 진행 (미기록 포함)결과물[배운 점]생각보다 태블로 시각화와 PPT 시각화에 많은 시간이 걸렸다.더군다나 프로젝트 기간 중 SQLD 시험일이 겹쳐 있어 버거웠다. (사실 시험 일정 때문에 주말까지 총 4일을 확보했음에도.. 2024. 3. 22.
3/22 - SQL 기초; 그룹별 집계 함수_서브 쿼리 활용 [기억할 개념] 1. 서브 쿼리문에서 먼저 나이, 성별, 수익 합계, 평균 수익을 먼저 내고, 2. 그 다음, 연령대 별로 성별 분류해주기 3. 위 쿼리문에서 나이, 성별, 수익 합계, 평균 수익을 한번 더 불러줘야 함. select Age,Gender,sum_revenue, avg_revenue, case when (Age between 10 and 19) and Gender='Male' then "10대 남자" when (Age between 10 and 19) and Gender='Female' then "10대 여자" when (Age between 20 and 29) and Gender='Male' then "20대 남자" when (Age between 20 and 29) and Gender=.. 2024. 3. 22.
[스파르타코딩클럽] 데이터분석 1기 - 실전 프로젝트 KPT 회고록 [프로젝트 정보] 프로젝트 기간: 2024.02.29 ~ 03.12 (주말 포함, 12일) 프로젝트 진행 조건 제출일 및 형식 [팀 정보] : Looker Ecommerce 한국 진출 프로젝트 선택 주제: 커머스 데이터 품질 검사 최종 주제: Looker 가상 브랜드의 한국 진출을 위한 사업 방향 제시 방향: 위 주제에서 가상의 브랜드가 한국 이커머스 시장에 진출한다는 가정 하에 스토리라인과 사업 방향 구축 [KPT 회고록] KEEP: 현재 만족하고 있는 부분, 계속 이어가고 싶은 부분 서미래 - 집중도 대비 결과가 좋게 나와서 만족스럽다. - 팀원들이 모두 적극적으로 협업해줘서 급한 일정을 모두 소화할 수 있었다. - 서로 직무 정보나 자격증 시험 공부에 대한 정보를 나눌 수 있어 좋았다. 박현정 - .. 2024. 3. 22.
3/22 - SQLD 자격증 대비반; 기본 개념 [기억할 개념] 1. 속성의 개념 - 인스턴스가 가진 어떠한 성질(성격) - 업무에서 필요로 하는 인스턴스로, 관리하고자 하는 의미상 더 이상 분리되지 않는 최소의 데이터 단위 2. 엔터티, 인스턴스, 속성, 속성값의 관계 - 한 개의 엔터티는 두 개 이상의 인스턴스의 집합이어야 한다. - 한 개의 엔터티는 두 개 이상의 속성으로 구성이어야 한다. - 한 개의 속성은 한 개의 속성값을 갖는다. 3. 속성의 특징 1) 업무에서 필요로 한다. - 아무 요소나 모두 속성이 되지 않고 업무에 관련된 어떤 특징이 속성이 될 수 있다. - 업무에서 관리하고자 하는 정보이어야 한다. 2) 속성은 그 자체로 독립성을 유지한다. - 가장 작은 단위로 의미를 지닌다. 3) 엔터티를 설명하고 인스턴스와 구성요소가 된다. -.. 2024. 3. 22.
3/22 - Pandas; Python 기본 함수 및 개념 [기억할 개념] 1. pandas의 데이터 오브젝트 1-1. 인덱스(index) : 데이터프레임(DataFrame) 또는 시리즈(Series)의 각 행 또는 각 요소에 대한 식별자 DataFrame 자료구조에도 인덱스를 설정할 수 있음 0부터 시작하는 숫자 뿐아니라 임의로 문자로 적용할 수 있음 아예 처음부터 파일 불러올때 , 인덱스를 지정하는 것도 가능 1-2. 인덱스 관련 함수 set_index(): 특정 컬럼에 들어있는 값을 인덱스로 활용 # df가 가지고 있는 특정 컬럼명을 기준으로 인덱스를 설정하기 data = df.set_index('컬럼명') data.head() # 불러올때 인덱스 지정하기 pd.read_csv('./data/file.csv' , index_col = '컬럼정보') pd.r.. 2024. 3. 22.
3/22 - DBeaver에서 파일 불러오기 오류 해결 안됨 [배운 점] DBeaver에서 csv 파일 import 시에 인코딩란에 euc-kr로 지정해줘야 한글이 깨지지 않음 SQL 가공이 필요할 때, csv 파일 모두 한글이라면 전처리가 되지 않음. (계속 오류 뜸) 일단 오늘 Pandas에서 SQL 처리하려 했는데 이것도 실패. DBeaver를 열어보니 업데이트하라고 또 오류. 프로그램 삭제하고 다시 다운 받음. 어찌어찌 DBeaver 실행하니 이젠 csv 파일이 말썽임. 오늘 발견한 SQL 오류만 체감 몇 만개임. 구글링해본 결과, csv 파일 모두 한글로 돼있어서 컬럼명 없다고 프로그램에서 ZiRal 염병 떠는 거 같음. (Jonna 예민 보스임) 1) SQL Error [1264] [22001]: Data truncation: Out of range v.. 2024. 3. 22.
3/22 - Pandas; Python 기본 세팅 csv 파일 불러오기 [기억할 개념] 1. vscode에서 세팅할 시, pandas와 numpy 불러오고, 시각화 툴도 가져오면 좋음 import seaborn as sns import pandas as pd import numpy as np 2. csv 파일 불러올 때 유의할 점: 파일 확장자 별로 지정해줘야 함 pd.read_csv('C:/Users/dnalf/OneDrive/바탕 화면/sparta_depth_pr/seoul_merge2.csv') data1 = pd.read_csv('C:/Users/dnalf/OneDrive/바탕 화면/sparta_depth_pr/seoul_merge2.csv') pd.read_excel('C:/Users/dnalf/OneDrive/바탕 화면/sparta_depth_pr/seoul_me.. 2024. 3. 22.
2/20 - 심화 프로젝트; 프로젝트 종료 [심화 프로젝트] 프로젝트명: 서울 상경 프로젝트 선택 주제: 서울시 전세 가격 예측 모델링 변형 최종 주제: 서울시 보증금 유형별 가격 적정치 모델링 – 페르소나 중심 목적: 서울시에서 치안이 좋고 보증금이 적정대인 적합한 자치구 선정 목표: 직접 설정한 페르소나에게 적합한 집을 후보 4개로 제시 진척도: 100% 완료 데이터 출처 카테고리 데이터명 출처 사용 용도 정부 (1) 서울시 등록인구 서울열린데이터광장 서울시 청년 인구 파악 (2) 서울시 상권 분석서비스 (상주인구 - 자치구/행정동) 서울열린데이터광장 서울시 청년 인구 파악 (3) 서울시 상권 분석서비스 (직장인구 - 자치구/행정동) 서울열린데이터광장 서울시 연령대별 직장인구 파악 (4) 역세권 공동주택 실거래정보 국가교통 데이터 오픈마켓 유.. 2024. 2. 20.
[스파르타코딩클럽] 데이터분석 1기 - 심화 프로젝트 KPT 회고록 [프로젝트 정보] 프로젝트 기간: 2024.02.06 ~ 02.19 (주말 포함, 13일) 프로젝트 진행 조건 [팀 정보] : 반반따리 프로젝트 진행 현황 [KPT 회고록] KEEP: 현재 만족하고 있는 부분, 계속 이어가고 싶은 부분 서미래 [팀 프로젝트] - 팀합이 좋고, 각자 특화된 영역이 있어 역할 분담을 하기가 수월했음 - 특히 전략 분석 파트, 데이터 분석 파트가 조화가 잘 이뤄짐 - 부족했던 데이터셋이나, 전략 흐름이 팀 회의 진행 중에 바로 해결된 점 - 단순한 주제에 스토리텔링을 가미하여, 기업 차원에서 의사결정 [캠프 자체] - 주제를 별도로 선정해주셨고, 예시 데이터가 있어서 좋았음 - 또한, 주어진 주제를 변형할 수 있어, 같은 주제지만 다른 인사이트를 도출할 수 있어 좋았음 신승현.. 2024. 2. 20.