부트캠프23 3/22 - SQLD 자격증 대비반; 기본 개념 [기억할 개념] 1. 속성의 개념 - 인스턴스가 가진 어떠한 성질(성격) - 업무에서 필요로 하는 인스턴스로, 관리하고자 하는 의미상 더 이상 분리되지 않는 최소의 데이터 단위 2. 엔터티, 인스턴스, 속성, 속성값의 관계 - 한 개의 엔터티는 두 개 이상의 인스턴스의 집합이어야 한다. - 한 개의 엔터티는 두 개 이상의 속성으로 구성이어야 한다. - 한 개의 속성은 한 개의 속성값을 갖는다. 3. 속성의 특징 1) 업무에서 필요로 한다. - 아무 요소나 모두 속성이 되지 않고 업무에 관련된 어떤 특징이 속성이 될 수 있다. - 업무에서 관리하고자 하는 정보이어야 한다. 2) 속성은 그 자체로 독립성을 유지한다. - 가장 작은 단위로 의미를 지닌다. 3) 엔터티를 설명하고 인스턴스와 구성요소가 된다. -.. 2024. 3. 22. 2024.01.26 부트캠프 6주차 - 주간 회고록 [6주차 기간]: 2024.01.22 ~ 01.26 (5일) [6주차 진척도]: Python 데이터 전처리 수강 100% 완료 / 기초 통계학 40% 완료 (주말 내 100% 수강 예정) [신규 팀 정보] : MBTI로 F와 T가 반반, I와 E가 반반, 그리고 20대와 30대가 반반이라 팀 이름을 '반반따리'로 정함. FACTS: [역할: 팀장] 이번 프로젝트에서도 또 팀장이 됐다. 금번 심화 프로젝트 기간에 설 연휴가 껴 있어서, 전략적으로 차주부터 주제와 데이터셋을 찾는 걸로 타임라인을 설정했다. 목표는 2/1(목) 전원이 찾아온 주제와 데이터셋을 모두 구글 스프레드 시트에 기재해 두고, 2/2(금)에 전원이 오프라인으로 모여 주제 설정과 방향성을 논의할 예정이다. 다만, 차주에 머신 러닝 모델링 .. 2024. 1. 26. 1/25 - Pandas&Python; Python 기초 문법① [기억할 개념]: Python - Pandas 1. .iloc[행,열] : 인덱스 번호로 선택 data.iloc[0,2] #행과 열 번호를 통해 특정 데이터를 선택할 수 있음 # iloc을 사용하여 특정 행과 열 선택 selected_data = df.iloc[1:4, 0:2] #인덱스 1부터 3까지의 행과 0부터 1까지의 열 선택 print(selected_data) 2. .loc[로우,컬럼] : 이름으로 선택 data.loc['행이름' , '컬럼명'] #행이름과 컬럼명을 통해서도 특정 데이터를 선택할 수 있음 #loc을 사용하여 특정 행과 열 선택 selected_data = df.loc['b':'d', 'A':'B'] #레이블 'b'부터 'd'까지의 행과 'A'부터 'B'까지의 열 선택 print(.. 2024. 1. 25. 1/19~23 - Side Project; 진행 현황 [1/19; Side Project] 대략적인 전략 전체 방향성이 나와서, 이 방향 토대로 내일 전략을 개요판/상세판 두 버전으로 빠르게 짜기로 했다. 팀원들끼리 대화하다 욕심이 생겨서, 엑셀 버전의 기획안을 PPT로 만들어 보기로 했다. (대신 full ver.아니라 약식 ver.인 걸로) 그래서 엑셀 파일은 다음주 월요일까지 변동 없이 마감일을 지키고, PPT는 다음주 주중에 일자를 잡아서 알려드리기로 함. [1/22; Side Project] 오늘 마감일이었는데, 집에 일이 생겨서 취합을 하지 못했다. 그래서 튜터님과 팀원들에게 양해를 구하고, 내일 오후 4시까지 최종 취합하는 것으로 협의 완료. 사실 온라인 마케팅 전략 짜는 건 이미 머릿 속에 다 있어서 그렇게 오래 걸리지 않았다. 내일 오전 중.. 2024. 1. 19. [스파르타코딩클럽] 데이터분석 1기 - 기초 프로젝트 KPT 회고록 [프로젝트 정보] 프로젝트 기간: 2024.01.11 ~ 01.18 (8일) 프로젝트 조건 조건에 대한 정식 발의 : 이 정식 발의로 발표일이 1일 연장되었음 (나의 큰 성과) [팀 정보] [KPT 회고] Keep: 현재 만족하고 있는 부분 & 계속 지속되었으면 하는 부분 - 팀 프로젝트 시 전담 튜터님이 배정되는 부분이 좋았다. - 팀 프로젝트의 장점은 집단 지성의 힘으로 문제를 해결해 나가는 부분이 좋다. - 주어진 사안에 대한 적극적인 소통이 좋았다. - 적절한 과업 난이도와 과하지 않았던 회의 빈도수가 좋았다. Problem: 불편하게 느끼는 부분 & 개선이 필요한 부분 - 튜터님이 상주하는 시간 외엔 질문하기 불편하다. - 중간에 생긴 문제를 바로바로 공유하지 않았다. - 튜터님들께서 중간 중간.. 2024. 1. 18. 2024.01.12 부트캠프 4주차 - 주간 회고록 [4주차 기간]: 2024.01.08 ~ 01.12(5일) [4주차 진척도]: A01팀, 팀원 전체 데이터 분석 단계 투입 [기초 프로젝트 진척도]: 데이터 분석 단계로, 현재 진행률 20~25% FACTS: [역할: 팀장] 기초 프로젝트의 전체적인 일정이 조금 촉박하다. 원래 발표일은 1/17일이었는데, 그나마 지난주에 내가 정식 발의해서 1일이 연장되었음에도 매우 촉박하다. 그나마 우리 팀은 산업군, 주제 선정부터 미리 해놔서 망정이지, 11일부터 시작했다면 정말 아득하다. 기초 프로젝트를 끌고 가는 게 쉽지 않다. 아직 힘에 부치진 않지만, 내 전문 영역이 광고와 마케팅이고, 데이터 분석은 '초보' 단계이다 보니 어떤 데이터로 인사이트가 나오게끔 엮어야 하는지 고민이 많다. (아마 이건 팀원들도 마.. 2024. 1. 12. 1/12 - SQL 기초 Project & 마케팅 Side Project; 진행 현황 [본 Project] 팀원들 모두 데이터 분석에 들어가니, 열의가 상당하다. 오히려 내가 기 빨리는 중. 지금 넷플릭스 이용자 분석과 연령대 별로 수익이 얼마인지 구해야 하는데, 카드사 매출과 연결시키고 있다. 그런데 이 흐름에서 두 가지 data risk가 있다. 이는 곧 데이터 신뢰도와 직결되는 문제라 고민이 많다. 1) 넷플릭스 raw data 자체가 한국 데이터가 아니라는 점 2) 카드사 매출에서 OTT가 넷플릭스를 포함한 타 OTT 플랫폼도 포함된다는 점 그래서 오늘 물어본 튜터님 말고도, 차주 월요일(1/15) 오전에 다른 튜터님들에게 의견을 물어볼 생각이다. 생각보다 raw data에서 인사이트를 뽑기 쉽지 않다. 인사이트가 뽑혀야 전략이 나오는데, raw data 간의 신뢰도가 문제인지라,.. 2024. 1. 12. 1/11 - SQL 기초 Project & Side Project; 진행 현황 [본 Project] 오늘 드디어 기초 프로젝트(라 부르고 나는 본 Project라 정의함.) 발제가 되었다. 처음 공지된 프로젝트 기간은 주말 포함 7일이었다. 하지만 우리 팀의 특성상 주말은 쉬고 싶어하는 사람들이기에, 가급적 평일에 끝내려고 금주 초반부터 미리 세팅에 들어갔다. 팀원의 의견에 따라 미리 금주 초반부터 프로젝트 세팅을 모두 해두었는데, 예상치 못한 변수가 생겼다. 주제와 공통 산업군은 모두 정해졌는데, 데이터셋이 문제였다. 막상 데이터셋을 확인해 보니, 데이터 신뢰도가 0이었고, 집계가 잘못됐거나, 설계가 잘못된 듯한 수치가 나왔다. 정확히 통계청 수치와 비교해 보니 상식적으로 이상했다. 어떤 데이터셋으로 할지 찾기 전에, 플랫폼을 정하려고 했었다. 그러나 막상 팀원들이 '마케팅 전략.. 2024. 1. 11. 1/10 - Python 기초 학습 5일차 & Side Project [기억할 개념]1. for문을 한 줄로 표현할 때 2. map + lambda 3. filter: true 값만 뽑아냄 4. args(arguments): 여러 개의 인수를 하나의 매개변수로 받을 때 5. Class: 수 많은 데이터에서 반복적인 처리 과정이 필요할 때Class가 하나의 부모 역할순서는 Class 정의 → 그 안에 속성을 정의 → 마지막 개체를 정의해주는 것이 key-point! [Python 해설강의]: 전체적으로 나는 정답을 내기 위해, 굉장히 '창의적'으로 코딩을 하고 있었다. 내가 이해한 선으로, 구글링 과정 중에 이해하면서 풀었는데, 사실 이게 맞는 방식인지도 모르겠다. 코드에도 따로 정답이 있는 건가..? 정답만 나오면 되지 않을까? 그런데 정답 코드를 보니 파이썬의 기초 함수.. 2024. 1. 10. 이전 1 2 3 다음