본문 바로가기

Adsp13

비전공자 데이터분석 준전문가 (ADsP) 합격수기 [취득계기]일단 나는 통계학이나 컴퓨터 쪽 전공이 아니다.관련지식이 1도 없는 상태였고 아직도 진로를 정하지 못한 3학년이었는데 겨울방학에 뭐라도 취득해보자 했던 상태였다..그래도 프로그래밍 쪽으로 프로젝트나 동아리 경험이 있었고 빅데이터 쪽에 관심이 있었기 때문에 관심이 갔던 자격증이었다.친구말로는 2주잡고 공부해도 충분하다고 했는데 난 넉넉하게 3주 잡고 시작 하였다. [사용했던 교재]친구가 민트책이 제일 유명하다고 해서 책은 고민도 안하고 민트책으로 바로 구매했다. 정가가 네이버 최저가로는 25000원정도 하던데 마침 당근마켓에서 중고가로 5000원에 올라와서 바로 거래했다.완전 새거였다. 바람직한 거래였다. [공부방법]공부기간을 3주로 잡았는데 1,2 과목은 단순암기고 3과목이 어렵다고 해서 3과.. 2021. 4. 22.
기출문제 오답 ** 정보를 제공하는 분석기술 : 추출 통찰력을 제공하는 분석기술 : 최적화, 모델링, 권고, 시뮬레이션 ** 가트너가 제시한 데이터사이언티스트의 역량 데이터 관리 분석 모델링 비즈니스 분석 소프트 스킬 ** 분석과제 수행할 때 고려해야할 속성 5가지 데이터 양 데이터 복잡성 속도 정확성, 정밀도 복잡성 ** 정형데이터 : 정보시스템 XML : 반정형데이터 **표준화 거리 : 각 변수를 해당 변수의 표준편차로 변환한 후 유클리드 거리를 계산한 거리맨하튼 거리 : 각 방향 직각의 이동 거리 합으로 계산.유클리드 거리 : 두 점을 잇는 가장 짧은 직선거리마할라노비스 거리 : 통계적 개념이 포함된 거리. 변수들의 산포를 고려하여 표준화 한 거리. **데이터의 정규성 확인- shapiro-wilks test- .. 2021. 3. 12.
군집분석 & 연관분석 ※ 계층적 군집분석 : n개 군집으로 시작해 점차 군집의 갯수 줄여 나가기 최단 연결법 최장 연결법 평균 연결법 와드 연결법 : 편차들 제곱의 합 군집화 ※ 비계층적 군집분석 : n개의 개체를 g개의 군집으로 나눌수 있는 모든 가능한 방법을 점검해 최적화한 군집 형성 - K평균 군집분석 : 분산을 최소화 하는 방식으로 동장 (연속형 변수) 초기 군집수 결정에 어려움이 있음. seed를 정해 seed 중심으로 군집형성 각 데이터를 거리가 가장 가까운 seed 있는 군집으로 분류 각 군집의 seed 값 다시 계산 ※ 혼합분포군집 : 모수와 함께 가중치를 자료로부터 추정하는 방법 사용. - EM 알고리즘 (E : 잠재변수 Z의 기대치 계산, M : 잠재변수 Z의 기대치 이용해 파라미터 추정) 알고리즘 그림 p.. 2021. 3. 11.
3과목 - 데이터 분석 개요, 데이터 마트 (문제) ** EDA의 또다른? 뜻EDA : 데이터가 가지고 있는 특성을 파악하기 위해 해당 변수의 분포 등 시각화하여 분석하는 분석방법 ** 모델링 성능 평가데이터 마이닝 - 정확도- 정밀도- 디텍트 레이트- 리프트시뮬레이션- Throughput- Average wating time- Average queue length- Time in system ** ODS : 정제된 데이터신규시스템 & 스테이지 영역 : 에서 가져온 데이터는 정제되어 있지x데이터 정제 후 DW, DM과 결합. ** EDA의 4가지 주제 (저잔자그)- 저항성의 강조- 잔차계산- 자료변수의 재표현- 그래프 통한 현시성 **reshape : 변수를 조합해 변수명을 만들고 변수들을 시간, 상품 등의 차원에 결합해 다양한 요약변수와 파생변수를 쉽게.. 2021. 3. 10.