본문 바로가기

자격증/ADsP8

ADsP 내용 정리 (4과목. 데이터 분석 - 키워드별 정리, 18회기출문제분석3) 1. 연관분석 연관규칙 : 항목들 간의 '조건-결과' 식으로 표현되는 유용한 패턴 연관분석(장바구니 분석) : 연관규칙을 발견해내는 것 연관분석 특징 기업 활동 중 마케팅 분야에서 가장 많이 사용됨 트랜잭션 : 특정고객, 장바구니 하나에 해당하는 정보 장바구니 데이터에서는 주로 트랜잭션 사이의 연관성을 살펴보는 것으로 빈번한 규칙 찾기 연관분석 장점 탐색적인 기법 : 조건반응으로 표현되는 결과 이해 쉬움 강력한 비목적석 분석기법 : 분석 방향/목적이 특별하게 없는 경우 목적변수 없으므로 유용 사용이 편리한 분석 데이터 형태 : 데이터변환없이 사용 가능 계산 용이 연관분석 단점 상당한 수의 계산 과정 : 품목 수 증가하면 분석에 필요한 계산은 대폭 늘어남 적절한 품목의 결정 : 너무 세분화해서 분석하면 의.. 2021. 7. 13.
ADsP 내용 정리 (4과목. 데이터 분석 - 키워드별 정리, 18회기출문제분석2) 1. 비모수 검정 모수적 검정 : 검정하고자 하는 모집단 분포에 대한 가정을 하고 그 가정하에 검정통계량과 분포를 유도해 검정 실시 가정된 분포의 모수(모평균, 모비율, 모분산)에 대해 가설 설정 관측된 자료를 이용해 구한 표본평균,표본분산 등을 이용해 검정 실시 비모수적 검정 : 자료가 추출된 모집단 분포에 대해 아무 제약 가하지 않고 검정 실시 가설은 단지 '분포의 형태가 동일하다' 또는 '동일하지않다'와 같이 설정 관측값의 절대 크기에 의존하지 않는 관측값들의 순위나 두 관측값 차이의 부호 등을 이용해 검정함 대표적 비모수 검정방법 : 쌍으로 관측된 표본에 대한 부호 검정, 윌콕슨의 순위합검정, 윌콕슨의 부호순위합검정, 만-위트니의 U검정, 런검정, 스피어만의 순위상관계수 2. SOM (자기조직화지.. 2021. 7. 13.
ADsP 내용 정리 (4과목. 데이터 분석 - 키워드별 정리) 1. 탐색적 자료분석(EDA) 5가지 특징 시각화하여 분석하는 분석 방식 다양한 차원과 값을 조합 (특이점이나 의미있는 사실 도출) EDA 4가지 주제 저항성의 강조 잔차 계산 자료변수의 재표현 그래프를 통한 현시성 데이터 양 많을수록 활용도 많이 함 시간 많이 필요한 경우 : 모델링 업무로 진행하는 것이 일반적 최근 EDA 자동 신속하게 수행 유의미한 값만 파악 데이터 만듦 2. 패턴 인식 : 원자료 이용해서 사전지식과 패턴에서 추출된 통계정보로 자료 또는 패턴 분류하는 분야 교사학습법(지도학습) : 온라인 쇼핑몰 기존 고객 구매패턴으로 고객그룹 분류하는 방법 비교사학습법(비지도학습) : 비슷한 성향을 가진 고객들의 유사도에 근거여 군집을 만들어 고객마케팅에 활용 3. 데이터 마트 : 전체 데이터웨어하.. 2021. 7. 9.
ADsP 내용 정리 (3과목. 데이터 분석 기획 - (제1장) 데이터 분석 기획의 이해) 제1절 분석 기획 방향성 도출 분석 기획이란 실제 분석을 수행하기에 앞서 분석을 수행할 과제의 정의 및 의도했던 결과를 도출할 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업 어떤 목표(what)를 달성하기 위하여(why) 어떤 데이터를 가지고 어떤 방식(how)으로 수행할지 계획을 수립 1. 분석 기획의 특징 IT기술 및 분석 기법에만 치우치지 않도록 주의 비즈니스에 대한 이해, 수학/통계적 지식, IT기술 3가지 영역에 대한 역량 및 시각 필요 분석대상 및 분석방법에 따라 분석 주제는 4가지로 나뉨 구분 Known Un-Known Known Optimization Insight Un-Known Solution Discovery 2. 분석 기획시 고려사항 데이터에 대한 고려.. 2021. 7. 9.
ADsP 내용 정리 (1과목. 데이터 이해 - (제3장) 가치 창조를 위한 데이터 사이언스와 전략 인사이트) 제1절 빅데이터 분석과 전략 인사이트 1. 빅데이터 열풍과 회의론 빅데이터 회의론 원인 부정적 학습효과 : 과거의 고객관계관리(CRM) -> 공포 마케팅, 투자대비 효과 미흡 부적절한 성공사례 : 빅데이터 필요없는 분석사례, 기존 CRM분석 성과 싸이월드 사례 OLAP과 같은 분석 인프라로 존재했으나 중요한 의사결정에 데이터분석 활용 못함 웹로그 분석을 통한 일차원적 분석만 집중 소셜 네트워킹 활동 특성과 관련 분석을 위한 프레임워크나 평가자지표도 없었음 트렌드 변화가 사업모델에 미치는 영향에 대한 전략적 통찰을 가지지 못함 전략적 통찰 없는 분석의 함정 단순히 일차원적인 분석의 반복은 해당부서 업무에선 효과적이나 기업의 환경변화와 고객변화에 전략적 대처가 힘듦 전략적 통찰력의 창출에 초점을 맞춰 분석을.. 2021. 7. 9.
ADsP 시험 정리 및 내용 정리 (1과목. 데이터 이해 - (제1장) 데이터의 이해) 1. 2019년 시험 일정 시험명 원서접수 시험일 결과발표 제20회 데이터분석준전문가(ADsP) ~2.18 3.9 4.9 제21회 데이터분석준전문가(ADsP) 3.12~5.13 6.1 7.2 제22회 데이터분석준전문가(ADsP) 6.4~8.12 8.31 10.1 제23회 데이터분석준전문가(ADsP) 9.3~11.4 11.23 12.24 2. 데이터분석준전문가 자격검정시험 과목 구분 시험과목 과목별 세부 항목 1과목 데이터 이해 1. 데이터의 이해 2. 데이터의 가치와 미래 3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 3과목 데이터분석 기획 1. 데이터분석 기획의 이해 2. 분석 마스터 플랜 4과목 데이터 분석 1. R기초와 데이터 마트 2. 통계 분석 3. 정형 데이터 마이닝 과목 1. 데이터.. 2021. 7. 9.
ADsP 내용 정리 (4과목. 데이터 분석 - 키워드별 정리, 18회기출문제분석1) 1. 회귀모형의 변수선택법 : 모든 가능한 독립변수들의 조합에 대한 회귀모형을 분석해 가장 적합한 모형 선택 전진선택법 : 절편만 있는 상수모형으로부터 시작해 중요하다고 생각되는 설명변수부터 차례로 모형에 추가 후진제거법 : 독립변수 후보 모두를 포함한 모형에서 가장 적은 영향을 주는 변수부터 하나씩 제거 단계별방법 : 전진선택법에 의해 변수를 추가하며 새롭게 추가된 변수를 인해 기존 변수가 그 중요도가 약화되면 해당변수를 제거하는 등 단계별로 추가 또는 삭제되는 변수를 검토해 더 이상 없을 때 중단 2. R명령어 Im(종속변수~설명변수. 데이터세트) : 사용할 분석방법은 회귀분석인 것을 인지시켜 줌 Direction="변수선택방법" : 선택 가능한 옵션은 forward, backward, both가 있.. 2021. 7. 8.
ADsP 내용 정리 (1과목. 데이터 이해 - (제2장) 데이터의 가치와 미래) 제2장 데이터의 가치와 미래 제1절 빅데이터의 이해 1. 정의 데이터 변화 : Volume(센싱데이터, 비정형 데이터), Variety(유형과 소스측면의 정형, 비정형 데이터), Velocity(데이터 수집과 처리측면) 기술 변화 : 새로운 데이터처리, 저장, 분석 및 아키텍쳐. 클라우드 컴퓨팅 활용 인재,조직 변화 : Data Scientist같은 새로운 인재필요, 데이터중심 조직 2. 출현 배경 ① 산업계 : 고객 데이터를 축적하여 데이터에 숨은 가치를 발굴해 새로운 성장동력원으로서의 기술 확보 ② 학계 : 거대 데이터를 다루는 학문 분야가 늘어나며 기술아키텍쳐 및 통계 도구들이 지속 발전 ③ 기술발전 : 관련기술의 발달(디지털화, 저장기술, 인터넷 보급, 모바일 혁명, 클라우드 컴퓨팅) ④ ICT발.. 2021. 7. 7.