[ADsP] 가설검증/통계

2023. 6. 3. 21:50·🥇 certification logbook
목차
  1. 가설검증/통계
  2. 탐색적 자료 분석 (EDA)
  3. 통계 자료 획득 방법
  4. 통계 자료 측정 방법
  5. 통계 분석
728x90
반응형

가설검증/통계

탐색적 자료 분석 (EDA)

해당 변수의 분포 등을 시각화하여 분석하는 분석 방식

4가지 주제

저항성의 강조
자료변수의 재표현
그래프를 통한 현시성
잔차계산

 
 

통계 자료 획득 방법

총 조사 / 전수조사

대상 집단 모두를 조사하는데 많은 비용과 시간이 소요되므로 특별한 경우를 제외하고는 사용하지 않음
 

표본 조사

용어

  1. 모집단 (population) 조사하고자 하는 대상 집단 전체
  2. 원소 (element) 모집단을 구성하는 개체
  3. 표본 (sample) 조사하기 위해 추출한 모집단의 일부 원소
  4. 모수 (parameter) 표본 관측에 의해 구하고자 하는 모집단에 대한 정보
  5. 표본오차 (sampling error) 표본에서 얻은 자료를 통해 모집단 전체의 특성을 추론함으로써 생기는 오차
  6. 비표본오차 (non-sampling error) 표본오차를 제외한 조사의 전체과정에서 발생할 수 있는 모든 오차
    1. 표본편의 (sampling bias) 비표본오차의 한 종류. 모수를 크게 또는 작게 추정하는 것과 같이 표본추출방법에서 기인하는 오차

 

표본 추출 방법

단순 랜덤 추출법 (simple random sampling)

각 샘플에 번호를 부여하여 임의의 n개를 추출하는 방법
각 샘플의 선택될 확률은 동일

계통추출법 (systematic sampling)

 

샘플을 나열하여 n개의 구간으로 나누고 임의 위치에서 매 k번째 항목을 추출하는 방법

집락추출법 (cluster random sampling)

군집을 구분하고 단순랜덤 추출법을 수행한 후, 모든 자료를 활용하거나 샘플링하는 방법. 집단 내 이질적, 집단 간 동질적

층화추출법 (stratified random sampling)

 

이질적인 원소들로 구성된 모집단에서 각 계층을 고루 대표할 수 있도록 각 층에서 랜덤 추출하는 방법. 층내 동질적, 층간 이질적.

 

통계 자료 측정 방법

질적척도

범주형 자료, 숫자들의 크기 차이가 계산되지 않는 척도

명목척도

어느 집단에 속하는지 분류할 때 사용 (성별, 출생지)

순서척도(서열척도)

서열관계를 관측하는 척도, 숫자의 크기를 의미있게 활용 가능(1등이 2등보다 성적이 높다 처럼) (만족도, 선호도, 신용등급)

 

양적척도

수치형 자료, 숫자들의 크기 차이를 계산 할 수 있는 척도

구간척도(등간척도)

속성의 양을 측정하는 것으로 구간사이 간격이 의미가 있는 자료.
절대적 크기는 측정할 수 없기에 덧셈, 뺄셈은 가능하나 곱셈, 나눗셈은 불가 (온도, 지수)

비율척도

간격에 대한 비율이 의미를 가지는 자료, 절대적 기준인 0이 존재하고, 사칙연산이 가능 (무게, 나이, 시간, 거리)
 

통계 분석

불확실한 현상, 특정한 집단을 대상으로 자료를 수집해 집단에 대한 정보를 구하고 적절한 통계분석 방법을 이용해 의사결정을 하는 과정
2023.05.21 - [data/ADsP] - [ADsP] 가설검증/통계 -기술 통계
2023.06.03 - [data/ADsP] - [ADsP] 가설검증/통계 - 통계적 추론

728x90
반응형

'🥇 certification logbook' 카테고리의 다른 글

[ADsP] 지도학습 - 회귀분석  (0) 2023.06.04
분석환경 설정 (파이썬 + 주피터노트북 + pandas)  (0) 2023.06.03
[ADsP] 확률분포  (0) 2023.06.03
[ADsP] 데이터마이닝  (0) 2023.06.03
[ADsP] 가설검증/통계 - 통계적 추론  (0) 2023.06.03
[ADsP] 가설검증/통계 -기술 통계  (0) 2023.05.21
[ADsP] 데이터 거버넌스 체계 수립  (0) 2023.05.21
[ADsP] 분석 거버넌스 체계 수립, 분석 수준 진단  (0) 2023.05.21
  1. 가설검증/통계
  2. 탐색적 자료 분석 (EDA)
  3. 통계 자료 획득 방법
  4. 통계 자료 측정 방법
  5. 통계 분석
'🥇 certification logbook' 카테고리의 다른 글
  • [ADsP] 확률분포
  • [ADsP] 데이터마이닝
  • [ADsP] 가설검증/통계 - 통계적 추론
  • [ADsP] 가설검증/통계 -기술 통계
이소야
이소야
✔ 공부 기록 ٩(๑•̀o•́๑)و
  • 이소야
    I study SO
    이소야
    ✔ 공부 기록 ٩(๑•̀o•́๑)و
  • 전체
    오늘
    어제
    • 분류 전체보기 (214) N
      • 🤖 ai logbook (39)
      • 💻 developers logbook (1)
      • 🥇 certification logbook (64) N
      • ⚖️ legal logbook (108)
      • ⚡ electronics logbook (1)
      • 🌍 english logbook (0)
      • 🎁 etc (1)
  • 최근 글

  • 인기 글

  • 태그

    deeplearning
    근로기준법
    방통대
    인공지능 입문
    자격증
    기본권의기초이론
    민법
    온라인 강의 추천
    머신러닝
    datascience
    데이터분석준전문가
    ADsP
    IBM
    형법
    법학과
    certificate
    Coursera
    데이터사이언스 입문
    Python
    빅데이터분석기사
  • hELLO· Designed By정상우.v4.10.3
이소야
[ADsP] 가설검증/통계

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.