본문 바로가기
DS공부

[방통대] 데이터정보처리입문 2~4강

by 띠오리팡 2023. 3. 21.

데이터란 datum의 복수형 수치/문자 중심의 데이터를 분석하는 방법을 배우게 될거임.

데이터 분석의 목적 ( 강의자료에 나와있음) 케이스(레코드)/변수(필드) 무응답 결측값으로 약속해서 넣는 것도 코딩 설계의 일부

자료의 개수나 측정단위가 다른 두 개 이상의 자료에 대한 표본집단 간의 상대적인 산포를 비교할 때 이용되는 측도로, 두 집단의 단위가 다르거나, 단위는 같지만 평균의 차이가 클 때 두 그룹의 산포를 비교하는 데 유용하게 이용되는 측도는? -> 변동계수

  1. 처음 접하는 개념이고
  2. 표준오차라고 생각했음

R을 통해서도 구할 수 있지만 숫자만 입력하면 중앙값을 구할 수 있는 많은 사이트가 있다!

http://mwultong.blogspot.com/2008/01/sum-average-stdev-median-calc.html


절사평균 : 10% 절사평균은 표본에서 가장 큰/작은 10%를 각각 떼고 계산한 값

R로 계산할 수 있음 mean(aval, trim=0.10)


R을 이용한 산포도 계산 식

R을 이용한 계산 > aval = c(5,4,7,6,8,10,11,0,7,18) > sd(aval) [1] 4.788876 > IQR(aval) [1] 4.25 > summary(aval) > quantile(aval, probs=c(0.25, 0.5, 0.75)) 25% 50% 75% 5.25 7.00 9.50

 

'DS공부' 카테고리의 다른 글

[방통대] R컴퓨팅 8강. 함수만들기  (0) 2023.04.21
[방통대] 데이터정보처리입문 1강  (0) 2023.03.21