언젠가는

데이터 단답형 대비 5 본문

IT/IT 지식

데이터 단답형 대비 5

new1life 2022. 7. 19. 19:32

두 개 이상의 집단끼리의 비교를 하고자 할 때, 집단 내의 분산을 비교해서 얻는 분포를 이용해서 가설검정을 하는 방법으로, 다수의 집단의 분산을 비교하면서 집단의 통계적 차이를 확인하는 분석방법을 무엇이라 하는가?

분산 분석

 

가능한 선택지 중에서 보상을 제일 많이 해주는 행동을 하거나 그러한 순서를 결정해서 학습하는 기법을 무엇이라 하는가?

강화 학습

 

모델 안에서 확인할 수 있는 변수이며, 데이터를 통해서 계산할 수 있는 값이다. 모델의 성능을 결정하며, 측정 또는 학습을 통해 내부적으로 결정한다. ANN의 가중치나 로지스틱 분석의 결정계수와 같은 값을 무엇이라 부르는가?

매개변수

 

종속변수가 범주형일 때 사용하는 모형으로, 독립변수는 연속형일 때 사용하는 분석 모델은?

로지스틱 회귀 분석

 

생명이 진화하는 과정을 가져와서 최적의 값을 구하는 알고리즘으로 존 홀랜드가 개발하였다. y=f(x)의 최적의 해를 구하기 위한 탐색 알고리즘을 무엇이라 하는가?

유전자 알고리즘

 

잔차의 분산이 독립변수와 관계없이 항상 같아야 한다는 특성으로, 잔차가 고르게 분포해야 한다는 특징을 무엇이라 하는가?

등분산성

 

오차항이 정규분포를 따르는지를 확인하기 위한 검정 기법으로, 회귀 분석에서 모든 독립변수에 대한 종속변수가 정규분포를 따르는가를 확인하는 방법을 무엇이라 부르는가?

샤피로-윌크 검정

 

비교할 수 있는 기준이 되는 데이터가 정규분포의 특성을 가지고 있어서 정규성 검정을 할 수 있고, 데이터가 어떤 특정한 분포를 따르는지를 확인하고 비교하는 검정 방법을 무엇이라 부르는가?

콜미고로프-스미르노프 검정(K-S검정)

 

회귀 모형이 통계적으로 의미를 가지고 있는지 확인하기 위한 것으로, 유의 수준 5%에서 '이것'의 p-value가 0.05보다 작으면 회귀식이 통계적으로 의미 있다고 할 수 있는 이것은?

F-통계량

 

회귀식 그 자체의 유의성을 보기 위한 것으로, 회귀 모형이 설명력을 가지고 있는지를 확인하는 값으로, 0에서 1 사이의 값을 가지며, 값이 높을수록 설명력이 좋은 것으로 인정하는 이 값은 무엇인가?

결정 계수

 

오차의 등분산성이 의심스럽거나, 이상치의 영향을 덜 받는 회귀 모형을 만들기 위해서 사용하는 것으로, 종속변수를 변환하여 문제를 해결하는 이방식은?

WLS(가중최소 자승법)

 

근사적으로 구하려는 값과 실제 값의 오차의 제곱 합이 최소가 되도록 만드는 값을 찾기 위한 방법은?

최소제곱법

 

다중 회귀 분석에서 설명변수 사이에 선형 관계가 있으면, 회귀 계수를 정확하게 추정하기 힘들다. 그렇기 때문에 이 검사 방법을 통해 해결하고자 한다. 분산 팽창 요인과 상태 지수를 통해 이것을 검사한다. 일부의 설명 변수가 다른 설명 변수와 상관관계가 높아서, 데이터 분석에 방해가 되는 현상을 무엇이라 하는가?

다중공선성

 

다중 회귀 모델에서 독립변수끼리 상관관계가 있는지 확인하기 위한 척도로, 보통 4보다 크면 다중공선성이 존재한다고 보고 10보다 크면 문제가 심각하다고 해석하는 이것은?

VIF(분산 팽창 요인)

 

모형이 복잡함에 대해서 벌점을 부과하는 방법으로, 실제 데이터의 분포와 예측된 모형의 분포의 차이를 나타내는 방법이며, 독립변수가 많은 모형이 유리하여, 독립변수의 영향을 많이 받는다. 이를 위해서 독립변수가 증가하면 벌점을 부여하여 품질을 평가하는 이것은?

AIC

 

표본이 커지더라도 부정확해지지 않게 보완한 벌점 방식으로, 표본이 커질수록 더 심하게 벌점을 부과하는 이것은?

BIC

 

특정한 사건이 생길 확률과, 생기지 않을 확률의 비를 나타낸 것을 무엇이라 부르는가?

오즈

 

불순도를 측정하는 지수로, 이것을 가장 감소시켜주는 예측 변수와 최적 분리를 통해서 자식 마디를 선택하는 분리 기준을 무엇이라 하는가?

지니 지수

 

열역학에서 쓰이는 무질서 정도를 나타내는 지수로, 원래 상태로 돌아갈 수 없는 성질을 말하며, 의사결정나무의 분리 기준으로 사용되는 이것은?

엔트로피 지수

 

편향이 심한 CART의 단점을 개선한 알고리즘으로, 편향이 거의 없고, 분리 규칙은 두 단계로 나누어 시행하며, 불순도의 척도로는 카이제곱 통계량을 사용하는 의사결정나무 알고리즘은?

QUEST

 

독립변수 간의 상호작용이 종속변수에 까지 영향을 끼치는 현상을 무엇이라 하는가?

교호 작용

 

 

 

'IT > IT 지식' 카테고리의 다른 글

데이터 단답형 대비 6  (0) 2022.07.21
데이터 단답형 대비 4  (0) 2022.07.17
데이터 단답형 대비 3  (0) 2022.07.17
데이터 단답형 대비 2  (0) 2022.07.16
데이터 단답형 대비 1  (0) 2022.07.14
Comments