데이터 단답형 대비 6
입력층과 출력층 사이에 한 개 이상의 은닉층을 마련해서 비선형적으로 나뉘는 데이터에 대해 학습이 가능한 이것은 무엇인가?
다층 퍼셉트론(NLP)
입력값 (A, B)가 서로 같을 때는 출력 값이 0이고, 다를 때는 출력 값이 1이 되는 연산으로, 퍼셉트론에서 선형 분리가 불가능한 연산을 무엇이라 하는가?
XOR 연산
출력 값과 데이터의 차이에 대한 제곱의 평균을 의미하며, 정답과 오답의 전체 확률을 고려한 손실 함수를 무엇이라 부르는가?
MSE
단어로 이루어진 변수를 표현하고자 하는 단어를 1로, 나머지는 0으로 채워 넣는 인코딩 방식은?
원-핫 인코딩
경사 하강법에서 학습할 때 학습해야 하는 정도를 설정해주는 초매개변수로 갱신하는 양을 의미하는 이것은?
학습률
계산된 수치와 정답의 차이를 구해서 오차를 줄이기 위해 가중치를 수정하는 방법으로 반복해서 수행하는 이 기법은?
오차역전파
SVM에서 결정 경계로부터 서포트 벡터의 거리를 말하며, 이것을 가장 크게 하는 것이 최적의 결정 경계인 이것은?
마진
SVM에서 완벽하게 분리하는 것이 불가할 때 선형적인 분류를 위하여 오차를 허용하는 변수를 무슨 변수라고 부르는가?
슬랙 변수
저 차원에서 고차원으로 매핑할 때, 연산이 복잡해지는데 이를 커널 함수를 이용하여 연산량 문제를 해결하는 기법은?
커널 트릭
장바구니 분석, 서열 분석이라고도 불리며, 쇼핑몰에서 관련된 상품을 추천해주는 서비스에서 활용하는 분석 기법은?
연관성 분석
연관성 분석의 측정지표로, 해당 규칙이 우연하게 나타난 것인지 아닌지를 확인하기 위해 연관성 정도를 파악하기 위한 척도는?
향상도
연관성 분석의 알고리즘으로, 모든 가능한 경우의 수를 찾는 방식이 비효율적이기 때문에 빈도를 함께 고려해서 연관성을 찾는 것이다. 최소 지지도보다 큰 지지도를 가지는 것들로만 모아서 계산하는 방법이며, 항목이 증가하면 규칙이 기하급수적으로 늘어나는 것을 방지해주는 이 알고리즘은?
아프리오리 알고리즘
지지도를 각각 계산하고, 최소 지지도 이상의 것들만 선택해서 트리를 형성하면서 계산을 줄이고, 스캔의 횟수도 아프리오리보다 줄인 이 알고리즘은?
FP-Growth 알고리즘
X차원의 공간에서의 거리를 말하며 X가 1일 때는 맨해튼 거리, X가 2일 때는 유클리드 거리와 같은 이 거리는?
민코프스키 거리
명목형 변수의 거리를 측정하기 위한 것으로, X, Y 두 집합의 유사도를 측정하는 방법이다. 두 집합이 같으면 1, 전부 다르면 0인 이것은?
자카드 계수
군집의 개체가 결합하는 순서를 보여주는 트리 형태의 구조로 군집 안에서 유사한 정도를 확인할 수 있고, K-평균 군집에서 K값을 선정할 때 사용하는 이것은?
덴드로그램
군집 안의 오차 제곱합에 따라서 군집하는 거리 측정 기법으로, 군집이 합쳐졌을 때 오차 제곱합이 제일 적게 증가하는 쪽으로 군집을 만들며, 군집 내의 분산을 최소화하는 이 연결법은?
와드 연결법
군집 간의 거리를 통해서 적절하게 분리되었는지를 확인하는 K-평균 군집의 K값 결정 기법으로, 거리가 멀면 최적화가 잘된 것이고 계수는 1과 가까워지고, 거리가 너무 가까우면 0에 가까워지는 이것은?
실루엣 기법
관측되지 않고 측정되지 않은 잠재적 변수에서 최대 가능도를 추정치로 사용하며, 최대 사후 확률을 갖는 추정 값을 찾기 위해 반복하는 알고리즘을 무엇이라 하는가?
EM 알고리즘
밀도를 기반으로 군집하는 알고리즘으로, 군집의 개수를 정하지 않지만, 반경 내의 최소 데이터 수는 정해야 하며 밀도에 따라서 연결하는 기하학적인 모양을 갖는 알고리즘은?
DBSCAN
자기 조직화 지도에서 입력층과 가장 가까운 뉴런을 의미하는 것으로, 연결 강도를 다시 조정할 대 사용하며, 최고로 잘 맞는 친구들이라는 뜻을 가진 이것은?
BMU
설명이 가능한 오차에 의한 변동이 총변동에서 차지하는 비율로, 입력 변수가 증가하면 같이 증가하며, 변수의 수가 증가하면 같이 증가해서, 적절하지 않은 변수가 추가되면 값이 줄어드는 수정된 '이것'도 존재한다. 이것은?
결정계수
의사결정나무에서 가지를 더 이상 늘리지 않고, 현재의 마디가 끝마디가 되게 만드는 규칙을 무엇이라 하는가?
정지 규칙
카이제곱 통계량을 사용하며, 다지 분리를 허용하는 의사결정나무 알고리즘을 무엇이라 하는가?
CHAID
인공신경망의 활성화 함수 중에서 출력 값이 다수이고, 목표하는 값의 범주가 다양할 때 각 범주에 속할 확률로 변환해주며, 출력하는 값의 총합은 1이 되는 이 함수는?
Softmax 함수