언젠가는
데이터 단답형 대비 1 본문
원래 입력하지 않은 값인데, 입력하였다고 생각하는 값을 무엇이라고 합니까?
노이즈
배웠던 경험들을 토대로 개인이 터득한 것이지만, 운동 기술과 같이 겉으로 나타나지 않고, 신체적 요건 등이 제약으로 공유되기 힘든 지식은 무엇인가요?
암묵지
형식지들이 합쳐져서 또 다른 형식지를 만드는 과정을 무엇이라 하나요
연결화
어느 그룹 안에 속한 인간들이 연결망의 특징을 분석해서 시각화하는 분석은?
사회 연결망 분석(SNA)
가트너의 분석 가치 에스컬레이터에서 어떠한 사건이 생겼는지를 분석하는 단계는?
묘사 분석
분석 가치 에스컬레이터에서 해당 사건이 일어난 이유, 왜 발생했는지를 분석하는 단계는?
단계 분석
인터넷이 연결된 곳에서 정보들을 자신과 다수의 다른 컴퓨터와 연결하여 처리하는 서비스를 일컫는 말은?
클라우드 컴퓨팅
자료의 분포 형태를 직사각형 형태로 시각화하여 보여주는 차트로, 수평축은 계급을 수직축은 상대 도수를 나타낸 것은?
히스토그램
분산된 서버에서 에이전트를 실행하고, 컬렉터가 에이전트로부터 데이터를 받아 HDFS에 저장하는 비정형 데이터 수집 방법은?
척와
로그 데이터를 효율적으로 수집하기 위한 기술로, 이벤트와 에이전트로 구성된 것은?
플럼
실시간 로그 데이터를 수집하여 HDFS를 제외한 저장소에 저장하는 기술은?
스크라이브
실시간 로그를 발행과 구독의 방식을 통해 처리하는 것은?
아파치 카프카
커넥터를 통해서 데이터베이스와 하둡 파일 시스템 사이에서 상호 교환하는 기능을 수행하는 기술은?
스쿱
네임 노드, 데이터 노드, 보조 네임 노드로 구성된 분산 파일 시스템을 무엇이라 하는가?
HDFS
SQL을 지원하지 않고, 수평적으로 확장이 가능한 실시간 무작위 조회가 가능한 분산 데이터베이스는?
HBase
하둡 환경의 프레임 워크와 충돌이 거의 없으며, 선택한 컬럼에 대한 Read를 빠르게 할 수 있는 특징을 가진 스토리지는?
쿠두
모든 데이터를 키와 값 쌍으로 만들고, 데이터를 분류하거나 처리하는 것으로 맵, 셔플, 리듀스 순서로 처리가 이루어지는 처리 방식은?
맵리듀스
마스터인 리소스 매니저와 슬레이브인 노드 매니저로 이루어진 리소스 관리 플랫폼은?
얀
맵리듀스를 사용하기 위해 자체 언어를 제공하는 SQL과 유사한 형태로 설계하게 만들어 주는 도구는?
피그
인 메모리 캐싱을 이용하여 스트림 데이터를 처리하고, 실시간 데이터 처리가 가능한 오픈소스의 분산처리 시스템은?
아파치 스파크
하둡 기반의 데이터 웨어하우스 설루션으로, 안에서 맵리듀스로 바뀌어 실행되는 특성을 가진 것은?
하이브
코디네이터 시스템으로, 자바 서블릿 컨테이너에서 사용되는 이것은?
우지
분산 코디네이터 시스템으로, 한 곳에 몰리지 않도록 분산하여 동시에 처리하는 특징을 가진 이것은?
주키퍼
파이썬 기반의 기술로, 크롤링을 통해 데이터를 수집하는 수집 기술은?
스크래파이
블로그에서 새로 게시된 글들을 공유하기 위해서 XML으로 정보를 제공해서 데이터를 수집하는 기술은?
RSS
대량으로 저장된 데이터 속에서 자동적으로 규칙과 패턴을 체계적으로 발견하는 기법은?
데이터 마이닝
가장 최근에 바뀐 데이터들을 자동으로 다른 곳으로 이동하는 기술로, 하루 종일 놔두어야 하는 업무에서 백업용으로 활용할 수 있는 것은?
CDC
데이터에 추가적으로 작업을 시행하기 위해서 원천 데이터들을 활용해서 만들고, 데이터 웨어하우스로 이동하기 전에 보관되는 곳은?
ODS
프로파일링 기술을 바탕으로 통계 패턴과 분석을 위해 페이야드가 만든 분석 방법론은?
KDD
업무를 분류하는 체계로 거시적으로 업무를 나눈 다음, 단위적으로 세분화하는 구조로 프로젝트를 시행하면서 작업을 설정할 때 필요한 이것은?
WBS
보통은 소비자들을 챙기기 위해서 관리하기 위한 도구로 알려져 있으며, 내부의 정보들을 분석하여 향후의 장기적인 목적을 세울 수 있도록 도와주는 프로그램을 무엇이라 합니까?
CRM
웹상의 데이터를 URI로 식별하고, 그 URI에 정보를 부여하는 오픈 데이터를 무엇이라 하는가?
LOD
노이즈를 제거하기 위해 추세를 벗어나는 값들을 변환하여 매끄럽게 만드는 것으로, 군집화 등의 기법을 사용하는 이것은?
평활화
개인의 식별되는 정보의 전부 혹은 일부를 대체되는 값들로 대체하여 변환하는 기법으로, 과도한 이것은 정보로서의 가치를 없애버린다. 이를 무엇이라 하는가?
데이터 마스킹
개인을 알아볼 수 있는 데이터에 대해서 직접적으로 알아보지 못하도록 일반화된 다른 값으로 대체하는 방법은?
가명 처리
같은 확률적인 정보를 가진 변형된 값을 가지고 원래 데이터를 바꾸는 기법은?
섭동
값을 수정하는 것이 아니라, 위치를 바꾸는 기법인 이것은 무엇인가?
치환
관계형 데이터베이스에서 참조하는 관계인 두 테이블은 언제나 일관된 값을 가져야 한다는 것을 의미하는 이것은?
참조 무결성
잠재적 오류를 발견하기 위한 방법으로, 데이터의 변경이 발생하는 모든 부분에서 수행하며, 표준 도메인과 일치하는지 검증하는 이것은?
데이터 프로파일링
인터넷에서 제공하는 다량의 웹 사이트로부터 각종 문서나 콘텐츠 등을 수집하는 기술은?
크롤링
비정형 데이터 중 이미지의 저장 방식은?
RGB
데이터 중에서 특정 사용자 또는 특정 부서에서 사용하는 데이터들을 모아서 작은 규모의 데이터 웨어하우스를 만드는 데, 이를 무엇이라고 하는가?
데이터 마트
가공되지 않은 날것의 데이터들을 종류에 관계없이 저장할 수 있는 시스템을 무엇이라 하는가?
데이터 레이크
구글에서 만든 것으로, 클라이언트와 마스터, 청크 서버로 이루어진 파일 시스템은?
GFS
시스템의 전부 혹은 일부가 고장 나더라도 모든 기능 혹은 일부 기능을 이전과 똑같이 이용할 수 있게 만들어주는 기술은?
FTA
시스템에 장애가 발생해서 이용이 불가한 상태에서 대체 시스템을 작동시키게 만드는 HA 기술은?
페일 오버
'IT > IT 지식' 카테고리의 다른 글
데이터 단답형 대비 3 (0) | 2022.07.17 |
---|---|
데이터 단답형 대비 2 (0) | 2022.07.16 |
인공신경망 (0) | 2022.07.14 |
알아두면 좋은 IT 지식 16 - 암호 키, UML, 소프트웨어 아키텍처 등 (0) | 2022.07.14 |
군집분석 (0) | 2022.07.14 |
Comments