IT/IT 자격증

빅데이터분석기사(빅분기) 4회 실기 후기

new1life 2022. 6. 30. 18:55

안녕하세요!

 

빅데이터 분석기사 실기 시험을 6월 25일에 보고 나서 잘 기억날 때 후기를 남겨보려고 합니다.

 

우선 빅분기는 작년에 생긴 아가 아가 한 시험입니다.

 

이제 빅데이터 시대에 도래한 만큼 미리 자격을 갖추어 두면 좋겠다고 생각했어요.

 

사실 데이터 분석이 어떻게 진행되는지 궁금하기도 하였습니다.

 

그렇지만 느낀 점은 이 자격증을 가지고 있다고 해서 데이터 분석을 할 줄 안다?! 까지는 아니라고 생각해요.

 

그만큼 데이터 분석은 광범위하고, 배울 것도 많다는 것을 깨달았어요!

 

실제로 국내에서 제일 어렵기로 유명한 데이터 분석 시험이 ADP라는 것이 있습니다.

 

이 시험을 볼 때는 오픈북이래요. 빅분기는 아쉽게도 오픈북이 아닙니다.

 

그래서 ADP 보실 때 캐리어에 자료들 싸고 오시는 분들도 계신다고 합니다. 그만큼 광범위하고, 어렵다는 거겠죠?!

합격률도 2%대라고 합니다..

 

다시 빅데이터 분석기사로 돌아와서, 빅분기는 코로나19로 인해서 1회와 2회가 함께 진행이 되었다고 합니다.

그냥 한 번에 1회로 해도 되지 않나? 싶긴 하네요

 

그래서 제가 본 4회는 3회라고 할 수 있습니다! 기출이 두 개밖에 없어요..!!

 

준비하면서도 많이 불안하더라고요. 우선 필기에서 모르는 범위의 문제들이 다수 출제되었기도 해서 

 

이번에 실기에서도 생각지도 못한 것이 나오지는 않을까..! 했었습니다.

 

시험은 단답형 10문제, 작업형 1, 작업형 2 이렇게 구성되어 있습니다.

 


단답형은 진짜 단답으로 답을 적어야 합니다. 

예를 들어, 정답인 레이블이 존재하는 학습방법을 무엇이라 하는가? -> 지도 학습

이런 식입니다. 배점은 3점이고, 총 30점이 주어집니다.

영어로 써도, 한국어로 써도 되는데, 둘 다 썼을 경우에는 둘 다 맞아야지만 정답이라고 합니다.(그냥 하나만 쓰세요)

단답형 공부는 따로 하진 않고, 실기 책은 사두었는데, 그렇게 많은 도움은 되지 않았아요.. 오히려 필기책이 더..

 

시험환경은 '구름'입니다.

 

작업형 1, 2는 코딩 문제예요.

언어는 R과 Python을 사용할 수 있습니다.

 

저는 Python을 선택했어요. 물론 시험장에서 자신이 원하는 언어를 사용하면 됩니다.

 

파이썬을 선택한 이유는, 직관적이고, 그전에 조금 배웠고, 머신러닝과 딥러닝에 관심이 있었기 때문입니다.

 

그리고 제가 느끼기에는 파이썬이 작업형 1 풀 때 더 쉽지 않을까 생각합니다.

 

이번에 나온 작업형 1  문제는

 

1. Q1에서 Q3 빼서 절댓값으로 정수형 출력하는 문제

-> Q3-Q1 해서 정수형으로 출력해도 정답으로 해줄까? 하는 궁금증이 생겼습니다. 그렇게 하진 않았지만

 

2. 리뷰?였나 긍정적인 리뷰를 가진 것이 전체 리뷰의 몇 퍼센트인지를 구하고, 그중에 어떤 값을 가진 것의 개수 뽑기

 

3. 논란이 많은 넷플릭스 시계열 문제! 해당 연도, 달에서 영국이 만든 작품 개수 뽑기였던 것으로 기억합니다.

여기서 논란이 되었던 것이 연도가 January 1th 인가로 되어 있었는데, 공백이 있는 것이 몇 개 있었다고 합니다.

'January 1st', '_january 1st' 이랬나 봐요.

그런데 저는 판 다스의 날짜형 변환 함수를 써서 공백이 있는지도 몰랐어요.. 판다스 사랑해

아쉽게 문제 제대로 확인 못하신 분들도 계셨습니다.. 다들 두 번 세 번 검토!!

 

근데 출제의 의도를 보면, 하드코딩을 해서 눈으로 확인하는 것을 보려는 것이 아니라서, 함정을 숨겨놨을 수도 있지 않을까 하는 생각이 듭니다.

날짜형으로 변환하면 공백이 있어도 처리가 되거든요...

논란이 되는 부분이 날짜형으로 안 바꾸고 문자열 뽑으신 분들과 일일이 찾아보신 분들 중에서 공백이 있는 것은 이상 값으로 봐야 하는 것 아니냐는 논란이 있습니다.

그러나, 철자가 틀린 것도 아니고, 날짜형 변환할 때 오류가 생기지 않았기 때문에.. 모르겠네요..ㅠㅠ

 

또한, 출력을 하면 되는 것이어서, 중간에 코드 없이 답만 불러와도 되는지, 출제의도에 따라 날짜형 변환하는 것을 보려고 한 것인지는 아직 초창기라 명백하게 모르겠습니다..

 

작업형 2문제는 다중 분류 문제였어요.

그전까지 이진 분류 문제가 대부분이어서, 이번에도 확률 값 아니면 이진 분류? 아니면 회귀? 아닐까 예상했었는데 아니었습니다. 그래도 분류라서 머신러닝 돌려서 예측값 찾고 파일 만들어서 제출했습니다.

 

칼럼명 1개라서, 칼럼명 제대로 적었는지, 테스트랑 개수는 맞는지 확인하고, 인덱스도 뺐는지 확인하고 제출했습니다.

 

아래에 제출 예시에도 index=False가 쓰여있어서 이번에는 얄짤없을 것 같은 느낌이 듭니다.

 

아마 이후에는 회귀가 나올 가능성이 있어 보이네요.

 

이렇게 풀고 한 세 번 정도 검토하니까 11시 30분이 넘어서 퇴실하였습니다. 금메달은 아니었는데, 은메달이었나?

 

근데, 작업형 2를 랜덤 포레스트랑 xgboost 중 하나 밀고 가려고 했는데 xgboost 경고 떠서 그냥 랜덤 포레스트로 갔습니다.

 

나중에 경고문은 무시해도 된다고 하셨지만, 왜 경고문이 뜨는지는 모르겠네요..

 

그리고 문제 제출 실패 오류 이슈로 1시간 연장되었다고 합니다.. 이것 때문에 불안해서 제출 여러 번 누름...

 

10시 정각에 시험 시작이고 10시 30분에 화장실 가능, 11시 30분 퇴장 가능입니다.

 

 

저는 커피를 마시고 들어갔더니 화장실을 한 번 갔습니다. 

 

시험 전에 크롬으로 테스트 주소 알려주시는데 goorm을 groom으로 적으셔서 다들 안 들어가진 다고..ㅋㅋㅋ하는 해프닝이 있었습니다.. 저도 근데 groom이 맞는 줄

 

 

그리고 메모장 사용 가능하고,

틀어 놓을 수 있는 게 시험환경에서 보이는 사용 가능한 라이브러리랑 유의사항 파일인데.. 

그거 보고 있는 어떤 분 딴 거 틀어놓은 줄 알고 혼나심..

 

아, 그리고 단답형 중에 F1스코어 구하는 문제가 있었는데, 계산기 쓰다가 혼나신 분도 계시다고 한다ㅎㅎ.

나는 작업형 넘어가서 풀어봄

 

그리고 어떤 고사장에서는 종이 필기 가능한 곳도 있었다고 한다.

f1스코어 빼고는 그다지 사용할 일도 없고, 연습할 때 메모장에 쓰는 걸로 연습해서 엄청나게 불공정하다고 생각하지는 않는다.

 

그러고 보니 시험 시작 전에 옆에 앉으신 분이 타자로 마구마구 뭘 치시길래 타자 연습하시나 했는데,

그분이 감독관님 불러서 그 내용 읽게 하시고, 그거 읽으신 감독관님이 앞에 계신 분 메모장에 라이브러리 미리 쳐놓으신 것을 제지하셨다..ㅋㅋㅋㅋ