비전공자 빅데이터분석기사(빅분기) 4회 최종 합격 후기!
빅데이터 분석기사 실기 합격했습니다!
그래서 합격 후기를 한번 남겨보려고 합니다.
빅데이터 분석기사에서 논란이 되었던 index=False는 문제가 되지 않았나 봅니다!
csv파일로 만들면 자동으로 인덱스가 생성이 되는데, index=False를 해야 인덱스 없이 생성이 됩니다.
제출 파일 예시에 인덱스명이 없어서, 이대로 제출해야 하나? 하고 생각을 했었습니다.
왜냐하면 3회 실기에서 해당 부분을 지키지 않아서 0점 처리가 되신 분들이 계셨거든요.
그런데, 재검토 제출하시고 점수를 다 받으실 수 있었다고 합니다!
이번에는 재검토 제출 안 하셔도 다 옳게 채점이 된 것 같아요!
솔직히 인덱스 명을 기입했다고 분석이 잘못된 것은 아니라고 생각합니다.
또한, 주석 문에는 해당 글귀가 있었지만, 문제 부분에는 명시해주지는 않았어요.
칼럼명만 제대로 적으면 된 거 아닌가 생각합니다.
그리고 작업형 1의 넷플릭스 문제는 결국 6이 정답이었나 봐요!
작업형 1에서 전처리를 해서 푸는 것에 대해서 다들 혼란이 있었습니다.
그래서 오히려 실무 경험이 있으신 분들 중에서 전처리를 작업형 1에서 하는 것이 맞나? 시키는 것만 해야 하는 것 아닌가? 하셔서 그런 상황이 생겼던 것 같습니다.
그리고 R로 문제를 푸신 분들 중에는 print문으로 출력해서 틀리신 분들이 계셨다고 합니다.
저도 제출 예시에 cat으로 출력하라고 적혀있는 것을 보았는데, 이렇게 명시해 놓은 상황에서는 가차 없이 채점이 이루어진다는 사실을 알게 되었습니다.
또한, 작업형 1은 부분점수가 없기 때문에, 출력만 제대로 하면 정답 처리가 되는 지도 궁금해지네요
제출 예시에는 변수명을 출력하라고 적혀있어서, result=6 하고 print(result) 해도 되는 걸까요?
저는 약간 걱정스러웠던 것이 정수형으로 출력하라고 해서 print(int(result)) 한 거랑, print(int(len(df))) 로 제출했던 것이 마음에 조금 걸렸습니다. 그런데 맞은 것을 보면 이건 상관이 없었나 봅니다!
아무래도 시작한 지 얼마 되지 않은 시험이라서, 조금 명확하지 않은 부분이 많은 것 같습니다.
다음에 준비하고 보실 분들은 옆에 나와있는 제출 예시를 잘 보고 제출하는 것이 좋을 것 같습니다!
저는 단답형을 7개 맞았습니다. 가채점할 때에도 7개 맞은 것을 확인할 수 있었는데요,
Q-Q플롯으로 확인할 수 있는 것이 정상성이라고 생각했는데 정규성만 답으로 체크되신 것 같아요.
저는 정상성 썼다가 이상한 걸로 바꿨는데, 어차피 틀린 것이었네요.(저는 정상성이라고 배운 것 같은데..)
아쉬운 것은 박스 콕스랑 여 존슨 어떻게 하는지 공부하고 갔는데, 어떤 건지 제대로 몰라서 단답형에 적지 못한 것이 한입니다. 최소 제곱 법도 필기할 때 그렇게 봤던 것이었는데, MSE 적고 나온...
단답형은 30점 만점이지만, 작업형 1, 2가 10점 단위로 점수가 나뉘기 때문에, 10점대, 20점대, 30점 이렇게 생각해야 하더라고요.
합격이 60점이라서, 단답형 18점을 받아도, 작업형 1+2 합친 것이 40점이라면 58점이라서 그렇습니다.
그래도 60점을 넘긴다면 점수가 높을수록 기분은 좋잖아요?!
작업형 2는 10점 감점되었어요..
뭐 때문에 감점되었는지는 정확하게 모르지만 아마 평가 점수가 조금 낮게 나왔을 것 같습니다!
왜냐하면 제가 macro f1 score를 구하는 법을 몰랐거든요!
그래서 랜덤 포레스트로 모델 만들고 하이퍼 파라미터 조정을 못하고 제출을 하였어요.
근데 나중에 찾아보니까 정말 간단하게 설정할 수 있더라고요.
저는 그것도 모르고 sklearn.metrics 못쓰냐고 문의하고 앉아있었습니다.
빅데이터 분석기사를 취득하고 나니까 드는 생각은 '찍먹'이다 라는 것입니다.
정말로 데이터 분석의 정말 기초적인 부분을 한 이제 아장아장 걸을 수 있는 아이가 된 정도라고 생각합니다.
그렇지만, 자격증 취득은 어떻게 보면 자신의 관심의 표현이라고 생각해요.
왜냐하면 필기부터 관심이 없거나, 흥미를 느끼지 못한다면 공부하기 힘들 것 같다는 생각이 듭니다.
그런데 저는 실기 준비하는 것은 더 재미있게 할 수 있었습니다. 기초적인 것을 해서 그럴 수 있겠지만 재미있었어요!
그래서 프로젝트들도 조금씩 해보려고 부릉부릉 하고 있답니다.
데이터 분석에 관심이 생긴 건 제가 다른 사람들을 판단하기 너무 힘들었기 때문입니다.
다들 각자의 사정이 있고, 살아온 환경이 있는데, 어떤 것으로 내가 판단을 해야 하나 고민이 많았는데,
그래도 조금이나마 객관적인 것이 어떻게 보면 데이터잖아요. 그래서 더 관심을 가지고 공부하게 되었습니다.
완전하게 공정한 것, 완전하게 객관적인 것은 사실상 불가능하다고 생각합니다.
그렇지만, 참고할 수 있는 무언가가 주어진다면 자신의 선택이나 다른 사람들의 성향을 파악하는 데 도움이 되지 않을까요?
빅데이터 시대에는 사생활 침해의 문제도 있겠지만, 사물인터넷과 센서 데이터들도 융합되어서 좀 더 편하고 조금은 무서울 수 있는 시대가 올 것 같습니다.
앞으로도 더 열심히 해서 자격증만 취득하기보다는 실무적인 경험들을 쌓아야 할 것 같아요.