목록전체 글 (49)
언젠가는

빅데이터 분석기사 실기 합격했습니다! 그래서 합격 후기를 한번 남겨보려고 합니다. 빅데이터 분석기사에서 논란이 되었던 index=False는 문제가 되지 않았나 봅니다! csv파일로 만들면 자동으로 인덱스가 생성이 되는데, index=False를 해야 인덱스 없이 생성이 됩니다. 제출 파일 예시에 인덱스명이 없어서, 이대로 제출해야 하나? 하고 생각을 했었습니다. 왜냐하면 3회 실기에서 해당 부분을 지키지 않아서 0점 처리가 되신 분들이 계셨거든요. 그런데, 재검토 제출하시고 점수를 다 받으실 수 있었다고 합니다! 이번에는 재검토 제출 안 하셔도 다 옳게 채점이 된 것 같아요! 솔직히 인덱스 명을 기입했다고 분석이 잘못된 것은 아니라고 생각합니다. 또한, 주석 문에는 해당 글귀가 있었지만, 문제 부분에는..
앙상블이란 여러 개의 예측모형을 만들고, 조합하여 하나의 최종 예측모형을 만다는 것이다. 다중 모델 조합, 분류기 조합이 있다. 앙상블을 통해서 신뢰성을 높일 수 있다. 그러나, 모형이 어떻게 그렇게 나왔는지 제대로 알지 못하기 때문에, 원인 분석과 같은 것에는 부적절하다. 학습 자료의 작고 소중한 변화에도 예측 모형이 크게 변한다면, 그 모형은 불안정한 상태이다. 앙상블에는 배깅, 부스팅, 랜덤 포레스트가 존재한다. 배깅은 여러 개의 부트스트랩 자료를 만들어서 각 부트스트랩에 예측모형을 만들어서 결합한다. 부트스트랩은 주어진 자료에서 동일한 크기의 표본을 랜덤 복원 추출로 뽑은 자료이다. 부트스트랩을 통해서 100개의 샘플을 추출해도 단 한 번도 선택받지 못한 모태 솔로들이 무려 36.8%나 된다. 보..
지도 학습과 비지도 학습 데이터의 학습방법은 지도 학습과 비지도 학습이 있습니다. 지도 학습은 정답인 레이블이 있는 학습이고, 비지도 학습은 레이블이 없이 이루어지는 학습이라고 생각하면 됩니다. 지도 학습에는 의사결정 나무, 인공신경망, 회귀분석, 로지스틱 회귀분석, 사례기반 추론, 최근접 이웃 법(KNN)이 있습니다. 비지도 학습에는 연관성 규칙 발견, 군집분석, SOM이 있습니다. '예측'은 분류 규칙을 가장 많이 사용합니다. 예측은 회귀분석, 판별분석, 신경망, 의사결정 나무도 활용합니다. '설명'은 연관 규칙(사기 적발), 연속 규칙(고객 구매이력을 통한 목표 마케팅), 데이터 군집화(판촉활동, 이벤트 대상 선정) 데이터 마이닝 추진단계는 목적 설정, 데이터 준비, 가공, 기법 적용, 검증으로 이..
저는 정보처리기사를 21년 11월에 취득하였습니다. 정보처리기사는 Qnet에서 신청할 수 있습니다. 실기 같은 경우에도 원하는 고사실 선택이 어마어마합니다. 10시에 바로 들어갔는데도, 대기 오랫동안 했어요. 그래도 결국에는 원하는 장소를 택할 수 있습니다! 그렇지만 10시 이후에 들어간 다음에는 남는 고사장이 많이 없더라고요. 10시 되기 전에 접수 대기하시는 것 잊지 마세요! 저는 필기시험을 보고, 실기 공부는 조금 게을리했습니다. 필기 공부만큼 하지는 않았던 것 같아요. 그 이유는 필기와 범위가 겹치고, 익숙한 용어들을 조금 더 깊이 알고 간다는 의미이기도 하기 때문입니다. 책은 수제비라는 교재를 사용하였어요. 수제비라는 책이 정말 도움이 많이 되었습니다. 수제비 책을 보고, 또 수제비 카페가 정말..

오늘은 ADsP 합격후기를 가져왔습니다! 저는 2022년 2월 말에 시험을 봤습니다. 원래는 빅데이터 분석기사를 보려고 했는데, 올해 첫 시험이 4월이더라고요! 그래서 그전에 미리 할 것이 없나 보다가 ADsP랑 범위가 겹쳐서 하게 되었습니다! ADsP는 데이터 분석 준전문가 자격증이라고도 불립니다. 과목은 3과목입니다! 1. 데이터의 이해 2. 데이터 분석 기획 3. 데이터 분석 세 과목당 40% 이상 맞아야 하고 합격은 60 이상입니다. 제가 공부한 책은 데이터 에듀의 민트 책을 골랐습니다! 7년 연속 베스트셀러라고 하네요. 책이 그리고 꽤나 두꺼워요..!! 처음에 보고 깜짝 놀랐습니다.. 근데 기출문제도 잘 되어있고, 정리도 잘 되어있는 느낌이 들었습니다. 그런데, 정오표를 한번 확인해 보세요! 틀..