목록배깅 (1)
언젠가는
앙상블, 텍스트 마이닝, SOM
앙상블이란 여러 개의 예측모형을 만들고, 조합하여 하나의 최종 예측모형을 만다는 것이다. 다중 모델 조합, 분류기 조합이 있다. 앙상블을 통해서 신뢰성을 높일 수 있다. 그러나, 모형이 어떻게 그렇게 나왔는지 제대로 알지 못하기 때문에, 원인 분석과 같은 것에는 부적절하다. 학습 자료의 작고 소중한 변화에도 예측 모형이 크게 변한다면, 그 모형은 불안정한 상태이다. 앙상블에는 배깅, 부스팅, 랜덤 포레스트가 존재한다. 배깅은 여러 개의 부트스트랩 자료를 만들어서 각 부트스트랩에 예측모형을 만들어서 결합한다. 부트스트랩은 주어진 자료에서 동일한 크기의 표본을 랜덤 복원 추출로 뽑은 자료이다. 부트스트랩을 통해서 100개의 샘플을 추출해도 단 한 번도 선택받지 못한 모태 솔로들이 무려 36.8%나 된다. 보..
IT/IT 지식
2022. 7. 11. 21:26