그런 다음 이전 단계에서 잘못 분류된 관찰의 중요성을 강화하는 수정된 훈련 세트에 알고리즘이 적용됩니다. 보다 구체적으로, 잘못 분류된 관측값은 훈련 분류기를 사용하여 동일한 절차를 거치는 다음 표본에서 선택될 확률이 더 높습니다. 단계에 대해 k 훈련 샘플이 만들어질 때까지 반복됩니다 . 최종 결정, 즉 분류는 개별 분류자의 가중치 투표를 기반으로 합니다[ 29 ]. 부스팅 알고리즘에는 여러 버전이 있지만 가장 많이 사용되는 것은 AdaBoost [ 10 , 32 ]입니다. 우리는 본 연구에서 이 알고리즘을 사용합니다.
성과 지표
우리는 [ 12 , 19 , 20 , 21 , 22 , 28 ] 에 따라 신용 분류 모델의 성능을 분석하기 위해 표준 지표를 사용합니다 . 측정항목에는 전체 정확도(ACC), 제1종 오류(T1E), 제2종 오류(T2E)가 포함되며 표 2 와 같이 혼동 행렬로 표시됩니다 .
표 2 신용 점수에 대한 혼동 행렬 민감도는 제1종 오류가 낮을 때 1에 가까운 값을 가지며, 특이도는 제2종 오류가 낮을 때 1에 가까운 값을 갖습니다. ROC(수신기 작동 특성) 곡선은 모든 모델에 대해 구축되었습니다. 검증 세트에 대한 정밀도 기준을 제공하는 AUC(Area Under the Curve) ROC 측정을 사용하여 모델의 결과를 비교합니다[ 19 ].
표본 크기가 얼마나 중요한지 확인하기 위해 Crone, Finlay 및 Vieira et al.과 동일한 절차를 적용합니다. [ 8 , 31 ] 또한 다양한 인스턴스 수로 모델을 탐색합니다. 즉, 총 10개의 서로 다른 세트인 100, 250, 500, 750, 1000, 2500, 5000, 7500, 10,000 인스턴스 세트에 대한 결과를 생성하여 모델을 탐색합니다.
구글상위노출구글상위노출스포츠중계사이트제작스포츠중계 제작구글상위노출온라인카지노소액결제현금화무료스포츠중계무료스포츠중계성인용품성인용품롤 토토롤 토토비제이벳강남달토강남레깅스룸구글 백링크
11
대표이사 : 장세훈ㅣ사업자번호 515-01-33451ㅣ1공장 (우) 712-844 경상북도 경산시 와촌면 상암리 641번지ㅣ도로명주소 : 경북 경산시 와천동길 192
TEL : 053-853-9567~8ㅣFAX : 053-853-9569ㅣE-mail : taewha08@naver.com