Please use this identifier to cite or link to this item: http://cmuir.cmu.ac.th/jspui/handle/6653943832/73868
Title: การปรับค่าเสียหายในการจำแนกประเภทผิดเพื่อการเรียนรู้ที่อ่อนไหวต่อค่าเสียหายบนชุดข้อมูลชีวการแพทย์ที่ไม่สมดุล
Other Titles: Misclassification cost adjustment for cost-sensitive learning on imbalanced biomedical datasets
Authors: ปริญญา ปันสิน
Authors: จักรเมธ บุตรกระจ่าง
ปริญญา ปันสิน
Keywords: ปรับค่าเสียหายในการจำแนกประเภทผิด;Cost sensitive learning;Misclassification cost assignment;imbalance data classification;เรียนรู้ที่อ่อนไหวต่อค่าเสียหาย;AdaBoost cost sensitive boosting;ข้อมูลชีวการแพทย์ที่ไม่สมดุล;Biomedical Data
Issue Date: Jun-2022
Publisher: เชียงใหม่ : บัณฑิตวิทยาลัย มหาวิทยาลัยเชียงใหม่
Abstract: The data where number of examples in each class differ significantly or imbalance data can be found in various application domains. The traditional supervised learning following the Empirical Risk Minimisation principle, which minimises the misclassification regardless of the types of error, often yields a classification model that generalises poorly on the minority class. Cost-sensitive learning is one of the promising approaches to introducing inductive bias into the model for imbalance data classification. This thesis the aim comparative study of misclassification cost and initial weight assignment strategies for AdaBoost. And bring about to propose method for automatically determine suitably cost of misclassification and initial weight. In this thesis, we studied three strategies for determining misclassification costs for an imbalance dataset and incorporated such costs into a cost- sensitive AdaBoost algorithm. The strategies consist of Imbalance Ratio which is determine misclassification cost from ratio of each class instance, Grid Search which is find expected parameter procedure for learning step and Distribution Correction that is modify the initial weight by sample size in those target class. Apply whole strategies with Cost-Sensitive AdaBoost. The experimental results based on five imbalance biomedical testbeds. The results are appear the imbalance ratio strategy seemed to over- estimate the misclassification costs and as a result yielded a model which is too focused on the minority class. The grid search improved upon the traditional AdaBoost on some datasets but is still comparable to AdaBoost overall. And the distribution correction strategy seemed to outperform all other strategies. It is therefore recommended that the proposed distribution correction method is the most effective strategy in terms of imbalance-aware performance measures.
URI: http://cmuir.cmu.ac.th/jspui/handle/6653943832/73868
Appears in Collections:SCIENCE: Independent Study (IS)

Files in This Item:
File Description SizeFormat 
parinya_punsin_cost.pdfการปรับค่าเสียหายในการจำแนกประเภทผิดเพื่อการเรียนรู้ที่อ่อนไหวต่อค่าเสียหายบนชุดข้อมูลชีวการแพทย์ที่ไม่สมดุล4.09 MBAdobe PDFView/Open    Request a copy


Items in CMUIR are protected by copyright, with all rights reserved, unless otherwise indicated.