Please use this identifier to cite or link to this item: http://cmuir.cmu.ac.th/jspui/handle/6653943832/69257
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorผู้ช่วยศาสตราจารย์ ดร.ชุมพล บุญคุ้มพรภัทร-
dc.contributor.authorจินตนา ตาคำen_US
dc.date.accessioned2020-08-03T07:38:25Z-
dc.date.available2020-08-03T07:38:25Z-
dc.date.issued2015-04-
dc.identifier.urihttp://cmuir.cmu.ac.th/jspui/handle/6653943832/69257-
dc.description.abstractClass imbalance is a problem that aims to improve the accuracy of a minority class, while imputation is a process to replace missing values. Traditionally, class imbalance and imputation problems are considered independently. In addition, filled-in minority-class values that are substituted by traditional methods are not sufficient for imbalance datasets. In this paper, we provide a new parameter-free imputation to operate on imbalance datasets by estimating a random value between the mean of the missing value attribute and a value in this attribute of the closet record instance from the missing value record. Our proposed algorithm ignores mean of instances to avoid an over-fitting problem. Consequently, experimental results on imbalance datasets reveal that our imputation outperforms other techniques, when class imbalance measures are used.en_US
dc.language.isothen_US
dc.publisherเชียงใหม่ : บัณฑิตวิทยาลัย มหาวิทยาลัยเชียงใหม่en_US
dc.titleการใส่ค่าข้อมูลที่ขาดหายโดยวิธีเพื่อนบ้านใกล้ที่สุดเคตัวเพื่อการจำแนกประเภทในชุดข้อมูลอสมดุลen_US
dc.title.alternativek–Nearest Neighbour Imputation for Classification in Imbalance Datasetsen_US
dc.typeThesis
thesis.degreemasteren_US
thesis.description.thaiAbstractชั้นข้อมูลอสมดุลเป็นปัญหาที่ต้องการปรับปรุงความถูกต้องของชั้นข้อมูลกลุ่มด้อย ในขณะที่การใส่ค่าคือกระบวนการเติมค่าที่ขาดหาย โดยทั่วไปชั้นข้อมูลอสมดุลและปัญหาการใส่ค่าคือปัญหาที่เป็นอิสระต่อกัน นอกเหนือจากนี้การใส่ค่าในชั้นข้อมูลด้อยโดยวิธีการแทนที่แบบเดิมยังไม่เพียงพอสำหรับชุดข้อมูลอสมดุล ในงานวิจัยนี้เราได้นำเสนอเทคนิคใหม่ในการใส่ค่าโดยไม่ต้องมีการกำหนดค่าพารามิเตอร์ ซึ่งวิธีการดำเนินการในชุดข้อมูลอสมดุลจะทำโดยการประมาณค่าจากการสุ่มระหว่างค่าเฉลี่ยของแอตทริบิวต์ที่เกิดการขาดหายและค่าของข้อมูลในแอตทริบิวต์ที่ใกล้ที่สุดจากค่าที่ขาดหายไป อัลกอริทึมที่นำเสนอไม่สนใจค่าเฉลี่ยของข้อมูลเพื่อหลีกเลี่ยงปัญหาการซับซ้อนกันของข้อมูล ดังนั้นผลการทดลองของชุดข้อมูลอสมดุลแสดงให้เห็นว่าเทคนิคการใส่ค่ามีประสิทธิภาพดีกว่าเทคนิคอื่นๆเมื่อถูกนำมาใช้กับชั้นข้อมูลอสมดุลen_US
Appears in Collections:SCIENCE: Theses

Files in This Item:
File Description SizeFormat 
Full.pdf3.48 MBAdobe PDFView/Open    Request a copy


Items in CMUIR are protected by copyright, with all rights reserved, unless otherwise indicated.