Please use this identifier to cite or link to this item:
http://cmuir.cmu.ac.th/jspui/handle/6653943832/79167
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | วิมลิน เหล่าศิริถาวร | - |
dc.contributor.author | อินทร จันทร์อุดม | en_US |
dc.date.accessioned | 2023-11-10T01:30:29Z | - |
dc.date.available | 2023-11-10T01:30:29Z | - |
dc.date.issued | 2566-09-30 | - |
dc.identifier.uri | http://cmuir.cmu.ac.th/jspui/handle/6653943832/79167 | - |
dc.description.abstract | Cervical cancer is considered a dangerous and common disease among women all over the world, and it still carries a relatively high mortality rate. Prediction patient’s survival is an important aspect of research due to its significance in enhancing treatment efficacy. Currently, survival prediction heavily relies on statistical methods, which has limitations when dealing with non-linear correlated data. Therefore, this research aims to apply and ensemble machine learning techniques through the selective stacking method to construct a classification model to predict the survival interval and a regression model to make a numerical survival prediction. In this research, multiple machine learning were trained and the top three most efficient models were selected for another round of machine learning. This approach enhance prediction accuracy when compared to the results from models generated solely using conventional machine learning techniques. This research utilized patient data from the medical records of the Faculty of Medicine, Chiang Mai University, which includes factors such as patient age, tumor size, pathology, tumor stage, chemotherapy method, brachytherapy method, radiation dose administered, side effect status, start date of diagnosis, end date of diagnosis, date of local recurrence, date of distant recurrence, date of death, and survival status. The classification model categorized survival periods into fur ranges: “< 6 months”, “6 months – 3 years”, “3 years – 5 years”, and “> 5 years” while the regression model use the interval between the start date of diagnosis and death of patients as the target output. The feature importance was then identified from regression model using the local interpretable model-agnostic explanations (LIME) technique. The results showed that models created using the selective stacking method provided more accurate predictions compared to models generated using traditional machine learning techniques in both classification and regression. The classification model achieved an accuracy of 87.81 percent, and the regression model had a root mean squared error of 18.92 and a correlation coefficient of 0.669. The most influential factor on survival was the side effect status around any organs. By observing individual patient prognostic results, factors that tend to contribute to longer or shorter survival times could be identified. This information can be valuable for treatment planning, resource allocation, and providing appropriate treatment guidelines for patients. | en_US |
dc.language.iso | other | en_US |
dc.publisher | เชียงใหม่ : บัณฑิตวิทยาลัย มหาวิทยาลัยเชียงใหม่ | en_US |
dc.subject | Machine learning | en_US |
dc.subject | Cervical cancer | en_US |
dc.subject | Survival prediction | en_US |
dc.subject | Feature importance | en_US |
dc.subject | Visualization | en_US |
dc.title | การพยากรณ์ช่วงเวลาการรอดชีวิตในผู้ป่วยมะเร็งปากมดลูกโดยใช้เทคนิคการเรียนรู้ของเครื่อง | en_US |
dc.title.alternative | Survival period prediction in cervical cancer patients using machine learning techniques | en_US |
dc.type | Thesis | |
thailis.classification.ddc | - | - |
thailis.controlvocab.thash | การเรียนรู้ของเครื่อง | - |
thailis.controlvocab.thash | ปากมดลูก -- มะเร็ง | - |
thailis.controlvocab.thash | ปากมดลูก -- มะเร็ง -- ผู้ป่วย | - |
thesis.degree | master | en_US |
thesis.description.thaiAbstract | มะเร็งปากมดลูกนับเป็นโรคอันตรายที่พบได้บ่อยในผู้หญิงทั่วโลกและยังมีอัตราการเสียชีวิตที่ค่อนข้างสูง การพยากรณ์การรอดชีวิตในผู้ป่วยนับเป็นหนึ่งในการศึกษาที่มีความสำคัญเนื่องจากเป็นวิธีการที่จะช่วยเพิ่มประสิทธิภาพในการรักษา การพยากรณ์การรอดชีวิตในปัจจุบันเน้นหนักในการใช้วิธีการทางสถิติ ซึ่งมีข้อจำกัดหากต้องรับมือกับข้อมูลที่มีความสัมพันธ์แบบไม่เป็นเชิงเส้น ดังนั้นงานวิจัยฉบับนี้จึงมีวัตถุประสงค์เพื่อประยุกต์ใช้เทคนิคการเรียนรู้ของเครื่องแบบรวมกลุ่ม (Ensemble machine learning) ผ่านวิธีการคัดเลือกแบบซ้อน (Selective stacking method) ในการสร้างแบบจำลองรูปแบบการจำแนกประเภท เพื่อทำการพยากรณ์ช่วงเวลาการรอดชีวิต และ สร้างแบบจำลองการถดถอยเพื่อทำการพยากรณ์การรอดชีวิตในรูปแบบตัวเลขที่มีความแม่นยำ โดยในงานวิจัยนี้จะทำการสร้างแบบจำลองด้วยการเรียนรู้ของเครื่องในหลายรูปแบบ และเลือกแบบจำลองที่มีประสิทธิภาพสูงที่สุด 3 อันดับแรกมาใช้ในการจำลองการเรียนรู้ด้วยเครื่องอีกครั้งหนึ่งเพื่อทำให้ผลลัพธ์ในการพยากรณ์มีความแม่นยำมากขึ้นเมื่อทำการเปรียบเทียบกับผลการพยากรณ์ที่ได้จากแบบจำลองที่สร้างโดยใช้ทั้งเทคนิคการเรียนรู้ของเครื่องแบบดั้งเดิม งานวิจัยฉบับนี้ได้ใช้ข้อมูลผู้ป่วยจากเวชระเบียนคณะแพทยศาสตร์ มหาวิทยาลัยเชียงใหม่ ซึ่งประกอบด้วยข้อมูล อายุของผู้ป่วย ขนาดเนื้องอก รูปแบบของเซลล์เนื้องอก ระยะของเนื้องอก การรักษาด้วยเคมีบำบัด วิธีการรักษาด้วยการฝังแร่ ปริมาณรังสีที่ให้ ณ บริเวณต่าง ๆ สถานะผลข้างเคียง วันที่เริ่มเข้ารับการวินิจฉัย วันที่สิ้นสุดการเข้ารับการวินิจฉัย วันที่เกิดซ้ำ วันที่เกิดการลุกลาม และสถานะการรอดชีวิต จากนั้นทำการเตรียมข้อมูล โดยแบบจำลองรูปแบบการจำแนกประเภทจะจำแนกช่วงเวลาการรอดชีวิตออกเป็น 4 ช่วงได้แก่ "< 6 เดือน" "6 เดือน - 3 ปี" "3 ปี - 5 ปี" และ "> 5 ปี" และสำหรับแบบจำลองรูปแบบการถดถอยจะนำช่วงเวลาระหว่างวันที่เริ่มเข้ารับการวินิจฉัย และการเสียชีวิตของผู้ป่วยที่ไม่ผ่านการจำแนกคลาสมาใช้เป็นเป้าหมาย จากนั้นทำการระบุความสำคัญของปัจจัยจากแบบจำลองแบบถดถอยโดยใช้เทคนิคไลม์ (Local interpretable model-agnostic explanations : LIME) จากผลลัพธ์แสดงให้เห็นว่าแบบจำลองที่สร้างโดยใช้วิธีการเรียนรู้แบบรวมกลุ่มผ่านการคัดเลือกแบบซ้อนสามารถให้ผลการพยากรณ์ที่แม่นยำกว่าแบบจำลองที่สร้างโดยใช้ทั้งเทคนิคการเรียนรู้ของเครื่องแบบดั้งเดิมทั้งในรูปแบบการจำแนกประเภท และการถดถอย โดยมีค่าความแม่นยำ(Accuracy) เท่ากับ 87.81 เปอร์เซ็นต์ สำหรับแบบจำลองรูปแบบการจำแนกประเภท และมีค่ารากที่สองของค่าเฉลี่ยความผิดพลาดกำลังสอง (Root Mean Square Error) เท่ากับ 18.92 และค่าสัมประสิทธิ์สหสัมพันธ์ (Correlation Coefficient) เท่ากับ 0.669 สำหรับแบบจำลองรูปแบบการถดถอย จากผลการระบุความสำคัญของปัจจัยพบว่าปัจจัยที่มีอิทธิพลต่อการรอดชีวิตมากที่สุดคือ สถานะผลข้างเคียงบริเวณอวัยวะต่าง ๆ และหากสังเกตุปัจจัยที่มีอิทธิพลต่อการรอดชีวิตในผู้ป่วยแบบรายบุคคล ก็จะสามารถระบุได้ว่าปัจจัยใดมีแนวโน้มในการทำให้ผู้ป่วยมีช่วงเวลาการรอดชีวิตที่สั้นลง หรือนานขึ้นได้ ซึ่งจะเป็นประโยชน์ต่อการวางแผนการรักษา การใช้ทรัพยากร และมอบแนวทางในการรักษาให้แก่ผู้ป่วยได้อย่างเหมาะสม | en_US |
Appears in Collections: | ENG: Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
640631019 นายอินทร จันทร์อุดม.pdf | 3.66 MB | Adobe PDF | View/Open Request a copy |
Items in CMUIR are protected by copyright, with all rights reserved, unless otherwise indicated.