Kardiyovasküler Hastalık Oluşum Mekanizmalarını Anlamak İçin Veri Madenciliği Yöntemleri ve Makine Öğrenmesi Modellerinin Geliştirilmesi
Loading...
Date
2020, 2020
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abdullah Gül Üniversitesi, Fen Bilimleri Enstitüsü
Open Access Color
OpenAIRE Downloads
OpenAIRE Views
Abstract
Dünya Sağlık Örgütü'nün 2016 yılında yayınladığı bir rapora göre, Koroner Arter Hastalığı (KAH), dünyadaki toplam ölümlerin %31'ine (17,9 milyon), neden olmaktadır. Ayrıca, 2030'da yaklaşık 23,6 milyon insanın KAH'dan dolayı öleceği tahmin edilmektedir. Bu hastalığın önümüzdeki yıllarda, milyonlarca ölüme neden olacağı, tanı ve tedavisinin milyarlarca dolara mal olacağı düşünülmektedir. KAH, arterlerin duvarlarında aterom denilen yağlı madde birikiminin bir sonucu olarak, kalbin kanla yeterince beslenmemesi durumudur. Makine öğrenmesi ve veri madenciliğinin yöntemlerinin gelişmesiyle birlikte, bazı fiziksel ve biyokimyasal değerleri kontrol ederek, Kardiovasküler Hastalığı (KVH) ucuz ve zahmetsiz bir şekilde teşhis etmek mümkündür. Bu bağlamda, bu tezde, KVH teşhisi için farklı hesaplamalı öznitelik seçme (ÖS) yöntemleri, doğrusal ayırt edici analizler ve farklı sınıflandırma algoritmaları değerlendirilmiş; ve bir alan bilgisi temelli ÖS yöntemi, bir topluluk ÖS yöntemi ve bir olasılıksal ÖS yöntemi önerilmiştir. Bu tez çalışması, halka açık iki veri seti olan UCI Cleveland ve Z-Alizadehsani verileri üzerinde deneyler yaparak, KHV'ları daha düşük maliyetle teşhis edebilecek sağlam bir model geliştirmeyi amaçlamaktadır. Önerilen çözüm, yapılan deneylerdeki tanı testlerinde %91.78 doğruluk ve %93.50 duyarlılık ulaşmıştır.
World Health Organization (WHO) reported that in 2016, 31% (17.9 million) of the total deaths in the world were caused by Coronary Artery Disease (CAD) and it is estimated that around 23.6 million people will die from CAD in 2030. In the following years, this disease will cause millions of more deaths and the diagnosis and treatment will cost billions of dollars. CAD, which is a sub-category of Cardiovascular Disease (CVD), is the inability to feed the heart with blood as a result of the accumulation of fatty matter called atheroma on the walls of the arteries. With the development of machine learning and data mining techniques, it became possible to diagnose Cardiovascular Diseases (CVD), especially CADs, at a lower cost via checking some physical and biochemical values. To this end, in this thesis, for CVD diagnosis problem, different computational feature selection (FS) methods, dimension reduction, and different classification algorithms have been evaluated; and a domain knowledge-based FS method, an ensemble FS method and a probabilistic FS method have been proposed. Via experimenting on two publicly available data sets, i.e., UCI Cleveland and Z- Alizadehsani, this thesis aims to generate a robust model for the diagnosis of CVD, at a lower cost. In our experiments, our proposed solution achieved 91.78% accuracy and 93.50% sensitivity on the diagnostic tests.
World Health Organization (WHO) reported that in 2016, 31% (17.9 million) of the total deaths in the world were caused by Coronary Artery Disease (CAD) and it is estimated that around 23.6 million people will die from CAD in 2030. In the following years, this disease will cause millions of more deaths and the diagnosis and treatment will cost billions of dollars. CAD, which is a sub-category of Cardiovascular Disease (CVD), is the inability to feed the heart with blood as a result of the accumulation of fatty matter called atheroma on the walls of the arteries. With the development of machine learning and data mining techniques, it became possible to diagnose Cardiovascular Diseases (CVD), especially CADs, at a lower cost via checking some physical and biochemical values. To this end, in this thesis, for CVD diagnosis problem, different computational feature selection (FS) methods, dimension reduction, and different classification algorithms have been evaluated; and a domain knowledge-based FS method, an ensemble FS method and a probabilistic FS method have been proposed. Via experimenting on two publicly available data sets, i.e., UCI Cleveland and Z- Alizadehsani, this thesis aims to generate a robust model for the diagnosis of CVD, at a lower cost. In our experiments, our proposed solution achieved 91.78% accuracy and 93.50% sensitivity on the diagnostic tests.
Description
Keywords
Computer Engineering And Computer Science And Control, Bilgisayar Mühendisliği Bilimleri-Bilgisayar Ve Kontrol
Turkish CoHE Thesis Center URL
Fields of Science
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
95
