İstatistiksel Ön Puanlama Bileşeni ile Gruplama Puanlama Modellemesi (GSM) Yaklaşımın Geliştirilmesi: Yüksek Boyutlu Transkriptomik Veri Analizi için Bir Vaka Çalışması
Files
Date
2024, 2024
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abdullah Gül Üniversitesi / Sosyal Bilimler Enstitüsü
Open Access Color
OpenAIRE Downloads
OpenAIRE Views
Abstract
Rapid advancements in transcriptomic technologies have significantly increased the volume of data available for analysis, which presents challenges in terms of efficiency and computational demand. This thesis introduces a Pre-Scoring component to the Grouping-Scoring-Modeling (G-S-M) framework to address inefficiencies caused by the excessive number of gene groups generated by traditional GSM. By selectively prioritizing gene groups based on their statistical significance, this innovation aims to reduce the computational demands associated with scoring these groups using machine learning models, thereby streamlining the analysis process. Assessed across nine diverse Gene Expression datasets, the Pre-Scoring G-S-M framework not only maintained accuracy comparable to the traditional approach but did so with significantly fewer genes. This refinement conserves resources while maintaining the robustness and reliability of the data analysis, crucial for advancing research in personalized medicine and therapeutic strategies. The findings suggest that the modified G-S-M framework serves as a valuable tool in bioinformatics, offering a more efficient approach to handling large-scale genomic datasets. Future work will focus on adapting this enhanced framework to incorporate diverse types of omics knowledge, such as proteomics and metabolomics, further optimizing its performance to broaden its applicability in both clinical and research settings
Transkriptomik teknolojilerdeki hızlı ilerlemeler, analiz için kullanılabilir veri miktarını önemli ölçüde artırmış, bu da verimlilik ve hesaplama talepleri açısından zorluklar oluşturmuştur. Bu tez, geleneksel GSM tarafından üretilen aşırı sayıdaki gen gruplarından kaynaklanan verimsizlikleri ele almak için Gruplandırma-Puanlama- Modelleme (G-S-M) çerçevesine bir Ön-Puanlama bileşeni tanıtmaktadır. İstatistiksel öneme göre seçici bir şekilde gen gruplarını önceliklendirerek, bu yenilik, bu grupların makine öğrenimi modelleri kullanılarak puanlanmasıyla ilişkili hesaplama taleplerini azaltmayı hedeflemekte ve böylece analiz sürecini daha verimli hale getirmektedir. Dokuz çeşitli Gen İfadesi veri seti üzerinde değerlendirildiğinde, Ön Puanlama G-S- M çerçevesi, geleneksel yaklaşımla karşılaştırılabilir doğrulukta performans göstermekle kalmamış, aynı zamanda önemli ölçüde daha az gen ile bunu başarmıştır. Bu iyileştirme, kişiselleştirilmiş tıp ve tedavi stratejilerinde araştırmaları ilerletmek için hayati olan veri analizinin sağlamlığını ve güvenilirliğini korurken kaynakları korur.
Transkriptomik teknolojilerdeki hızlı ilerlemeler, analiz için kullanılabilir veri miktarını önemli ölçüde artırmış, bu da verimlilik ve hesaplama talepleri açısından zorluklar oluşturmuştur. Bu tez, geleneksel GSM tarafından üretilen aşırı sayıdaki gen gruplarından kaynaklanan verimsizlikleri ele almak için Gruplandırma-Puanlama- Modelleme (G-S-M) çerçevesine bir Ön-Puanlama bileşeni tanıtmaktadır. İstatistiksel öneme göre seçici bir şekilde gen gruplarını önceliklendirerek, bu yenilik, bu grupların makine öğrenimi modelleri kullanılarak puanlanmasıyla ilişkili hesaplama taleplerini azaltmayı hedeflemekte ve böylece analiz sürecini daha verimli hale getirmektedir. Dokuz çeşitli Gen İfadesi veri seti üzerinde değerlendirildiğinde, Ön Puanlama G-S- M çerçevesi, geleneksel yaklaşımla karşılaştırılabilir doğrulukta performans göstermekle kalmamış, aynı zamanda önemli ölçüde daha az gen ile bunu başarmıştır. Bu iyileştirme, kişiselleştirilmiş tıp ve tedavi stratejilerinde araştırmaları ilerletmek için hayati olan veri analizinin sağlamlığını ve güvenilirliğini korurken kaynakları korur.
Description
Keywords
Science And Technology, Bilim Ve Teknoloji
Turkish CoHE Thesis Center URL
Fields of Science
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
69
Collections
Sustainable Development Goals
3
GOOD HEALTH AND WELL-BEING

7
AFFORDABLE AND CLEAN ENERGY

9
INDUSTRY, INNOVATION AND INFRASTRUCTURE

11
SUSTAINABLE CITIES AND COMMUNITIES

14
LIFE BELOW WATER
