Yüksek Lisans Tezleri

Permanent URI for this collectionhttps://hdl.handle.net/20.500.12573/5799

Browse

Search Results

Now showing 1 - 2 of 2
  • Master Thesis
    Gruplama Puanlama Modelleme (G-S-M) ve Geleneksel Özellik Seçim Yaklaşımını Kullanarak İnsan Gastrointestinal Kanser Mikrobiyotalarındaki Potansiyel Taksonomik Biyobelirteçlerin Belirlenmesi
    (2025) Çanakcımaksutoğlu, Beyza; Güngör, Burcu; Yousef, Malik
    Mikrobiyal bolluk değerlerinin analizi, kanser tahmini için bir potansiyel taşır. Bu çalışma, daha önce paralel olarak incelenmemiş bir alan olan hem doku hem de kan örnekleri kullanarak gastrointestinal (GI) kanser hastaları arasında paylaşılan mikrobiyal biyobelirteçleri belirlemeyi amaçlamaktadır. Bu çalışma, baş ve boyun, yemek borusu, mide, kolon ve kolorektal kanserlere odaklanarak kan ve doku örneklerini analiz etti. Dekontaminasyon adımları gerçekleştirilerek, insan olmayan genetik kodlar işlenerek, tür düzeyinde mikroorganizmalar ve bollukları belirlenerek, kanser hastalarından doku ve kan örnekleri toplayan 'Kanser Genom Atlası'ndan TCMA veri seti oluşturuldu. Geleneksel özellik seçimi algoritmaları (CMIM, mRMR, FCBF, IG, XGB ve SKB) yüksek boyutlu özellik alanını daralttı. Sınıflandırma performansı, 100-kat Monte Carlo çapraz doğrulaması olan bir Random Forest kullanılarak değerlendirildi. Ayrıca, gruplama yöntemi ile özellik boyutunu ve tahmin süresini azaltmak için oluşturulan MicrobiomeGSM modeli, hem kan hem de dokudan türetilen örnekler kullanılarak eğitildi ve MicrobiomeGSM modelinin genelleştirilebilirliği sergilendi. Geleneksel özellik seçimi yöntemleri ve biyolojik veri tabanlı MicrobiomeGSM modellerinin performansları karşılaştırıldı. Gelecekte, ortak biyobelirteç adayları doktorların metastaz olasılığını anlamasına yardımcı olabilir ve tedavi yollarına buna göre karar verilebilir.
  • Master Thesis
    RNA Etkileşimlerinin İn Silico Analizi
    (Abdullah Gül Üniversitesi, Fen Bilimleri Enstitüsü, 2024) Orhan, Mehmet Emin; Demirci, Müşerref Duygu Saçar
    Many supervised machine learning models have been developed for the classification and identification of non-coding RNA (ncRNA) sequences. These models play a significant role in the diagnosis and treatment of various diseases. During such analyses, positive learning datasets typically consist of known ncRNA examples, some of which may even be confirmed with strong experimental evidence. However, there is no database of validated negative sequences for ncRNA classes or standardized methodologies for generating high quality negative samples. To overcome this challenge, a new method for generating negative data called the NeRNA (Negative RNA) method has been developed in this study. NeRNA generates negative sequences using known ncRNA sequences and their octal representations, similar with frame shift mutations found in biology but without base deletions or insertions. In this thesis, the NeRNA method was tested separately with four different ncRNA datasets, including microRNA (miRNA), transfer RNA (tRNA), long non-coding RNA (lncRNA), and circular RNA (circRNA). Additionally, a species-specific case study was conducted to demonstrate and compare the performance of the study's miRNA predictions. The results of 1000-fold cross-validation on machine learning algorithms such as Decision Trees, Naive Bayes, Random Forest classifiers, and deep learning algorithms like Multilayer Perceptrons, Convolutional Neural Networks, and Simple Feedforward Neural Networks showed that models developed using datasets generated by NeRNA exhibited significantly high prediction performance. NeRNA has been published as an easy-to-use, updatable, and modifiable KNIME workflow, along with example datasets and required extensions that can be downloaded and utilized. NeRNA is designed specifically as a powerful tool for RNA sequence data analysis.