Yüksek Lisans Tezleri

Permanent URI for this collectionhttps://hdl.handle.net/20.500.12573/5799

Browse

Search Results

Now showing 1 - 9 of 9
  • Master Thesis
    Chebyformer: Düğüm Bazlı Filtreleme ile Trafik Akış Tahmini
    (2026) Kayapınar, Ahmet; Coşkun, Mustafa; Güngör, Burcu
    Akıllı Ulaşım Sistemleri (AUS) için doğru trafik akışı tahmini, tıkanıklığı ve karbon emisyonlarını azaltmak için olmazsa olmaz bir kilometre taşıdır. Uzaysal-Zamansal Grafik Sinir Ağları (STGNN'ler) bu görev için standart haline gelmiş olsa da, mevcut modellerin çoğu, trafik düzenlerinin tüm trafik ağı boyunca homojen olduğunu varsayarak küresel spektral filtrelere dayanmaktadır. Bu yaklaşım, farklı sensörlerin farklı fiziksel davranışlar gösterdiği trafiğin heterofilik doğasını yakalamada başarısız olmaktadır. Bu sınırlamayı azaltmak için, bu tez yeni bir hibrit mimari olan ChebyFormer'ı önermektedir. Model, sayısal olarak kararlı spektral özellik çıkarımı sağlamak için Chebyshev-Garnoldi algoritmasını ve uyarlanabilir, düğüm bazlı spektral filtreleri öğrenmek için PolyFormer dikkat mekanizmasını entegre etmektedir. Model, iki genel veri kümesi (PeMSD4, PeMSD8) ve Kayseri'den yeni toplanan bir gerçek dünya veri kümesi üzerinde değerlendirilmiştir. Deneysel sonuçlar, ChebyFormer'ın kısa ve uzun vadeli tahminlerde Ortalama Mutlak Hata (MAE) ve Karesel Ortalama Hata (RMSE) açısından en son temel modellerden (APPNP, GPRGNN) sürekli olarak daha iyi çalıştığını göstermektedir. Öğrenilen filtrelerin ek nitel analizi, modelin farklı trafik düzenleri arasında ayrım yapma yeteneğini doğrulayarak, kentsel trafik tahmininde düğüm bazlı filtrelemenin gerekliliğini doğrulamaktadır.
  • Master Thesis
    Gruplama Puanlama Modelleme (G-S-M) ve Geleneksel Özellik Seçim Yaklaşımını Kullanarak İnsan Gastrointestinal Kanser Mikrobiyotalarındaki Potansiyel Taksonomik Biyobelirteçlerin Belirlenmesi
    (2025) Çanakcımaksutoğlu, Beyza; Güngör, Burcu; Yousef, Malik
    Mikrobiyal bolluk değerlerinin analizi, kanser tahmini için bir potansiyel taşır. Bu çalışma, daha önce paralel olarak incelenmemiş bir alan olan hem doku hem de kan örnekleri kullanarak gastrointestinal (GI) kanser hastaları arasında paylaşılan mikrobiyal biyobelirteçleri belirlemeyi amaçlamaktadır. Bu çalışma, baş ve boyun, yemek borusu, mide, kolon ve kolorektal kanserlere odaklanarak kan ve doku örneklerini analiz etti. Dekontaminasyon adımları gerçekleştirilerek, insan olmayan genetik kodlar işlenerek, tür düzeyinde mikroorganizmalar ve bollukları belirlenerek, kanser hastalarından doku ve kan örnekleri toplayan 'Kanser Genom Atlası'ndan TCMA veri seti oluşturuldu. Geleneksel özellik seçimi algoritmaları (CMIM, mRMR, FCBF, IG, XGB ve SKB) yüksek boyutlu özellik alanını daralttı. Sınıflandırma performansı, 100-kat Monte Carlo çapraz doğrulaması olan bir Random Forest kullanılarak değerlendirildi. Ayrıca, gruplama yöntemi ile özellik boyutunu ve tahmin süresini azaltmak için oluşturulan MicrobiomeGSM modeli, hem kan hem de dokudan türetilen örnekler kullanılarak eğitildi ve MicrobiomeGSM modelinin genelleştirilebilirliği sergilendi. Geleneksel özellik seçimi yöntemleri ve biyolojik veri tabanlı MicrobiomeGSM modellerinin performansları karşılaştırıldı. Gelecekte, ortak biyobelirteç adayları doktorların metastaz olasılığını anlamasına yardımcı olabilir ve tedavi yollarına buna göre karar verilebilir.
  • Master Thesis
    Enhancing Breast Cancer Detection With a Hybrid Machine Learning Approach
    (2024) Etcil, Mustafa; Güngör, Burcu; Güngör, V. Cagri
    Dünya Sağlık Örgütü (WHO) tarafından belirlendiği üzere, göğüs kanseri, son beş yılda 7.8 milyon yeni vakayla en yaygın kanser türlerinden biri olarak ön plana çıkmaktadır. Bu çarpıcı istatistik, gelişmiş tanı yöntemlerine olan acil ihtiyacı vurgulamaktadır. Bu bağlamda, mevcut çalışma, göğüs kanseri tespiti için lojistik regresyon modeli eğitim sürecini iyileştirmek amacıyla klonal seçim algoritması (CSA) ile parçacık sürü optimizasyonunu (PSO) yenilikçi bir şekilde birleştiren CSA-PSO-LR sınıflandırıcısını önermektedir. Bu araştırma, geniş çapta tanınan iki veri seti olan Wisconsin Diagnostik Göğüs Kanseri (WDBC) ve Wisconsin Göğüs Kanseri Veritabanı (WBCD) kullanılarak, performans değerlendirmesi için 10 kat çapraz doğrulama ve Bayes hiperparametre optimizasyonunu içeren katı bir değerlendirme protokolü uygulamaktadır. Ayrıca, çalışma, model eğitim süresini önemli ölçüde kısaltmayı amaçlayan CPU paralelleştirme stratejilerini tanıtmaktadır. Karar ağaçları, aşırı gradyan artırma, en yakın komşular, lojistik regresyon, rastgele ormanlar ve destek vektör makineleri gibi makine öğrenimi algoritmalarına karşı yapılan karşılaştırmalı analizler, CSA-PSO-LR sınıflandırıcısının tespit doğruluğu ve F1-ölçütü açısından üstün performans sergilediğini göstermektedir. Bu araştırma, göğüs kanserinin erken tespitine yönelik yenilikçi bir yaklaşım sunarak, daha etkili tedavi planlarının kolaylaştırılmasına ve hastaların hayatta kalma beklentilerinin artırılmasına katkıda bulunmaktadır.
  • Master Thesis
    Biyomedikal Varlıklar Arasındaki İlişkilerin Biyomedikal Makaleler Aracılığıyla Keşfedilmesine Dair Bir Sistem Geliştirilmesi
    (2025) Altuner, Osman; Güngör, Burcu; Bakal, Mehmet Gökhan
    Günümüz dünyasında dijitalleşme hızla yayılmaktadır. Bu yayılma, bir yandan hayatımızı kolaylaştırırken diğer yandan büyük miktarda dijital verinin analizi ve işlenmesi gibi yeni zorlukları da beraberinde getirmektedir. Bu durum özellikle akademik araştırmalar bağlamında belirgindir. Akademik araştırmalar, gelişmiş değerlendirme süreçlerine ihtiyaç duymaktadır. Bu bağlamda, hastalıklar üzerine yapılan araştırmaların etkili bir şekilde değerlendirilmesi gerektiği bilinmektedir. Bu çalışmada, hastalıklarla ilgili yayınlar metin analizi yöntemlerine tabi tutulmuş ve ardından verilerin önemli biyomedikal bağlantılarla ilişkilendirilmesini sağlayan bir ağ yapısına dönüştürülmüştür. Amaç, tedavi edici ve sebep verici gibi önemli bağlantılara sahip iki biyomedikal varlığın karmaşık ağ yapısını incelemektir. Bu durumda, manuel arama yöntemleriyle elde edilen varlık ikililerinin gerçek bağlantılar olduğu doğrulanmıştır. Bu çalışma, mevcut bilinen biyomedikal varlıkların bulunmasında sıklıkla zaman alan manuel arama sürecini başarıyla çözmüştür. Ayrıca, bu yöntem sayesinde birden fazla ikili bağlantı örüntüsü aracılığıyla bilinmeyen veya henüz keşfedilmemiş olası yeni ilişkilerin (tedavi edici, sebep verici vb.) keşfedilme potansiyeli bulunmaktadır. Sonuç olarak, çizge analizi, bilgi keşfi ve metin madenciliği gibi tekniklerin bir araya getirilmesi, biyomedikal araştırmalarda potansiyel olarak önemli yeni sonuçların keşfedilmesine yol açmaktadır.
  • Master Thesis
    Enhancing breast cancer detection with a hybrid machine learning approach
    (Abdullah Gül Üniversitesi, Fen Bilimleri Enstitüsü, 2024) Etcil, Mustafa; Güngör, Burcu; Güngör, V. Cagri
    According to the World Health Organization (WHO), breast cancer is one of the most prevalent illnesses, with 7.8 million instances recorded in the previous five years. As such, it poses a serious threat to world health. This alarming statistic underscores the urgent necessity for enhanced diagnostic methods. Against this backdrop, the current study proposes a novel diagnostic model, the CSA-PSO-LR classifier, which innovatively combines the clonal selection algorithm (CSA) with particle swarm optimization (PSO) to refine the logistic regression model training process for breast cancer detection. This research employs two extensively recognized datasets: the Wisconsin Diagnostic Breast Cancer (WDBC) and the Wisconsin Breast Cancer Database (WBCD), putting into practice a strict evaluation procedure that assesses performance using Bayesian hyperparameter optimization and 10-fold cross-validation. Furthermore, the study introduces CPU parallelization strategies to significantly curtail the model training time. Comparative analyses against machine learning algorithms, encompassing decision trees, extreme gradient boosting, k-nearest neighbors, logistic regression, random forests, and support vector machines, demonstrate the CSA-PSO-LR classifier's superior performance in detection accuracy and F1-measure. This investigation contributes a groundbreaking approach to the early detection of breast cancer, potentially facilitating more effective treatment plans and enhancing patient survival prospects.
  • Master Thesis
    İnsan Bağırsak Mikrobiyotasından Hastalık Biyobelirteçlerinin Tespiti için Makine Öğrenmesi Temelli Sistem Geliştirilmesi
    (Abdullah Gül Üniversitesi, Fen Bilimleri Enstitüsü, 2024) Koçak, Ayşegül; Güngör, Burcu; Yousef, Malik
    The human gut microbiota consists of a diverse ecosystem of organisms, encompasses billions of species. Recently developed next-generation sequencing methods have enabled researchers to examine the microbiota in greater detail, leading to new insights into its functions and dysfunctions. This study aims to identify metagenomic biomarkers (Microorganism-Enzyme Pairs) for colorectal cancer (CRC). The tool that we used allows for the analysis of microorganisms and enzymes within the gut microbiota. It achieves this by initially clustering enzymes based on their correlations with species and subsequently utilizing these clustering results to evaluate the ability of groups to differentiate between patient and healthy cohorts. By integrating species and enzymes, it is possible to identify pathogen microorganisms and enzyme clusters, that have the potential to distinguish cases (individuals with CRC) from controls (healthy individuals). The identified enzyme clusters and associated species could potentially act as biomarkers for colorectal cancer (CRC), enabling early diagnosis and more effective treatment. This approach holds promise for further exploration of the gut microbiota and its importance in human health and illness. Keywords: Bioinformatics, Machine Learning, Colorectal Cancer Diagnosis
  • Master Thesis
    İstatistiksel Ön Puanlama Bileşeni ile Gruplama Puanlama Modellemesi (GSM) Yaklaşımın Geliştirilmesi: Yüksek Boyutlu Transkriptomik Veri Analizi için Bir Vaka Çalışması
    (Abdullah Gül Üniversitesi / Sosyal Bilimler Enstitüsü, 2024) Khokhar, Maham; Güngör, Burcu
    Rapid advancements in transcriptomic technologies have significantly increased the volume of data available for analysis, which presents challenges in terms of efficiency and computational demand. This thesis introduces a Pre-Scoring component to the Grouping-Scoring-Modeling (G-S-M) framework to address inefficiencies caused by the excessive number of gene groups generated by traditional GSM. By selectively prioritizing gene groups based on their statistical significance, this innovation aims to reduce the computational demands associated with scoring these groups using machine learning models, thereby streamlining the analysis process. Assessed across nine diverse Gene Expression datasets, the Pre-Scoring G-S-M framework not only maintained accuracy comparable to the traditional approach but did so with significantly fewer genes. This refinement conserves resources while maintaining the robustness and reliability of the data analysis, crucial for advancing research in personalized medicine and therapeutic strategies. The findings suggest that the modified G-S-M framework serves as a valuable tool in bioinformatics, offering a more efficient approach to handling large-scale genomic datasets. Future work will focus on adapting this enhanced framework to incorporate diverse types of omics knowledge, such as proteomics and metabolomics, further optimizing its performance to broaden its applicability in both clinical and research settings
  • Master Thesis
    Kanser Alt Tipi Tanımlama Problemi için Bir Etiket Yayma Yaklaşımı Geliştirme
    (Tubitak Scientific & Technological Research Council Turkey, 2022) Guner, Pinar; Bakir-Gungor, Burcu; Coskun, Mustafa; Güner, Pınar; Güngör, Burcu; Coşkun, Mustafa
    Kanser terimi, anormal hücrelerin kontrolden çıkıp diğer dokuları istila ettiği hastalıkları tanımlamak için kullanılır. Çok sayıda kanser türü vardır ve birçok kanser türü, farklı klinik ve biyolojik etkileri olan çeşitli alt tiplere sahiptir. Bu farklılıklar, kanserin farklı alt tiplerinin tedavisi için farklı yöntemlerin izlenmesi gerektiğini göstermektedir. Kişiselleştirilmiş tıbbın geliştirilmesine yardımcı olabileceğinden, kanser alt tiplerini keşfetmek biyoinformatikte önemli bir problemdir. Kanserin alt tipinin bilinmesi, tedavi basamaklarının ve öngörünün belirlenmesinde faydalıdır. Hesaplamalı biyoinformatik yöntemler, farklı kanser alt tiplerinin ortak moleküler patolojisini ortaya çıkararak hedeflenen tedavileri tasarlamak için kanser analizi yapmaya yardımcı olur. Şimdiye kadar, kanser alt tiplerini keşfetmek veya kanseri bilgilendirici alt tiplere ayırmak için çeşitli hesaplamalı yöntemler önerildi. Ancak, mevcut çalışmalar verilerin seyrekliğini dikkate almamakta ve kötü koşullu (tersi alınamayan) çözümle sonuçlanmaktadır. Bu eksikliği gidermek için, bu tezde, uygulamalı sayısal cebir tekniklerini kullanarak kanseri alt tiplerine ayırmak için alternatif bir denetimsiz hesaplama yöntemi öneriyoruz. Daha detaylı olarak, bu etiket yayma tabanlı yaklaşımı kolon, baş ve boyun, rahim, mesane ve meme tümörlerinin somatik mutasyon profillerini sınıflandırmak için uyguladık. Sonra, yöntemimizin performansını temel yöntemlerle karşılaştırarak değerlendirdik. Kapsamlı deneyler, yaklaşımımızın, modern denetimsiz ve denetimli yaklaşımlardan büyük ölçüde daha iyi performans göstererek tümör sınıflandırma görevlerini yüksek oranda yerine getirdiğini kanıtlamaktadır.
  • Master Thesis
    K-mer Sekans Gösterimine Dayalı MicroRNA-Hastalık İlişkilerinin ve MicroRNA-Tür İlişkilerinin Sınıflandırılması
    (Abdullah Gül Üniversitesi, Fen Bilimleri Enstitüsü, 2022) Erbaşı, Yalçın Han; Güngör, Burcu
    The dysregulated gene expression brings about a variety of diseases, and dysregulation of microRNA (miRNA) has a wide impact on disease development and cellular physiology. Thus, miRNAs play important roles in a variety of fundamental and significant biological processes related to human diseases. There are a lot of research about changes in the function of miRNAs have been published in many human diseases. Computational methods serve as a complementary process to traditional wet-lab experiments, which require many resources and time in terms of detecting potential miRNA-Disease associations. Furthermore, there is a need to present a novel approach that allows assignment of an unknown miRNA to its most likely species. An easy way to filter new data would be to ensure that the new miRNA is classified below the maximum distance to the species known to originate from. In this thesis, a computational model has been proposed for identifying miRNA-disease and miRNA-Species associations by depicting the miRNAs with their k-mer sequence representation and by utilizing machine learning methodologies. The difference of our approach is which we reveal disease and species associated the sequences of miRNA store information. This put a question about the miRNA's chemical compounds and their associations with different types of species and diseases. With this study, the new disease-disease and species-Species associations disclosed can be calculated for many different species and diseases, these approaches can develop to species and disease classification. Lastly, our study may open a door to redefine species and diseases classifications which have been used nowadays, also it may provide the improvement of treatment strategies and early diagnosis