Yüksek Lisans Tezleri
Permanent URI for this collectionhttps://hdl.handle.net/20.500.12573/5799
Browse
7 results
Search Results
Master Thesis Chebyformer: Düğüm Bazlı Filtreleme ile Trafik Akış Tahmini(2026) Kayapınar, Ahmet; Coşkun, Mustafa; Güngör, BurcuAkıllı Ulaşım Sistemleri (AUS) için doğru trafik akışı tahmini, tıkanıklığı ve karbon emisyonlarını azaltmak için olmazsa olmaz bir kilometre taşıdır. Uzaysal-Zamansal Grafik Sinir Ağları (STGNN'ler) bu görev için standart haline gelmiş olsa da, mevcut modellerin çoğu, trafik düzenlerinin tüm trafik ağı boyunca homojen olduğunu varsayarak küresel spektral filtrelere dayanmaktadır. Bu yaklaşım, farklı sensörlerin farklı fiziksel davranışlar gösterdiği trafiğin heterofilik doğasını yakalamada başarısız olmaktadır. Bu sınırlamayı azaltmak için, bu tez yeni bir hibrit mimari olan ChebyFormer'ı önermektedir. Model, sayısal olarak kararlı spektral özellik çıkarımı sağlamak için Chebyshev-Garnoldi algoritmasını ve uyarlanabilir, düğüm bazlı spektral filtreleri öğrenmek için PolyFormer dikkat mekanizmasını entegre etmektedir. Model, iki genel veri kümesi (PeMSD4, PeMSD8) ve Kayseri'den yeni toplanan bir gerçek dünya veri kümesi üzerinde değerlendirilmiştir. Deneysel sonuçlar, ChebyFormer'ın kısa ve uzun vadeli tahminlerde Ortalama Mutlak Hata (MAE) ve Karesel Ortalama Hata (RMSE) açısından en son temel modellerden (APPNP, GPRGNN) sürekli olarak daha iyi çalıştığını göstermektedir. Öğrenilen filtrelerin ek nitel analizi, modelin farklı trafik düzenleri arasında ayrım yapma yeteneğini doğrulayarak, kentsel trafik tahmininde düğüm bazlı filtrelemenin gerekliliğini doğrulamaktadır.Master Thesis Gruplama Puanlama Modelleme (G-S-M) ve Geleneksel Özellik Seçim Yaklaşımını Kullanarak İnsan Gastrointestinal Kanser Mikrobiyotalarındaki Potansiyel Taksonomik Biyobelirteçlerin Belirlenmesi(2025) Çanakcımaksutoğlu, Beyza; Güngör, Burcu; Yousef, MalikMikrobiyal bolluk değerlerinin analizi, kanser tahmini için bir potansiyel taşır. Bu çalışma, daha önce paralel olarak incelenmemiş bir alan olan hem doku hem de kan örnekleri kullanarak gastrointestinal (GI) kanser hastaları arasında paylaşılan mikrobiyal biyobelirteçleri belirlemeyi amaçlamaktadır. Bu çalışma, baş ve boyun, yemek borusu, mide, kolon ve kolorektal kanserlere odaklanarak kan ve doku örneklerini analiz etti. Dekontaminasyon adımları gerçekleştirilerek, insan olmayan genetik kodlar işlenerek, tür düzeyinde mikroorganizmalar ve bollukları belirlenerek, kanser hastalarından doku ve kan örnekleri toplayan 'Kanser Genom Atlası'ndan TCMA veri seti oluşturuldu. Geleneksel özellik seçimi algoritmaları (CMIM, mRMR, FCBF, IG, XGB ve SKB) yüksek boyutlu özellik alanını daralttı. Sınıflandırma performansı, 100-kat Monte Carlo çapraz doğrulaması olan bir Random Forest kullanılarak değerlendirildi. Ayrıca, gruplama yöntemi ile özellik boyutunu ve tahmin süresini azaltmak için oluşturulan MicrobiomeGSM modeli, hem kan hem de dokudan türetilen örnekler kullanılarak eğitildi ve MicrobiomeGSM modelinin genelleştirilebilirliği sergilendi. Geleneksel özellik seçimi yöntemleri ve biyolojik veri tabanlı MicrobiomeGSM modellerinin performansları karşılaştırıldı. Gelecekte, ortak biyobelirteç adayları doktorların metastaz olasılığını anlamasına yardımcı olabilir ve tedavi yollarına buna göre karar verilebilir.Master Thesis Enhancing Breast Cancer Detection With a Hybrid Machine Learning Approach(2024) Etcil, Mustafa; Güngör, Burcu; Güngör, V. CagriDünya Sağlık Örgütü (WHO) tarafından belirlendiği üzere, göğüs kanseri, son beş yılda 7.8 milyon yeni vakayla en yaygın kanser türlerinden biri olarak ön plana çıkmaktadır. Bu çarpıcı istatistik, gelişmiş tanı yöntemlerine olan acil ihtiyacı vurgulamaktadır. Bu bağlamda, mevcut çalışma, göğüs kanseri tespiti için lojistik regresyon modeli eğitim sürecini iyileştirmek amacıyla klonal seçim algoritması (CSA) ile parçacık sürü optimizasyonunu (PSO) yenilikçi bir şekilde birleştiren CSA-PSO-LR sınıflandırıcısını önermektedir. Bu araştırma, geniş çapta tanınan iki veri seti olan Wisconsin Diagnostik Göğüs Kanseri (WDBC) ve Wisconsin Göğüs Kanseri Veritabanı (WBCD) kullanılarak, performans değerlendirmesi için 10 kat çapraz doğrulama ve Bayes hiperparametre optimizasyonunu içeren katı bir değerlendirme protokolü uygulamaktadır. Ayrıca, çalışma, model eğitim süresini önemli ölçüde kısaltmayı amaçlayan CPU paralelleştirme stratejilerini tanıtmaktadır. Karar ağaçları, aşırı gradyan artırma, en yakın komşular, lojistik regresyon, rastgele ormanlar ve destek vektör makineleri gibi makine öğrenimi algoritmalarına karşı yapılan karşılaştırmalı analizler, CSA-PSO-LR sınıflandırıcısının tespit doğruluğu ve F1-ölçütü açısından üstün performans sergilediğini göstermektedir. Bu araştırma, göğüs kanserinin erken tespitine yönelik yenilikçi bir yaklaşım sunarak, daha etkili tedavi planlarının kolaylaştırılmasına ve hastaların hayatta kalma beklentilerinin artırılmasına katkıda bulunmaktadır.Master Thesis Biyomedikal Varlıklar Arasındaki İlişkilerin Biyomedikal Makaleler Aracılığıyla Keşfedilmesine Dair Bir Sistem Geliştirilmesi(2025) Altuner, Osman; Güngör, Burcu; Bakal, Mehmet GökhanGünümüz dünyasında dijitalleşme hızla yayılmaktadır. Bu yayılma, bir yandan hayatımızı kolaylaştırırken diğer yandan büyük miktarda dijital verinin analizi ve işlenmesi gibi yeni zorlukları da beraberinde getirmektedir. Bu durum özellikle akademik araştırmalar bağlamında belirgindir. Akademik araştırmalar, gelişmiş değerlendirme süreçlerine ihtiyaç duymaktadır. Bu bağlamda, hastalıklar üzerine yapılan araştırmaların etkili bir şekilde değerlendirilmesi gerektiği bilinmektedir. Bu çalışmada, hastalıklarla ilgili yayınlar metin analizi yöntemlerine tabi tutulmuş ve ardından verilerin önemli biyomedikal bağlantılarla ilişkilendirilmesini sağlayan bir ağ yapısına dönüştürülmüştür. Amaç, tedavi edici ve sebep verici gibi önemli bağlantılara sahip iki biyomedikal varlığın karmaşık ağ yapısını incelemektir. Bu durumda, manuel arama yöntemleriyle elde edilen varlık ikililerinin gerçek bağlantılar olduğu doğrulanmıştır. Bu çalışma, mevcut bilinen biyomedikal varlıkların bulunmasında sıklıkla zaman alan manuel arama sürecini başarıyla çözmüştür. Ayrıca, bu yöntem sayesinde birden fazla ikili bağlantı örüntüsü aracılığıyla bilinmeyen veya henüz keşfedilmemiş olası yeni ilişkilerin (tedavi edici, sebep verici vb.) keşfedilme potansiyeli bulunmaktadır. Sonuç olarak, çizge analizi, bilgi keşfi ve metin madenciliği gibi tekniklerin bir araya getirilmesi, biyomedikal araştırmalarda potansiyel olarak önemli yeni sonuçların keşfedilmesine yol açmaktadır.Master Thesis Enhancing breast cancer detection with a hybrid machine learning approach(Abdullah Gül Üniversitesi, Fen Bilimleri Enstitüsü, 2024) Etcil, Mustafa; Güngör, Burcu; Güngör, V. CagriAccording to the World Health Organization (WHO), breast cancer is one of the most prevalent illnesses, with 7.8 million instances recorded in the previous five years. As such, it poses a serious threat to world health. This alarming statistic underscores the urgent necessity for enhanced diagnostic methods. Against this backdrop, the current study proposes a novel diagnostic model, the CSA-PSO-LR classifier, which innovatively combines the clonal selection algorithm (CSA) with particle swarm optimization (PSO) to refine the logistic regression model training process for breast cancer detection. This research employs two extensively recognized datasets: the Wisconsin Diagnostic Breast Cancer (WDBC) and the Wisconsin Breast Cancer Database (WBCD), putting into practice a strict evaluation procedure that assesses performance using Bayesian hyperparameter optimization and 10-fold cross-validation. Furthermore, the study introduces CPU parallelization strategies to significantly curtail the model training time. Comparative analyses against machine learning algorithms, encompassing decision trees, extreme gradient boosting, k-nearest neighbors, logistic regression, random forests, and support vector machines, demonstrate the CSA-PSO-LR classifier's superior performance in detection accuracy and F1-measure. This investigation contributes a groundbreaking approach to the early detection of breast cancer, potentially facilitating more effective treatment plans and enhancing patient survival prospects.Master Thesis İnsan Bağırsak Mikrobiyotasından Hastalık Biyobelirteçlerinin Tespiti için Makine Öğrenmesi Temelli Sistem Geliştirilmesi(Abdullah Gül Üniversitesi, Fen Bilimleri Enstitüsü, 2024) Koçak, Ayşegül; Güngör, Burcu; Yousef, MalikThe human gut microbiota consists of a diverse ecosystem of organisms, encompasses billions of species. Recently developed next-generation sequencing methods have enabled researchers to examine the microbiota in greater detail, leading to new insights into its functions and dysfunctions. This study aims to identify metagenomic biomarkers (Microorganism-Enzyme Pairs) for colorectal cancer (CRC). The tool that we used allows for the analysis of microorganisms and enzymes within the gut microbiota. It achieves this by initially clustering enzymes based on their correlations with species and subsequently utilizing these clustering results to evaluate the ability of groups to differentiate between patient and healthy cohorts. By integrating species and enzymes, it is possible to identify pathogen microorganisms and enzyme clusters, that have the potential to distinguish cases (individuals with CRC) from controls (healthy individuals). The identified enzyme clusters and associated species could potentially act as biomarkers for colorectal cancer (CRC), enabling early diagnosis and more effective treatment. This approach holds promise for further exploration of the gut microbiota and its importance in human health and illness. Keywords: Bioinformatics, Machine Learning, Colorectal Cancer DiagnosisMaster Thesis İstatistiksel Ön Puanlama Bileşeni ile Gruplama Puanlama Modellemesi (GSM) Yaklaşımın Geliştirilmesi: Yüksek Boyutlu Transkriptomik Veri Analizi için Bir Vaka Çalışması(Abdullah Gül Üniversitesi / Sosyal Bilimler Enstitüsü, 2024) Khokhar, Maham; Güngör, BurcuRapid advancements in transcriptomic technologies have significantly increased the volume of data available for analysis, which presents challenges in terms of efficiency and computational demand. This thesis introduces a Pre-Scoring component to the Grouping-Scoring-Modeling (G-S-M) framework to address inefficiencies caused by the excessive number of gene groups generated by traditional GSM. By selectively prioritizing gene groups based on their statistical significance, this innovation aims to reduce the computational demands associated with scoring these groups using machine learning models, thereby streamlining the analysis process. Assessed across nine diverse Gene Expression datasets, the Pre-Scoring G-S-M framework not only maintained accuracy comparable to the traditional approach but did so with significantly fewer genes. This refinement conserves resources while maintaining the robustness and reliability of the data analysis, crucial for advancing research in personalized medicine and therapeutic strategies. The findings suggest that the modified G-S-M framework serves as a valuable tool in bioinformatics, offering a more efficient approach to handling large-scale genomic datasets. Future work will focus on adapting this enhanced framework to incorporate diverse types of omics knowledge, such as proteomics and metabolomics, further optimizing its performance to broaden its applicability in both clinical and research settings
