RNA Etkileşimlerinin İn Silico Analizi

dc.contributor.advisor Demirci, Müşerref Duygu Saçar
dc.contributor.author Orhan, Mehmet Emin
dc.contributor.department AGÜ, Fen Bilimleri Enstitüsü, Biyomühendislik Ana Bilim Dalı en_US
dc.contributor.other 01. Abdullah Gül University
dc.contributor.other 04. Yaşam ve Doğa Bilimleri Fakültesi
dc.contributor.other 04.01. Biyomühendislik
dc.date.accessioned 2025-04-10T16:18:22Z
dc.date.available 2025-04-10T16:18:22Z
dc.date.issued 2024 en_US
dc.date.issued 2024
dc.date.submitted 2024-05-24
dc.description.abstract Many supervised machine learning models have been developed for the classification and identification of non-coding RNA (ncRNA) sequences. These models play a significant role in the diagnosis and treatment of various diseases. During such analyses, positive learning datasets typically consist of known ncRNA examples, some of which may even be confirmed with strong experimental evidence. However, there is no database of validated negative sequences for ncRNA classes or standardized methodologies for generating high quality negative samples. To overcome this challenge, a new method for generating negative data called the NeRNA (Negative RNA) method has been developed in this study. NeRNA generates negative sequences using known ncRNA sequences and their octal representations, similar with frame shift mutations found in biology but without base deletions or insertions. In this thesis, the NeRNA method was tested separately with four different ncRNA datasets, including microRNA (miRNA), transfer RNA (tRNA), long non-coding RNA (lncRNA), and circular RNA (circRNA). Additionally, a species-specific case study was conducted to demonstrate and compare the performance of the study's miRNA predictions. The results of 1000-fold cross-validation on machine learning algorithms such as Decision Trees, Naive Bayes, Random Forest classifiers, and deep learning algorithms like Multilayer Perceptrons, Convolutional Neural Networks, and Simple Feedforward Neural Networks showed that models developed using datasets generated by NeRNA exhibited significantly high prediction performance. NeRNA has been published as an easy-to-use, updatable, and modifiable KNIME workflow, along with example datasets and required extensions that can be downloaded and utilized. NeRNA is designed specifically as a powerful tool for RNA sequence data analysis. en_US
dc.description.abstract Kodlanmayan RNA (ncRNA) dizilerinin sınıflandırılması tanımlanması için birçok denetimli makine öğrenimi modelleri geliştirilmiştir. Bu modeller birçok hastalığın tanı ve tedavisinde önemli rol oynamaktadır. Bu tür analizler sırasında, pozitif öğrenme veri kümeleri genellikle bilinen ncRNA örneklerinden oluşur ve hatta bazıları güçlü deneysel verilerle doğrulanmış olabilir. Buna karşılık, ncRNA sınıfları için doğrulanmış negatif dizileri içeren bir veri tabanı veya yüksek kaliteli negatif örnek oluşturmayı sağlayan standart metodolojiler bulunmamaktadır. Bu zorluğun üstesinden gelebilmek için, bu çalışmada yeni bir negatif veri oluşturma yöntemi olan NeRNA (negatif RNA) yöntemi geliştirilmiştir. NeRNA, bilinen ncRNA dizilerini ve sekizli gösterim yapılarını kullanılarak negatif diziler oluşturur, bu oluşturma biyoloji de bulunan çerçeve kayması mutasyonlarına benzer bir şekilde ancak baz silme veya ekleme olmadan gerçekleşir. Bu tez kapsamında, mikroRNA (miRNA), transfer RNA (tRNA), uzun kodlamayan RNA (lncRNA) ve dairesel RNA (circRNA) dahil olmak üzere dört farklı ncRNA veri kümesi ile ayrı ayrı test edilmiştir. Ayrıca, çalışmanın miRNA tahminleri üzerinde performansını göstermek ve karşılaştırmak için türe özgü bir vaka analizi gerçekleştirilmiştir. Çalışma boyunca kullanılan Karar Ağacı, Naieve Bayes, Rastgele Orman sınıflandırıcıları gibi makine öğrenimi algoritmaları ve Çok Katmanlı Algılayıcı, Evrişimli Sinir Ağı ve Basit İleri Beslemeli Sinir Ağları gibi derin öğrenme algoritmaları üzerinde yapılan 1000 kat çapraz doğrulama sonuçları, NeRNA tarafından oluşturulan veri kümeleri kullanılarak elde edilen modellerin önemli ölçüde yüksek tahmin performansı sağladığını göstermektedir. NeRNA, örnek veri kümeleri ve gerekli uzantılarla birlikte indirilebilen, kullanımı kolay, güncellenebilir ve değiştirilebilir bir KNIME iş akışı olarak yayınlanmaktadır. NeRNA, özellikle RNA dizisi veri analizi için güçlü bir araç olarak tasarlanmıştır.
dc.identifier.uri https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=1pwTzRXnomYf6jwqVORfUfZpOTMiGnd0v-O7CFNfP5WFWCssfFW8f_uOTOoXghg2
dc.identifier.uri https://hdl.handle.net/20.500.12573/2471
dc.language.iso eng en_US
dc.language.iso en
dc.publisher Abdullah Gül Üniversitesi, Fen Bilimleri Enstitüsü en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject Bilgisayar Mühendisliği Bilimleri-Bilgisayar Ve Kontrol
dc.subject Biyoistatistik
dc.subject Computer Engineering And Computer Science And Control en_US
dc.subject Biyomühendislik
dc.subject Biostatistics en_US
dc.subject Biyoinformatik
dc.subject Bioengineering en_US
dc.subject Biyoistatistik
dc.subject Bioinformatics en_US
dc.subject Dairesel Rna
dc.subject Bioistatistics en_US
dc.subject Makine Öğrenmesi
dc.subject Circular RNA en_US
dc.subject Makine Öğrenmesi Yöntemleri
dc.subject Machine Learning en_US
dc.subject Mikro RNA
dc.subject Machine Learning Methods en_US
dc.subject Micro RNA en_US
dc.title RNA Etkileşimlerinin İn Silico Analizi
dc.title Advancing Machine Learning Analysis of Non-Coding RNA: A Novel Approach of Negative Sequence Generation en_US
dc.title.alternative RNA etkileşimlerinin in silico analizi en_US
dc.type Master Thesis en_US
dspace.entity.type Publication
gdc.author.institutional Saçar Demirci, Müşerref Duygu
gdc.description.department Fen Bilimleri Enstitüsü / Biyomühendislik Ana Bilim Dalı
gdc.description.endpage 59
gdc.description.publicationcategory Tez en_US
gdc.identifier.yoktezid 876732
relation.isAuthorOfPublication 99fd1cc2-69da-4eaa-a58d-7425d0459b6f
relation.isAuthorOfPublication.latestForDiscovery 99fd1cc2-69da-4eaa-a58d-7425d0459b6f
relation.isOrgUnitOfPublication 665d3039-05f8-4a25-9a3c-b9550bffecef
relation.isOrgUnitOfPublication 4eea69bf-e8aa-4e3e-ab18-7587ac1d841b
relation.isOrgUnitOfPublication 5519c95e-5bcb-45e5-8ce1-a8b4bcf7c7b9
relation.isOrgUnitOfPublication.latestForDiscovery 665d3039-05f8-4a25-9a3c-b9550bffecef

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
876732.pdf
Size:
1.66 MB
Format:
Adobe Portable Document Format
Description:
Yüksek Lisans Tezi

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.44 KB
Format:
Item-specific license agreed upon to submission
Description: