Zenginleştirilmiş Öznitelikler ve Makine Öğrenmesi Yöntemleriyle Protein Yerel Yapı Tahmini
| gdc.relation.journal | Tubitak | en_US |
| dc.contributor.author | Aydın, Zafer | |
| dc.contributor.authorID | 0000-0001-7686-6298 | en_US |
| dc.contributor.department | AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü | en_US |
| dc.contributor.institutionauthor | Aydın, Zafer | |
| dc.contributor.other | 01. Abdullah Gül University | |
| dc.contributor.other | 02. 04. Bilgisayar Mühendisliği | |
| dc.contributor.other | 02. Mühendislik Fakültesi | |
| dc.date.accessioned | 2025-09-25T11:02:41Z | |
| dc.date.available | 2025-09-25T11:02:41Z | |
| dc.date.issued | 2017 | en_US |
| dc.description.abstract | Projenin amacı proteinlerde bulunan ikincil yapı, dihedral açı ve çözücü erişilirlik gibi bir boyutlu yapısal özelliklerin başarılı olarak tahmin edilmesi ve bu tahminleri kullanarak parçacık seçimi yapan yeni bir yöntem geliştirilmesidir. Geliştirilen yöntemler sayesinde proteinlerin üç boyutlu yapısının daha doğru tahmin edilmesi, proteinlerin fonksiyonlarının daha iyi anlaşılması ve daha etkili ilaç tasarımı yapılması mümkün olacaktır. Bir boyutlu yapısal özelliklerin tahmini için yürütücünün daha önce geliştirdiği iki aşamalı hibrit sınıflandırma yöntemi kullanılmıştır. Bu yöntemde bulunan sınıflandırıcılar için dizi tabanlı profiller, yapısal profil matrisleri gibi çeşitli öznitelik vektörleri kullanılmıştır. İkinci aşamadaki sınıflandırıcı için destek vektör makinası, derin KSA, rastgele orman ve topluluk gibi çeşitli öğrenme yöntemleri eğitilmiş ve geliştirilen yöntemlerin tahmin başarı oranları standart veri kümelerinde incelenmiştir. Ayrıca bu aşamada derin otokodlayıcılar ve öznitelik seçme yaklaşımları ile boyut düşürme gerçekleştirilmiştir. Protein parçacık seçimi için verilen iki amino asit dizisi parçacığının yapısal olarak benzer olup olmadığının tahmin eden yöntemler geliştirilmiştir. Bunun için Rosetta programının parçacık veritabanında bulunan proteinlerden parçacık ikilileri örneklenmiş, bu ikililer BCScore yöntemi ile etiketlenmiş, eğitim ve test kümeleri oluşturulmuştur. Ayrıca farklı öznitelik kümeleri konsept hiyerarşi yaklaşımı ile kapsamlı olarak incelenmiş ve en başarılı sonucu veren öznitelik kombinasyonları tespit edilmiştir. Parçacık seçimi probleminde 3 ve 9 amino asitlik parçacıklar üzerinde çalışılmıştır ancak yöntemler diğer uzunluktaki parçacıklar için de kolaylıkla uygulanabilecektir. Projede geliştirilen yöntemler sayesinde ikincil yapı tahmin başarısı en zor tahmin kategorisinde %2.6 iyileşmiş, dihedral açı tahmin başarısı önemli oranda iyileşmiş, çözücü erişilirlik probleminde literatürdeki en başarılı yöntemler ile benzer bir seviye yakalanmıştır. Parçacık seçiminde ise verilen iki parçacığın yapılarının benzer olup olmadıkları 3-mer parçacıklar için %94 ve 9merler içinse %97 oranı ile tahmin edilmiştir. Yapılan çalışmaların neticesinde öznitelik vektörlerinin daha iyi tasarlanmasının ve farklı sınıflandırma yöntemlerinin birleştirilip optimize edilmesinin yapısal özellik tahmin başarısını önemli oranda iyileştirdiği sonucuna varılmıştır. | en_US |
| dc.description.abstract | The current project concentrated on predicting one dimensional structural properties of_x000D_ proteins such as secondary structure, dihedral angle and solvent accessibility successfully_x000D_ and developing a novel method that uses these predictions for fragment selection. Upon_x000D_ reaching these objectives it is anticipated that the accuracy and quality of protein 3D_x000D_ structure prediction will improve, which will provide a better understanding of the functional_x000D_ roles of proteins and advance drug screening, drug design, and enzyme design processes.To predict one dimensional structural properties a two-stage hybrid method is used, which_x000D_ employs sequence based profiles and structural profiles as input features. For the classifier_x000D_ at the second stage support vector machine, deep CNF, random forest and an ensemble_x000D_ classifier have been trained and tested on established benchmarks. Additionally,_x000D_ dimensionality reduction techniques are developed and analyzed at this stage including deep_x000D_ autoencoders and feature selection methods. For fragment selection, classifiers have been_x000D_ developed that decide whether two amino acid fragments are structurally similar or not. To_x000D_ build the train and test sets, fragment pairs are sampled from the fragment database of the_x000D_ Rosetta program and labeled using BCScore method. A concept hierarchy approach has_x000D_ been implemented to find the best feature set combination. Though the present study_x000D_ concentrated on 3-mers and 9-mers the methods developed can also be applied easily to_x000D_ other fragment sizes. According to evaluations, a 2.6% improvement has been obtained for_x000D_ protein secondary structure prediciton in the most difficult setting, a significant improvement_x000D_ in dihedral angle class prediction, and an accuracy comparable to state-of-the-art methods in_x000D_ solvent accessilibity. In fragment selection fragment pairs can be classified as similar or not_x000D_ with 94% accuracy for 3-mers and 97% for 9-mers. As a result, designing better features,_x000D_ combining and optimizing classifiers improve the success rates of methods that predict_x000D_ structural properties of proteins. | en_US |
| dc.identifier.uri | https://hdl.handle.net/20.500.12573/5095 | |
| dc.language.iso | tur | en_US |
| dc.publisher | TUBİTAK | en_US |
| dc.relation.tubitak | 113E550 | |
| dc.rights | info:eu-repo/semantics/openAccess | en_US |
| dc.subject | Bir boyutlu protein yapı tahmini | en_US |
| dc.subject | protein parçacık seçimi | en_US |
| dc.subject | makine öğrenmesi | en_US |
| dc.subject | derin öğrenme | en_US |
| dc.subject | öznitelik çıkarımı | en_US |
| dc.subject | boyut düşürme | en_US |
| dc.subject | one dimensional protein structure prediction | en_US |
| dc.subject | protein fragment selection | en_US |
| dc.subject | machine learning | en_US |
| dc.subject | deep learning | en_US |
| dc.subject | feature extraction | en_US |
| dc.subject | dimensionality reduction | en_US |
| dc.title | Zenginleştirilmiş Öznitelikler ve Makine Öğrenmesi Yöntemleriyle Protein Yerel Yapı Tahmini | en_US |
| dc.type | Project | en_US |
| dspace.entity.type | Publication | |
| gdc.author.institutional | Aydın, Zafer | |
| gdc.description.endpage | 47 | en_US |
| gdc.description.publicationcategory | Diğer | en_US |
| gdc.description.startpage | 1 | en_US |
| relation.isAuthorOfPublication | a26c06af-eae3-407c-a21a-128459fa4d2f | |
| relation.isAuthorOfPublication.latestForDiscovery | a26c06af-eae3-407c-a21a-128459fa4d2f | |
| relation.isOrgUnitOfPublication | 665d3039-05f8-4a25-9a3c-b9550bffecef | |
| relation.isOrgUnitOfPublication | 52f507ab-f278-4a1f-824c-44da2a86bd51 | |
| relation.isOrgUnitOfPublication | ef13a800-4c99-4124-81e0-3e25b33c0c2b | |
| relation.isOrgUnitOfPublication.latestForDiscovery | 665d3039-05f8-4a25-9a3c-b9550bffecef |