Makine Öğrenmesi ile Protein Parçacık Seçimi

dc.contributor.advisor Aydın, Zafer
dc.contributor.author EMRE ULUTAŞ, ALPEREN
dc.contributor.author Ulutaş, Alperen Emre
dc.contributor.department AGÜ, Fen Bilimleri Enstitüsü, Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı en_US
dc.contributor.institutionauthor EMRE ULUTAŞ, ALPEREN
dc.contributor.other 01. Abdullah Gül University
dc.contributor.other 02. 04. Bilgisayar Mühendisliği
dc.contributor.other 02. Mühendislik Fakültesi
dc.date.accessioned 2020-07-21T13:18:53Z
dc.date.available 2020-07-21T13:18:53Z
dc.date.issued 2018 en_US
dc.date.issued 2018
dc.description.abstract Protein parçacık seçimi proteinlerin üç boyutlu yapılarının tahmin edilmesindeki önemli adımlardan biridir. Doğru parçacık yapılarının seçilmesi üç boyutlu yapının doğru tahmin edilmesi için gereklidir. Bu tezde verilen iki protein parçacığının üç boyutlu yapılarının birbirine benzer olup olmadığını tahmin eden çeşitli yapay öğrenme yöntemleri geliştirilmiştir. Bu sayede yapısı bilinmeyen bir hedef protein için parçacık yapılarının seçilmesi mümkün olacaktır. Tahmin yönteminin girdi olarak kullanacağı öznitelik parametrelerinin tasarlanması için bir konsept hiyerarşi yaklaşımı izlenmiştir. Bunun için dizi profil matrisleri, ikincil yapı, çözücü erişilirlik ve bükülme açı sınıfı tahminleri çeşitli kombinasyonlarda ve izdüşüm uzaylarında incelenmiştir. Üç ve dokuz amino asitlik parçacıkların yapısal benzerlik tahmini için çeşitli sınıflandırma ve regresyon modelleri eğitilmiş ve optimize edilmiştir. Bunlar arasında lojistik regresyon, AdaBoost, karar ağacı, en yakın komşu, sade Bayes, rastgele orman, destek vektör makinası ve çok-katmanlı algılayıcı bulunmaktadır. Elde edilen sonuçlara göre farklı öznitelik kümelerinin konsept hiyerarşi yaklaşımı ile birleştirilmesi ve model optimizasyonları tahmin başarısını önemli oranda iyileştirmiştir. Ayrıca çapraz doğrulama deneyleri neticesinde parçacık benzerliğinin yüksek başarı oranları ile tahmin edilebildiği gösterilmiştir. Parçacık benzerliği sınıflandırma problemi olarak tanımlandığı zaman tahmin yöntemlerinin başarı oranları birbirine yakın olarak elde edilmiştir. Regresyon modelleri arasında ise rastgele orman yöntemi en yüksek tahmin başarısına ulaşmıştır.
dc.description.abstract Protein fragment selection is an important step in predicting the three-dimensional (3D) structure of proteins. Selecting the right fragments contributes significantly to accurate prediction of 3D structure. In this thesis, a machine learning approach is employed to predict whether a pair of protein fragments have similar 3D structures or not, which can be used to select fragment structures for a target protein with unknown structure. To design input features, a concepy hierarchy is implemented, which considers sequence profile matrices, predicted secondary structure, solvent accessibility and torsion angle classes as features in various combinations and projections. Several machine learning classifiers and regressors are trained and optimized for predicting the structural similarity of 3-mer and 9-mer fragments including logistic regression, AdaBoost, decision tree, k-nearest neighbor, naive Bayes, random forest, SVM and multi-layer perceptron. The results demonstrate that combining different feature sets through concept hierarcy and model optimization improves the prediction accuracy substantially. Furthermore it is possible to predict the structural similarity of fragment pairs with high accuracy, which is assessed by perforing cross-validation experiments on fragment datasets. When the structural similarity of fragments is defined as a classification problem, the accuracy of different classifiers are obtained as similar to each other. Among the regression methods, random forest provided the best accuracy metrics. en_US
dc.identifier.other Tez No: 513554
dc.identifier.uri https://hdl.handle.net/20.500.12573/316
dc.identifier.uri https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=hcgrYffRbz0Z44UJEuLtwel99o7d7x25l5gG1-czlXFlL_PhkpMH3_2n8ZXqc6Sz
dc.language.iso eng en_US
dc.language.iso en
dc.publisher Abdullah Gül Üniversitesi en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject Computer Engineering And Computer Science And Control en_US
dc.subject Bioengineering en_US
dc.subject Bilgisayar Mühendisliği Bilimleri-Bilgisayar Ve Kontrol
dc.subject Biyomühendislik
dc.title Makine Öğrenmesi ile Protein Parçacık Seçimi
dc.title Protein Fragment Selection Using Machine Learning en_US
dc.title.alternative Makine öğrenmesi ile protein parçacık seçimi en_US
dc.type Master Thesis en_US
dspace.entity.type Publication
gdc.author.institutional Aydın, Zafer
gdc.description.department Fen Bilimleri Enstitüsü / Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
gdc.description.endpage 85
gdc.description.publicationcategory Tez en_US
gdc.identifier.yoktezid 513554
relation.isAuthorOfPublication a26c06af-eae3-407c-a21a-128459fa4d2f
relation.isAuthorOfPublication.latestForDiscovery a26c06af-eae3-407c-a21a-128459fa4d2f
relation.isOrgUnitOfPublication 665d3039-05f8-4a25-9a3c-b9550bffecef
relation.isOrgUnitOfPublication 52f507ab-f278-4a1f-824c-44da2a86bd51
relation.isOrgUnitOfPublication ef13a800-4c99-4124-81e0-3e25b33c0c2b
relation.isOrgUnitOfPublication.latestForDiscovery 665d3039-05f8-4a25-9a3c-b9550bffecef

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
PROTEIN FRAGMENT SELECTION.pdf
Size:
2.34 MB
Format:
Adobe Portable Document Format
Description:
Yüksek Lisans Tezi

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: