Protein İkincil Yapısının Tahmini için Sınıflandırma Yöntemlerinin Optimizasyonu

dc.contributor.advisor Aydın, Zafer
dc.contributor.author Uzut, Ömmu Gülsüm
dc.contributor.department AGÜ, Fen Bilimleri Enstitüsü, Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı en_US
dc.contributor.other 01. Abdullah Gül University
dc.contributor.other 02. 04. Bilgisayar Mühendisliği
dc.contributor.other 02. Mühendislik Fakültesi
dc.date.accessioned 2021-12-28T08:23:56Z
dc.date.available 2021-12-28T08:23:56Z
dc.date.issued 2017 en_US
dc.date.issued 2017
dc.date.submitted 2017-07
dc.description.abstract Protein ikincil yapı tahmini, proteinin yapısını ve fonksiyonunu anlamak için önemli ve yaygın olarak kullanılan bir aşamadır. İkincil yapı tahmin bilgisi üç boyutlu yapı tahmini için de kullanıldığından protein dizisiyle üç boyutlu yapısı arasında bir köprü olarak görülebilir. Şimdiye kadar, tahmin doğruluk oranını artırmak için birçok yöntem geliştirilmiştir. Yöntemlerin performansını etkileyecek birden fazla durum vardır. Bunlar arasında model hiper-parametrelerinin doğru seçilmesi önem taşımaktadır. Model eğitme sürecinde direkt olarak öğrenilemeyen bu parametrelerin optimize edilmesiyle modellerin hassas olarak ayarlanması mümkündür. Bu sayede aşırı uyum ve eksik uyum gibi davranışlardan kaçınılması amaçlanır. Bu tezde, destek vektör makinesi, derin katlamalı yapay sinir alanları ve rastgele orman yöntemleri bir hibrit sınıflandırıcının ikinci aşamasında kullanılmak üzere optimize edilmiş ve ikincil yapı tahmini problemine uygulanmıştır. Buna ek olarak eğitilen sınıflandırıcılardan elde edilen tahminler bir topluluk yöntemi ile farklı kombinasyonlarda birleştirilmiş ve başarı oranları en zor tahmin koşulu için incelenmiştir. Geliştirilen yöntemlerin doğruluk oranları literatürdeki en iyi yöntemler ile aynı seviyededir ve farklı modellerin birleştirilmesinin tahmin başarısını iyileştirme potansiyeli bulunduğu gösterilmiştir.
dc.description.abstract Protein secondary structure prediction (PSSP) is important for understanding protein structure and function. It can be seen as a bridge between amino acid sequence and three-dimensional (3-D) structure of a protein. To date, many methods have been proposed to improve prediction accuracy. There are multiple conditions that will affect the performance of a method. One of these is the selection of correct hyper parameters, which may not be learned directly from the regular training process. Optimizing these hyper-parameters enable us to fine-tune the model complexity preventing over-fitting and under-fitting. In this thesis, we optimized a support vector machine, a deep convolutional neural field and a random forest for the second stage of a hybrid classifier for protein secondary structure prediction. In addition, we built an ensemble classifier that combines the predictions from the individual methods in various combinations. We demonstrate that the overall accuracy of the ensemble is comparable to the success rates of the state-of-the-art methods in the most difficult prediction setting and combining the selected models have the potential to further improve the accuracy of the base learners. en_US
dc.identifier.uri https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=7lOJX8w_8PRQU1mSHU6-jm8NuQz-wFIZ51PkDS8-u0aA15dyaDwU2MR9oY6R9hKk
dc.identifier.uri https://hdl.handle.net/20.500.12573/1110
dc.language.iso eng en_US
dc.language.iso en
dc.publisher Abdullah Gül Üniversitesi, Fen Bilimleri Enstitüsü en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject Computer Engineering And Computer Science And Control en_US
dc.subject Bilgisayar Mühendisliği Bilimleri-Bilgisayar Ve Kontrol
dc.title Protein İkincil Yapısının Tahmini için Sınıflandırma Yöntemlerinin Optimizasyonu
dc.title Optimizing Classifiers for Protein Secondary Structure Prediction en_US
dc.type Master Thesis en_US
dspace.entity.type Publication
gdc.author.institutional Aydın, Zafer
gdc.description.department Fen Bilimleri Enstitüsü / Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
gdc.description.endpage 76
gdc.description.publicationcategory Tez en_US
gdc.identifier.yoktezid 476265
relation.isAuthorOfPublication a26c06af-eae3-407c-a21a-128459fa4d2f
relation.isAuthorOfPublication.latestForDiscovery a26c06af-eae3-407c-a21a-128459fa4d2f
relation.isOrgUnitOfPublication 665d3039-05f8-4a25-9a3c-b9550bffecef
relation.isOrgUnitOfPublication 52f507ab-f278-4a1f-824c-44da2a86bd51
relation.isOrgUnitOfPublication ef13a800-4c99-4124-81e0-3e25b33c0c2b
relation.isOrgUnitOfPublication.latestForDiscovery 665d3039-05f8-4a25-9a3c-b9550bffecef

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
12-ÜMMÜ GÜLSÜM UZUT.pdf
Size:
1.8 MB
Format:
Adobe Portable Document Format
Description:
Yüksek Lisans Tezi

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.44 KB
Format:
Item-specific license agreed upon to submission
Description: