Comparison of Machine Learning Classifiers for Protein Secondary Structure Prediction

dc.contributor.author Aydin, Zafer
dc.contributor.author Kaynar, Oguz
dc.contributor.author Gormez, Yasin
dc.contributor.author Isik, Yunus Emre
dc.contributor.authorID 0000-0001-7686-6298 en_US
dc.contributor.department AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü en_US
dc.contributor.institutionauthor Aydin, Zafer
dc.date.accessioned 2023-05-02T07:21:07Z
dc.date.available 2023-05-02T07:21:07Z
dc.date.issued 2018 en_US
dc.description.abstract Proteinlerin üç boyutlu yapılarının tahmin edilmesi teorik kimya ve biyoenformatik için önemli problemlerden biridir. Protein yapı tahmininin en önemli aşamalarından biri ise ikincil yapı tahminidir. Protein veritabanlarındaki verilerin hızlı artışı ve yakın zamanda geliştirilen farklı öznitelik çıkarma yöntemleri neticesinde ikincil yapı tahmini için kullanılan veri setleri boyut ve örnek sayısı bakımından büyümektedir. Bu nedenle hızlı çalışan ve belirli bir doğruluk oranını sahip tahmin algoritmaların kullanılması önem kazanmaktadır. Bu çalışmada iki aşamalı hibrit bir sınıflandırıcının ikinci aşaması için çeşitli sınıflama algoritmaları, EVAset veri seti kullanılarak hem orijinal boyutlu uzayda hem de bilgi kazancı metriği ile boyutu düşürülen uzayda optimize edilmiştir. Elde edilen sonuçlar doğrultusunda en başarılı tahmin yöntemi destek vektör makinası olurken model eğitme süresi bakımından en hızlı yöntem aşırı öğrenme makinası olarak elde edilmiştir. en_US
dc.description.abstract Three-dimensional structure prediction is one of the important problems in bioinformatics and theoretical chemistry. One of the most important steps in the three-dimensional structure prediction is the estimation of secondary structure. Due to rapidly growing databases and recent feature extraction methods datasets used for predicting secondary structure can potentially contain a large number of samples and dimensions. For this reason, it is important to use algorithms that are fast and accurate. In this study, various classification algorithms have been optimized for the second phase of a two-stage classifier on EVAset benchmark both in the original input space and in the space reduced using the information gain metric. The most accurate classifier is obtained as the support vector machine while the extreme learning machine is significantly faster in model training. en_US
dc.identifier.isbn 978-1-5386-1501-0
dc.identifier.issn 2165-0608
dc.identifier.other WOS:000511448500400
dc.identifier.uri https://hdl.handle.net/20.500.12573/1587
dc.language.iso tur en_US
dc.publisher IEEE en_US
dc.relation.journal 2018 26TH SIGNAL PROCESSING AND COMMUNICATIONS APPLICATIONS CONFERENCE (SIU) en_US
dc.relation.publicationcategory Makale - Uluslararası Hakemli Dergi - Kurum Öğretim Elemanı en_US
dc.rights info:eu-repo/semantics/closedAccess en_US
dc.subject İkincil Yapı Tahmini en_US
dc.subject Protein Yapı Tahmini en_US
dc.subject Öznitelik Seçimi en_US
dc.subject Makine Öğrenmesi en_US
dc.subject Secondary Structure Prediction en_US
dc.subject Feature Selection en_US
dc.subject Machine Learning en_US
dc.title Comparison of Machine Learning Classifiers for Protein Secondary Structure Prediction en_US
dc.type other en_US

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
Comparison_of_machine_learning_classifiers_for_protein_secondary_structure_prediction.pdf
Size:
716.19 KB
Format:
Adobe Portable Document Format
Description:
Proceedings Paper

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.44 KB
Format:
Item-specific license agreed upon to submission
Description: