Comparison of NR and UniClust Databases for Protein Secondary Structure Prediction

dc.contributor.author Aydin, Zafer
dc.contributor.author Kaynar, Oguz
dc.contributor.author Gormez, Yasin
dc.contributor.authorID 0000-0001-7686-6298 en_US
dc.contributor.department AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü en_US
dc.contributor.institutionauthor Aydin, Zafer
dc.date.accessioned 2023-04-28T08:52:23Z
dc.date.available 2023-04-28T08:52:23Z
dc.date.issued 2018 en_US
dc.description.abstract Proteinlerin üç boyutlu yapılarının tahmin edilmesi teorik kimya ve biyoenformatik için önemli problemlerden biridir. Üç boyutlu yapı tahminin en önemli aşamalarından biri ise ikincil yapı tahminidir. İkincil yapı tahmininde başarı oranının artırılması kullanılan sınıflama algoritması kadar, hesaplanan özniteliklere de bağlı olmaktadır. Öznitelik çıkarmak için sıkça kullanılan çoklu hizalama yöntemlerinde ise hesaplanan değerler, hizalama için kullanılan veri tabanına göre farklılık göstermektedir. Bu nedenle öznitelik matrisleri oluşturulurken uygun veri tabanın seçilmesi önem kazanmaktadır. Bu çalışmada CB513 veri seti kullanılarak iki farklı hizalama yöntemi ve üç farklı veri tabanı yardımı ile 5 farklı veri seti oluşturulmuş ve bu veri setleri iki aşamalı hibrit bir sınıflandırıcı kullanılarak karşılaştırılmıştır. Elde edilen sonuçlar doğrultusunda en iyi başarı oranı HHBlits hizalama yönteminin ilk aşamasında hesaplanacak PSSM değerleri için UniClust ve yapısal profil matrisleri için yine HHBlits’in ilk aşamasında NR veri tabanı kullanıldığında elde edilmiştir. en_US
dc.description.abstract Three-dimensional structure prediction is one of the important problems in bioinformatics and theoretical chemistry. One of the most important steps in the threedimensional structure prediction is the estimation of secondary structure. Improving the accuracy rate in protein secondary structure prediction depends on computed attributes as well as the classification algorithms. In multiple alignment methods, which are often used to extract an attribute, the calculated values differ according to the database used for the alignment. For this reason, it is important to use a suitable database against which the target proteins are aligned to compute profile feature vectors. In this study, 5 different datasets are generated for the CB513 benchmark with the aid of two different alignment methods and three different databases. The profile features are fed as input to a two-stage hybrid classifier. According to the experimental results, the highest accuracy rate is obtained when UniClust database is used at the first stage of HHBlits alignment to calculate PSSM values and NR database is used at the first stage of HHBlits alignment to calculate structural profile matrices. en_US
dc.identifier.endpage 4 en_US
dc.identifier.isbn 978-1-5386-1501-0
dc.identifier.issn 2165-0608
dc.identifier.other WOS:000511448500138
dc.identifier.startpage 1 en_US
dc.identifier.uri https://hdl.handle.net/20.500.12573/1586
dc.language.iso tur en_US
dc.publisher IEEE en_US
dc.relation.journal 2018 26TH SIGNAL PROCESSING AND COMMUNICATIONS APPLICATIONS CONFERENCE (SIU) en_US
dc.relation.publicationcategory Makale - Uluslararası Hakemli Dergi - Kurum Öğretim Elemanı en_US
dc.rights info:eu-repo/semantics/closedAccess en_US
dc.subject Secondary Structure Prediction en_US
dc.subject Protein Structure Prediction en_US
dc.subject Multi Alignment en_US
dc.subject Protein Database en_US
dc.subject İkincil Yapı Tahmini en_US
dc.subject Protein Yapı Tahmini en_US
dc.subject Çoklu Hizalama en_US
dc.subject Protein Veri Tabanı en_US
dc.title Comparison of NR and UniClust Databases for Protein Secondary Structure Prediction en_US
dc.type other en_US

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
Comparison_of_NR_and_UniClust_databases_for_protein_secondary_structure_prediction.pdf
Size:
710.1 KB
Format:
Adobe Portable Document Format
Description:
Proceedings Paper

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.44 KB
Format:
Item-specific license agreed upon to submission
Description: