Protein İkincil Yapısının Tahmini için Sınıflandırma Yöntemlerinin Optimizasyonu
| dc.contributor.advisor | Aydın, Zafer | |
| dc.contributor.author | Uzut, Ömmu Gülsüm | |
| dc.contributor.department | AGÜ, Fen Bilimleri Enstitüsü, Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı | en_US |
| dc.contributor.other | 01. Abdullah Gül University | |
| dc.contributor.other | 02. 04. Bilgisayar Mühendisliği | |
| dc.contributor.other | 02. Mühendislik Fakültesi | |
| dc.date.accessioned | 2021-12-28T08:23:56Z | |
| dc.date.available | 2021-12-28T08:23:56Z | |
| dc.date.issued | 2017 | en_US |
| dc.date.issued | 2017 | |
| dc.date.submitted | 2017-07 | |
| dc.description.abstract | Protein ikincil yapı tahmini, proteinin yapısını ve fonksiyonunu anlamak için önemli ve yaygın olarak kullanılan bir aşamadır. İkincil yapı tahmin bilgisi üç boyutlu yapı tahmini için de kullanıldığından protein dizisiyle üç boyutlu yapısı arasında bir köprü olarak görülebilir. Şimdiye kadar, tahmin doğruluk oranını artırmak için birçok yöntem geliştirilmiştir. Yöntemlerin performansını etkileyecek birden fazla durum vardır. Bunlar arasında model hiper-parametrelerinin doğru seçilmesi önem taşımaktadır. Model eğitme sürecinde direkt olarak öğrenilemeyen bu parametrelerin optimize edilmesiyle modellerin hassas olarak ayarlanması mümkündür. Bu sayede aşırı uyum ve eksik uyum gibi davranışlardan kaçınılması amaçlanır. Bu tezde, destek vektör makinesi, derin katlamalı yapay sinir alanları ve rastgele orman yöntemleri bir hibrit sınıflandırıcının ikinci aşamasında kullanılmak üzere optimize edilmiş ve ikincil yapı tahmini problemine uygulanmıştır. Buna ek olarak eğitilen sınıflandırıcılardan elde edilen tahminler bir topluluk yöntemi ile farklı kombinasyonlarda birleştirilmiş ve başarı oranları en zor tahmin koşulu için incelenmiştir. Geliştirilen yöntemlerin doğruluk oranları literatürdeki en iyi yöntemler ile aynı seviyededir ve farklı modellerin birleştirilmesinin tahmin başarısını iyileştirme potansiyeli bulunduğu gösterilmiştir. | |
| dc.description.abstract | Protein secondary structure prediction (PSSP) is important for understanding protein structure and function. It can be seen as a bridge between amino acid sequence and three-dimensional (3-D) structure of a protein. To date, many methods have been proposed to improve prediction accuracy. There are multiple conditions that will affect the performance of a method. One of these is the selection of correct hyper parameters, which may not be learned directly from the regular training process. Optimizing these hyper-parameters enable us to fine-tune the model complexity preventing over-fitting and under-fitting. In this thesis, we optimized a support vector machine, a deep convolutional neural field and a random forest for the second stage of a hybrid classifier for protein secondary structure prediction. In addition, we built an ensemble classifier that combines the predictions from the individual methods in various combinations. We demonstrate that the overall accuracy of the ensemble is comparable to the success rates of the state-of-the-art methods in the most difficult prediction setting and combining the selected models have the potential to further improve the accuracy of the base learners. | en_US |
| dc.identifier.uri | https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=7lOJX8w_8PRQU1mSHU6-jm8NuQz-wFIZ51PkDS8-u0aA15dyaDwU2MR9oY6R9hKk | |
| dc.identifier.uri | https://hdl.handle.net/20.500.12573/1110 | |
| dc.language.iso | eng | en_US |
| dc.language.iso | en | |
| dc.publisher | Abdullah Gül Üniversitesi, Fen Bilimleri Enstitüsü | en_US |
| dc.rights | info:eu-repo/semantics/openAccess | en_US |
| dc.subject | Computer Engineering And Computer Science And Control | en_US |
| dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar Ve Kontrol | |
| dc.title | Protein İkincil Yapısının Tahmini için Sınıflandırma Yöntemlerinin Optimizasyonu | |
| dc.title | Optimizing Classifiers for Protein Secondary Structure Prediction | en_US |
| dc.type | Master Thesis | en_US |
| dspace.entity.type | Publication | |
| gdc.author.institutional | Aydın, Zafer | |
| gdc.description.department | Fen Bilimleri Enstitüsü / Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı | |
| gdc.description.endpage | 76 | |
| gdc.description.publicationcategory | Tez | en_US |
| gdc.identifier.yoktezid | 476265 | |
| relation.isAuthorOfPublication | a26c06af-eae3-407c-a21a-128459fa4d2f | |
| relation.isAuthorOfPublication.latestForDiscovery | a26c06af-eae3-407c-a21a-128459fa4d2f | |
| relation.isOrgUnitOfPublication | 665d3039-05f8-4a25-9a3c-b9550bffecef | |
| relation.isOrgUnitOfPublication | 52f507ab-f278-4a1f-824c-44da2a86bd51 | |
| relation.isOrgUnitOfPublication | ef13a800-4c99-4124-81e0-3e25b33c0c2b | |
| relation.isOrgUnitOfPublication.latestForDiscovery | 665d3039-05f8-4a25-9a3c-b9550bffecef |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- 12-ÜMMÜ GÜLSÜM UZUT.pdf
- Size:
- 1.8 MB
- Format:
- Adobe Portable Document Format
- Description:
- Yüksek Lisans Tezi
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.44 KB
- Format:
- Item-specific license agreed upon to submission
- Description: