Protein Yapı Tahmini için Derin Öğrenme Modellerinin Geliştirilmesi

dc.contributor.advisor Aydın, Zafer
dc.contributor.author Görmez, Yasin
dc.contributor.authorID 0000-0001-6539-3616 en_US
dc.contributor.department AGÜ, Fen Bilimleri Enstitüsü, Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı en_US
dc.contributor.other 01. Abdullah Gül University
dc.contributor.other 02. 04. Bilgisayar Mühendisliği
dc.contributor.other 02. Mühendislik Fakültesi
dc.date.accessioned 2023-09-21T07:14:37Z
dc.date.available 2023-09-21T07:14:37Z
dc.date.issued 2022 en_US
dc.date.issued 2022
dc.date.submitted 2022-10-12
dc.description.abstract The three-dimensional structure of a protein provides important clues about the function of that protein. Although there have been many studies on protein structure prediction, the problem has still not been solved completely. As it is very difficult to predict the three-dimensional structure of a protein directly, predictions of structural properties of proteins such as secondary structure, solvent accessibility, and torsion angles are carried out first, which are later used as inputs to more elaborate structure estimation tasks. In this thesis, novel deep learning models have been developed by using convolutional neural networks (CNN), graph convolutional networks (GCN) and long-short-term memory (LSTM) recurrent neural networks to predict secondary structure, solvent accessibility and torsion angles of proteins. A rich feature set formed by using PSI-BLAST, HHBlits, physicochemical properties, structural profile matrices, AA index values, and graphs representing the relationship between amino acids were used as inputs to the models. In the first study, a deep learning model was developed by using CNN and GCN layers for secondary structure prediction. In the second study, LSTM layers were added to the first model, which was extended to make solvent accessibility and torsion angle predictions as well using the multi-task learning approach. In both studies, graphs were generated using neighborhood relations between amino acids. In the last study, a novel U-net-based model was designed for secondary structure prediction using CNN, GCN, and LSTM layers. The graph matrices used as input to GCN layers were obtained by using protein contact map prediction. All models were trained, optimized and tested on benchmark data sets. Improvements were obtained in accuracy as compared to the state-of-the-art en_US
dc.description.abstract Bir proteinin üç boyutlu yapısı, o proteinin fonksiyonu hakkında önemli ipuçları sunmaktadır. Literatürde protein yapı tahmini yapan birçok çalışma bulunmasına rağmen bu problem henüz tam olarak çözümlenememiştir. Üç boyutlu protein yapı tahmininin direkt olarak yapılması çok zor olduğundan ilk etapta ikincil yapı, çözücü erişilirlik ve burulma açıları gibi yapısal özellikler tahmin edilir ve daha karmaşık yapı tahmin algoritmalarına girdi olarak gönderilir. Bu tezde, ikincil yapı, çözücü erişilirlik ve burulma açıları tahminleri için evrişimsel sinir ağları (ESA), çizge evrişimsel ağlar (ÇEA) ve uzun kısa vadeli hafıza (UKVH) temelli tekrarlayan yapay sinir ağları kullanılarak özgün derin öğrenme modelleri geliştirilmiştir. PSI-BLAST, HHBlits, fiziko kimyasal özellikler, yapısal profil matrisleri ve AAindex parametreleri kullanılarak oluşturulan zengin bir öznitelik seti ve amino asitler arasındaki ilişkinin temsil edildiği çizgeler modellerde girdi olarak kullanılmıştır. İlk çalışmada, ikincil yapı tahmini için ESA ve ÇEA kullanılarak özgün bir model oluşturulmuştur. İkinci çalışmada, ilk modele UKVH katmanları da eklenmiş ve model çok görevli öğrenme yaklaşımı sayesinde çözücü erişilirlik ve burulma açı tahminleri de yapacak şekilde güncellenmiştir. Her iki çalışmada da ÇEA modellerinin girdileri olan çizgeler amino asitler arası komşuluk ilişkisi kullanılarak oluşturulmuştur. Son çalışmada ESA, ÇEA ve UKVH kullanılarak U-net tabanlı özgün bir model ikincil yapı tahmini için tasarlanmıştır. Bu çalışmada girdi olarak kullanılan çizge matrisi protein temas haritası tahmini kullanılarak elde edilmiştir. Tüm modeller güncel veri kümelerinde eğitilmiş, optimize edilmiş ve test edilmiştir. Literatürdeki yöntemlerden daha başarılı sonuçlar elde edilmiştir.
dc.identifier.uri https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=qVqOZFj2DwNmvdf1oGFYiJ4xgfLRHsX7E2ZfmzIvRBOUqK47rLxMeCN6GTkzwrbF
dc.identifier.uri https://hdl.handle.net/20.500.12573/1802
dc.language.iso eng en_US
dc.language.iso en
dc.publisher Abdullah Gül Üniversitesi, Fen Bilimleri Enstitüsü en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject Computer Engineering And Computer Science And Control en_US
dc.subject Bioengineering en_US
dc.subject Torsion en_US
dc.subject Deep Learning en_US
dc.subject Bilgisayar Mühendisliği Bilimleri-Bilgisayar Ve Kontrol
dc.subject Accessibility en_US
dc.subject Biyomühendislik
dc.subject Protein Structure Prediction en_US
dc.subject Burulma
dc.subject Derin Öğrenme
dc.subject Erişilebilirlik
dc.subject Protein Yapı Tahmini
dc.title Protein Yapı Tahmini için Derin Öğrenme Modellerinin Geliştirilmesi
dc.title Developing Deep Learning Models for Protein Structure Prediction en_US
dc.title.alternative Protein yapı tahmini için derin öğrenme modellerinin geliştirilmesi en_US
dc.type Doctoral Thesis en_US
dspace.entity.type Publication
gdc.author.institutional Aydın, Zafer
gdc.description.department Fen Bilimleri Enstitüsü / Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
gdc.description.endpage 94
gdc.description.publicationcategory Tez en_US
gdc.identifier.yoktezid 766673
relation.isAuthorOfPublication a26c06af-eae3-407c-a21a-128459fa4d2f
relation.isAuthorOfPublication.latestForDiscovery a26c06af-eae3-407c-a21a-128459fa4d2f
relation.isOrgUnitOfPublication 665d3039-05f8-4a25-9a3c-b9550bffecef
relation.isOrgUnitOfPublication 52f507ab-f278-4a1f-824c-44da2a86bd51
relation.isOrgUnitOfPublication ef13a800-4c99-4124-81e0-3e25b33c0c2b
relation.isOrgUnitOfPublication.latestForDiscovery 665d3039-05f8-4a25-9a3c-b9550bffecef

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
766673.pdf
Size:
2.75 MB
Format:
Adobe Portable Document Format
Description:
Doktora Tezi

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.44 KB
Format:
Item-specific license agreed upon to submission
Description: