Bilgisayar Mühendisliği Bölümü Koleksiyonu
Permanent URI for this collectionhttps://hdl.handle.net/20.500.12573/203
Browse
Browsing Bilgisayar Mühendisliği Bölümü Koleksiyonu by Language "tur"
Now showing 1 - 20 of 26
- Results Per Page
- Sort Options
conferenceobject.listelement.badge Blockchain Based User Management System(IEEE, 2020) Temiz, Mustafa; Soran, Ahmet; Arslan, Halil; Erel, Hilal; 0000-0003-0683-1836; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü; Soran, Ahmet—Blokzinciri, çeşitli kriptografi teknikleri kullanılarak birbirine bağlanmış bloklar içerisinde bulunan verilerin, ağ üzerinde diğer noktalara dağıtılmasıyla oluşturulan güvenilir ve şeffaf bir yapıdır. Mevcut veri tabanı işlemlerinden farkı, yetki ve sorumlukların tek bir merkezi otoritede bulunmaması, bu yetki ve sorumlulukların ağda bulunan diğer düğümlere dağıtılarak görev paylaşımı sağlanmasıdır. Bunu sağlayabilmek için eşler arası ağ altyapısı kullanılmaktadır. Fakat bu aşamada güvenlik anlamında kimlik doğrulama işlemi temel güvenlik mekanizmalarından birini oluşturmaktadır. Bu çalışmada, blokzincirdeki hız sorunlarına çözüm olabileceği düşünülen, daha güvenilir ve güncel teknolojilerle entegre olacak şekilde çalışabilen bir kullanıcı yönetim sistemi önerilmektedir.conferenceobject.listelement.badge Blockchain-based Fog Computing Applications in Healthcare(IEEE, 2020) Adanur, Beyhan; Bakir-Gungor, Burcu; Soran, Ahmet; 0000-0003-4983-2417; 0000-0002-2272-6270; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü; Adanur, Beyhan; Bakir-Gungor, Burcu; Soran, Ahmet— Son zamanlarda blokzincir teknolojisinin sağlık alanında kullanımı artmıştır. Blokzincir teknolojisinin sağlık alanına getirdiği birçok yenilik olmasına rağmen, halen çözülmeyi bekleyen problemleri mevcuttur. Bu problemlere alternatif çözümler getirmesi amacıyla, sis bilişimin blokzincir teknolojisi ile birlikte kullanılması gündeme gelmiştir. Bu çalışmada, blokzincir tabanlı sis bilişim teknolojisinin sağlık alanındaki uygulamaları incelenmektedir. Sunulan çalışmanın amacı, sağlık alanında, blokzincir ve sis bilişiminin etkileşimli bir şekilde kullanımı hakkında okuyucuların fikir edinmelerini sağlamaktır. Bu amaç doğrultusunda öncelikle, sis bilişimi ve blokzincir teknolojileri tanıtılmıştır. Sonrasında, alanların birbirlerine entegrasyonu, bu teknolojilerin beraber kullanımının sağlık alanına getirdiği avantajlar ve dezavantajlar tartışılmış ve bu teknolojilerin beraber kullanımlarına dair sistem önerisinde bulunulmuştur.Other Comparison of Machine Learning Classifiers for Protein Secondary Structure Prediction(IEEE, 2018) Aydin, Zafer; Kaynar, Oguz; Gormez, Yasin; Isik, Yunus Emre; 0000-0001-7686-6298; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü; Aydin, ZaferProteinlerin üç boyutlu yapılarının tahmin edilmesi teorik kimya ve biyoenformatik için önemli problemlerden biridir. Protein yapı tahmininin en önemli aşamalarından biri ise ikincil yapı tahminidir. Protein veritabanlarındaki verilerin hızlı artışı ve yakın zamanda geliştirilen farklı öznitelik çıkarma yöntemleri neticesinde ikincil yapı tahmini için kullanılan veri setleri boyut ve örnek sayısı bakımından büyümektedir. Bu nedenle hızlı çalışan ve belirli bir doğruluk oranını sahip tahmin algoritmaların kullanılması önem kazanmaktadır. Bu çalışmada iki aşamalı hibrit bir sınıflandırıcının ikinci aşaması için çeşitli sınıflama algoritmaları, EVAset veri seti kullanılarak hem orijinal boyutlu uzayda hem de bilgi kazancı metriği ile boyutu düşürülen uzayda optimize edilmiştir. Elde edilen sonuçlar doğrultusunda en başarılı tahmin yöntemi destek vektör makinası olurken model eğitme süresi bakımından en hızlı yöntem aşırı öğrenme makinası olarak elde edilmiştir.Other Comparison of NR and UniClust Databases for Protein Secondary Structure Prediction(IEEE, 2018) Aydin, Zafer; Kaynar, Oguz; Gormez, Yasin; 0000-0001-7686-6298; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü; Aydin, ZaferProteinlerin üç boyutlu yapılarının tahmin edilmesi teorik kimya ve biyoenformatik için önemli problemlerden biridir. Üç boyutlu yapı tahminin en önemli aşamalarından biri ise ikincil yapı tahminidir. İkincil yapı tahmininde başarı oranının artırılması kullanılan sınıflama algoritması kadar, hesaplanan özniteliklere de bağlı olmaktadır. Öznitelik çıkarmak için sıkça kullanılan çoklu hizalama yöntemlerinde ise hesaplanan değerler, hizalama için kullanılan veri tabanına göre farklılık göstermektedir. Bu nedenle öznitelik matrisleri oluşturulurken uygun veri tabanın seçilmesi önem kazanmaktadır. Bu çalışmada CB513 veri seti kullanılarak iki farklı hizalama yöntemi ve üç farklı veri tabanı yardımı ile 5 farklı veri seti oluşturulmuş ve bu veri setleri iki aşamalı hibrit bir sınıflandırıcı kullanılarak karşılaştırılmıştır. Elde edilen sonuçlar doğrultusunda en iyi başarı oranı HHBlits hizalama yönteminin ilk aşamasında hesaplanacak PSSM değerleri için UniClust ve yapısal profil matrisleri için yine HHBlits’in ilk aşamasında NR veri tabanı kullanıldığında elde edilmiştir.conferenceobject.listelement.badge Credit Card Fraud Detection with Machine Learning Methods(IEEE, 345 E 47TH ST, NEW YORK, NY 10017 USA, 01.01.2019) Goy, Gokhan; Gezer, Cengiz; Gungor, Vehbi Cagri; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği BölümüWith the increase in credit card usage of people, the credit card transactions increase dramatically. It is difficult to identify fraudulent transactions among the vast amount of credit card transactions. Although credit card fraud is limited in number of transactions, it causes serious problems in terms of financial losses for individuals and organizations. Even though large number of studies has been conducted to solve this problem, there is no generally accepted solution. In this paper, a publicly available data set is used. The unbalance problem of the data set was solved by using hybrid sampling methods together. On this data set, comparative performance evaluations have been conducted. Different from other studies, the Area Under the Curve (AUC) metric, which expresses the success in such data sets, has also been used in addition to standard performance metrics. Since it is also important to quickly detect credit card fraud transactions; the running time of different methods is also presented as another performance metric.Other Credit Risk Analysis based on Hybrid Classification: Case Studies on German and Turkish Credit Datasets(IEEE, 2018) Cetiner, Erkan; Kocak, Taskin; Güngör, Vehbi Çağrı; 0000-0003-0803-8372; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü; Güngör, Vehbi Çağrı— Kredi risk analizi, karar verme süreçleri açısından finans sektöründe önemli bir rol oynamaktadır. Bankalar ve finansal kuruluşlar, müşterilerinden büyük ölçeklerde ham veri toplamaktadırlar. Veri madenciliği teknikleri, bu ham veri içerisinden kullanışlı bilgiler edinmek amacıyla kullanılabilir. Destek-vektörleri, yapay sinir ağları ve bayesian yaklaşımı bu alanda hali hazırda kullanılan sınıflandırma yöntemleridir. Bu çalışmada, farklı tekil sınıflandırma yöntemlerinin bir araya getirilerek hibrid bir yaklaşımla, sınıflandırma sonuçlarının doğruluğunun arttırılması hedeflenmiştir. Farklı kombinasyonlar ayrıca sınıflandırma yetkinliği açısından performans karşılaştırılmasına tabi tutulmuştur. Hem Alman kredi veriseti hem de ulusal bir bankadan alınan veriseti üzerinde ilgili yaklaşım çalıştırılmış ve yöntemin genelleştirilebilme özelliğinin görülmesi de amaçlanmıştır. Deney sonuçları, özellik seçiminin sınıflandırma başarımı ve hesaplama zamanı açısından çok önemli olduğunu, hibrid yaklaşımın tekil sınıflandırma yöntemlerine göre sınıflandırma doğruluğu açısından daha iyi sonuçlar verdiğini ve son olarak radial-basis fonksiyonu ile birlikte kullanıldığında destek-karar vektörlerinin hem tekil hem hibrid yaklaşımlar içerisinde en iyi sınıflandırma başarımına sahip olduğunu göstermiştir.conferenceobject.listelement.badge Ensemble Churn Prediction for Internet Service Provider with Machine Learning Techniques(IEEE, 345 E 47TH ST, NEW YORK, NY 10017 USA, 2020) Goy, Gokhan; Kolukisa, Burak; Bahcevan, Cenk; Gungor, Vehbi Cagri; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği BölümüWith the developing technology in every fields, a competitive marketing environment has been arised In this competitive environment analyzing customer behavior has become vital In particular, the ability to easily change any service provider has become vet) , critical for the company to continue its existence At the same time, the amount of financial resources spent on retaining instituters much less than to obtain new clients. In this context, the traditional methods of examining vast amount of data obtained today for establishing decision support systems have lost their validities In this study. we used a dataset which is provided by TurkNet serving as an internet service provider in Turkey. Various preprocessing steps has performed on this dataset and then classification algorithms ran. Afterwards results have obtained and compared. The results of these experiments analyzed in terms of the area under the curve value In this context the aunt successful classifier algorithm has been determined as the Random Trees algorithm with a value of 0.936.Other An Ensemble Feature Selection Methodology That Incorporates Domain Knowledge for Cardiovascular Disease Diagnosis(IEEE, 2020) Kolukisa, Burak; Güngör, Vehbi Çağrı; Gungor, Burcu Bakir; 0000-0003-0423-4595; 0000-0002-2272-6270; 0000-0003-0803-8372; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü; Kolukisa, Burak; Güngör, Vehbi Çağrı; Gungor, Burcu BakirKoroner Arter Hastalığı (KAH), arterlerin duvarlarında aterom denilen yağlı madde birikiminin bir sonucu olarak kalbin yeterince beslenememesi durumudur. KAH, 2016 yılında dünyadaki toplam ölümlerin %31'ine (17,9 milyon) neden olmuştur ve teşhis edilmesi zordur. 2030 yılında, yaklaşık olarak 23,6 milyon insanın bu hastalıktan öleceği tahmin edilmektedir. Makine öğrenmesi ve veri madenciliği yöntemlerinin gelişmesiyle birlikte, bazı fiziksel ve biyokimyasal değerleri inceleyerek, KAH’nı ucuz ve zahmetsiz bir şekilde teşhis etmek mümkün olabilir. Bu çalışmada, KAH sınıflandırma problemi için, uzman bilgisini içine alan yeni bir topluluk öznitelik seçim yöntemi önerilmiştir. Önerilen çözüm, UCI Cleveland KAH veri kümesi üzerinde uygulanmış, farklı sınıflandırma algoritmaları kullanılarak, farklı performans ölçütleri karşılaştırılmıştır. Gerçekleştirdiğimiz deneylerde, önerdiğimiz çözümün, MLP sınıflandırıcısı ve seçilen 9 öznitelik kullanıldığında, %85.47 doğruluk, %82.96 hassasiyet ve 0.839 F-ölçüsüne ulaştığı gösterilmiştir. Bu çalışmanın devamında, hastanelerde gerçek zamanlı veriler üzerinde, hızlı bir şekilde KAH tahminlemesi yapabilecek bir makine öğrenmesi modeli oluşturabilmeyi amaçlıyoruz.conferenceobject.listelement.badge Graph-based Biomedical Knowledge Discovery(IEEE, 2024) Altuner, Osman; Bakir-Gungor, Burcu; Bakal, Gokhan; 0000-0003-2897-3894; 0000-0002-2272-6270; AGÜ, Mühendislik Fakültesi, Elektrik - Elektronik Mühendisliği Bölümü; Altuner, Osman; Bakir-Gungor, Burcu; Bakal, GökhanDijitalleşme süreci tüm dünyada oldukça yüksek bir hızla ilerlemektedir. Bu durum günümüz yaşantısında bir çok kolaylık sağladığı gibi ortaya çıkan devasa dijital verilerin analizi ve işlenmesi gibi bir problemi de beraberinde getirmektedir. Bu durum yayınlanan akademik çalışmalar için de geçerlidir. Bu anlamda çalışmalar dahilinde bulunan yenilikçi bilgilere ulaşmak için her bir çalışmayı değerlendirme süreci oldukça zahmetli bir süreci gerektirmektedir. Bu sebeple yapılan bu çalışmada hedef hastalıklar özelinde elde edilmiş yayınlar metin analiz süreçleriyle analiz edilmiş ve anlamlı terimlerin biyomedikal ilişkiler üzerinden bağlanmasını sağlayan çizge yapısına dönüştürülmüştür. Elde edilen yoğun çizge yapısı üzerinde treats (tedavi edici), causes (sebep verici), associated_with (ilişkili) gibi önemli bağlantılara sahip ikili biyomedikal varlıklar sorgulanmıştır. Sorgu sonuçlarına göre elde edilen varlık ikilileri manuel arama yöntemiyle de teyit edilmiş ve gerçek bağlantılar olduğu ispatlanmıştır. Bu çalışmayla birlikte, bilinen biyomedikal varlıkların önerilen yaklaşımla elde edilmesi uzun zaman gerektiren manuel arama problemini çözmesi hedeflenmektedir. Ayrıca birden fazla ikili bağlantı örüntüleriyle bilinmeyen/keşfedilmemiş olası yeni ilişkiler (tedavi edici, sebep verici, ilişkili vb.) elde etme potansiyeli de bulunmaktadır.conferenceobject.listelement.badge The Identification of Discriminative Single Nucleotide Polymorphism Sets for the Classification of Behcet's Disease(IEEE, 345 E 47TH ST, NEW YORK, NY 10017 USA, 2018) Gormez, Yasin; Isik, Yunus Emre; Bakir-Gungor, Burcu; 0000-0002-2272-6270; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği BölümüBehcet's disease is a long-term multisystem inflammatory disorder, characterized by recurrent attacks affecting several organs. As the genotyping individuals get cheaper and easier following the developments in genomic technologies, genome-wide association studies (GWAS) emerged. By this means, via studying big-sized case-control groups for a specific disease, potential genetic variations, single nucleotide polymorphisms (SNPs) are identified. Although several genetic risk factors are identified for Behcet's disease with the help of these studies via scanning around a million of SNPs, these variations could only explain up to 200/u of the disease's genetic risk. In this study, for Behcet's disease classification, via comparing all the SNPs genotyped in GWAS, with the SNPs selected via using genetic knowledge, gain ratio and information gain; both reduction in the feature size and improvement in the classification accuracy is aimed. Also, using different classification algorithms such as random forest, k-nearest neighbour and logistic regression, their effects on the classification accuracy are investigated. Our results showed that compared to other feature selection methods, with at least 81% success rate, the selection of the SNPs using the genetic information (of their GWAS p-values, indicating the significance of the SNP against the disease) provides 15% to 42% improvement in all classification algorithms. This improvement is statistically sound. While gain ratio and information gain feature selection techniques yield similar classification accuracies, the models using all SNPs could not exceed 50% accuracies and results in the worst performance.conferenceobject.listelement.badge Identification of Shared Pathways Among Immune Related Diseases Utilizing Active Subnetworks(IEEE, 345 E 47TH ST, NEW YORK, NY 10017 USA, 2020) Eryilmaz, Mahmut Kaan; Kuzudisli, Cihan; Gungor, Burcu Bakir; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği BölümüDifferent, but related diseases often contain shared symptoms indicating the presence of possible overlaps in underlying pathogenic mechanisms. The identification of the shared pathways and related factors across these diseases helps to better understand the causes of these diseases, to prevent and treat these diseases. In this study, using immune-related diseases, we proposed a new method on how to compare the development mechanisms of related diseases based on biological pathways. Following the developments in genomic technologies, the genotyping gets cheaper and easier, and hence genome-wide association studies (GWAS) emerged. By this means, via studying big-sized case-control groups for a specific disease, potential genetic variations, single nucleotide polymorphisms (SNPs) could he identified. With the help of these studies, in which around a million of SNPs are scanned, the variations and genes that could have a role in specific disease development could be detected. In this study, via using available GWAS datasets and human protein-protein interaction network, and via detecting active subnetworks and affected pathways, seven immune related diseases are analyzed. Via investigating the similarities among the identified pathways for related diseases, we aim to define the underlying pathogenic mechanisms, and hence to contribute to the elucidation of disease development mechanisms and to the drug repositioning studies.conferenceobject.listelement.badge In-silico Identification of Papillary Thyroid Carcinoma Molecular Mechanisms(IEEE, 345 E 47TH ST, NEW YORK, NY 10017 USA, 2019) Ersoz, Nur Sebnem; Guzel, Yasin; Bakir-Gungor, Burcu; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği BölümüRepresenting approximately 70% to 80% of thyroid cancers, papillary thyroid cancer (PTC) is the most common type of thyroid cancers. PTC is seen in all age groups, but it is seen more frequently in women than in men. Detection of biomarker proteins of papillary thyroid cancinoma plays an important role in the diagnosis of the disease. In this study, we aim to find target genes and pathways that are associated with papillar thyroid carcinoma, by integrating different bioinformatics methods. For this purpose, usingin-silico methodologies, candidate genes and pathways that could explain disease development mechanisms are identified. Throughout this study, firstly we identified differentially expressed genes as the amount of their protein product differ between patient and healthy groups. Secondly, by using active subnetworks search algorithms, topologic analyses and functional enrichment tests, candidate proteins,which could be thought as PTC biomarkers, and affected pathways are identified.conferenceobject.listelement.badge Investigation of Hepatocellular Carcinoma Molecular Mechanisms via in Silico Analyses(IEEE, 345 E 47TH ST, NEW YORK, NY 10017 USA, 2020) Dogan, Refika Sultan; Saka, Samed; Gungor, Burcu Bakir; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği BölümüHepatocellular carcinoma (HCC) is the most common cause of cancer-related death in the world. The molecular changes in the organism during the development of HCC are not fully understood. The aim of the present study is to contribute to the identification of critical genes and pathways associated with HCC via integrating various bioinformatics methods. In this study, experiments were conducted on gene expression data of 14 HCC tissues and non-cancerous control tissues. A total of 1229 genes, which show a statistically significant change between the groups, were identified. Among these, 681 genes were upregulated and 548 genes were downregulated. Via mapping the detected genes into protein protein interaction networks, active subnetwork search, subnetwork topological analysis and functional enrichment analyses were carried out. The interactions between the molecular pathways affected by HCC were also presented.Research Project Kablosuz Sualtı Algılayıcı Ağlarında Katmanlar Arası İletişim Ve Fırsatçı Spektrum Erişimi(TUBİTAK, 2018) Güngör, Vehbi Çağrı; Tuna, Gürkan; 0000-0003-0803-8372; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü; Güngör, Vehbi ÇağrıDünyamızın üçte ikisinden fazlası sularla kaplıdır. Denizlerden, göllerden ve nehirlerden oluşan sualtı dünyası doğal kaynaklar (petrol, doğalgaz ve değerli mineraller) bakımından oldukça zengin olup insanoğlu tarafından henüz tam olarak keşfedilememiştir. Son yıllarda, bilimsel, çevresel, ticari ve askeri uygulamalarda kullanılmak üzere kablosuz sualtı algılayıcı ağların geliştirilmesi ve gerçekleştirilmesi noktasında endüstride ve akademide olağanüstü artan bir hızda ilgi olmuştur. Günümüzde sualtı algılayıcı ağlarının deprem izleme, denizbilim veri toplanması, felaket yönetimi, çevresel kirliliğin gözlemlenmesi, güvenli gemi seyri, çoklu ortam taktik izleme vb. alanlarda çeşitli uygulamaları bulunmaktadır. Bununla birlikte, sualtı akustik ortamı güvenilir ve etkin kablosuz iletişim için ciddi zorluklar yaratmaktadır. Bu bağlamda, güvenilir ve etkin sualtı iletişimin sağlanması için özgün bir iletişim sistemi gerekmektedir. Bu projede, kablosuz sualtı algılayıcı ağlarının ortak problemleri olan yayılım gecikmesinin yüksek ve değişken olması, sualtı kanal kapasitesinin yere, zamana ve frekansa bağlı olarak ciddi şekilde değişiklik göstermesi ve kablosuz sualtı algılayıcı düğümlerinin çok sınırlı enerjiye sahip olması gibi problemlerin adreslenmesi için konum farkında Katmanlar arası İletişim ve Fırsatçı Spektrum Erişim (Kİ-FSE) sistemi önerilmektedir. Geliştirilen Kİ-FSE sistemi kaynakları kısıtlı sualtı elemanları için geleneksel iletişim katman modelinde uygulama katmanından fiziksel katmana kadar iletişim katmanlarının yükünü azaltacak ve performanslarını geliştirecek tam bir katmanlar arası çözümdür. Ayrıca, Kİ-FSE sistemi sualtı ortamında etkin spektrum kullanımını sağlamak için fırsatçı spektrum erişim tekniklerinden faydalanmaktadır. Genel olarak, bu projenin nihai sonucu sualtı ortamları için özgün katmanlar arası ve fırsatçı spektrum erişim esasına dayanan iletişim protokollerinin geliştirilmesi için gerekli metotların ve temel kavramların ortaya konmasıdır. Sonuç olarak; bu projenin kariyer ve eğitimsel faydalarına ilaveten, bu projenin sonuçlarıyla mümkün kılınabilecek sağlam ve geniş ölçekli sualtı algılayıcı ağları sualtı dünyasının bilimsel, çevresel, ticari, askeri, vb. amaçlar için kapsamlı keşfini başarmayı mümkün kılacak ve sualtında bulunan yeni doğal kaynakların (petrol, doğal gaz, vb.) sualtı algılayıcı ağları tarafından keşfedilmesine önayak olacaktırconferenceobject.listelement.badge Lifetime Analysis of Error Control Schemes on Wireless Sensor Networks in Industrial Environments(IEEE, 345 E 47TH ST, NEW YORK, NY 10017 USA, 2019) Tekin, Nazli; Gungor, V. Cagri; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği BölümüDue to the harsh channel conditions of the industrial environment, the data transmission over wireless channel suffers from erroneous packets. The energy consumption of error control schemes is of vital importance for battery-powered Wireless Sensor Networks (WSNs). In this paper, the performance evaluation of error control schemes namely, Automatic Repeat Request (ARQ), Forward Error Correction (FEC) and Hybrid ARQ (HARQ) in industrial environment in terms of energy efficiency is presented. The impact of the existing error control schemes on the industrial wireless sensor network lifetime is analyzed. A novel Mixed Integer Programming (MIP) framework is developed to maximize network lifetime. Performance results show that utilizing BCH (31,21,5) for Telos at the link layer maximizes the network lifetime while attaining the desired application reliability rate.Article Network intrusion detection based on machine learning strategies: performance comparisons on imbalanced wired, wireless, and software-defined networking (SDN) network traffics(TÜBİTAK Academic Journals, 2024) Hacilar, Hilal; Aydin, Zafer; Gungor, Vehbi Cagri; 0000-0025-8116-722; 0000-0001-7686-6298; 0000-0003-0803-8372; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü; Hacilar, Hilal; Aydin, Zafer; Gungor, Vehbi CagriThe rapid growth of computer networks emphasizes the urgency of addressing security issues. Organizations rely on network intrusion detection systems (NIDSs) to protect sensitive data from unauthorized access and theft. These systems analyze network traffic to detect suspicious activities, such as attempted breaches or cyberattacks. However, existing studies lack a thorough assessment of class imbalances and classification performance for different types of network intrusions: wired, wireless, and software-defined networking (SDN). This research aims to fill this gap by examining these networks' imbalances, feature selection, and binary classification to enhance intrusion detection system efficiency. Various techniques such as SMOTE, ROS, ADASYN, and SMOTETomek are used to handle imbalanced datasets. Additionally, eXtreme Gradient Boosting (XGBoost) identifies key features, and an autoenco der (AE) assists in feature extraction for the classification task. The study evaluates datasets such as AWID, UNSW, and InSDN, yielding the best results with different numbers of selected features. Bayesian optimization fine-tunes parameters, and diverse machine learning algorithms (SVM, kNN, XGBoost, random forest, ensemble classifiers, and autoencoders) are employed. The optimal results, considering F1-measure, overall accuracy, detection rate, and false alarm rate, have been achieved for the UNSW-NB15, preprocessed AWID, and InSDN datasets, with values of [0.9356, 0.9289, 0.9328, 0.07597], [0.997, 0.9995, 0.9999, 0.0171], and [0.9998, 0.9996, 0.9998, 0.0012], respectively. These findings demonstrate that combining Bayesian optimization with oversampling techniques significantly enhances classification performance across wired, wireless, and SDN networks when compared to previous research conducted on these datasets.conferenceobject.listelement.badge A New Method to Identify Affected Pathway Subnetworks and Clusters in Colon Cancer(IEEE, 345 E 47TH ST, NEW YORK, NY 10017 USA, 11.09.2019) Goy, Gokhan; Yazici, Miray Unlu; Bakir-Gungor, Buren; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği BölümüNowadays new technological developments that play an important role in the production of big data have brought about the interpretation, sharing and storage of data related to complex diseases. Combining multi-omic data in different molecular levels is potentially important for understanding the biological origin of complex diseases. One of these complex diseases is cancer of different types, which has one of the highest causes of death worldwide. The integration of multiple omic data in the framework of a comprehensive analysis and identification of relevant pathways contribute to the development of therapeutic approaches related to disease. In this study, RNA and methylation data (genes and p values) of colon adenocarcinoma were obtained from TCGA data portal and combined with Fisher's method. While protein subnetworks affected by the disease were identified by using subnetwork algorithm, pathways related to the disease and genes associated with these pathways were determined by functional enrichment analysis. Using gene-pathway relationship matrix, kappa scores of pathways were determined by similarity calculation. In this way, the pathways were clustered according to the hierarchically optimal number, as a result, the most important pathway clusters and related genes that are effective in disease formation identified.conferenceobject.listelement.badge NSEM: Novel Stacked Ensemble Method for Sentiment Analysis(IEEE, 345 E 47TH ST, NEW YORK, NY 10017 USA, 2018) Emre Isik, Yunus; Gormez, Yasin; Kaynar, Oguz; Aydin, Zafer; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği BölümüToday, people often share their ideas, opinions and feelings through forums, social media sites, blogs and similar platforms. For this reason, access to these data has become very easy. Increase in the number of shares makes it possible to analyze and use these data in terms of marketing and politics. However, due to the large number of data, it is impossible that this analysis will be done by humans. Determination of what type of emotion is included automatically is done by sentiment analysis methods. In these methods, the text is defined as a mathematical vector and classified by machine learning methods. Ensemble methods are one of the most important methods used as classifiers in sentiment analysis. In these methods, a classifier error is tried to be solved by another classifier. In sentiment analysis, the feature vector that describes the text is as important as the classifier. Feature vectors obtained using different methods can make mistakes in different places. For this reason, in this study, NSEM is proposed for sentiment analysis, which is a new ensemble method that uses 2 different classifiers and 2 different feature extraction methods. As a result of the analysis, the proposed method is the most successful method with an accuracy rate of 79.1%.conferenceobject.listelement.badge PCB component recognition with semi-supervised image clustering [Yari-gözetimli görüntü kümeleme ile baskili devre karti bileşeni tanima](Institute of Electrical and Electronics Engineers Inc., 2021) Unal, A.E.; Tasdemir K.; Bahcebasi A.; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü; Bahcebasi, A.; Tasdemir, K.; Bahcebasi, A.Classification of surface mounted devices plays an important role on automated inspection systems of printed component board production. Limited number of publicly available datasets which the components are labeled and high intraclass variance in these datasets causes the supervised approches to be inefficient. In this study a deep learning method, enhanced with an unsupervised clustering system, which uses a small set of labeled data is proposed. The method compared with the current studies and the supervised systems. Most optimized setting reached high accuracy results by outrunning current classification methods. © 2021 IEEE.conferenceobject.listelement.badge Population Specific Classification of Colorectal Cancer with Meta-Analysis of Metagenomic Data(Institute of Electrical and Electronics Engineers Inc., 2023) Temiz, Mustafa; Yousef, Malik; Bakir-Gungor, Burcu; 0000-0002-2272-6270; 0000-0002-2839-1424; AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü; Bakir-Gungor, Burcu; Temiz, MustafaYeni nesil dizilemedeki ve "-omik" teknolojilerdeki gelişmeler, insan bağırsak mikrobiyomunu karakterize etmeyi mümkün kılmaktadır. Bu mikroorganizmaların bazıları bağışıklık sistemimizin temel düzenleyicileriyken, mikrobiyotanın modülasyonu çeşitli hastalıklara yol açar. Dünya çapında üçüncü yaygın kanser türü olan kolorektal kanser (KRK), genetik mutasyonlar, çevresel koşullar ve bağırsak mikrobiyotasındaki anomalilerin etkisiyle oluşmaktadır. Bu çalışma, tür seviyesinde metagenomik veri setleri üzerinde çeşitli makine öğrenmesi yöntemleri kullanarak farklı popülasyonlar için meta-analiz gerçekleştirmeyi; bu sayede KRK teşhisine yardımcı olabilecek sınıflandırma modelleri oluşturmayı amaçlamaktadır. Bu çalışmada, 8 farklı ülke ve 9 farklı metagenomik veri seti üzerinde popülasyon içi, popülasyonlar arası ve leave one dataset out (LODO) yöntemi kullanılarak 3 farklı meta-analiz gerçekleştirilmiştir. KRK teşhisine yardımcı model geliştirirken 4 farklı sınıflandırma algoritması (Rastgele Orman (RF), Logitboost, Adaboost ve Karar Agaci (DT)) kullanılmaktadır. Yapılan deneylerde en üstün performans olarak, popülasyonlar arası performans değerlendirmesinde eğitim veri seti için JP ve test veri seti için JPN popülasyonları kullanıldığında Random Forest algoritması ile 0.98 AUC elde etmiştir.