Çalışan Yıpranması Tahmini ve Film Tavsiyesi için Öneri Sistemi
Date
2020, 2020
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abdullah Gül Üniversitesi, Fen Bilimleri Enstitüsü
Open Access Color
OpenAIRE Downloads
OpenAIRE Views
Abstract
Bu tezde Makine Öğrenimi Topluluğunda ortaya atılan iki probleme odaklanıyoruz: tavsiye sistemi ve çalışanların yıpranma sorunu. Tavsiye sistemi, kullanıcıların bir ürün satın alırken belirli bir öğeyi tercih edip etmeyeceğini tahmin eden bir bilgi filtreleme sistemidir. Tavsiye sistemleri tahmin etmek için kullanıcı / öğe bilgilerini kullanır. Bu sistemler, özellikle işbirlikçi filtreleme tabanlı sistemler, E-ticarette yaygın olarak kullanılmaktadır. Bu çalışmada, ortak filtreleme ve kullanıcıların / öğelerin yan bilgilerini birleştiren karma bir model öneriyoruz. Önerilen modelde, ilişkili komşuları bulmak ve onları kümelemek için kullanıcıların / öğelerin yan bilgileri kullanılır. Daha sonra, bu kümelere ortak filtreleme yöntemleri uygulanır. Önerilen modelin performansını değerlendirmek için matris çarpanlara ayırma ve yeniden başlatma ile rastgele yürüme uygulanır. Önerilen yaklaşım MovieLens verileri üzerinde sistematik olarak değerlendirilir. Deneysel sonuçlar, kullanıcının / öğenin yan bilgisini kullanan önerilen modelin geleneksel ortak filtreleme yöntemlerinin performansını önemli ölçüde geliştirdiğini göstermektedir. Tezin ikinci bölümünde, hangi kişilerin şu anda çalıştıkları bir şirketten ayrılacağını / devam edeceğini tahmin etmeye çalışan, çalışan yıpranması tahmini sorununu ele almaya çalışıyoruz. Günümüzde şirketler için çalışanların işlerini bırakıp bırakmayacaklarını tahmin etmeleri çok önemlidir. En iyi performans gösteren çalışanların işi bırakması, kuruluşlarda finansal veya kurumsal bilgi kaybına neden olabilir. Bu tür kayıplardan kaçınmak için şirketler, çalışanların yıpranmasını tahmin etmelidir. Bununla birlikte, şirketlerin İK departmanları bu tür tahminleri yapacak kadar gelişmiş değildir. Bu amaçla şirketler, çalışanların yıpranmasını zamanında ve doğru bir şekilde tahmin etmek için veri madenciliği yöntemleri kullanmaktadır. Bu çalışmada, Doğrusal diskriminant analizi (LDA), Naive Bayes, Bagging, AdaBoost, Lojistik Regresyon, Destek Vektör Makinesi (SVM), Rastgele Orman, J48, LogitBoost, Çok Katmanlı Algılayıcı (MLP), K-En Yakın Komşular (KNN), XGBoost, Graph Convolutional Networks, iki özel şirket veri kümesinde (IBM ve Adesso İnsan Kaynakları veri kümelerine) çalışanların yıpranmasını tahmin etmek için uygulanmıştır. Mevcut çalışmalardan farklı olarak, bulgularımızı sistematik olarak F-ölçü, Eğri Altında Alan, doğruluk, duyarlılık ve özgüllük gibi çeşitli sınıflandırma metrikleri ile değerlendiriyoruz. Performans sonuçları, LogitBoost ve Lojistik Regresyon algoritmaları gibi veri madenciliği yöntemlerinin çalışanların yıpranmasını tahmin etmede çok yararlı olabileceğini göstermektedir.
In this thesis, we focus on two problems raised in Machine Learning Community, namely, the recommender system and employee attrition problem. The recommender system is an information filtering system that predicts whether users would prefer a given item when purchasing a product. Recommender systems utilize information of users/items to predict. These systems, especially the collaborative filtering based ones, are used widely in E-commerce. In this work, we propose a hybrid model that combines collaborative filtering and side-information of users/items. In the proposed model, side-information of users/items is utilized to find correlated neighbors and cluster them. Then, collaborative filtering methods are applied to these clusters. The matrix factorization and random walk with restart are implemented to evaluate the performance of the proposed model. The proposed approach is systematically evaluated on MovieLens data. Experimental results show that the proposed model, which uses the side-information of the user/item, considerably improves the performance of traditional collaborative filtering methods. In the second part of the thesis, we try to address the employee attrition prediction problem, which is trying to predict which persons will leave/continue a company for which they currently work. Nowadays, it is very critical for companies to predict that the employees will leave their jobs or not. Leaving employees, who are top performers, may cause financial or institutional knowledge losses in the organizations. To avoid such losses, companies have to predict employee attrition. However, the HR departments of companies are not advanced enough to make such a prediction. To this end, companies are using data mining methods to timely and accurately predict employee attrition. In this study, the performance of different classification methods, such as Linear discriminant analysis (LDA), Naive Bayes, Bagging, AdaBoost, Logistic Regression, Support Vector Machine (SVM), Random Forest, J48, LogitBoost, Multilayer Perceptron (MLP), K-Nearest Neighbors (KNN), XGBoost, Graph Convolutional Networks, have been presented to predict employee attrition based on two private company datasets, i.e., IBM and Adesso Human Resource datasets. Different from existing studies, we systematically evaluate our findings with various classification metrics, such as F-measure, Area Under Curve, accuracy, sensitivity, and specificity. Performance results show that data mining methods, such as LogitBoost and Logistic Regression algorithms, can be very useful for predicting employee attrition.
In this thesis, we focus on two problems raised in Machine Learning Community, namely, the recommender system and employee attrition problem. The recommender system is an information filtering system that predicts whether users would prefer a given item when purchasing a product. Recommender systems utilize information of users/items to predict. These systems, especially the collaborative filtering based ones, are used widely in E-commerce. In this work, we propose a hybrid model that combines collaborative filtering and side-information of users/items. In the proposed model, side-information of users/items is utilized to find correlated neighbors and cluster them. Then, collaborative filtering methods are applied to these clusters. The matrix factorization and random walk with restart are implemented to evaluate the performance of the proposed model. The proposed approach is systematically evaluated on MovieLens data. Experimental results show that the proposed model, which uses the side-information of the user/item, considerably improves the performance of traditional collaborative filtering methods. In the second part of the thesis, we try to address the employee attrition prediction problem, which is trying to predict which persons will leave/continue a company for which they currently work. Nowadays, it is very critical for companies to predict that the employees will leave their jobs or not. Leaving employees, who are top performers, may cause financial or institutional knowledge losses in the organizations. To avoid such losses, companies have to predict employee attrition. However, the HR departments of companies are not advanced enough to make such a prediction. To this end, companies are using data mining methods to timely and accurately predict employee attrition. In this study, the performance of different classification methods, such as Linear discriminant analysis (LDA), Naive Bayes, Bagging, AdaBoost, Logistic Regression, Support Vector Machine (SVM), Random Forest, J48, LogitBoost, Multilayer Perceptron (MLP), K-Nearest Neighbors (KNN), XGBoost, Graph Convolutional Networks, have been presented to predict employee attrition based on two private company datasets, i.e., IBM and Adesso Human Resource datasets. Different from existing studies, we systematically evaluate our findings with various classification metrics, such as F-measure, Area Under Curve, accuracy, sensitivity, and specificity. Performance results show that data mining methods, such as LogitBoost and Logistic Regression algorithms, can be very useful for predicting employee attrition.
Description
Keywords
Computer Engineering And Computer Science And Control, Bilgisayar Mühendisliği Bilimleri-Bilgisayar Ve Kontrol
Turkish CoHE Thesis Center URL
Fields of Science
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
68