مقایسه الگوریتم های مختلف طبقه بندی در تشخیص دیابت نوع ۲ در ایران

مقایسه الگوریتم های مختلف طبقه بندی در تشخیص دیابت نوع ۲ در ایران

 مقاله انگلیسی ۷ صفحه PDF و ترجمه فارسی ۱۵ صفحه Word

چکیده

در دنیای پزشکی امروز، داده ها بر روی علائم بیماران مبتلا به بیماری های مختلف به طور گسترده می باشد، که تجزیه و تحلیل و در نظر گرفتن تمام عوامل صرفاً توسط یک شخص (دکتر) امکان پذیر نمی باشد. بنابراین، نیاز به یک سیستم هوشمند برای در نظر گرفتن عوامل مختلف و شناسایی یک مدل مناسب بین پارامترهای مختلف، مشهود است. دانش داده کاوی، به عنوان پایه و اساس چنین سیستم هایی، یک نقش حیاتی در پیشرفت علوم پزشکی، به ویژه در تشخیص بیماری های مختلف، ایفا می کند. دیابت نوع ۲، یکی از این بیماری ها است که در سال های اخیر افزایش یافته است، که اگر دیر تشخیص داده شود، می تواند منجر به عوارض جدی شود. در این مقاله، چند روش و الگوریتم داده کاوری مورد استفاده قرار گرفته است و به مجموعه ای از داده های غربالگری برای دیابت نوع ۲ در تبریز، ایران اعمال می گردد. عملکرد روش هایی از قبیل ماشین بردار پشتیبانی، شبکه عصبی مصنوعی، درخت تصمیم، نزدیک تریم همسایه، و شبکه بیزی در تلاش برای پیدا کردن بهترین الگو برای تشخیص این بیماری، مقایسه شده است. شبکه عصبی مصنوعی با نرخ دقت ۹۷٫۴۴%، دارای بهترین عملکرد بر روی مجموعه داده های انتخاب شده می باشد. نرخ دقت برای ماشین بردار پشتیبانی، درخت تصمیم، ۵- نزدیک ترین همسایه، و شبکه بیزی، به ترتیب ۸۱٫۱۹، ۹۵٫۰۳، ۹۰٫۸۵ و ۹۱٫۶۰% می باشد. نتایج شبیه سازی نشان می دهد که اثر بخشی تکنیک های مختلف طبقه بندی بر روی یک مجموعه داده وابسته به کاربرد، و همچنین ماهیت و پیچیدگی مجموعه داده استفاده شده می باشد. علاوه بر این، همیشه ممکن نیست گفته شود که تکنیک طبقه بندی همیشه بهترین عملکرد را خواهد داشت. بنابراین، در مواردی که در آن داده کاوی برای تشخیص و یا پیش بینی بیماری، استفاده می شود، مشاوره با متخصصان، برای انتخاب تعداد و نوع پارامترهای مجموعه داده برای بدست آوردن بهترین نتایج ممکن اجتناب پذیر است.

کلمات کلیدی: دیابت نوع ۲, ماشین بردار پشتیبانی, درخت تصمیم, شبکه عصبی مصنوعی, نزدیکترین همسایه, شبکه بیزی

Comparison of various classification algorithms in the diagnosis of type 2 diabetes in Iran

Abstract In today’s medical world, data on symptoms of patients with various diseases are so widespread, that analysis and consideration of all factors is merely not possible by a person (doctor). Therefore, the need for an intelligent system to consider the various factors and identify a suitable model
between the different parameters is evident. Knowledge of data mining, as the foundation of such systems, has played a vital role in the advancement of medical sciences, especially in diagnosis of various diseases. Type 2 diabetes is one of these diseases, which has increased in recent years, which if diagnosed late can lead to serious complications. In this paper, several data mining methods and algorithms have been used and applied to a set of screening data for type 2 diabetes in Tabriz, Iran. The performance of methods such as support vector machine, artificial neural network, decision tree, nearest neighbors, and Bayesian network has been compared in an effort to find the best algorithm for diagnosing this disease. Artificial neural network with an accuracy rate of 97.44 % has the best performance on the chosen dataset. Accuracy rates for support vector machine, decision tree, 5- nearest neighbor, and Bayesian network are 81.19, 95.03, 90.85, and 91.60 %, respectively. The results of the simulations show that the effectiveness of various classification techniques on a dataset depends on the application, as well as the nature and complexity of the dataset used. Moreover, it is not always possible to say that a classification technique will always have the best performance. Therefore, in cases where data mining is used for diagnosis or prediction of diseases, consultation with specialists is inevitable, for selecting the number and type of dataset parameters to obtain the best possible results.
Keywords: Type 2 diabetes , Support vector machine , Decision tree , Artificial neural network , Nearest neighbors , Bayesian network

.

.

95,000 ریال – خرید

.

.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *