Diabetes Prediction by Optimizing the Nearest Neighbor Algorithm Using Genetic Algorithm

12  Download (0)

Full text

(1)

پی

ش

یب

ن

ی

د

ی

تبا

هب اب

ی

هن

یزاس

روگلا

ی

مت

دزن

ی

ک

یرت

ن

اسمه

ی

ه

روگلا طسوت

ی

مت

تنژ

ی

ک

نموم دمحم ی 1 * لع ، ی طل دمحم ی ف 2 دهم ، ی مارص اقآ 3 م جاح مظاک ، ی هدازر 4 ، رث یا وارغ ی 5 س ، ی د قن دمحم ی ب ارقلا 6 :هلاقم تفایرد 26 / 2 / 1397  :هلاقم شریذپ 7 / 7 / 1397  :عاجرا نموم ی دمحم طل ، ی ف لع ی دمحم مارص اقآ ، دهم ی م جاح ، ی هدازر مظاک وارغ ، ی رث یا ارقلا ، س ی د قن دمحم ی ب . پی ش یب ن ی د ی تبا هب اب ی هن یزاس روگلا ی مت دزن ی ک یرت ن اسمه ی ه روگلا طسوت ی مت تنژ ی ک هلجم . یکشزپ تسیز و تملاس کیتامروفنا 1398 ؛ 6 ( 1 :) 23 -12 . 1 . وجشناد ی رتکد ی ، ،رتویپماک هورگ هدکشناد سدنهم ی هاگشناد ،رتویپماک و قرب ی ،دز ی ،دز ا ی نار 2 . رایشناد ، ،رتویپماک هورگ سدنهم هدکشناد ی ،رتویپماک و قرب یعونصم شوه ، هاگشناد ی ،دز ی ،دز ا ی نار 3 . یرتکد ،رتویپماک مولع ،رایشناد ،رتویپماک یسدنهم هورگ سدنهم هدکشناد ی رتویپماک و قرب ، هاگشناد ی ،دز ی ،دز ا ی نار 4 . ب صصختم ی رام ی اه ی لخاد ی شناد و ی ،را کشزپ هدکشناد ی ، ملاسا دازآ هاگشناد ی ، دحاو ی دز ، ی ،دز ا ی نار 5 . سانشراک ی سدنهم دشرا ی پماک ی رتو مرن رازفا ، برم ی ، یپماک هورگ ،رتو سدنهم هدکشناد ی پماک ی رتو ،قرب و مرن رازفا ، لاع شزومآ عمتجم ی ارفسا ی ،ن لامش ناسارخ ی ، ارفسا ی ،ن ا ی نار 6 . مومع کشزپ ی ، کشزپ هدکشناد ی ، ملاسا دازآ هاگشناد ی ، دحاو ی دز ، ی ،دز ا ی نار * سم هدنسیون وئ ی دز ، هاگشناد ی ،دز هدکشناد سدنهم ی رتویپماک هورگ ،رتویپماک و قرب  سامت هرامش : 09159736003 Email: mohamad.momeny@stu.yazd.ac.ir :همدقم ای تباید يرامیب کی دنق للاتخا کیلوباتم تخوس و يزاس رد ندب ییاناوت هک تسا دیلوت نیلوسنا رد ندب زا نیب یم و دور نیلوسنا يدیلوت یمن دناوت درکلمع یعیبط دوخ ار ماجنا دوجو .دهد یگژیو و مئلاع ياه فلتخم ،يرامیب نیا صیخشت ار يارب ناکشزپ راوشد یم دنک . هداد لیلحت ناکما يواک هداد ياه ینیلاب نارامیب يارب ت میمص يریگ ياه یم مهارف ار یکشزپ دنک . فده نیا شهوژپ ، هئارا کی لدم يارب شیپ تقد شیازفا ینیب تسا تباید . :شور یکشزپ هدنورپ ،هعلاطم نیا رد 1151 دادعت اب تباید هب لاتبم رامیب 19 یگژیو دروم تفرگ رارق یسررب هاگیاپ زا نارامیب تاعلاطا . درادناتسا هداد UCI عمج يروآ دش لقادح نارامیب زا کی ره . هب تدم کی لاس تحت يریگیپ دوب هب .دن روظنم شیپ لدم هئارا زا تباید ینیب و کیتنژ متیروگلا کیدزن هیاسمه نیرت هدافتسا .دش جیاتن : جیاتن ناشن داد هک تقد شیپ لدم ینیب اب ربارب يداهنشیپ 76 / 0 دوب . نینچمه يارب شور یبصع هکبش ،زیب ویان ياه رپ نورتپس هیلا دنچ نابیتشپ رادرب نیشام و شیپ تقد اب ربارب بیترت هب ینیب 62 / 0 ، 65 / 0 و 75 / 0 .دمآ تسد هب هجيتن :يريگ رد شیپ ینیب ،تباید لدم ریاس هب تبسن يداهنشیپ لدم دروم ياه هسیاقم ، لقادح ياراد نازیم اطخ و شیب نیرت و تقد تحص طخ نازیم رثکادح ،زیب ویان شور .تسا مک و ا یم اراد ار تقد نیرت .دشاب هژاو ديلك :اه شیپ تباید ینیب کیدزن متیروگلا ،کیتنژ متیروگلا ، هداد ،هیاسمه نیرت يواک

(2)

پي ش بي ن ی د ی تبا هب اب ي هن زاس ي روگلا ی مت ینموم ناراکمه و 23 -12 ): 1 ( 6 ; 2019 Informatics Biomedical and Health of Journal 13 همدقم دی تبا ی ا بی رام ي دنق ی ک لوباتم للاتخا ی ک رد .تدسا نددب رد ای ن ب ی رام ي اناوت یی لوت ی د لوسنا ی ن دب زا ندب رد ی ن دم ی دور و دی ا لوسنا ربارب رد ندب ی ن هددش موادقم ؛ دنب اربا ی ن لودسنا ی ن لوت دی د ي من ی دناوت بط درکلمع یع ی د .ددهد مادجنا ار دودخ ی تدبا ودن ود لددصا ی د رد .دراد ی تددبا وددن ددی ک رخت ددی ب لولددس اه ي رد اددتب لوت صقن هب رجنم سارکناپ ی د لودسنا ی ن م ی ،ود ودن رد و دودش واقم م ت پی ش هدنور لوسنا هب ندب ی ن اهن رد هدک دراد دودجو دی ت رخت هب تسا نکمم ی ب لولس اه ي اتب ي لماک صقن و سارکناپ لوت ی د لوسنا ی ن د رد .دوش رجنم ی تبا هدک تدسا صخشم ود ون تنژ لماوع ی ک ی ، قاچ ی و مک کرحت ی ن شق مهم ی لاتبا رد ي دردف دنراد [ 1 .] ب ی رام ي دی تبا ی دک ی رم لدماوع زا و م دی ر ب رد ی رتدش تسا اهروشک [ 2 .] هباشت لاب مئلاع ین ی امزآ و ی هاگش ی دی ،تبا ردب لامتحا ادطخ زو خشت رد ی ص ازفا ار ی ش م ی دهد خدشت . ی ص دپ و ی ش یب دن ی اودنا بی رام ي نکت زا هدافتسا اب اه ی ک ياه هداد يواک ناکما یذپ ر .تدسا هداد يواک رد کشزپ ی رف هب آ شیپ زا ربتعم تاعلاطا جارختسا دنی ،هتخانشان لباق مهف و لباق دامتعا زا هداد هادگیاپ ياده یکدشزپ و هدافتسا نآزا تهج دپ ی ش یب دن ی ، خدشت ی ص نادمرد هدب کدمک و بی رام ي م هتفگ ی ب دیفم ياهوگلا فشک .دوش ی ن ب ی رام ي مئلاع و لاب ین ی امزآ و ی هاگش ی ب ی رام اهدربراک زا ي هداد کدشزپ رد يواک ی هداد رد یلدم ،دیفم يوگلا زا روظنم .تسا اه تدسا هدک ادبترا نایم کی یز هعومجمر هداد زا ياه ب ی رام خدشت و ی ص ب ی رادم ي ار بی نا م ی دنک [ 3 لاس رد .] ياه خا دی ر پ ادب ی تفردش اده ی ی رد هدک خشت ی ص ا سردوز ی ن ب ی رام ي ن نآ نامرد ،هدمآ دوجو هب دی ز ادب قفوم ی ت ب ی رتش ي هدودت ردگا .تدسا هدش هارمه ياده رد ناتدسپ بودخ هدب دنودش فدشک کچوک هزادنا ی .دنتدسه نادمرد لدباق هداد اک و ي شور زا ياه دج دی د اردب ي خدشت ی ص د سردوز ی تدبا تسا [ 4 ]. Su نارادکمه و [ 5 هکبدش زا ] اه ي بدصع ی عوندصم ی ، تدخرد مصت ی ،م سرگر ی نو تسجل ی ک گتدسباو ددعاوق و ی زا هدافتدسا ادب سکع اه ي دعب هس ي ب ،ندب ی رام ي دی تبا هعجارم رد ار ناگدننک پی ش بی ددن ی ا رد .دددندرک ددی ن قحت ددی ،ق سکع ادده ي هددس دعب ي و دعبود ي مامت زا ی اضعا ي ب( فلتخم دارفا ندب ی نارادم د دی تبا ی و درگ تبث )ملاس دارفا ی د ا زا سپدس . دی ن سکع و اده ی گژ ی اده یی حم ،مکش حطس :دننام ی ط تسد مجح ،اهاپ .دش جارختسا ...و اه اب هب گراک ی ر ي ا ی ن غتم ی اهر نکت رد ی ک اده ي هداد وادک ي اپ ردب دی ه سکع اه ي هس دعب ي و ددعبود ي تدقد ادب نددب 89 % لاتدبا هدب بی رام ي دی تبا پ مود ون ی ش بی ن ی تسا .دش دعاوق جارخ ي بق زا ی ل « مکش مجح رگا x = ادپ مجح و y= دس تحادسم و ی هن z= لاددمتحا اددب هاددگنآ دددشاب 90 % ب ی راددم دی تددبا دراد مود وددن » زا روآون ي اه ي ا ی ن دوب شهوژپ . Santhanam و Padmavathi [ 6 ارددب ] ي زا دددعب شهاددک روگلا ی مت تنژ ی ک هدشوخ و دنب K-Means سلاک تدهج ددنب ي دی تبا شور ( Support Vector Machine ) SVM ار ب ه ارددب .دددندرب راددک ي ا ی داددج اپ زا لدددم ی هاددگ درادناتددسا هداد ( Universal Chess Interface ) UCI .دددندرک هدافتددسا تقد 71 / 96 % ارب ي خشت ی ص دی تبا تن ی هج ا ی ن هعلاطم رد .دودب ای ن رودگلا زا شهوژپ ی مت K-Means اردب ي هداد فذدح اده ي ون ی ز ي ، روگلا ی مت تنژ ی ک اردب ي نا و ادخت ی دگژ ی و اهن رد دی ت زا روگلا ی مت شام ی ن تشپ رادرب ی ناب ارب ي هقبط دنب ي دی تدبا هدافتدسا دندومن . Chakraborty راکمه و ش [ 7 هب زا ] ی هن زاس ي زا هدافتدسا ادب روگلا ی مت تنژ ی ک اردب ي هداد اده ي م ی رآوردک ي خدشت تدهج ی ص دی تبا خشت تقد دوبهب .دندرک هدافتسا ی ص پ و ی ش بی ن ی دی تبا اب دافتسا هب زا ه ی هن زاس ي روآودن زا هفدهدنچ ي ا دی ن شهوژدپ .دودب اپ زا هدافتسا ی هاگ درادناتسا هداد (

United States Military

Standard ) MLL رب ا ي خشت ی ص دی تبا ا تودق اقن زا دی ن .دودددب شهوژدددپ Maheta و Dabhi [ 8 همانرب زا ] ون ی دددس ی هب ی هن زاددس ي روددگلا ی مت تنژ ددی ک ارددب ي سلاک دددنب ي هداد ادده ي راقتمان ن ، ارب ي پ ی ش بی ن ی روگلا زا ی مت دشام ی ن تدشپ رادردب ی ناب و بصع هکبش ی عونصم ی دندرک هدافتسا . تقد خشت ی ص پ و ی ش یب ن ی شور ياه هداد يواک م ار ی اوت ن اب روگلا زا هدافتسا ی مت تنژ ی ک ازفا ی ش زا یکی کیتنژ متیروگلا .داد هورگ ریز ياه راکتبا ارف تابساحم ي لدماکت نیناوق زا هک تسا یب عبت یعیبط کیژولو ی ت یم دنک . متیروگلا کیتنژ ادب هدافتدسا زا نوناق ياقب یرترب ن ،اه رد ی ک ز ی هعومجمر خساپ زا ياه دسم لئ ،ه هب لابند هدب تدسد ندروآ خدساپ ياده ردتهب تدسا . دی ک ز دی ر خساپ زا هعومجم اه ي اردب ندکمم ي دسم لئ عمج ،ه دی ت لوا دی ه ار کشت ی ل م ی دهد ره شزرا اب بسانتم . ی ک خدساپ زا ده ،ا ددنیآرف اختنا زا یعمج ت لوا ی ه لوت و دی د اردب لثم ي ا ی دادج دج لدسن دی د م ماجنا ی دوش ره رد . لسن کرت ادب دی ب لوت و دی لثمد خدساپ ياده پ یعیبط کیتنژ زا هک ییاهرگلمع کمک هب ،هدش اختنا ی ور ي م ی ،دننک بیرقت ياه يرتهب زا اوج ییاهن تدسد هب یدم ددیآ . نیا رف آ دنی ثعاب یم دوش هک لسن ه يا دیدج اب طیاردش دسم لئ ه رتراگزاددس ددشاب ن د [ 9 ]، دددش یعددس شهوژددپ نددیا رد شور

(3)

14 23 -12 ): 1 ( 6 ; 2019 Informatics Biomedical and Health of Journal دزن ی ک یرت ن اسمه ی ه ارب ي ازفا ی ش خشت تقد ی ص پ و ی ش یب دن ی بی رام ي دی تبا روگلا اب ی مت تنژ ی ک ار دوبهب دشخبب . فده ا ی ن ا هعلاطم ی ن هداد هعومجم زا هدافتسا اب هک تسا ياده وبرم هدنورپ هب ياه ب ی نارام اپ رد ی گ ها هداد UCI [ 10 لددم ،] ی ارب ي ازفا ی ش خشت تقد ی ص پ و ی ش یب ن ی شور ياه دزن ی ک یرت ن اسمه ی ه روگلا طسوت ی مت تنژ ی ک فرعم ی ددرگ . شور فلا -روآدرگ ي هعومجم هداد اه هعومجم هداد ياه د هدب وبرم ی ،تدبا اپ زا ی هادگ درادناتدسا هداد UCI وبرم هب لاس 2014 دش هتفرگ . هک لماش 1151 هدنومن ب دو هنومن . ییاه رط زا ددندوب لدماک تاعلاطا دقاف هک دی ق شور بی ش یرت ن ناوارف ی ، مخت ی ن ارب .دندش هدز ي ب ره ی رادم داددعت 19 وی ژ یگ هدش تبث تسا . لوددج 1 نادشن هددنهد وی دگژ ی ياده اپ ی هاگ .تسا هدافتسا دروم هداد بلاق هداد بسانم اه هب ناودنع يدورو هداد يوادک ادتن رد ی ج و جورخ ی ت أث ی راذگر داقم رگا .تسا ی ر وی گژ ی ياه رد هداد هعومجم توافتم هنماد ی رد ادطخ زورب لامتحا ،دنشاب هتشاد رارق ی هدتفا اده ازفا ی ش م ی ی دبا هداد نداد رارق هب . ياده دی ک رادمآ هدعماج ي رد لامرن ،هباشم هنماد يزاس دم هتفگ ی دودش پ لددم رد . ی داهندش ي لامرن هوحن يزاس شور هب Max/Min اب رد و [ هز 1 -0 . تسا ] ب -روگلا ی مت تنژ ي ک ای هد لصا ی روگلا ی مت تنژ ی ک رظن زا ی ه لماکت ی وراد ی ن هدش هتفرگ رظن .تسا ی ه وراد ی ن ا هب ی ن تافدص زا هتدسد نآ هک تسا حرش بط یع ی ناوق اب هک ی ن بط یع ی ب يراگزاس ی ش يردت سنادش ،ددنراد ب ياقب ی ش يرت اش .دنراد ی نا رظن هک تسا رکذ ی ه لماکت ی وراد ی ن ه ی چ لحت تابثا یل ی عطق و ی ا اما ؛درادن ز دبرجت رظن ی يرادمآ و أت یی د [ تسا هدش 11 .] روگلا ی مت تنژ ی ک لاس رد 1962 م ی يدلا هدئارا ددنله ناج طسوت دش . ای ن روگلا ی مت روگلا هورگ رد ی مت ياه هب ی هدن يزادس فدادصت ی هب يارددب و دراد رارددق ی هددن يزاددس پ لئاددسم ی چ ددی هد ياددضف اددب تسج يوجو هتخانشان بسانم تسا [ 12 .] دارفا دج ی د ی ک رط زا هعماج ی ق دلووداز لوت ی د م ی سناش .دنوش ياقب ی ک دج لسن رد درف دی د کرت هدب دی ب موزودمورک ادخ ی لحارم رد .تسا هتسباو دلووداز شدهج تدسا ندکمم ییاده رد صوصخ ی تا ی ک دج لسن درف ی د تن رد هک دهد خر ی هج يدوجوم صوصخ اب ی تا لاع ی لوت لااب يراگزاس و ی د دوش دنور رد . ددلووداز هنوگ هب ياه رترب رد ره لدسن هزادجا دیلوت د م هداد لثم ی و دودش هددنوگ يادده ولطماددن هب ردددت ی ج ددب زا ی ن دارددفا و تددفر دددنهاوخ لسن ياه یدج د م لماکت نامز تشذگ اب ی ی دنبا روگلا . ی مت تنژ ی ک ز رد ی ر ب هصلاخ تروص هب ی نا .تسا هدش 1 -هعومجم ياده یفدادصت دناک زا دی ياهاد ودج ناودنع هدب ا عمج ی ت لوا ی ه لوت ی د م ی لوت ،دنوش ی د دناک اب لسن ره رد و دی ياهاد دج ی يد اج ی زگ ی ن م ی .دنوش 2 -روگلا رارکت ره رد ی ،مت عمج ی ت گدنزارب عبات طسوت ی زرا دی با ی م ی دوش ردتهب زا يدادعت سپس . ی ن دناک دی اهاد ددعب لدسن ياردب زگ ی شن م ی دنوش عمج و ی ت دج ی د کشت ار ی ل م ی .دنهد 3 -ادعت ا زا يد ی ن عمج ی ت تنژ ياهروتارپا زا هدافتسا اب ی ک ی ظن ی ر لوت يارب شهج و عطاقت ی د دج نادنزرف ی د م هدافتسا ی .دنوش 4 -سر ات قوف لحارم ی ند هب ی ک م همادا بسانم خساپ ی ی دبا . لحارم روگلا يارجا يارب هدش حرطم ی مت تنژ ی ک بدلاق رد دی ک لکش رد امندنور 1 دش هداد ناشن . لودج 1 هزاب : ریداقم یگژیو ياه ینيلاب ناراميب یگژیو حيضوت ياه ینيلاب ناراميب هزاب ریداقم یگژیو ياه ینيلاب ناراميب تیفیک یبایزرا هجیتن 0% هجیتن پی ش امن ی ش مئلاع ياراد( DR لاع نودب/ ئ م DR ) 1% دادعت MA نانیمطا حطس رد هدش فشک ياه α = 0.5 .... و 1.0 . 2% -7% اقن دادعت exudate نانیمطا حطس رد α = 0.5 .... و 1.0 . 8% -16% يرون کسید زکرم زا لاوکام زکرم یسدیلقا هلصاف 17% جیاتن AM/FM هقبط ساسارب يدنب مئلاع ياراد( DR لاع نودب/ ئ م DR ) 18%

(4)

پي ش بي ن ی د ی تبا هب اب ي هن زاس ي روگلا ی مت ینموم ناراکمه و 23 -12 ): 1 ( 6 ; 2019 Informatics Biomedical and Health of Journal 15 لکش 1 امندنور : ي روگلا ی مت تنژ ي ک ج يداهنشيپ لدم ا کی ره یگژیو ز هتفای و اه شیپ و صیخشت رد اه زا تباید ینیب .دنتسه رادروخرب یصاخ تیمها هب بی نا دی رگ یگژیو همه اه هب .دنتسین ناسکی شزرا ياراد ناونع يرامیب صیخشت رد لاثم ود یگژیو ( Body Mass Index ) BMI یکیتنژ لماوع و لودج .دنتسه یتوافتم تیمها ياراد 2 هب وبرم تاحیضوت مادکره یگژیو زا یم شیامن ار اه .دهد ای ن هک زا کی ره یگژیو ياراد اه شزرا هچ ی رد ردقچ و تسا خشت ی ص بی رام ي نیا رد .تسا یمهم هلئسم ،دراد شقن هعلاطم هئارا یشور دش یگژیو زا کی ره شقن و شزرا هک اه هب روط و صخشم قیقد هداد صیخشت يرامیب دش هداد . هدنورپ رد دوجوم ياه اب نارامیب هدافتسا مرن زا رازفا Mathworks Matlab R2019a

فیصوت هیبش ، دش لیلحت و يزاس همادا رد . اب يداهنشیپ لدم شور تخرد ياه میمصت و زیب ویان ،يریگ کیدزن هیاسمه نیرت .تفرگ رارق هسیاقم دروم لودج 2 یگژیو هب طوبرم تاحيضوت : شيپ و صيخشت رد اه تباید ینيب علاطا یگژیو دروم رد هدش صخشم تا هتفای و اه شيپ و صيخشت رد اه تباید ینيب 0 ) نآ رد هک تیفیک یبایزرا يرنیاب هجیتن 1 و دب تیفیک هدنهد ناشن 0 .تسا نآ بسانم تیفیک هدنهد ناشن 1 ) نآ رد هک ،يرگلابرغ زا شیپ ییاتود هجیتن 1 و دیدش هیکبش للاتخا هدنهد ناشن 0 .تسا نآ نادقف 2-7 صیخشت جیاتن ) MA زا يدادعت يارب یگژیو رادقم ره ، MA افلآ نانیمطا حطس رد اه ، تسا تباث . . . ، 1 ، 0.5 بیترت هب 8-15 هباشم تاعلاطا لماش ) 2 -7 يارب ) exudates .تسا هعومجم ناونع هب لسکیپ دادعت ياج هب اقن زا يا یم دیلوت ار تاعیاض هک ییاه داد ناشن ،دننک ،تسا هدش ه یگژیو نیا رطق اب تاعیاض دادعت میسقت اب اه ROI هزادنا ناربج يارب یم يداع ،ریوصت فلتخم ياه دنوش . 16 ،رامیب تیعضو دروم رد مهم تاعلاطا هئارا يارب يرون کسید زکرم و لاوکام زکرم یسدیلقا هلصاف ) رطق اب زین یگژیو نیا ROI تسا هدش يداع . 17 يرون کسید رطق ) . 18 يرنیاب هجیتن ) AM 19 هریخذ بسچرب( سلاک بسچرب ) سلاک يارب يزاس و اه Messidor 1 و 2 و 3 ) 1 هناشن يواح ياه DR یم .دشاب 0 هناشن نودب ياه DR یم .دشاب

(5)

16 23 -12 ): 1 ( 6 ; 2019 Informatics Biomedical and Health of Journal پ شور رد ی داهنش ي ارب ي ره شقن و شزرا ندرک صخشم ی ک و زا ی گژ ی اه خشت رد ی ص ب ی رام ي هدافتسا کیتنژ متیروگلا زا دش . ارب ي ره ی ک و زا ی گژ ی ،اه ی ک رعت نژ ی ف دش ارب . ي هدرادقم ی نژ ،اه هب روط یفداصت ارب ي نژ رده دی ک [ هزادب رد دددع 1 -0 ] هداد اصتخا دش هدنهد ناشن هک هجرد مها ی ت وی گژ ی رظانتم رزب نژ رادقم هزادنا ره .تسا نژ نآ اب رت ،دشاب نادشن هددنهد شزرا و یمها ت ب ی ش رت وی گژ ی رظانتم .تسا هب ازا ي ره ی ک موزومورک زا ياه عمج رد دوجوم ی ،ت ز لحارم ی ر م رارکت ی دوش : 1 -هداد هعومجم اه یناوخارف م ی دوش . 2 ی ک م اختنا هداد هعومجم زا دروکر ی دوش . 3 -داقم ی ر وی گژ ی ياه م لامرن دروکر ی دوش . 4 -و رده هدب -ودبرم نژ رادقم ی دگژ ی جارختدسا موزودمورک زا م ی دوش . 5 -هب روط ره رظانتم ی ک و زا ی گژ ی اه دوخ هب وصخم نژ رد و رادقم ات هدش رض ی گژ ی اه نزو راد دنوش . 6 لحارم ی ک ارب جنپ ات ي م رارکت اهدروکر همه ی دوش . 7 -داقم ساسا رب ی ر نزو راد یو گژ ی ،اه هسلاک لمع يدنب مادجنا م ی دوش . ک ره ییاناوت ای یگتسیاش هدنهد ناشن یگدنزارب عبات موزومور غتم رددف اددب .تددسا ی اددهر ي رعت ددی ف هدددش لودددج رد 1 عباددت ، گدنزارب ی لکش رد 2 ن ام ی ش ددش هداد هدسلاک لدمع . يددنب ادب داقم ی ر وی گژ ی ياه نزو ،راد هک رب ساسا یره ک موزومورک زا اده هبساحم یم ،ددرگ دزن شور هب دی ک یردت ن ادسمه ی ه [ 13 مادجنا ] دش هدسلاک هدک موزومورک ره . يددنب ادطخ ادب ار ي دپ ی ش یب دن ی مک يرت اش ،دهد ماجنا ی هتس رت مخت .دوب دهاوخ ی ن انبم رب اطخ ي هنومن دیگ ر ي شور هدب 10

-Fold Cross Validation [ 14 ] ماجنا دش . ALGORITHM

1) Read the training data from a file 2) Read the testing data from a file

3) Normalize the attribute values in the rangeof 0 to 1.

4) Let x1,x2….xm denote the m instances from data set {f1, f2, … , fn},n = Number of features

5) Let Ch denote the current chromosome from population {g1, g2, … , gr}, r = Number of genes

6) Assign weight Ch to each instance xi in the training set

7) Train the weights on the whole training data set

For every training instance

 Calculate the weighted value as

Chj * xij , where j is the attribute

 Find the K nearest neighbors based on the Euclidean distance

 Calculate the class value End for

8) For each testing instance in the testing data set

 Find the K nearest neighbors in the training data set based on the Euclidean distance

 Predict the class value by finding the maximum class represented in the K nearest neighbors End for

9) Calculate the error rate as Error Rate =

1- (# of correctly classified examples / All) * 100 10) Fitness Function=Minimize (Error Rate)

لکش 2 یگدنزارب عبات : رگلمع دیلوت يارب ار موزومورک يدادعت ، اختنا عمج زا لثم دی ت یم اختنا ا رد .دنک ی ن اختنا شور زا لدم هدبخن ارگ هدافتدسا ا رد .تسا هدش ی ن موزومورک نیرتهب شور اه رد ره لسن ياردب لوت ددی د ددم اددختنا لثم ی دنوددش اددختنا . ناددگبخن هددب نازددیم لباق هظحلام ا ي ک ییارا یرودگلا مت تنژ دی ک ر ا یدم شیازدفا ددهد [ 15 فداددصت تروددص هددب عطاددقت لددمع رد .] ی شددخب ییادده زا

(6)

پي ش بي ن ی د ی تبا هب اب ي هن زاس ي روگلا ی مت ینموم ناراکمه و 23 -12 ): 1 ( 6 ; 2019 Informatics Biomedical and Health of Journal 17 موزومورک اه ادب ی ددک ی رگ کرت دی ب دج ددنزرف و هددش دی د ددلوتم م ی دوش ا . ی ن را ثدعاب وضوم يردب دصوصخ زا ناددنزرف ی تا دلاو ی ن م دوخ ی دوش لکش رد . 3 لوت هوحن ی د دج دنزرف ی د امن ی ش دش هداد رگلمع . ع مادمتا زا سدپ شدهج لدم يور ردب عطادقت دج نادنزرف ی د یدم لامعا کدی زا نژ کدی ردگلمع ندیا .دودش ار موزومورک هب روط نآ ياوتحم سپس و هدومن اختنا یفداصت غت ار نژ یی ر یم لکش .دهد 4 ناشن هدنهد هوحن شهج یم دشاب . 1 رادرب r ( داعبا رد 34 × 1 ) هب روط [ هزاب رد یفداصت 1 -0 یهدرادقم ] یم .ددرگ 2 موزومورک ود یفداصت تروص هب 1 Ch و 2 Ch یم اختنا تیعمج زا .دنوش 3 -2 r) * Ch -1 + ( 1 r * Ch لوا دیدج دنزرف = 4 -2 + r * Ch 1 r) * Ch -1 ( مود دیدج دنزرف = لکش 3 دیدج دنزرف ديلوت هوحن : مامتا زا سپ لمع موزومورک ،شهج ناونع هب هدش دیلوت ياه فرگ رظن رد دیدج لسن یم هت ،لسن نیدنچ تشذگ زا سپ .دنوش موزومورک ریداقم هب ییاهن خساپ و هدش ارگمه اه یم تسد دیآ . 1 رادرب r ( موزومورک کی داعبا رد 34 × 1 یم فیرعت ) .دوش 2 رادرب r [ هزاب رد لامرن عیزوت اب 1 , 1 -یم یهدرادقم ] .ددرگ 3 -هب یم اختنا تیعمج زا موزومورک کی یفداصت تروص .دنوش 4 -رک شهج موزومو هتفای اب هدش اختنا موزومورک عمج زا r یم داجیا .دوش لکش 4 : شهج رگلمع لامعا هوحن [ نابیتشپ رادرب نیشام شور هس اب يداهنشیپ لدم 16 هکبدش ،] یبصع هیلا دنچ نورتپسرپ [ 17 و ] [ زیب ویان 18 هسیاقم ] هددش نیب ابترا .تسا سلاک ياه یعقاو و سلادک ياده شیدپ یدنیب ش سیرتام زا هدافتسا اب هد Confusion هبساحم لباق رد .تسا لکش 5 دروم ياهرتماراپ ، سیرتام زاین Confusion رکذ دش . TP : دادعت ییاهدروکر هک هب ،یتسرد تبثم صیخشت یم هداد دنوش . TN : دادعت ییاهدروکر هک هب ،یتسرد یفنم صیخشت یم هداد دنوش . FP : داد ییاهدروکر هک هب طلغ ، تبثم صیخشت یم هداد دنوش . FN : دادعت ییاهدروکر هک هب ،طلغ یفنم صیخشت یم هداد دنوش . لکش 5 دروم ياهرتماراپ : نيب طابترا يارب زاين سلاك ياه یعقاو و سلاك ياه شيپ ینيب هدش هسیاقم يارب لدم شور ریاس اب يداهنشیپ ياهرایعم زا اه Accuracy ، Sensitivity ، Specificity ، Precision و F-Measure هجوت اب لکش هب 5 هدافتسا ریز طباور قبط دش : Accuracy = (TP + TN) / All (1) Sensitivity = TP / (TP + FN) (2) Specificity = TN / (FP + TN) (3) Precision = TP / (TP + FP) (4) Recall = TP / (TP + FN) (5) F Measure = 2 * Precision * Recall (6)

(7)

18 23 -12 ): 1 ( 6 ; 2019 Informatics Biomedical and Health of Journal جیاتن شیدپ یددنیب و صیخدشت حیحددص تددباید ادب هدافتددسا زا شودده یعونصم و يریگدای ،نیشام سناش نامرد قفوم ار لااب یم درب . رد نیا شهوژپ يارب شیپ یب ن ی خشت و ی ص دی ،تبا رودگلا زا ی مت تنژ ی ک ارب ي هب ی هن يزاس اتن ی ج روگلا ی مت دزن دی ک یردت ن ادسمه ی ه و دش هدافتسا ی ک دج لدم ی د درگ هئارا ی د پ شور رد . ی داهنش ي اب غتم دادعت شهاک زا هدافتسا ی اهر نزو و راد ندردک یو دگژ ی اده ادب هب یگراک ر ي روگلا ی مت تنژ ی ک ارب ي ازفا ی ش حارط فده اب تقد ی زرا و ی با ی ی ک کشزپ لدم ی را عت رد یی ن خددب هدجرد ی م ی دی تدبا لودج رد .دش ماجنا 3 نزو هوحن اد ر ندرک یو گژ ی اه ردب سادسا دش هداد ناشن رظانتم نژ . اتن ی ج بش ی ه يزاس م ناشن ی دهد لددم هک یپ داهندش ي تدقد ادب پی ش یب ن ی 76 / 0 شور زا ياه ادن ی و ب دی ،ز بدصع هکبدش ی MLP ( Multi Layer Perceptron ) و شام ی ن تشپ رادرب ی ناب تقد بی ش يرت خشت رد لااب تقد .دراد ی ص دی تدبا کادح ی ردترب زا ي هر ی تفا پ ی داهنش ي .تسا لودج 3 نزو : یگژیو ندرك راد کيتنژ متیروگلا زا هدافتسا اب اه یگژیو راد نزو ياه هيلوا رادقم لامرن رادقم نزو نزو رادقم راد 3 X 55 71 / 0 3 / 0 21 / 0 4 X 3 33 / 0 2 / 0 07 / 0 ... ... ... ... ... لکش 6 امن ی ش ارب اطخ دصرد هدنهد ي دپ ی ش یب دن ی ب ی رادم ي رد روگلا ی مت پ ی داهنش ي رد 40 تدسا لسن . لکدش 7 نادشن هددنهد رادومن یاتن ج خشت ی ص شور ياه عم اب فلتخم دی را Accuracy نادمه .تسا هدنوگ هدک هدهادشم ددش پ لددم ی داهندش ي تدقد بی ش يرت اس هب تبسن ی ر شور اه دراد . ینچمه ن اقم ی هدس ادتن ی ج پی ش یب ن ی ب ی رام ي عم اب ی اهرا ي Sensitivity ، Specificity ، Precision و F-Measure لودددج رد 4 یاددمن ش .دددش هداد یاتن ج اقم ی هس ناشن هددنهد يردترب پ لددم دردکلمع ی داهندش ي ددم ی دددشاب داددقم . ی ر ناددشن لودددج هدددنهد درددکلمع رددتهب شور یپ داهنش ي .تسا لکش 6 شیپ یارب اطخ دصرد : یداهنشیپ متیروگلا رد یرامیب ینیب

(8)

ینموم ناراکمه و 23 -12 ): 1 ( 6 ; 2019 Informatics Biomedical and Health of Journal 19 یب ویان ی ک ش رادرب یشا ا یتشپ یداهنشیپ د د 62% 65% 75% 76% 60% 62% 64% 66% 68% 70% 72% 74% 76% 78% لکش 7 جیاتن رادومن : اب رایع Accuracy لودج 4 : رايعم اب جیاتن هسیاقم ياه Sensitivity ، Specificity ، Precision و F-Measure هسیاقم رايعم تبثم سلاك ویان شور زيب یبصع هکبش شور شور نابيتشپ رادرب نيشام لدم يداهنشيپ Sensitivity ياراد مئلاع DR 452 / 0 768 / 0 837 / 0 877 / 0 نودب مئلاع DR 764 / 0 558 / 0 669 / 0 644 / 0 Specificity ياراد مئلاع DR 764 / 0 558 / 0 669 / 0 644 / 0 نودب مئلاع DR 452 / 0 767 / 0 837 / 0 877 / 0 Precision ياراد مئلاع DR 629 / 0 605 / 0 691 / 0 704 / 0 نودب مئلاع DR 612 / 0 730 / 0 823 / 0 884 / 0 F-Measure ياراد مئلاع DR 526 / 0 676 / 0 757 / 0 781 / 0 نودب مئلاع DR 680 / 0 633 / 0 738 / 0 731 / 0 ثحب و تن ي هج گ ي ر ي هعومجم ،هعلاطم نیا رد يا اهوگلا زا ي م ؤ د زورب رد رث ی تدبا ردب اپ ساسا ی هاگ درادناتسا هداد UCI تفرگ رارق شزادرپ دروم رد . ای ن شهوژپ لوبق لباق دادعت ی ب زا ی نارام غتم اب ی اهر ي اب بسانم هداد لقادح ياه تسد زا دش هتفرگ راک هب هتفر اب رضاح هعلاطم . هب گراک ی ر ي وی گژ ی ياه ب ی نارام دی تبا ی رودگلا زا هدافتدسا ادب ی مت تنژ ی ک دزن و ی ک یرت ن اسمه ی ،ه دی تبا پ ار ی ش یب دن ی دردک لددم . پی يداهنش ا ی ن لامرن لماش هعلاطم زادس ي وی دگژ ی ،اده ادختنا وی گژ ی ،اه نزو یهد و هب ی گژ ی اه فرعم و ی شور ی ارب ي پ ی ش یب ن ی دی تبا و زا هدافتسا اب ی گژ ی ياده نزو راد تدسا . رد ا دی ن هدعلاطم اسانش رب هولاع یی مهم یرت ن وی گژ ی ،اده ادختنا زا هدافتدسا ادب وی گژ ی اه روگلا ساسا رب ی مت تنژ ی ک بسح رب رتهب يدرکلمع هب صخاش ياه قد ،ت یساسح ت و و ی گژ ی هب تسد .دمآ ا ی ن ره هک ی ک و زا ی گژ ی اه اراد ي شزرا هچ ی رد رددقچ و تسا خشت ی ص ب ی رام ي سم ،دراد شقن لئ مهم ه ی ا رد ،تسا ی ن هعلاطم شور ی هئارا دش ره شقن و شزرا هک ی ک و زا ی دگژ ی اده هدب روط قد ی ق ب و صخشم ی رام ي دی تبا پ ی ش یب ن ی خشت و ی ص هداد ددش ، پ شور رد ی داهنش ي ارب ي زرا ندرک صخشم ش ره شقن و ی ک و زا ی گژ ی اه خشت رد ی ص ب ی رام ي هدافتدسا کدیتنژ متیرودگلا زا دش . رد هعلاطم يا پ ی ش بی ن ی ب ی رام ي دی تبا دشام اب مود ون ی ن رادردب تشپ ی ناب دش ماجنا [ 19 ] ا رد ی ن شهوژدپ 768 ب ی رادم تدشه ادب غتم ی ر بق زا ی ل راشف نوخ م و دارفا دی ناز لودسنا ی ن رزت ی دق ی دب ار ي خشت ی ص دی تبا هنومن دادعت .دش هدافتسا اه ي لدباق لوبق اردب ي هداد واک ي ازم زا یا ي ا ی ن دوب شهوژپ ؛ غتم مک دادعت اما ی اهر ارب ي لدم زاس ي اعم زا ی ب ا ی ن داددعت ردضاح هدعلاطم رد .تدسا شور لوبق لباق ی ب زا ی نارام غتم داددعت ادب ی ادهر ي لقاددح ادب بدسانم هداد ياه تسد زا گ رادک هدب هتفر ددش هدتفر زم هدک دی ت لددم

(9)

20 23 -12 ): 1 ( 6 ; 2019 Informatics Biomedical and Health of Journal پی داهنش ي هعلاطم نیا پ لدم هب تبسن ی ش بی ن ی ب ی رادم ي دی تدبا شام اب مود ون ی ن تشپ رادرب ی ناب .تسا Barakat ناراددکمه و [ 20 هب و دوددبهب اددب ] ی هن زاددس ي شور ددشام ی ن تددشپ رادرددب ی ناب خددشت رد ی ص ب ی راددم ي دی تددبا ود وددن سر ی دند لمادش هدافتسا دروم هداد هعومجم . 4682 ردفن هدعجارم و اب هدننک ی گژ ی اه ي دسنج ی ،ت BMI رادشف ، ،نوخ لورتدسلک و دددنق لباق دادددعت .دوددب نوخ هددنومن هددظحلام لدم رد اه اددس ز ي زا ازم یا ي ا ی ن دوب شهوژپ ؛ ع اما ی ب لصا ی ا ی ن ن شور ی ز مک دادعت غتم ی اهر ارب ي لدم زاس ي پ لدم هک ،تسا ی داهنش ي ا ی ن هدعلاطم غتم دادعت اب ی اهر ي ب يدرکلمع بسانم ردته ي اردب ي دپ ی ش یب دن ی دی تبا .دراد Worachartcheewan نارادددکمه و [ 21 دددشور ] ی اردددب ي خشت ی ص ب ی رام ي شام شور زا هدافتسا اب ی ن شرادرب تدشپ ی ناب و روگلا ی مت تنژ ی ک هئارا هروظنم دنچ دنداد اپ . ی هاگ هداد UCI ارب ي بش ی ه زاددس ي زا هدافتددسا .تددسا هددتفرگ رارددق هدافتددسا دروددم مک ی هن زاس ي ر ی کس خاس رات ي شام رد ی ن تشپ رادرب ی ناب ادج هب ي مک ی هن ندرک برجت ی ا ز صوصخ ی تا شام ی ن تشپ رادرب ی ناب .تدسا شور رد SVM ارددب ي ددسرگر لئاددسم لددح ی نو ، عباددت ادددتبا سرگر ی نو اب هب گراک ی ر ي ی ک دطخ عبادت هتسد ی دشام طدسوت ی ن تشپ رادرب ی ناب مخت ی ن م هدز ی دوش لمع سپدس . دی تا دسرگر ی نو عبات طسوت ی ا فاردحنا هک دعقاو راددقم ز ی نآ رد ردتمک عبادت زا عت تافلت یی ن ،تسا هدش ماجنا م ی دوش اهن رد . ی ت رتهب ی ن اوج مک اب ی هن زاس ي ر ی کس راتخاس ي دشام طسوت ی ن تدشپ رادردب ی ناب م هئارا ی ددرگ ا رد . دی ن هدعلاطم ردب یدنتبم کدیتنژ متیرودگلا زا هبتر ولغمان يدنب (

Nondominated Sorting Genetic

Algorithm ) ارب ي هب لئاسم لح ی هن زاس ي هدافتسا دش ا . ی داج عمج ددی ت لوا ددی ،ه عم فددده عددباوت هبددساحم ی اددهرا ي ارب گدددنز ی ، بترم زاس ي عمج ی ت مادحدزا هلدصاف دروآرب ،هبلغ ورش قبط ی ، سر ات لحارم رارکت ،شهج ،عطاقت ، اختنا ی ند هدمتاخ رش هب ا راک لحارم زا ی ن روگلا ی مت ا رد .تسا ی ن شهوژپ رتماراپ هس C ، γ سپا و ی نول تن رد ی هج پ ی ش بی دن ی ب ی رادم ي دت أث ی ر راددقم .ددنراد ارب کچوک ي رتماراپ C هب رجنم شهاک هتدسد تدقد خرن دنب ي م ی دوش رادقم رگا . C هتدسد تدقد ،دشاب رزب دنب ي هدلحرم رد ازفا شزومآ ی ش م ی ی دبا ؛ لو ی ادمزآ هلحرم رد تقد شهاک ی ش ار عمج ادتبا رد .تشاد دهاوخ لابند هب ی ت لوا ی ه اردب ي ادهرتماراپ ي رتمارادددپ MP ، C ، γ دددسپا و ی نول کدددشت ی ل ددددیدرگ سپدددس . هب ی هن زاس ي ماجنا دش هب هلحرم . ی هن زاس ي و شزودمآ زادف لماش زاف شیامزآ زا سپ .تسا ی نتفا دادقم ی ر هب ی هدن اردب ي ادهرتماراپ روگلا طسوت ی مت NSGA سلاک لدمع ددنب ي مادجنا تدفرگ و اتن ی ج اهن یی هب تسد دمآ ع . ی ب ا ی ن ا شور دی ن دت هدک تدسا أث ی ر رتماراپ γ جورخ رد ی هتدسد دنب ي هدب تبدسن C ب ی ش ردت ،تدسا رزب رادقم ارب ي رتماراپ γ شزاردب ثدعاب بی ش ددحزا راددقم و پ رد ار تقد شهاک کچوک ی پ لدم .دراد ی يداهنش هعلاطم نیا عس ی درک اج هب ي رتمارادپ هدس زا هدافتدسا C ، γ دسپا و ی نول و سلاک دنب ي ، نکت زا ی ک لامرن س يزا وی گژ ی ،اه و اختنا ی گژ ی اه نزو و یهد و هب ی گژ ی اه امن هدافتسا ی د لادع هدش ثعاب هک هو ردب اسانش یی مهم یرت ن وی گژ ی ،اه و اختنا زا هدافتسا اب ی گژ ی اه ردب روددگلا ساددسا ی مت تنژ ددی ک رددتهب يدرددکلمع هددب ي بددسح رددب صخاش ياه ،تقد یساسح ت و و ی گژ ی هب تسد دیآ . Rudziński [ 22 هب زا ] ی هن زاس ي نتبم ی زاف دعاوق رب ي تدهج سلاک دنب ي تسا هدرک هدافتسا و ا زا ی ن ارب شور ي هقبط ددنب ي اپ اونا ی هاگ اه ي م و لااب تقد .دندرک هدافتسا هداد دی ناز ادطخ ي اپ یی ن ازم زا دی ا ي ا دی ن پ و دودب شور ی چ دی گد ی لاادب ي نادمز ی زا اعم ی ب ا ی ن ا نوچ .تسا شور دی ن هدعلاطم عدس ی دحارط رد ی و زرا ی با ی ی ک کشزپ لدم ی را عت رد یی ن خددب هدجرد ی م ی دی تدبا ار پ ،دراد ی چ ی گد ی نامز ی اپ یی ن ا فادها زا ی ن م شور ی دشاب . Richards ناراددکمه و [ 23 رددم هددب وددبرم تادهاددشم ] ب سردوز ی نارام دی تبا ی هدعومجم .ددنداد راردق هدعلاطم دروم ار هداد اه ي هب وبرم 21000 ب ی رادم دروم زا .تدفرگ راردق هدعلاطم اتن جی ا ی ن نمجنا دعاوق شور زا هدافتسا ،هعلاطم ی اردب ي فدشک دعاوق ي هک تسا هب لومعمروط کشزپ طسوت اده دان دی هد هدتفرگ م ی دش ؛ ا رد ادما دی ن عدس هدعلاطم ی ددش ادسانش ردب هولادع یی مهم یرت ن وی گژ ی ،اه و اختنا زا هدافتسا اب ی دگژ ی اده سادسا ردب روگلا ی مت تنژ ی ک صخاش بسح رب رتهب يدرکلمع هب اه ي ،تقد یساسح ت و و ی گژ ی تسد دبای . رد یشهوژپ مدصت تدخرد شور زا ی م تن و ددش هدافتدسا ی هدج « مهم رت ی ن غتم ی ر ارب ي م داردفا ندس ،نوخ دنق لرتنک ی ددشاب » ا .دش لصاح ی ن تن ی هج مصت رد ی م گ ی ر ي اردب ناکدشزپ ي دسفت ی ر اتن ی ج امزآ ی هاگش ی دم ؤ دودب رث [ 24 ] . Huang نارادکمه و [ 25 ] وی گژ ی اه ي ت أث ی ر ور رب راذگ ي ددنق لرتنک زا هدافتدسا ادب ار نوخ شور اه ي هداد واک ي سررب دروم ی ا رد .دنداد رارق ی ن زا شهوژدپ مصت تخرد ی م ب و ی ز اس هد لحت روظنم هب ی ل هداد وادک ي هدافتدسا غتم هک دش صخشم و دندرک ی اهر ي خدشت نامز تدم ،نس ی ص بی رام ي ، نی زا لودسنا نامرد هب ی ،ن و نودخ زکودلگ ژر دی م اذدغ ی ی مهم رت ی ن اهروتکاف ي رثا ور رب راذگ ي ددنق لردتنک .دنتدسه نوخ Huang [ ناراددکمه و 25 ارددب ] ي هدددمع لددماوع ییاددسانش شور زا ،تدباید لرتنک رب راذگریثأت اده ي دعمج شوده ی اردب ي و اختنا ی گژ ی پ .دندرک هدافتسا ی چ ی گد ی لااب ي نامز ی اعم زا دی ب

(10)

پي ش بي ن ی د ی تبا هب اب ي هن زاس ي روگلا ی مت ینموم ناراکمه و 23 -12 ): 1 ( 6 ; 2019 Informatics Biomedical and Health of Journal 21 ای ن ا نوچ .دوب شور ی ن عس هعلاطم ی حارط رد ی را و زی با ی دی ک کشزپ لدم ی را عت رد یی ن خدب هجرد ی م ی دی تبا ،دراد ار پی چ ی گد ی نامز ی اپ یی ن ا فادها زا ی ن م شور ی دشاب . Lee ناراکمه و [ 26 ور رب هعلاطم اب ] ي 88 ب ی ،رام ادهروتکاف ي پی ش بی ن ی دوبهب هدننک ي دی تبا حارج لمع زا دعب ی قاچ ی لمع( ور ي ار )هدعم ی دنتفا اتن . ی ج قحت ی ق کاح ی ا دنلاآ هدک دوب نآ ز ی ن مآ ی زارفسنارتون رادشف و لورتدسلک ، مهم نوخ ردت ی ن غتم ی ادهر یی ور رب هک دنتسه ي ب دوبهب ی نارام د دی تبا ی دحارج لدمع زا ددعب ی قاچ ی ت أث ی ر م ی دنراذگ پ لدم . ی داهنش ي ردضاح هعلاطم ادب تدقد 76% عس ی هن هدرک ی ک وی گژ ی اسانش اب هکلب مهم یی مهم یرت ن وی گژ ی اه ی ک کشزپ لدم ی را عت رد نئمطم یی ن خددب هدجرد ی م ی دی تبا .دشاب Han [ ناراکمه و 27 لحت اب ] ی ل دسررب و ی ب تادعلاطا ی نارادم اپ رد دوجوم ی هاگ هداد دی ک ب ی ناتدسرام و هدب گراک ی ر ي متیرودگلا شیپ ار تباید دوجو ،میمصت تخرد اب رضاح هعلاطم .دندرک ینیب تقد 76 % اب هب گراک ی ر ي وی گژ ی ياه ب ی نارام دی تبا ی هدافتدسا ادب روگلا ی مت تنژ ی ک دزن و ی ک یرت ن ه ادسم ی ،ه دی تدبا دپ ار ی ش یب دن ی دومن . لدم پ ی داهنش ي تقد اب 76 % اراد ي ردتهب درکلمع ي هدب تبدسن اددن شور ی و ب ددی ،ز مددصت تددخرد ی م دزن و ددی ک یرددت ن اددسمه ی ه رد خشت ی ص دی تبا پ شور رد .تسا ی داهنش ي شهادک زا هدافتسا اب غتم دادعت ی اهر نزو و راد ندرک یو ژ گ ی اه هب اب یگراک ر ي رودگلا ی مت تنژ ی ک ارب ي ازفا ی ش حارط فده اب تقد ی زرا و ی با ی ی ک لدم کشزپ ی را عت رد یی ن خددب هدجرد ی م ی دی تدبا لددم .ددش مادجنا کشزپ ی را حارط ی ا رد هددش دی ن خدشت رد شهوژدپ ی ص هدجرد خدب ی م ی هتسد و تسا هدوب قفوم يدنب لباق تقد اب لوبق ی ماجنا دیدرگ امزآ . ی ش اه ش و بی ه يزاس س داد نادشن ی متدس کدشزپ دی را فرعم ی ا رد هدش ی ن ور رب شهوژپ ي ب هداد هعومجم ی نارام موب ی د هب لاتبم ی تبا ب ی ناتسرام اترم ی دز تدقد هب 3 / 97 % دسر ی هد قحت زا رتلااب هک تسا ی تاق ور ردب هباشم ي داد هدعومجم ه ده يا تسا هدوب توافتم ؛ پ اما ی چ ی گد ی نامز و رب ندودب تددم اردجا زا قن ا عض ا ف دی ن شور دودب قحت رد هدک ی تادق آ ی هددن عدس ی رد ا ندرک فرطرب ی ن هاوخ فعض د دش . ای ن س ی متس م ی ناودنع هدب دناوت دی ک س ی متدس کدشزپ ی را رد بطم اه ي کشزپ ی سب ی را دربراک ي .دشاب اتن ی ج بش ی ه يزاس ناشن داد لدم هک یپ داهنش ي پ تقد اب ی ش یب ن ی 76 / 0 شور زا ياه ان ی و ب ی ،ز بصع هکبش ی رپ لا دنچ نورتپس ی ه و شام ی ن تشپ رادرب ی ناب تقد يرتشیب خشت رد لااب تقد .دراد ی ص دی تبا کاح ی رترب زا ي هر ی تفا پ ی داهنش ي .تسا عفانم ضراعت فیاظو نیب کشزپ دوجو صیخشت هوحن رد تدباید رادمیب رد هب لاتبم دنق یم دودجو هب راعت کشزپ یصخش عفانم و .ددیآ مهم د ،دوددجوم یددنارگن نیرددت رارددق تددیولوا ر عیرددست نتفرددگ شیپ ینیب تباید دوجو هئارا ياج هب شدناد ردب یدنتبم تامددخ يوس زا یصصخت یم هک تسا ناکشزپ دادمتعا لزدنت هدب دناوت لاکدشا هدب تسا نکمم عفانم راعت .دوش رجنم نانآ هب رامیب مدهم هدک ددهد خر فلتخم ياردب مدک نادمز فردص نآ نیردت شیپ ینیب تباید دوجو .تسا و مدئلاع همه زا رگا وی گژ ی اده رد صیخشت تباید شهاک صیخشت ياطخ ،دوش هدافتسا م ی ی دبا . References

1. Kitabchi AE, Umpierrez GE, Miles JM, Fisher JN. Hyperglycemic crises in adult patients with diabetes. Diabetes Care 2009;32(7):1335-43.

2. Gardner DG, Shoback D. Greenspan's Basic & Clinical Endocrinology. 9th ed. NewYork: McGraw-Hill Medical; 2011.

3. Gastaldelli A, Gaggini M, DeFronzo RA. Role of adipose tissue insulin resistance in the natural history of type 2 diabetes: results from the san antonio metabolism study. Diabetes 2017;66(4):815-22.

4. Volkov P, Bacos K, Ofori JK, Esguerra JL, Eliasson L. Whole-genome bisulfite sequencing of human pancreatic islets reveals novel differentially methylated regions in type 2 diabetes pathogenesis. Diabetes 2017;66(4):1074-85.

5. Su CT, Yang CH, Hsu KH, Chiu WK. Data mining for the diagnosis of type II diabetes from three-dimensional body surface anthropometrical scanning data. Computers & Mathematics with Applications 2006;51(6):1075-92.

6. Santhanam T, Padmavathi MS. Application of K-Means and Genetic Algorithms for Dimension Reduction by Integrating SVM for Diabetes Diagnosis. Procedia Computer Science 2015;47:76-83.

7. Chakraborty G, Chakraborty B. Multi-objective Optimization Using Pareto GA for Gene-Selection from Microarray Data for Disease Classification. IEEE International Conference on Systems, Man, and Cybernetics; 2013 Oct 13-16; Manchester, UK: IEEE; 2013. p. 2629-34.

8. Maheta HK, Dabhi VK. Classification of imbalanced data sets using Multi Objective Genetic International

(11)

22 23 -12 ): 1 ( 6 ; 2019 Informatics Biomedical and Health of Journal

Conference on Computer Communication and Informatics (ICCCI);2015 Jan 8-10; Coimbatore, India: IEEE; 2015.p. 1-6.

9. Holland JH. Adaptation in Natural and Artificial Systems: An Introductory Analysis with Applications to Biology, Control, and Artificial Intelligence. MIT press; 1992.

10. Antal B, Hajdu A. An ensemble-based system for automatic screening of diabetic retinopathy. Knowledge-Based Systems 2014;60:20-7.

11. Han J, Kamber, M, Pei J. Data Mining: Concepts and Techniques. 3th ed. USA: Morgan Kaufmann; 2011.

12. Goldberg DE, Holland JH. Genetic Algorithms and Machine Learning. Machine Learning 1988;3(2):95-9.

13. Alpaydin E. Voting over multiple condensed nearest neighbors. Artificial Intelligence Review 1997;11(1):115-32.

14. Kohavi R. A Study of Cross-validation and bootstrap for accuracy estimation and model selection. Proceedings of the 14th international joint conference on Artificial intelligence; 1995 Aug 20-25; Montreal, Quebec, Canada: Morgan Kaufmann Publishers Inc; p.1137–43.

15. De Jong KA. Analysis of the behavior of a class of genetic adaptive systems [dissertation]. Michigan: University of Michigan Ann Arbor, MI; 1975.

16. Cortes C, Vapnik V. Support-vector networks. Machine Learning1995;20(3):273-97.

17. Rosenblatt F. Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms. Spartan Books; 1962.

18. Rennie JD, Shih L, Teevan J, Karger DR. Tackling the poor assumptions of naive bayes text classifiers. In Proceedings of the Twentieth International Conference on International Conference on Machine Learning; 2003 Aug 21 – 24; Washington, DC, USA: AAAI Press; 2003. p. 616-23.

19. Purnami SW, Embong A, Zain JM, Rahayu SP. A new smooth support vector machine and its applications in diabetes disease diagnosis. Journal of Computer Science 2009;5(12):1003-8.

20. Barakat N, Bradley AP, Barakat MH. Intelligible support vector machines for diagnosis of diabetes mellitus. IEEE Transactions on Information Technology in Biomedicine 2010; 14(4): 1114-20.

21. Worachartcheewan A, Nantasenamat C, Isarankura-Na-Ayudhya C, Pidetcha P, Prachayasittikul V. Identification of metabolic syndrome using decision tree analysis. Diabetes Res Clin Pract 2010;90(1):e15-8.

22. Rudziński F. A multi-objective genetic

optimization of interpretability-oriented fuzzy rule-based classifiers. Applied Soft Computing 2016;38:118-33.

23. Richards G, Rayward-Smith VJ, Sonksen PH, Carey S, Weng C. Data mining for indicators of early mortality in a database of clinical records. Artif Intell Med 2001;22(3):215-31.

24. Breault JL, Goodall CR, Fos PJ. Data mining a diabetic data warehouse. Artif Intell Med 2002;26(1-2):37-54.

25. Huang Y, McCullagh P, Black N, Harper R. Feature selection and classification model construction on type 2 diabetic patients' data. Artif Intell Med 2007;41(3):251-62.

26. Lee WJ, Chong K, Chen JC, Ser KH, Lee YC, Tsou JJ, et al. Predictors of diabetes remission after bariatric surgery in Asia. Asian J Surg 2012;35(2):67-73.

27. Han J, Rodriguez JC, Beheshti M. Diabetes data analysis and prediction model discovery using rapidminer. Second International Conference on Future Generation Communication and Networking; 2008 Dec 13-15; Hainan Island, China: IEEE; 2008. p. 96-9.

(12)

Journal of Health and Biomedical Informatics

Medical Informatics Research Center 2019; 6(1): 12-23

Diabetes Prediction by Optimizing the Nearest Neighbor Algorithm Using

Genetic Algorithm

Momeny Mohammad1*, Latif Ali Mohammad2, Agha Sarram Mehdi 3, Hajmirzazade

Kazem4, Gharravi Sorayya5,NaghiboAlghara Seyed Mahammad6 Received: 16 May, 2018 Accepted: 29 Sep, 2018

Citation: Momeny M, Latif AM, Sarram R, Kazem Hajmirzazade K, Gharravi S, NaghiboAlghara SM. Diabetes Prediction by Optimizing the Nearest Neighbor Algorithm Using Genetic Algorithm. Journal of Health and Biomedical Informatics 2019; 6(1): 12-23. [In Persian]

1. Ph.D. Student, Electrical and Computer Engineering Dept., School of Electrical and Computer Engineering, Yazd University, Yazd, Iran

2.Assistant Professor, Electrical and Computer Engineering Dept., Yazd University, Yazd, Iran

3.Associate Professor of Computer Sciences, Electrical and Computer Engineering Dept., Yazd University, Yazd, Iran 4.Assistant Professor of Diseases and Diseases, Faculty of Medicine, Islamic Azad University, Yazd. Iran.

5.M.Sc. in Computer engineering(Software), Lecturer, Electrical and Computer Engineering Department, Computer Dept., Integrated Higher Education of Esfarayen, North Khorasan, Esfarayen, Iran

6.General Medicine, Faculty of Medicine, Islamic Azad University, Yazd, Iran

*Correspondence: Faculty of Electrical and Computer Engineering, Computer Department, Yazd University, Yazd, Iran.

Tel: 09159736003  Email: mohamad.momeny@stu.yazd.ac.ir

Introduction: Diabetes or diabetes mellitus is a metabolic disorder in body when the body does not produce insulin, and produced insulin cannot function normally. The presence of various signs and symptoms of this disease makes it difficult for doctors to diagnose. Data mining allows analysis of patients’ clinical data for medical decision making. The aim of this study was to provide a model for increasing the accuracy of diabetes prediction.

Method: In this study, the medical records of 1151 patients with diabetes were studied, with 19 features. Patients’ information were collected from the UCI standard database. Each patient has been followed for at least one year. Genetic Algorithm (GA) and the nearest neighbor algorithm were used to provide diabetes prediction model.

Results: It was revealed that the prediction accuracy of the proposed model equals 0.76. Also, for the methods of Naïve Bayes, Multi-layer perceptron (MLP) neural network, and support vector machine (SVM), the prediction accuracy was 0.62, 0.65, and 0.75, respectively.

Conclusion: In predicting diabetes, the proposed model has the lowest error rate and the highest accuracy compared to the other models. Naïve Bayes method has the highest error rate and the lowest accuracy.

Keywords: Prediction of diabetes, Genetic algorithm, Nearest neighbor algorithm, Data mining

Figure

Updating...

References