پیاده سازی مقاله: طبقه بندی زیرگروه ویروس آنفولانزا با استفاده از تکنیک های داده کاوی

چکیده:

آنفولانزا یک بیماری شدیدا مسری، حاد و تب زاست که در اثر ویروس آنفولانزا ایجاد می شود ، این ویروس از سه نوع تشکیل شد ه-است: نوع B، Aو C. در طی قرن گذشته، اپیدمی های مختلفی از آنفولانزا نوع A، مرگ و میر و خسارات سنگین اقتصادی به جامعه انسانی تحمیل کرده است. آنفولانزا A بر اساس آنتی ژن های سطحی اش، هماگلوتینین و نورامینیداس تقسیم بندی میشود. تا کنون61 زیرگروه از هماگلوتینین و 9 زیرگروه از نورامینیداس شناسایی شده است. تشخیص زودهنگام و دقیق زیرگروه ویروس امری حیاتی است. کارهای معدودی در حوزه داده کاوی در این راستا، انجام شده است که غالبا روی ناحیه محدودی از دیتاست و تنها برای چند زیرگروه رایج بوده است؛ در این پژوهش، دیتاست بزرگی شامل 43533 توالی ثبت شده آنفولانزا نوعA در کتابخانهNCBI از سال 1900 تا کنون در قالب 4 گروه استفاده شده است: توالی های DNA و پروتئینی آنتی ژن هماگلوتینین، توالیهایDNA و پروتئینی آنتی ژن نورامینیداس. پس از پیش پردازش های متعدد، با استفاده از طبقه بندی جنگل تصادفی، جنگلی از طبقه-بندهای مستقل از هم، مدل دقیقی برای تشخیص زیرگروه ویروس، بدست آمد. این مدل قادر به تشخیص ویروس از تمام زیرگروه-ها، بر اساس توالی هر کدام از آنتی ژن های هماگلوتینین و نورامینیداس با تشخیص و حساسیت 99% میباشد.

دریافت مقاله:

 لینک مقاله

دریافت پیاده سازی:

برای دریافت پیاده سازی مقاله مورد نظر، و یا اعمال بهبود در آن، با استفاده از لینک زیر، سفارش خود را ارسال نمایید.

سفارش انجام پروژه