۵۷ مطلب با موضوع «مقالات» ثبت شده است

یاده سازی پایان نامه: پیش بینی بستری مجدد در بیمارستان ها با تکنیک های داده کاوی

پیاده سازی پایان نامه: پیش بینی بستری مجدد در بیمارستان ها با تکنیک های داده کاوی

بهداشت و درمان به یکی از بزرگترین صنایع در سطح جهان تبدیل شده است و به همین دلیل منابع زیادی را مصرف می کند. در سال‌های اخیر بستری مجدد در بیمارستان به دلیل هزینه‌های غیرضروری در سیستم مراقبت‌های بهداشتی به موضوعی قابل توجه تبدیل شده است. بسیاری از بستری‌های مجدد قابل پیشگیری به کیفیت پایین مراقبت در طول اقامت بیمار در بیمارستان و همچنین به ضعیف فرآیند ترخیص مربوط می‌شود. در سال های اخیر به کارگیری تکنیک های داده کاوی توانسته مداخلات موثر و پیشگیرانه را برای آن اجرا کند.

  • شریف پژوه

پیاده سازی پایان نامه: داده کاوی برای انتخاب ویژگی در داده های بیان ژن

پیاده سازی پایان نامه: داده کاوی برای انتخاب ویژگی در داده های بیان ژن

شناسایی مهم‌ترین ژن‌ها و توالی‌های ژنی (عنوان ویژگی‌ها) ذخیره‌شده در مجموعه داده‌ای از ریزآرایه‌های بیان ژن یکی از مسائل مهم در حوزه ی پزشکی است. انتخاب مهم‌ترین ژن‌ها و طبقه‌بندی موارد بر اساس ژن‌های انتخابی با استفاده از تکنیک های داده کاوی یکی از راهکار های موجود در این زمینه است.

  • شریف پژوه

پیاده سازی پایان نامه: شناسایی موارد پرت در قیمت گذاری مسکن با تکنیک های داده کاوی

پیاده سازی پایان نامه: شناسایی موارد پرت در قیمت گذاری مسکن با تکنیک های داده کاوی

با توجه به اینکه برای افراد شناخت تغییر و تحول هایی که در آینده رخ می دهد اهمیت فراوانی دارد موضوعاتی که پیرامون پیش بینی می باشد برای افراد مورد توجه است. از جمله مواردی که در این بین اهمیت فراوانی دارد موضوعات پیرامون مسائل مالی از جمله پیش بینی قیمت مسکن می باشد. هدف از این تحقیق ارائه ی مدلی برای پیش بینی قیمت مسکن و پس از آن شناسایی موارد پرت در قیمت گذاری های انجام شده در این حوزه است.

  • شریف پژوه

پیاده سازی پایان نامه: تشخیص احتمالات مشکوک به پولشویی با استفاده از تکنیک های داده‌کاوی

پیاده سازی پایان نامه: تشخیص احتمالات مشکوک به پولشویی با استفاده از تکنیک های داده‌کاوی

در سال های اخیر موضوع پولشویی یکی از مباحث مهم اقتصادی می باشد که معضلات فراوانی را برای شرکت های کوچک و بزرگ ایجاد کرده است. از این رو راهکار های متعددی برای حل این مشکل در سراسر جهان پیشنهاد شده است. با توجه به گستردگی داده های موجود در این زمینه یکی از راهکار های حل این مسئله استفاده از تکنیک های داده کاوی می باشد.

  • شریف پژوه

پیاده سازی پایان نامه: پیش بینی میزان بارش فصلی و ماهیانه براساس داده کاوی

پیاده سازی پایان نامه: پیش بینی میزان بارش فصلی و ماهیانه براساس داده کاوی

داده‌کاوی هواشناسی شکلی از داده‌کاوی است که به یافتن الگوهای پنهان در داده‌های هواشناسی که تا حد زیادی در دسترس است می‌پردازد، به طوری که اطلاعات بازیابی شده می‌تواند به دانش قابل استفاده تبدیل شود. آب و هوا یکی از داده های هواشناسی است که سرشار از دانش مهم است. مهمترین عنصر اقلیمی که بر بخش های مختلف مانند کشاورزی تأثیر می گذارد، بارندگی است. بنابراین پیش‌بینی بارندگی در کشورهای مختلف به یک موضوع مهم تبدیل شده است. در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای پیش بینی بارندگی ارائه می شود.

  • شریف پژوه

پیاده سازی پایان نامه: پیش بینی نقص نرم افزار با استفاده از تکنیک های داده کاوی

پیاده سازی پایان نامه: پیش بینی نقص نرم افزار با استفاده از تکنیک های داده کاوی

فرآیند تست یکی از مهمترین فعالیت ها در توسعه و نگهداری نرم افزار است و زمان و منابع قابل توجهی را مصرف می کند. از آنجایی که توزیع اشکالات بین ماژول‌های نرم‌افزار یکنواخت نیست این مسئله در بسیاری از مواقع چالش برانگیز می باشد. بنابراین، پیش‌بینی نقص نرم‌افزار تکنیک مهمی است که در تضمین کیفیت نرم‌افزار مورد استفاده قرار می‌گیرد.  در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای پیش بینی نقص نرم افزار ارائه می شود.

  • شریف پژوه

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی پیش بینی قیمت سهام

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی پیش بینی قیمت سهام 

سرمایه گذاری در سهام عرضه شده در بورس اوراق بهادار یکی از گزینه های پرسود در بازار سرمایه است. با این وجود بازار سهام دارای سیستمی غیر خطی و آشوب گونه است که تحت تاثیر شرایط سیاسی، اقتصادی و روانشناسی می باشد. از این رو نحوه ی مدیریت و پیش بینی قیمت سهام برای سرمایه گذاران در بازار سهام اهمیت فراوانی دارد. برای حل مسئله ی پیش بینی قیمت سهام می توان از سیستم های هوشمند غیرخطی استفاده نمود. در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای حل این مسئله ارائه می شود.

  • شریف پژوه

پیاده سازی پایان نامه: تخمین مدت زمان جراحی از طربق تکنیک های داده کاوی

پیاده سازی پایان نامه: تخمین مدت زمان جراحی از طربق تکنیک های داده کاوی 

اتاق های عمل  یکی از گران ترین و سودآورترین منابع در یک سیستم بیمارستانی هستند. مدیران بیمارستان ها  همواره تلاش می کنند تا از این منابع به بهترین شکل ممکن استفاده کنند. به طور سنتی، مدت زمان جراحی با استفاده از آمار ها و اطلاعات موجود تخمین زده می شود. در این راستا برای غلبه بر مشکلات موجود در تخمین با انواع روش های سنتی و کمبود حجم نمونه کافی، روش های مبتنی بر داده کاوی پیشنهاد می شود که با استفاده از تکنیک های  موجود مدت زمان مورد نظر را پیش بینی خواهند کرد.

در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای پیش بینی مدت زمان جراحی ارائه می شود.

  • شریف پژوه

پیاده سازی پایان نامه: پیش بینی مصرف انرژی ساختمان با استفاده از تکنیک های داده کاوی

پیاده سازی پایان نامه: پیش بینی مصرف انرژی ساختمان با استفاده از تکنیک های داده کاوی

پیش‌بینی هوشمند مصرف انرژی به‌ویژه برای ساختمان‌ها مسئله ی مهمی است، زیرا مصرف انرژی ساختمان‌ها روز به روز در حال افزایش است و تقریباً به 40 درصد مصرف انرژی اولیه در کشورهای توسعه‌یافته می‌رسد. در سال های اخیر مصرف انرژی به دلیل رشد جمعیت به تدریج افزایش یافته است. افزایش مصرف انرژی ساختمان ها، اجباری را در کشورهای مختلف برای مدیریت و کاهش هر چه بیشتر مصرف انرژی به منظور ارتقای بهره وری انرژی ایجاد می کند.

در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای پیش بینی مصرف انرژی ساختمان ارائه می شود.

  • شریف پژوه

پیاده سازی مقاله: تشخیص بیماری آریتمی قلبی با استفاده از یادگیری عمیق

پیاده سازی مقاله: تشخیص بیماری آریتمی قلبی با استفاده از یادگیری عمیق

چکیده:

بیماریهای قلبی یکی از شایعترین انواع بیماریها است که آمار بسیار بالایی از مرگ و میر را به خوداختصاص میدهد. آریتمی ها ضربانهای غیر طبیعی هستند، که موجب میشوند قلب خیلی سریع تاکی کارد یا خیلی آهسته برادی کارد بزند و پمپاژ غیر مؤثر داشته باشد . تجزیه وتحلیل خودکار الکتروکاردیوگرام برای تشخیص ودرمان بیماران قلبی حیاتی است. روشهای متعددی از قبیل درخت تصمیم، شبکه عصبی، SVM ، بیزین و k نزدیکترین همسایگی برای تحلیل سیگنالهای ECG درتشخیص آریتمی مطرح گردیده اند. در این مقاله ضمن بررسی اجمالی این روش ها، بکارگیری شبکهعصبی عمیق برای تشخیص انواع آریتمی پیشنهاد شده است. در آزمایشات انجام شده روی دادگان آریتمی UCI عملکرد بهتر روش پیشنهادی مشاهده گردید.
  • شریف پژوه

پیاده سازی مقاله: زمان بندی وظایف در محیط ابری با استفاده از الگوریتم ژنتیک

پیاده سازی مقاله: زمان بندی وظایف در محیط ابری با استفاده از الگوریتم ژنتیک

چکیده:

با رشد مجازی سازی در سیستم های و تکنولوژی های جالب امروزی ، رایانش ابری به عنوان بستر جدید محاسباتی ظهور کرد. هدف نهایی رایانش ابری جلب رضایت کاربران بر اساس کیفیت سرویس تضمین شده برای آنها و کسب سود برای سرویس دهنده ی رایانش ابری می باشد، بنابراین لازم است که یک الگوریتم زمان بندی به هدف دست پیدا کند. اما مدل های موجود به دلیل اینکه فقط روی افزایش کارایی سیستم کار می کنند با محیط ابر قابل تطبیق نیستند، بطوریکه اکثر روش ها زمان بندی در محاسبات کلاستری فقط در زمینه ی بهینه کردن زمان تکمیل شده کارهای دسته ای، تلاش می کنند. زمان بندهای محیط ابر باید کیفیت سرویس موردنظر کاربر را فراهم کنند تا رضایت وی جلب شود. به همین منظور در این مقاله روشی برای حل مسئله ی زمان بندی بر اساس الگوریتم ژنتیک ارائه خواهد شد. در مدل ارائه شده، زمان بند در هر چرخه ی زمان بندی تابع زمان بندی الگوریتم ژنتیک را فراخوانی می کند، این تابع مجموعه ای از کارهای زمان بندی شده را ایجاد کرده و کیفیت هر یک از مجموعه ها را بر اساس میزان تامین رضایت کاربران و دسترسی پذیری ماشین های مجازی ارزیابی می کند و این تابع تا رسیدن به زمان بندی بهینه ادامه پیدا می کند. نتایج شبیه سازی های انجام شده میزان کارایی و تاثیر بیشتر مدل ارائه شده نسبت به مدل های موجود مانند روش زمان بندی نوبت چرخشی را نشان می دهد.
  • شریف پژوه

پیاده سازی مقاله: تحلیل روش های داده کاوی در پیش بینی ریزش مشتریان مخابرات

پیاده سازی مقاله: تحلیل روش های داده کاوی در پیش بینی ریزش مشتریان مخابرات

چکیده:

امروزه عملیات داده کاوی به صورت گسترده توسط تمامی شرکت ھای مشتری محور، از جمله مخابرات استفاده می شود. مھم ترین چالش و مسیله ای که صنعت مخابرات با آن روبه رو است، ریزش مشتری است. در این مقاله به بررسی تکنیک ھای پیش بینی ریزش مشتریان در مخابرات پرداخته ایم. به این نتیجه رسیدیم که تکنیک ھای مبتنی بر درخت تصمیم گیری دقیق تر از تکنیک ھای مبتنی بر رگرسیون است. روش ھای داده کاوی مبتنی بر شبکه ھای عصبی در مقایسه با تکنیک ھای درخت تصمیم گیری، نتایج بھتری ارایه می دھند. روش ھای مبتنی بر درخت تصمیم به ویژه 0/5C و CART از نظر دقت عملکرد نتایج بھتری نسبت به برخی از تکنیک ھای داده کاوی موجود مانند رگرسیون، دارند.
  • شریف پژوه

پیاده سازی مقاله: تجزیه و تحلیل داده های بزرگ تجاری در رایانش ابری مبتنی بر آپاچی اسپارک

پیاده سازی مقاله: تجزیه و تحلیل داده های بزرگ تجاری در رایانش ابری مبتنی بر آپاچی اسپارک

چکیده:

حجم بالایی از داده های تجاری توسط برنامه های کاربردی یا در محیط وب مرتبا ایجاد می شود و نیاز است که این داده ها مورد تجزیه و تحلیل قرار گرفته تا دانش نهفته درون آنها آشکار شود. روش های یادگیری ماشین و داده کاوی از جمله تکنیک های مهم در تحلیل داده های تجاری است اما چالش آنها در این است که توانایی آنها برای پردازش داده های بزرگ اندک است و نیاز است از روش های توزیع شده آنها استفاده شود. در این پژوهش یک روش مبتنی بر پردازش توزیع شده توسط فناوری آپاچی اسپارک ارائه شده تا روش های داده کاوی و یادگیری ماشین مانند تکنیک های درخت تصمیم گیری، جنگل تصادفی و رگرسیون در این بستر اجرایی شده و تحلیل داده های تجاری در زمان واقعی انجام شود. برای پیاده سازی روش پیشنهادی از داده های مرتبط با مشتریان در کاربردهای تجاری و محیط پردازش ابری آپاچی اسپارک استفاده شده است. نتایج نشان می دهد از بین تکنیک های درخت تصمیم گیری، جنگل تصادفی و رگرسیون در آپاچی اسپارک و حالت غیرتوزیع شده تکنیک رگرسیون دارای حداقل خطای ممکن برای تحلیل داده های تجاری است و از طرفی جنگل تصادفی در بین تکنکی های درخت تصمیم گیری، جنگل تصادفی و رگرسیون چه در حالت توزیع شده و چه در حالت غیرتوزیع شده دارای حداقل زمان اجراء برای تحلیل داده ها است.
  • شریف پژوه

پیاده سازی مقاله: بررسی کاربرد چارچوب های تحلیل عظیم داده ها در پیش بینی زلزله

پیاده سازی مقاله: بررسی کاربرد چارچوب های تحلیل عظیم داده ها در پیش بینی زلزله

چکیده:

این مقاله به بررسی کاربرد چارچوب های عظیم داده ها از جمله آپاچی هادوپ و آپاچی اسپارک در پیش بینی زلزله پرداخته است. برای این منظور، ابتدا چارچوب های هادوپ و اسپارک، نصب و پیکربندی شده، سپس از ابزار تحلیل و داده کاوی رپیدماینر و الگوریتم ماشین بردار پشتیبان غیرخطی با تابع کرنل RBF باتوجه به داده های پژوهش جهت مدل سازی بر روی این 2 چارچوب استفاده گردید. سپس همین فرآیند بدون استفاده از چارچوب های هادوپ و اسپارک تکرار گردید. مقایسه نتایج نشان می دهد؛ در مدلی که از چارچوب های هادوپ و اسپارک بعنوان زیرساخت پردازش استفاده نشده است، زمان اجرا حدودا 4 0 برابر حالتی است که از هادوپ و اسپارک استفاده گردیده است. ولیکن درخصوص خروجی مدل در رابطه با پیش بینی بزرگای زلزله، در هر دو مدل نتایج یکسان بوده و تفاوتی وجود نداشته است.
  • شریف پژوه

پیاده سازی مقاله: پردازش موازی در داده کاوی

پیاده سازی مقاله: پردازش موازی در داده کاوی

چکیده:

با افزایش انفجار گونه داده های بزرگ در زمینه های صنعتی و علمی، برای کار بر روی این داده ها و تجزیه و تحلیل آنها، سیستم های پردازش داده های بزرگ بسیار ضروری به نظر می رسد. مپ ریدوس و اسپارک دو محدوده محاسبات خوشه ای بسیار محبوب برای تجزیه و تحلیل داده ها در مقیاس بزرگ هستند، در حال حاضر مسلما اسپارک از لحاظ ویژگی هایی مانند تحمل خطا، عملکرد بالای پردازش داده ها در حافظه و مقیاس پذیری، جزء پیشرفته ترین سیستم های محاسباتی داده های بزرگ می باشد. اسپارک یه مدل برنامه ریزی آردیدی (مجموعه داده های توزیع شده) را در اختیار شما قرار می دهد، مدل برنامه نویسی با مجموعه ای از تحول ارائه شده و اپراتورهایی که عملکرد عملیات را می توان توسط کاربران با توجه به برنامه های خود را سفارشی کنند. اسپارک در اصل به عنوان یک سیستم پردازش سریع و کلی ارائه شده است که با توجه به شرایط مختلف از زمان معرفی آن، تلاش زیادی برای انجام کارهای تحقیقاتی روی آن انجام شده است. در این مقاله ما دلایل اهمیت داده پردازی موزای را بررسی نمودیم و در نهایت دو مدل محاسباتی مپ ریدوس و اسپارک را بعنوان ابزارهای رایج و مهم دادهپردازی موازی، بررسی و در مواردی با هم مقایسه نمودیم. در این بررسی نهایتا مشخص شد، بجز عملیات مرتب سازی، اسپارک گزینه بهتری برای داده کاوی موازی است.

  • شریف پژوه

پیاده سازی مقاله: شناسایی کاربران اسپم در شبکه های اجتماعی با استفاده از الگوریتم KNN

پیاده سازی مقاله: شناسایی کاربران اسپم در شبکه های اجتماعی با استفاده از الگوریتم KNN

چکیده:

امروزه با فراگیر شدن اینترنت، استفاده از شبکه های اجتماعی نیز گسترش یافته است. هدف افراد از عضویت در اینگونه شبکه ها به اشتراک گذاشتن داده ها در زمینه های مختلف است. این شبکه ها به کاربران اجازه میدهند تا مطالب خود را در زمینه های گوناگون گسترش دهند. مشکل زمانی پیش می آید که کاربری بخواهد از این قابلیت سوءاستفاده کرده و مطالب اسپم ارسال نماید. ما در این مقاله شناسایی اینگونه کاربران را مد نظر قرار داده ایم. برای بررسی این موضوع از پایگاه داده یکی از این شبکه ها استفاده کردیم. در مرحله یادگیری، به کمک کاربران عضو، اسپمرها را شناسایی کرده و خصوصیاتی را که مرتبط با این گونه کاربران هستند، درنظر گرفته ایم. براین اساس، کاربران جدید با درنظر گرفتن خصوصیاتشان و الگوریتمknn در یکی از دسته های اسپمر یا غیراسپمر طبقه بندی می شوند. در این روش حدود 75 درصد از اسپمرها به درستی تشخیص داده شدهاند. در مرحله بعدی، دسته بندی بر اساس مطالب کاربران انجام می شود. با این روش دقت تشخیص اسپمرها افزایش یافته و به 84 درصد میرسد.

  • شریف پژوه

پیاده سازی مقاله: تشخیص احساس از روی گفتار فارسی با استفاده از ماشین بردار پشتیبان

پیاده سازی مقاله: تشخیص احساس از روی گفتار فارسی با استفاده از ماشین بردار پشتیبان

چکیده:

تشخیص خودکار احساس از روی گفتار مساله بسیار مهم، در عرصه تعامل انسان و ماشین است.قابلیت تشخیص احساس توسط کامپیوتر با دقتی همانند انسان، به منظور ایجاد رابطه طبیعی و دوستانهبین انسان و کامپیوتر، بسیار حائز اهمیت است. با وجود پیشرفتهای گسترده در حوزهً پردازشگفتار، استخراج و درک احساس پنهان در گفتار انسان، همچون خشم، شادی و جز اینها، از یکسو و تولید گفتار احساسی مناسب از سوی دیگر، یکی از چالشهای مهم برای ساخت ماشینهایهوشمند محسوب میشود. در این مقاله، یک سیستم تشخیص خودکار احساس ارائه شده است.سیستم معرفی شده، شامل دو بخش اصلی، استخراج ویژگی و آموزش مدل دسته بند می باشد.درمرحله استخراج ویژگی، ویژگیهای عروضی از جمله فرکانس گام، شدت و ویژگی های کلی ازسیگنال گفتار به ازای شش حس متفاوت خشم، تنفر، ترس، شادی، غم و خنثی استخراج شده است.پس از تشکیل بردار ویژگی، با روش دستهبند ماشین بردار پشتیبان آموزش داده شده اند. در نهایت،نتیجه محاسبات انجام شده حاکی از میانگین دقت 82/744 درصد می باشد که در مقایسه با روش های دیگر از کارایی بالاتری برخوردار است.

  • شریف پژوه

پیاده سازی مقاله: مروری بر روش های پیش بینی نقص های نرم افزاری مبتنی بر یادگیری ماشین

پیاده سازی مقاله: مروری بر روش های پیش بینی نقص های نرم افزاری مبتنی بر یادگیری ماشین

چکیده:

پیش بینی نقص نرم افزار یکی از مهمترین موارد پژوهشی در حوزه مهندسی نرم افزار می باشد. وجود نقص در سیستمنرم افزاری یک تهدید جدی برای کیفیت نرم افزار به شمار میرود و موجب عدم انطباق محصول با نیاز مشتری می شود. ازطرفی یکی از فاکتورهایی که منجر به تعداد بالای خطاهای نرم افزاری و در نتیجه تولید نرم افزاری با کیفیت پایین میشود،محدودیت منابع تضمین کیفیت می باشد. بنابراین با توجه به محدودیت منابع بهتر است ابتدا ماژول هایی که مستعد نقصهستند شناسایی شده، سپس منابع را برای رفع نقص صرف این ماژول ها کنیم. مدلهای تشخیص نقص در ماژول هاینرم افزاری تاکنون توسط محققان زیادی مورد مطالعه قرار گرفته است و این در حالی است که بسیاری از روشهای پیش بینیماژول های نقصدار هنوز در مرحله اولیه می باشند و نیازمند تحقیق بیشتر برای رسیدن به مدل های قوی هستند. دراین مقالهبه بررسی ادبیات مهندسی نرمافزار در مورد پیش بینی نقص های نرم افزاری خواهیم پرداخت. توضیحات این مقاله منعکسکننده اطلاعات اکثر مقالات چاپ شده در زمینه تحلیل و بررسی مدلهای پیش بینی نقص نرم افزاری می باشد.

  • شریف پژوه

پیاده سازی مقاله: پیشبینی بیشینه بار مصرفی در بازار برق با استفاده از سریهای زمانی

پیاده سازی مقاله: پیشبینی بیشینه بار مصرفی در بازار برق با استفاده از سریهای زمانی

چکیده:

یک سری زمانی شامل مجموعه مشاهداتی است که بر حسب زمان مرتب شده باشند،نتایجی که از تحلیل این سریها به دست می آیند دارای کاربردهای اساسی در زمینه های مختلف از جمله اقتصاد و علوم مهندسی هستند. تجزیه و تحلیل چنینمشاهداتی نیازمند روشهایی است که قسمت مهمی از علم آمار را در بر می گیرند. هدف ما در این پروژه برازش یک مدل مناسب بر روی ماکزیمم بار مصرفی پست انتقال چمران شهرستان کرمانشاه در هر روز می باشد. داده های مورد مطالعه شامل ماکزیمم بار مصرفی هر روز و در طول سال 1393 می باشد. به کمک این مدل می توانیم ماکزیمم بار مصرفی را برای آیندهپیش بینی و کنترل نماییم. پارامترهای مختلف سری زمانی با استفاده از نرم افزار MINTAB محاسبه شده است. مطالعات انجام شده بر اساس داده های یک ساله می باشد که چناچه حجم اطلاعات ورودی افزایش یابد و داده های سالهای گذشته نیز به آن اضافه شود نتایج دقیق تری بدست خواهد آمد

  • شریف پژوه

پیاده سازی مقاله: طبقه بندی زیرگروه ویروس آنفولانزا با استفاده از تکنیک های داده کاوی

پیاده سازی مقاله: طبقه بندی زیرگروه ویروس آنفولانزا با استفاده از تکنیک های داده کاوی

چکیده:

آنفولانزا یک بیماری شدیدا مسری، حاد و تب زاست که در اثر ویروس آنفولانزا ایجاد می شود ، این ویروس از سه نوع تشکیل شد ه-است: نوع B، Aو C. در طی قرن گذشته، اپیدمی های مختلفی از آنفولانزا نوع A، مرگ و میر و خسارات سنگین اقتصادی به جامعه انسانی تحمیل کرده است. آنفولانزا A بر اساس آنتی ژن های سطحی اش، هماگلوتینین و نورامینیداس تقسیم بندی میشود. تا کنون61 زیرگروه از هماگلوتینین و 9 زیرگروه از نورامینیداس شناسایی شده است. تشخیص زودهنگام و دقیق زیرگروه ویروس امری حیاتی است. کارهای معدودی در حوزه داده کاوی در این راستا، انجام شده است که غالبا روی ناحیه محدودی از دیتاست و تنها برای چند زیرگروه رایج بوده است؛ در این پژوهش، دیتاست بزرگی شامل 43533 توالی ثبت شده آنفولانزا نوعA در کتابخانهNCBI از سال 1900 تا کنون در قالب 4 گروه استفاده شده است: توالی های DNA و پروتئینی آنتی ژن هماگلوتینین، توالیهایDNA و پروتئینی آنتی ژن نورامینیداس. پس از پیش پردازش های متعدد، با استفاده از طبقه بندی جنگل تصادفی، جنگلی از طبقه-بندهای مستقل از هم، مدل دقیقی برای تشخیص زیرگروه ویروس، بدست آمد. این مدل قادر به تشخیص ویروس از تمام زیرگروه-ها، بر اساس توالی هر کدام از آنتی ژن های هماگلوتینین و نورامینیداس با تشخیص و حساسیت 99% میباشد.

  • شریف پژوه
موضوعات