۶۶ مطلب با کلمه‌ی کلیدی «پیاده سازی مقاله» ثبت شده است

یاده سازی پایان نامه: پیش بینی بستری مجدد در بیمارستان ها با تکنیک های داده کاوی

پیاده سازی پایان نامه: پیش بینی بستری مجدد در بیمارستان ها با تکنیک های داده کاوی

بهداشت و درمان به یکی از بزرگترین صنایع در سطح جهان تبدیل شده است و به همین دلیل منابع زیادی را مصرف می کند. در سال‌های اخیر بستری مجدد در بیمارستان به دلیل هزینه‌های غیرضروری در سیستم مراقبت‌های بهداشتی به موضوعی قابل توجه تبدیل شده است. بسیاری از بستری‌های مجدد قابل پیشگیری به کیفیت پایین مراقبت در طول اقامت بیمار در بیمارستان و همچنین به ضعیف فرآیند ترخیص مربوط می‌شود. در سال های اخیر به کارگیری تکنیک های داده کاوی توانسته مداخلات موثر و پیشگیرانه را برای آن اجرا کند.

  • شریف پژوه

پیاده سازی پایان نامه: داده کاوی برای انتخاب ویژگی در داده های بیان ژن

پیاده سازی پایان نامه: داده کاوی برای انتخاب ویژگی در داده های بیان ژن

شناسایی مهم‌ترین ژن‌ها و توالی‌های ژنی (عنوان ویژگی‌ها) ذخیره‌شده در مجموعه داده‌ای از ریزآرایه‌های بیان ژن یکی از مسائل مهم در حوزه ی پزشکی است. انتخاب مهم‌ترین ژن‌ها و طبقه‌بندی موارد بر اساس ژن‌های انتخابی با استفاده از تکنیک های داده کاوی یکی از راهکار های موجود در این زمینه است.

  • شریف پژوه

پیاده سازی پایان نامه: تشخیص نفوذ با استفاده از روش های ترکیبی داده کاوی

پیاده سازی پایان نامه: تشخیص نفوذ با استفاده از روش های ترکیبی داده کاوی

با رشد سریع اینترنت، حملات سایبری به شبکه ها و سیستم های رایانه ای نیز به سرعت افزایش یافته است. به عنوان یک اقدام احتیاطی در برابر این حملات، سیستم‌های تشخیص نفوذ (IDS) در سیستم‌های شبکه مستقر شده‌اند. سیستم‌های تشخیص نفوذ بخشی از دومین خط دفاعی یک سیستم هستند.. آن ها را می توان همراه با سایر اقدامات امنیتی مانند کنترل دسترسی، مکانیسم های احراز هویت و تکنیک های رمزگذاری به منظور ایمن سازی بهتر سیستم ها در برابر حملات سایبری مستقر کرد. استفاده از ترکیب تکنیک های داده کاوی راهکاری برای ارائه ی یک سیستم تشخیص نفوذ موثر می باشد.

  • شریف پژوه

پیاده سازی پایان نامه: شناسایی موارد پرت در قیمت گذاری مسکن با تکنیک های داده کاوی

پیاده سازی پایان نامه: شناسایی موارد پرت در قیمت گذاری مسکن با تکنیک های داده کاوی

با توجه به اینکه برای افراد شناخت تغییر و تحول هایی که در آینده رخ می دهد اهمیت فراوانی دارد موضوعاتی که پیرامون پیش بینی می باشد برای افراد مورد توجه است. از جمله مواردی که در این بین اهمیت فراوانی دارد موضوعات پیرامون مسائل مالی از جمله پیش بینی قیمت مسکن می باشد. هدف از این تحقیق ارائه ی مدلی برای پیش بینی قیمت مسکن و پس از آن شناسایی موارد پرت در قیمت گذاری های انجام شده در این حوزه است.

  • شریف پژوه

پیاده سازی پایان نامه: تشخیص احتمالات مشکوک به پولشویی با استفاده از تکنیک های داده‌کاوی

پیاده سازی پایان نامه: تشخیص احتمالات مشکوک به پولشویی با استفاده از تکنیک های داده‌کاوی

در سال های اخیر موضوع پولشویی یکی از مباحث مهم اقتصادی می باشد که معضلات فراوانی را برای شرکت های کوچک و بزرگ ایجاد کرده است. از این رو راهکار های متعددی برای حل این مشکل در سراسر جهان پیشنهاد شده است. با توجه به گستردگی داده های موجود در این زمینه یکی از راهکار های حل این مسئله استفاده از تکنیک های داده کاوی می باشد.

  • شریف پژوه

پیاده سازی پایان نامه: پیش بینی میزان بارش فصلی و ماهیانه براساس داده کاوی

پیاده سازی پایان نامه: پیش بینی میزان بارش فصلی و ماهیانه براساس داده کاوی

داده‌کاوی هواشناسی شکلی از داده‌کاوی است که به یافتن الگوهای پنهان در داده‌های هواشناسی که تا حد زیادی در دسترس است می‌پردازد، به طوری که اطلاعات بازیابی شده می‌تواند به دانش قابل استفاده تبدیل شود. آب و هوا یکی از داده های هواشناسی است که سرشار از دانش مهم است. مهمترین عنصر اقلیمی که بر بخش های مختلف مانند کشاورزی تأثیر می گذارد، بارندگی است. بنابراین پیش‌بینی بارندگی در کشورهای مختلف به یک موضوع مهم تبدیل شده است. در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای پیش بینی بارندگی ارائه می شود.

  • شریف پژوه

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی پیش بینی قیمت سهام

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی پیش بینی قیمت سهام 

سرمایه گذاری در سهام عرضه شده در بورس اوراق بهادار یکی از گزینه های پرسود در بازار سرمایه است. با این وجود بازار سهام دارای سیستمی غیر خطی و آشوب گونه است که تحت تاثیر شرایط سیاسی، اقتصادی و روانشناسی می باشد. از این رو نحوه ی مدیریت و پیش بینی قیمت سهام برای سرمایه گذاران در بازار سهام اهمیت فراوانی دارد. برای حل مسئله ی پیش بینی قیمت سهام می توان از سیستم های هوشمند غیرخطی استفاده نمود. در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای حل این مسئله ارائه می شود.

  • شریف پژوه

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی زمان بندی کار ها

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی زمان بندی کار ها 

مسئله ی زمان‌بندی کارها (Job shop scheduling) یک مسئلهی بهینه‌سازی علوم رایانه و تحقیق در عملیات است که در آن کار های ایده‌آل به منابع در زمان‌های خاصی نسبت داده می‌شوند. در این مسئله n کار j1, j2, …, jn با اندازه‌های متفاوت که باید روی m ماشین یکسان زمان‌بندی شوند در تلاشند تا زمان کل(makespan)  را به حداقل برسانند. زمان کل مجموع زمان لازم برای انجام همه ی کار است. امروزه، این مسئله به عنوان یک مسئله ی پویا مطرح می‌شود، که با ارائه شدن هر کار، الگوریتم پویا باید با اطلاعات موجود تصمیم‌گیری کند قبل از اینکه کار بعدی مطرح شود.

در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای حل مسئله ی زمان بندی کار ها ارائه می شود.

  • شریف پژوه

پیاده سازی مقاله: زمان بندی وظایف در محیط ابری با استفاده از الگوریتم ژنتیک

پیاده سازی مقاله: زمان بندی وظایف در محیط ابری با استفاده از الگوریتم ژنتیک

چکیده:

با رشد مجازی سازی در سیستم های و تکنولوژی های جالب امروزی ، رایانش ابری به عنوان بستر جدید محاسباتی ظهور کرد. هدف نهایی رایانش ابری جلب رضایت کاربران بر اساس کیفیت سرویس تضمین شده برای آنها و کسب سود برای سرویس دهنده ی رایانش ابری می باشد، بنابراین لازم است که یک الگوریتم زمان بندی به هدف دست پیدا کند. اما مدل های موجود به دلیل اینکه فقط روی افزایش کارایی سیستم کار می کنند با محیط ابر قابل تطبیق نیستند، بطوریکه اکثر روش ها زمان بندی در محاسبات کلاستری فقط در زمینه ی بهینه کردن زمان تکمیل شده کارهای دسته ای، تلاش می کنند. زمان بندهای محیط ابر باید کیفیت سرویس موردنظر کاربر را فراهم کنند تا رضایت وی جلب شود. به همین منظور در این مقاله روشی برای حل مسئله ی زمان بندی بر اساس الگوریتم ژنتیک ارائه خواهد شد. در مدل ارائه شده، زمان بند در هر چرخه ی زمان بندی تابع زمان بندی الگوریتم ژنتیک را فراخوانی می کند، این تابع مجموعه ای از کارهای زمان بندی شده را ایجاد کرده و کیفیت هر یک از مجموعه ها را بر اساس میزان تامین رضایت کاربران و دسترسی پذیری ماشین های مجازی ارزیابی می کند و این تابع تا رسیدن به زمان بندی بهینه ادامه پیدا می کند. نتایج شبیه سازی های انجام شده میزان کارایی و تاثیر بیشتر مدل ارائه شده نسبت به مدل های موجود مانند روش زمان بندی نوبت چرخشی را نشان می دهد.
  • شریف پژوه

پیاده سازی مقاله: تحلیل روش های داده کاوی در پیش بینی ریزش مشتریان مخابرات

پیاده سازی مقاله: تحلیل روش های داده کاوی در پیش بینی ریزش مشتریان مخابرات

چکیده:

امروزه عملیات داده کاوی به صورت گسترده توسط تمامی شرکت ھای مشتری محور، از جمله مخابرات استفاده می شود. مھم ترین چالش و مسیله ای که صنعت مخابرات با آن روبه رو است، ریزش مشتری است. در این مقاله به بررسی تکنیک ھای پیش بینی ریزش مشتریان در مخابرات پرداخته ایم. به این نتیجه رسیدیم که تکنیک ھای مبتنی بر درخت تصمیم گیری دقیق تر از تکنیک ھای مبتنی بر رگرسیون است. روش ھای داده کاوی مبتنی بر شبکه ھای عصبی در مقایسه با تکنیک ھای درخت تصمیم گیری، نتایج بھتری ارایه می دھند. روش ھای مبتنی بر درخت تصمیم به ویژه 0/5C و CART از نظر دقت عملکرد نتایج بھتری نسبت به برخی از تکنیک ھای داده کاوی موجود مانند رگرسیون، دارند.
  • شریف پژوه

پیاده سازی مقاله: تجزیه و تحلیل داده های بزرگ تجاری در رایانش ابری مبتنی بر آپاچی اسپارک

پیاده سازی مقاله: تجزیه و تحلیل داده های بزرگ تجاری در رایانش ابری مبتنی بر آپاچی اسپارک

چکیده:

حجم بالایی از داده های تجاری توسط برنامه های کاربردی یا در محیط وب مرتبا ایجاد می شود و نیاز است که این داده ها مورد تجزیه و تحلیل قرار گرفته تا دانش نهفته درون آنها آشکار شود. روش های یادگیری ماشین و داده کاوی از جمله تکنیک های مهم در تحلیل داده های تجاری است اما چالش آنها در این است که توانایی آنها برای پردازش داده های بزرگ اندک است و نیاز است از روش های توزیع شده آنها استفاده شود. در این پژوهش یک روش مبتنی بر پردازش توزیع شده توسط فناوری آپاچی اسپارک ارائه شده تا روش های داده کاوی و یادگیری ماشین مانند تکنیک های درخت تصمیم گیری، جنگل تصادفی و رگرسیون در این بستر اجرایی شده و تحلیل داده های تجاری در زمان واقعی انجام شود. برای پیاده سازی روش پیشنهادی از داده های مرتبط با مشتریان در کاربردهای تجاری و محیط پردازش ابری آپاچی اسپارک استفاده شده است. نتایج نشان می دهد از بین تکنیک های درخت تصمیم گیری، جنگل تصادفی و رگرسیون در آپاچی اسپارک و حالت غیرتوزیع شده تکنیک رگرسیون دارای حداقل خطای ممکن برای تحلیل داده های تجاری است و از طرفی جنگل تصادفی در بین تکنکی های درخت تصمیم گیری، جنگل تصادفی و رگرسیون چه در حالت توزیع شده و چه در حالت غیرتوزیع شده دارای حداقل زمان اجراء برای تحلیل داده ها است.
  • شریف پژوه

پیاده سازی مقاله: بررسی کاربرد چارچوب های تحلیل عظیم داده ها در پیش بینی زلزله

پیاده سازی مقاله: بررسی کاربرد چارچوب های تحلیل عظیم داده ها در پیش بینی زلزله

چکیده:

این مقاله به بررسی کاربرد چارچوب های عظیم داده ها از جمله آپاچی هادوپ و آپاچی اسپارک در پیش بینی زلزله پرداخته است. برای این منظور، ابتدا چارچوب های هادوپ و اسپارک، نصب و پیکربندی شده، سپس از ابزار تحلیل و داده کاوی رپیدماینر و الگوریتم ماشین بردار پشتیبان غیرخطی با تابع کرنل RBF باتوجه به داده های پژوهش جهت مدل سازی بر روی این 2 چارچوب استفاده گردید. سپس همین فرآیند بدون استفاده از چارچوب های هادوپ و اسپارک تکرار گردید. مقایسه نتایج نشان می دهد؛ در مدلی که از چارچوب های هادوپ و اسپارک بعنوان زیرساخت پردازش استفاده نشده است، زمان اجرا حدودا 4 0 برابر حالتی است که از هادوپ و اسپارک استفاده گردیده است. ولیکن درخصوص خروجی مدل در رابطه با پیش بینی بزرگای زلزله، در هر دو مدل نتایج یکسان بوده و تفاوتی وجود نداشته است.
  • شریف پژوه

پیاده سازی مقاله: پردازش موازی در داده کاوی

پیاده سازی مقاله: پردازش موازی در داده کاوی

چکیده:

با افزایش انفجار گونه داده های بزرگ در زمینه های صنعتی و علمی، برای کار بر روی این داده ها و تجزیه و تحلیل آنها، سیستم های پردازش داده های بزرگ بسیار ضروری به نظر می رسد. مپ ریدوس و اسپارک دو محدوده محاسبات خوشه ای بسیار محبوب برای تجزیه و تحلیل داده ها در مقیاس بزرگ هستند، در حال حاضر مسلما اسپارک از لحاظ ویژگی هایی مانند تحمل خطا، عملکرد بالای پردازش داده ها در حافظه و مقیاس پذیری، جزء پیشرفته ترین سیستم های محاسباتی داده های بزرگ می باشد. اسپارک یه مدل برنامه ریزی آردیدی (مجموعه داده های توزیع شده) را در اختیار شما قرار می دهد، مدل برنامه نویسی با مجموعه ای از تحول ارائه شده و اپراتورهایی که عملکرد عملیات را می توان توسط کاربران با توجه به برنامه های خود را سفارشی کنند. اسپارک در اصل به عنوان یک سیستم پردازش سریع و کلی ارائه شده است که با توجه به شرایط مختلف از زمان معرفی آن، تلاش زیادی برای انجام کارهای تحقیقاتی روی آن انجام شده است. در این مقاله ما دلایل اهمیت داده پردازی موزای را بررسی نمودیم و در نهایت دو مدل محاسباتی مپ ریدوس و اسپارک را بعنوان ابزارهای رایج و مهم دادهپردازی موازی، بررسی و در مواردی با هم مقایسه نمودیم. در این بررسی نهایتا مشخص شد، بجز عملیات مرتب سازی، اسپارک گزینه بهتری برای داده کاوی موازی است.

  • شریف پژوه

پیاده سازی مقاله: تحلیل سبد خرید مشتریان در خرید اینترنتی با استفاده از تکنیک های داده کاوی

پیاده سازی مقاله: تحلیل سبد خرید مشتریان در خرید اینترنتی با استفاده از تکنیک های داده کاوی

چکیده:

در این مقاله عملیات برخی خریدها با انتخاب تصادفی در یک سایت بازاریابی مورد بررسی قرار می گیرد.این خریدها در فضای بیکران اینترنت که مجموعه ای بسیار بزرگ از شبکه های بزرگ و کوچک به هم پیوستهاست ، انجام می گیرد . اگر به جای رفتن به محیط بیرون از خانه و خرید از فروشگاههای سنتی و مدرن ، با استفاده از اینترنت خرید خود را انجام دهید خرید اینترنتی صورت گرفته است که هزینه آن به صورت آنلاین پرداخت می شود و یا مامور پست کالا را جلوی منزل به مشتری تحویل می دهد و هزینه کالا را پس از تحویل از مشتری دریافت می کند .سبد خرید مشتری شامل کالاهایی است که مشتری از یک فروشگاه اینترنتی خریده است .یعنی ممکن است یکباره چندین کالا خریده باشد .داده کاوی مجموعه ای از روشها در فرآیند کسب دانش است که برای تشخیص الگوها و رابطه های نامعلوم در داده ها مورد استفاده قرار می گیرد . فروش بازاریاب سایت ایران سی نت به عنوان موردانجام شد .در این مقاله سعی weka مطالعه فرض شده است . فرآیند داده کاوی در این پژوهش با استفاده از نرم افزار شده تا رابطه بین خرید چند کالا بررسی شود و پیشنهاد دهیم که اگر یکی از آنها را مشتری خرید ، با استفاده از قوانین کشف شده چه کالاهای دیگری را می تواند انتخاب کند .

  • شریف پژوه

پیاده سازی مقاله: شناسایی کاربران اسپم در شبکه های اجتماعی با استفاده از الگوریتم KNN

پیاده سازی مقاله: شناسایی کاربران اسپم در شبکه های اجتماعی با استفاده از الگوریتم KNN

چکیده:

امروزه با فراگیر شدن اینترنت، استفاده از شبکه های اجتماعی نیز گسترش یافته است. هدف افراد از عضویت در اینگونه شبکه ها به اشتراک گذاشتن داده ها در زمینه های مختلف است. این شبکه ها به کاربران اجازه میدهند تا مطالب خود را در زمینه های گوناگون گسترش دهند. مشکل زمانی پیش می آید که کاربری بخواهد از این قابلیت سوءاستفاده کرده و مطالب اسپم ارسال نماید. ما در این مقاله شناسایی اینگونه کاربران را مد نظر قرار داده ایم. برای بررسی این موضوع از پایگاه داده یکی از این شبکه ها استفاده کردیم. در مرحله یادگیری، به کمک کاربران عضو، اسپمرها را شناسایی کرده و خصوصیاتی را که مرتبط با این گونه کاربران هستند، درنظر گرفته ایم. براین اساس، کاربران جدید با درنظر گرفتن خصوصیاتشان و الگوریتمknn در یکی از دسته های اسپمر یا غیراسپمر طبقه بندی می شوند. در این روش حدود 75 درصد از اسپمرها به درستی تشخیص داده شدهاند. در مرحله بعدی، دسته بندی بر اساس مطالب کاربران انجام می شود. با این روش دقت تشخیص اسپمرها افزایش یافته و به 84 درصد میرسد.

  • شریف پژوه

پیاده سازی مقاله: تشخیص احساس از روی گفتار فارسی با استفاده از ماشین بردار پشتیبان

پیاده سازی مقاله: تشخیص احساس از روی گفتار فارسی با استفاده از ماشین بردار پشتیبان

چکیده:

تشخیص خودکار احساس از روی گفتار مساله بسیار مهم، در عرصه تعامل انسان و ماشین است.قابلیت تشخیص احساس توسط کامپیوتر با دقتی همانند انسان، به منظور ایجاد رابطه طبیعی و دوستانهبین انسان و کامپیوتر، بسیار حائز اهمیت است. با وجود پیشرفتهای گسترده در حوزهً پردازشگفتار، استخراج و درک احساس پنهان در گفتار انسان، همچون خشم، شادی و جز اینها، از یکسو و تولید گفتار احساسی مناسب از سوی دیگر، یکی از چالشهای مهم برای ساخت ماشینهایهوشمند محسوب میشود. در این مقاله، یک سیستم تشخیص خودکار احساس ارائه شده است.سیستم معرفی شده، شامل دو بخش اصلی، استخراج ویژگی و آموزش مدل دسته بند می باشد.درمرحله استخراج ویژگی، ویژگیهای عروضی از جمله فرکانس گام، شدت و ویژگی های کلی ازسیگنال گفتار به ازای شش حس متفاوت خشم، تنفر، ترس، شادی، غم و خنثی استخراج شده است.پس از تشکیل بردار ویژگی، با روش دستهبند ماشین بردار پشتیبان آموزش داده شده اند. در نهایت،نتیجه محاسبات انجام شده حاکی از میانگین دقت 82/744 درصد می باشد که در مقایسه با روش های دیگر از کارایی بالاتری برخوردار است.

  • شریف پژوه

پیاده سازی مقاله: مروری بر روش های پیش بینی نقص های نرم افزاری مبتنی بر یادگیری ماشین

پیاده سازی مقاله: مروری بر روش های پیش بینی نقص های نرم افزاری مبتنی بر یادگیری ماشین

چکیده:

پیش بینی نقص نرم افزار یکی از مهمترین موارد پژوهشی در حوزه مهندسی نرم افزار می باشد. وجود نقص در سیستمنرم افزاری یک تهدید جدی برای کیفیت نرم افزار به شمار میرود و موجب عدم انطباق محصول با نیاز مشتری می شود. ازطرفی یکی از فاکتورهایی که منجر به تعداد بالای خطاهای نرم افزاری و در نتیجه تولید نرم افزاری با کیفیت پایین میشود،محدودیت منابع تضمین کیفیت می باشد. بنابراین با توجه به محدودیت منابع بهتر است ابتدا ماژول هایی که مستعد نقصهستند شناسایی شده، سپس منابع را برای رفع نقص صرف این ماژول ها کنیم. مدلهای تشخیص نقص در ماژول هاینرم افزاری تاکنون توسط محققان زیادی مورد مطالعه قرار گرفته است و این در حالی است که بسیاری از روشهای پیش بینیماژول های نقصدار هنوز در مرحله اولیه می باشند و نیازمند تحقیق بیشتر برای رسیدن به مدل های قوی هستند. دراین مقالهبه بررسی ادبیات مهندسی نرمافزار در مورد پیش بینی نقص های نرم افزاری خواهیم پرداخت. توضیحات این مقاله منعکسکننده اطلاعات اکثر مقالات چاپ شده در زمینه تحلیل و بررسی مدلهای پیش بینی نقص نرم افزاری می باشد.

  • شریف پژوه

پیاده سازی مقاله: پیشبینی بیشینه بار مصرفی در بازار برق با استفاده از سریهای زمانی

پیاده سازی مقاله: پیشبینی بیشینه بار مصرفی در بازار برق با استفاده از سریهای زمانی

چکیده:

یک سری زمانی شامل مجموعه مشاهداتی است که بر حسب زمان مرتب شده باشند،نتایجی که از تحلیل این سریها به دست می آیند دارای کاربردهای اساسی در زمینه های مختلف از جمله اقتصاد و علوم مهندسی هستند. تجزیه و تحلیل چنینمشاهداتی نیازمند روشهایی است که قسمت مهمی از علم آمار را در بر می گیرند. هدف ما در این پروژه برازش یک مدل مناسب بر روی ماکزیمم بار مصرفی پست انتقال چمران شهرستان کرمانشاه در هر روز می باشد. داده های مورد مطالعه شامل ماکزیمم بار مصرفی هر روز و در طول سال 1393 می باشد. به کمک این مدل می توانیم ماکزیمم بار مصرفی را برای آیندهپیش بینی و کنترل نماییم. پارامترهای مختلف سری زمانی با استفاده از نرم افزار MINTAB محاسبه شده است. مطالعات انجام شده بر اساس داده های یک ساله می باشد که چناچه حجم اطلاعات ورودی افزایش یابد و داده های سالهای گذشته نیز به آن اضافه شود نتایج دقیق تری بدست خواهد آمد

  • شریف پژوه

پیاده سازی مقاله: طبقه بندی زیرگروه ویروس آنفولانزا با استفاده از تکنیک های داده کاوی

پیاده سازی مقاله: طبقه بندی زیرگروه ویروس آنفولانزا با استفاده از تکنیک های داده کاوی

چکیده:

آنفولانزا یک بیماری شدیدا مسری، حاد و تب زاست که در اثر ویروس آنفولانزا ایجاد می شود ، این ویروس از سه نوع تشکیل شد ه-است: نوع B، Aو C. در طی قرن گذشته، اپیدمی های مختلفی از آنفولانزا نوع A، مرگ و میر و خسارات سنگین اقتصادی به جامعه انسانی تحمیل کرده است. آنفولانزا A بر اساس آنتی ژن های سطحی اش، هماگلوتینین و نورامینیداس تقسیم بندی میشود. تا کنون61 زیرگروه از هماگلوتینین و 9 زیرگروه از نورامینیداس شناسایی شده است. تشخیص زودهنگام و دقیق زیرگروه ویروس امری حیاتی است. کارهای معدودی در حوزه داده کاوی در این راستا، انجام شده است که غالبا روی ناحیه محدودی از دیتاست و تنها برای چند زیرگروه رایج بوده است؛ در این پژوهش، دیتاست بزرگی شامل 43533 توالی ثبت شده آنفولانزا نوعA در کتابخانهNCBI از سال 1900 تا کنون در قالب 4 گروه استفاده شده است: توالی های DNA و پروتئینی آنتی ژن هماگلوتینین، توالیهایDNA و پروتئینی آنتی ژن نورامینیداس. پس از پیش پردازش های متعدد، با استفاده از طبقه بندی جنگل تصادفی، جنگلی از طبقه-بندهای مستقل از هم، مدل دقیقی برای تشخیص زیرگروه ویروس، بدست آمد. این مدل قادر به تشخیص ویروس از تمام زیرگروه-ها، بر اساس توالی هر کدام از آنتی ژن های هماگلوتینین و نورامینیداس با تشخیص و حساسیت 99% میباشد.

  • شریف پژوه

پیاده سازی مقاله: ارائه یک الگوریتم جهت بهبود الگوریتم k-means

پیاده سازی مقاله: ارائه یک الگوریتم جهت بهبود الگوریتم k-means

چکیده:

؛k-means یکی ازمحبوب ترین روش های خوشه بندی می باشد، به این دلیل که سادگی، و سرعت آن در طبقه بندی داده های عظیم بسیار خوب است. با این حال خروجی الگوریتم k-means به انتخاب مراکز خوشه های اولیه بستگی دارد، چون به صورت تصادفی انتخاب می شود. محدودیت دیگر آن تعداد مورد نیاز خوشه ورودی است، که این نیاز به نوعی دانش شهودی در مورد مقدار مناسب k دارد. در این مقاله یک الگوریتم پیشنهاد شده بر اساس k-means که تعیین تعداد خوشه k به عنوان ورودی را نیاز ندارد پیچیدگی زمانی و کیفیت خوشه های تولید شده توسط الگوریتم پیشنهادی با الگوریتم k-means اصلی با استفاده از دو مجموعه داده مختلف، مقایسه شده است.
  • شریف پژوه
موضوعات