۵ مطلب در فروردين ۱۳۹۹ ثبت شده است

پروژه اسپارک

پروژه اسپارک:

 

آپاچی اسپارک (Apache Spark) یک چارچوب رایانش توزیع‌شده متن‌باز است.

اسپارک یک رابط برنامه‌نویسی کاربردی برای برنامه‌نویسی تمام خوشه‌ها با موازی‌سازی داده‌های ضمنی و تحمل خطا فراهم می‌کند.

اسپارک از حافظه اصلی برای نگهداری داده‌های برنامه استفاده می‌کند که این امر باعث سریعتر اجرا شدن برنامه‌ها می‌شود.

همچنین یکی دیگر از مواردی که باعث افزایش کارایی اسپارک می‌شود، استفاده از مکانیسم حافظه نهان هنگام استفاده از داده‌هایی است که قرار است دوباره در برنامه استفاده شوند. اینکار باعث کاهش سربار ناشی از خواندن و نوشتن از دیسک می‌شود.

  • شریف پژوه

بهینه سازی ساختار شبکه عصبی با الگوریتم تکامل تفاضلی برای داده کاوی تشخیص تقلب در کارت های اعتباری

سفارش انجام پروژه داده کاوی تشخیص تقلب در کارت های اعتباری به کمک روش های شبکه ی عصبی و الگوریتم تکامل تفاضلی:

به دلیل ضعف های امنیتی سیستم پردازش کارت هـای بـانکی، تقلـب در آن هـا رونـد رو به گسترشی دارد و خسارت های زیادی وارد می کند. تقلب در کارت های بانکی به یکی از راه های کسب درآمد بـرای مجرمـان تبـدیل شـده اسـت. به همین دلیل مسئله ی تقلب برای بانـکهـا و مؤسسه ها اهمیت بالایی دارد. رویکردهای تشخیص تقلب به طور گسترده به دو دسته تقسیم می شوند. مورد اول، تشخیص سو استفاده است که تلاش می کند که موارد مشاهده شده قبلی را در قالب یک الگو یا امضا تشخیص دهد. مورد دوم، تشخیص ناهنجاری است که تلاش می کند تا یک مشخصه از تاریخچه عملکرد برای هر کاربر ایجاد کرده و سپس با هرگونه انحراف به قدر کافی بزرگ، پی به یک رفتار مشکوک می برد.

در این پروژه، با استفاده از تلفیق روش های شبکه ی عصبی (neural network) و الگوریتم تکامل تفاضلی (differential evolution algorithm)، مجموعه داده های مربوط به تشخیص تقلب در کارت های اعتباری مورد بررسی قرار گرفته است. نتایج در قالب مستندات و همچنین فایل های شبیه سازی فراهم شده است.

  • شریف پژوه

پروژه پیش بینی نرخ جرم و جنایت با استفاده از تلفیق درخت تصمیم و الگوریتم سیستم ایمنی مصنوعی

سفارش انجام پروژه پیش بینی نرخ جرم و جنایت با تلفیق روش های درخت تصمیم و الگوریتم سیستم ایمنی مصنوعی:

 

با گسترش روزافزون سیستم های کامپیوتری، تحلیلگران اطلاعات می توانند به روند حل جرم و جنایات سرعت بخشند و از این طریق به اجرای قانون کمک کنند. تجزیه و تحلیل و پیشگیری از جرم رویکردی برای شناسایی و تحلیل الگوها و روند جنایت است. در این پروژه اطلاعات ناشناخته و مفید از داده های بدون ساختار استخراج می شود و مناطقی که احتمال وقوع جرم و جنایت در آن ها وجود دارد، پیش بینی می شود.

در این پروژه، با استفاده از تلفیق روش های درخت تصمیم (decision tree) و الگوریتم سیستم ایمنی مصنوعی (Artificial immune system algorithm)، مجموعه داده های مربوط به پیش بینی نرخ جرم و جنایت مورد بررسی قرار گرفته است. نتایج در قالب مستندات و همچنین فایل های شبیه سازی فراهم شده است.

  • شریف پژوه

پروژه داده کاوی امتیاز اعتباری (Credit scoring) با نرم افزار رپیدماینر (RapidMiner)

سفارش انجام پروژه داده کاوی امتیاز اعتباری:

امتیاز اعتباری یک عبارت عددی است که با تکنیک‌های آماری و بر اساس اطلاعات واقعی که بیانگر وضعیت جاری و سابقه‌ای فرد یا شرکت هستند محاسبه می‌شود. امتیاز اعتباری یک نمره قابل مقایسه است؛ لذا تصمیم‌گیری بر این مبنا، در مقایسه با روش‌های سلیقه‌ای و گزارش‌های متنی، به مراتب قابل اطمینان‌تر و منصفانه‌تر خواهد بود. برای مطالعه جزییات بیشتر در مورد امتیازاعتباری کلیک کنید.

در این پروژه، با استفاده از نرم افزار رپیدماینر (RapidMiner)، مجموعه داده های مربوط به امتیاز اعتباری مورد بررسی قرار گرفته است. راهکارهای متعدد پاکسازی داده ها، دسته بندی، خوشه بندی بر روی داده ها اعمال شده است و نتایج در قالب مستندات و همچنین فایل های شبیه سازی فراهم شده است.

  • شریف پژوه

پروژه داده کاوی تشخیص سرطان با زبان R

سفارش انجام پروژه داده کاوی تشخیص سرطان:

سرطان نامی است که به مجموعهٔ بیماری‌هایی اطلاق می‌شود که از تکثیر مهارنشده سلول‌ها پدید می‌آیند. سلول‌های سرطانی از سازوکارهای عادی تقسیم و رشد سلول‌ها جدا می‌افتند. علت دقیق این پدیده همچنان نامشخص است ولی احتمال دارد عوامل ژنتیکی یا مواردی که موجب اختلال در فعالیت سلول‌ها می‌شوند در هسته سلول اشکال وارد کنند. از جملهٔ این موارد می‌توان از مواد رادیو اکتیو، مواد شیمیایی و سمی یا تابش بیش از حد اشعه‌هایی مانند نور آفتاب نام برد. در یک جاندار سالم، همیشه بین میزان تقسیم سلول، مرگ طبیعی سلولی و تمایز، تعادلی وجود دارد. برای مطالعه جزییات بیشتر در مورد بیماری سرطان کلیک کنید.

در این پروژه، با استفاده از زبان R، مجموعه داده های مربوط به سرطان (انواع سرطان) مورد بررسی قرار گرفته است. راهکارهای متعدد پاکسازی داده ها، دسته بندی، خوشه بندی بر روی داده ها اعمال شده است و نتایج در قالب مستندات و همچنین فایل های شبیه سازی فراهم شده است.

  • شریف پژوه
موضوعات
آخرین مطالب