۲ مطلب در فروردين ۱۳۹۹ ثبت شده است

پروژه اسپارک

پروژه اسپارک:

 

آپاچی اسپارک (Apache Spark) یک چارچوب رایانش توزیع‌شده متن‌باز است.

اسپارک یک رابط برنامه‌نویسی کاربردی برای برنامه‌نویسی تمام خوشه‌ها با موازی‌سازی داده‌های ضمنی و تحمل خطا فراهم می‌کند.

اسپارک از حافظه اصلی برای نگهداری داده‌های برنامه استفاده می‌کند که این امر باعث سریعتر اجرا شدن برنامه‌ها می‌شود.

همچنین یکی دیگر از مواردی که باعث افزایش کارایی اسپارک می‌شود، استفاده از مکانیسم حافظه نهان هنگام استفاده از داده‌هایی است که قرار است دوباره در برنامه استفاده شوند. اینکار باعث کاهش سربار ناشی از خواندن و نوشتن از دیسک می‌شود.

  • شریف پژوه

پروژه داده کاوی تشخیص سرطان با زبان R

سفارش انجام پروژه داده کاوی تشخیص سرطان:

سرطان نامی است که به مجموعهٔ بیماری‌هایی اطلاق می‌شود که از تکثیر مهارنشده سلول‌ها پدید می‌آیند. سلول‌های سرطانی از سازوکارهای عادی تقسیم و رشد سلول‌ها جدا می‌افتند. علت دقیق این پدیده همچنان نامشخص است ولی احتمال دارد عوامل ژنتیکی یا مواردی که موجب اختلال در فعالیت سلول‌ها می‌شوند در هسته سلول اشکال وارد کنند. از جملهٔ این موارد می‌توان از مواد رادیو اکتیو، مواد شیمیایی و سمی یا تابش بیش از حد اشعه‌هایی مانند نور آفتاب نام برد. در یک جاندار سالم، همیشه بین میزان تقسیم سلول، مرگ طبیعی سلولی و تمایز، تعادلی وجود دارد. برای مطالعه جزییات بیشتر در مورد بیماری سرطان کلیک کنید.

در این پروژه، با استفاده از زبان R، مجموعه داده های مربوط به سرطان (انواع سرطان) مورد بررسی قرار گرفته است. راهکارهای متعدد پاکسازی داده ها، دسته بندی، خوشه بندی بر روی داده ها اعمال شده است و نتایج در قالب مستندات و همچنین فایل های شبیه سازی فراهم شده است.

  • شریف پژوه
موضوعات
Latest Posts
Archive