سفارش انجام پروژه داده کاوی نشخیص اسپم:
به سوءاستفاده از ابزارهای الکترونیکی مانند ایمیل، مسنجر، گروههای خبری ایمیلی، فکس، پیام کوتاه و... برای ارسال پیام به تعداد زیاد و به صورت ناخواسته اسپم میگویند. با توجه به هزینه اندک این روش نسبت به پست سنتی که در گذشته برای ارسال پلاک به پلاک تبلیغات مورد استفاده قرار میگرفت و همچنین ناقص بودن قوانین بینالمللی برای محدود کردن هرزنامه، در حال حاضر اسپم ها در سطح وسیعی ارسال میشوند. امروزه اسپمها بهطور عمده با هدفهای تجاری منتشر میشوند ولی اسپمهای غیرتجاری مانند اسپم های سیاسی یا مذهبی نیز روز به روز در حال افزایش هستند. برای مقابله با اسپم ها تاکنون روشهای متعددی ایجاد شده است و این روند با توجه به ابعاد گسترده آن، همچنان ادامه دارد. برای مطالعه جزییات بیشتر در مورد تشخیص اسپم کلیک کنید.
در این پروژه، با استفاده از زبان R، مجموعه داده های مربوط به تشخیص اسپم مورد بررسی قرار گرفته است. راهکارهای متعدد پاکسازی داده ها، دسته بندی، خوشه بندی بر روی داده ها اعمال شده است و نتایج در قالب مستندات و همچنین فایل های شبیه سازی فراهم شده است.