سفارش انجام پروژه داده کاوی تشخیص اسپم با پایتون (Python):

به سوءاستفاده از ابزارهای الکترونیکی مانند ایمیل، مسنجر، گروه‌های خبری ایمیلی، فکس، پیام کوتاه و... برای ارسال پیام به تعداد زیاد و به صورت ناخواسته اسپم می‌گویند. با توجه به هزینه اندک این روش نسبت به پست سنتی که در گذشته برای ارسال پلاک به پلاک تبلیغات مورد استفاده قرار می‌گرفت و همچنین ناقص بودن قوانین بین‌المللی برای محدود کردن هرزنامه، در حال حاضر اسپم ها در سطح وسیعی ارسال می‌شوند. امروزه اسپم‌ها به‌طور عمده با هدف‌های تجاری منتشر می‌شوند ولی اسپم‌های غیرتجاری مانند اسپم های سیاسی یا مذهبی نیز روز به روز در حال افزایش هستند. برای مقابله با اسپم ها تاکنون روش‌های متعددی ایجاد شده است و این روند با توجه به ابعاد گسترده آن، همچنان ادامه دارد. برای مطالعه جزییات بیشتر در مورد تشخیص اسپم کلیک کنید.

در این پروژه، با استفاده از پایتون (Python)، مجموعه داده های مربوط به تشخیص اسپم مورد بررسی قرار گرفته است. راهکارهای متعدد پاکسازی داده ها، دسته بندی، خوشه بندی بر روی داده ها اعمال شده است و نتایج در قالب مستندات و همچنین فایل های شبیه سازی فراهم شده است.


موارد قابل تحویل:

  • فایل های شبیه سازی مربوط به پایتون (Python)
  • مستندات پروژه، شامل توضیحات مربوط به فعالیت های صورت گرفته
  • فایل ارائه ی پاورپوینت
  • فیلم آموزشی برای آشنایی دقیق تر با فرآیند انجام پروژه
  • مجموعه داده ی مورد استفاده در پروژه
  • امکان آماده سازی این پروژه با سایر نرم افزارها، نظیر رپیدماینر (RapidMiner)، وکا(Weka)، نایم(Knime)، کلمنتاین(clementine) یا مدلر(IBM Spss Modeler)، زبان R و ... فراهم است.


برخی از روش های مورد بررسی:

  • روش های مختلف پاکسازی
    • حذف مقادیر گم شده (missing values)، 
    • حذف داده های پرت، 
    • حذف نویز، 
    • گسسته سازی، 
    • ایجاد ویژگی های جدید، 
    • نرمال سازی، 
    • انتخاب زیرمجموعه ای مناسب از ویژگی ها و...
  • روش های مختلف تصویر سازی 
    • نمودارهای هیستوگرام(histogram) 
    • هیستوگرام رنگی
    • پراکندگی(Scatter) و...
  • روش های مختلف دسته بندی
    • ساخت انواع درخت تصمیم(decision tree) نظیر CHAID، CART، C5.0 و ...
    • ماشین بردار پشتیبان(support vector machine)
    • شبکه ی عصبی(Neural Net)
    • Logistic regression
    • جنگل تصادفی(Random Forest)
    • استخراج قوانین(Rule Induction) 
    • و...
  • روش های تجمعی 
    • بگینگ(bagging)
    • بوستینگ(boosting)
  • تلفیق روش های مختلف دسته بندی 
    • به عنوان مثال تلفیق روش های ماشین بردار پشتیبان با شبکه ی عصبی.
  • روش های مختلف ارزیابی نظیر Cross Validation
  • موارد و الگوریتم های قید شده، تنها قسمتی کوچکی از فرآیندهای داده کاوی را شامل می شود. انواع مختلف روش های داده کاوی و هوش مصنوعی با توجه به درخواست شما، قابل ارائه است.


مشاوره انجام پایان نامه، پروپزال و مقاله:

در صورتی که به مشاوره برای انجام پایان نامه، پروپزال و مقاله، همچنین آموزش انجام پایان نامه، پروپزال و مقاله در زمینه ی تشخیص اسپم، نیازمندید، این مورد را هنگام درخواست قید نمایید. با توجه به قوانین موجود، فعالیت شریف پژوه محدود به آموزش و مشاوره در این موارد می باشد.


منحصر به فرد بودن پروژه:

در صورتی که نیاز به یک پروژه اختصاصی و منحصر به خودتان در زمینه تشخیص اسپم داشته باشید، این مورد را هنگام درخواست قید نمایید.