سفارش انجام پروژه داده کاوی تشخیص تقلب:

تقلب در مفهوم عام، عبارت است از تحریف حقایق مهم، توسط فردی که می داند ادعایش حقیقت ندارد و یا ارائه حقایق، بدون توجه نسبت به صحت آنها و به قصد فریب دیگران. رویکردهای تشخیص تقلب به طور گسترده به دو دسته تقسیم می شوند. مورد اول، تشخیص سو استفاده است که تلاش می کند که موارد مشاهده شده قبلی را در قالب یک الگو یا امضا تشخیص دهد. مورد دوم، تشخیص ناهنجاری است که تلاش می کند تا یک مشخصه از تاریخچه عملکرد برای هر کاربر ایجاد کرده و سپس با هرگونه انحراف به قدر کافی بزرگ، پی به یک رفتار مشکوک می برد.

در این پروژه، با استفاده از نرم افزار رپیدماینر (RapidMiner)، مجموعه داده های مربوط به تشخیص تقلب مورد بررسی قرار گرفته است. راهکارهای متعدد پاکسازی داده ها، دسته بندی، خوشه بندی بر روی داده ها اعمال شده است و نتایج در قالب مستندات و همچنین فایل های شبیه سازی فراهم شده است.


موارد قابل تحویل:

  • فایل های شبیه سازی مربوط به نرم افزار رپیدماینر (RapidMiner)
  • مستندات پروژه، شامل توضیحات مربوط به فعالیت های صورت گرفته
  • فایل ارائه ی پاورپوینت
  • فیلم آموزشی برای آشنایی دقیق تر با فرآیند انجام پروژه
  • مجموعه داده ی مورد استفاده در پروژه
  • امکان آماده سازی این پروژه با سایر نرم افزارها، نظیر وکا(Weka)، نایم(Knime)، کلمنتاین(clementine) یا مدلر(IBM Spss Modeler)، زبان R، پایتون(Python) و ... فراهم است.


برخی از روش های مورد بررسی:

  • روش های مختلف پاکسازی
    • حذف مقادیر گم شده (missing values)، 
    • حذف داده های پرت، 
    • حذف نویز، 
    • گسسته سازی، 
    • ایجاد ویژگی های جدید، 
    • نرمال سازی، 
    • انتخاب زیرمجموعه ای مناسب از ویژگی ها و...
  • روش های مختلف تصویر سازی 
    • نمودارهای هیستوگرام(histogram) 
    • هیستوگرام رنگی
    • پراکندگی(Scatter) و...
  • روش های مختلف دسته بندی
    • ساخت انواع درخت تصمیم(decision tree) نظیر CHAID، CART، C5.0 و ...
    • ماشین بردار پشتیبان(support vector machine)
    • شبکه ی عصبی(Neural Net)
    • Logistic regression
    • جنگل تصادفی(Random Forest)
    • استخراج قوانین(Rule Induction) 
    • و...
  • روش های تجمعی 
    • بگینگ(bagging)
    • بوستینگ(boosting)
  • تلفیق روش های مختلف دسته بندی 
    • به عنوان مثال تلفیق روش های ماشین بردار پشتیبان با شبکه ی عصبی.
  • روش های مختلف ارزیابی نظیر Cross Validation
  • موارد و الگوریتم های قید شده، تنها قسمتی کوچکی از فرآیندهای داده کاوی را شامل می شود. انواع مختلف روش های داده کاوی و هوش مصنوعی با توجه به درخواست شما، قابل ارائه است.


مشاوره انجام پایان نامه، پروپزال و مقاله:

در صورتی که به مشاوره برای انجام پایان نامه، پروپزال و مقاله، همچنین آموزش انجام پایان نامه، پروپزال و مقاله در زمینه ی تشخیص تقلب، نیازمندید، این مورد را هنگام درخواست قید نمایید. با توجه به قوانین موجود، فعالیت شریف پژوه محدود به آموزش و مشاوره در این موارد می باشد.


منحصر به فرد بودن پروژه:

در صورتی که نیاز به یک پروژه اختصاصی و منحصر به خودتان در زمینه تشخیص تقلب داشته باشید، این مورد را هنگام درخواست قید نمایید.