پیاده سازی مقاله: الگوریتم خوشه بندی اسناد بر پایه الگوریتم K-MEANS بهبود یافته

چکیده:

خوشه بندی یکی از مسائل مهم داده کاوی است که هدف آن گروه گروه کردن تعدادی از اشیاء به طوری است که اشیاء درون یک گروه به هم شباهت بیشتری داشته و اشیاء دو گروه مختلف نسبت به هم متفاوت باشند. در این مقاله به مسئله خوشه بندی اسناد پرداخته شده است. الگوریتم خوشه بندی به کاررفته بر اساس الگوریتم K-Means است. اعمال تغییراتی در این الگوریتم از جمله تعیین تعداد تکرار مرحله پالایش برحسب یک مقدار آستانه، اعمال تکنیک N-Gram و تکنیک های دیگر باعث افزایش درصد موفقیت الگوریتم، بیش از 12 درصد در مجموعه فارسی آزمایش شده و حدود 25 درصد در مجموعه انگلیسی آزمایش شده، شده است.

دریافت مقاله:

 لینک مقاله

دریافت پیاده سازی:

برای دریافت پیاده سازی مقاله مورد نظر، و یا اعمال بهبود در آن، با استفاده از لینک زیر، سفارش خود را ارسال نمایید.

سفارش انجام پروژه