۲۷۲ مطلب با کلمه‌ی کلیدی «سفارش انجام پروژه داده کاوی» ثبت شده است

پیاده سازی پایان نامه: تشخیص نفوذ با استفاده از روش های ترکیبی داده کاوی

پیاده سازی پایان نامه: تشخیص نفوذ با استفاده از روش های ترکیبی داده کاوی

با رشد سریع اینترنت، حملات سایبری به شبکه ها و سیستم های رایانه ای نیز به سرعت افزایش یافته است. به عنوان یک اقدام احتیاطی در برابر این حملات، سیستم‌های تشخیص نفوذ (IDS) در سیستم‌های شبکه مستقر شده‌اند. سیستم‌های تشخیص نفوذ بخشی از دومین خط دفاعی یک سیستم هستند.. آن ها را می توان همراه با سایر اقدامات امنیتی مانند کنترل دسترسی، مکانیسم های احراز هویت و تکنیک های رمزگذاری به منظور ایمن سازی بهتر سیستم ها در برابر حملات سایبری مستقر کرد. استفاده از ترکیب تکنیک های داده کاوی راهکاری برای ارائه ی یک سیستم تشخیص نفوذ موثر می باشد.

  • شریف پژوه

پیاده سازی پایان نامه: شناسایی موارد پرت در قیمت گذاری مسکن با تکنیک های داده کاوی

پیاده سازی پایان نامه: شناسایی موارد پرت در قیمت گذاری مسکن با تکنیک های داده کاوی

با توجه به اینکه برای افراد شناخت تغییر و تحول هایی که در آینده رخ می دهد اهمیت فراوانی دارد موضوعاتی که پیرامون پیش بینی می باشد برای افراد مورد توجه است. از جمله مواردی که در این بین اهمیت فراوانی دارد موضوعات پیرامون مسائل مالی از جمله پیش بینی قیمت مسکن می باشد. هدف از این تحقیق ارائه ی مدلی برای پیش بینی قیمت مسکن و پس از آن شناسایی موارد پرت در قیمت گذاری های انجام شده در این حوزه است.

  • شریف پژوه

پیاده سازی پایان نامه: تشخیص احتمالات مشکوک به پولشویی با استفاده از تکنیک های داده‌کاوی

پیاده سازی پایان نامه: تشخیص احتمالات مشکوک به پولشویی با استفاده از تکنیک های داده‌کاوی

در سال های اخیر موضوع پولشویی یکی از مباحث مهم اقتصادی می باشد که معضلات فراوانی را برای شرکت های کوچک و بزرگ ایجاد کرده است. از این رو راهکار های متعددی برای حل این مشکل در سراسر جهان پیشنهاد شده است. با توجه به گستردگی داده های موجود در این زمینه یکی از راهکار های حل این مسئله استفاده از تکنیک های داده کاوی می باشد.

  • شریف پژوه

پیاده سازی پایان نامه: پیش بینی میزان بارش فصلی و ماهیانه براساس داده کاوی

پیاده سازی پایان نامه: پیش بینی میزان بارش فصلی و ماهیانه براساس داده کاوی

داده‌کاوی هواشناسی شکلی از داده‌کاوی است که به یافتن الگوهای پنهان در داده‌های هواشناسی که تا حد زیادی در دسترس است می‌پردازد، به طوری که اطلاعات بازیابی شده می‌تواند به دانش قابل استفاده تبدیل شود. آب و هوا یکی از داده های هواشناسی است که سرشار از دانش مهم است. مهمترین عنصر اقلیمی که بر بخش های مختلف مانند کشاورزی تأثیر می گذارد، بارندگی است. بنابراین پیش‌بینی بارندگی در کشورهای مختلف به یک موضوع مهم تبدیل شده است. در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای پیش بینی بارندگی ارائه می شود.

  • شریف پژوه

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی پیش بینی قیمت سهام

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی پیش بینی قیمت سهام 

سرمایه گذاری در سهام عرضه شده در بورس اوراق بهادار یکی از گزینه های پرسود در بازار سرمایه است. با این وجود بازار سهام دارای سیستمی غیر خطی و آشوب گونه است که تحت تاثیر شرایط سیاسی، اقتصادی و روانشناسی می باشد. از این رو نحوه ی مدیریت و پیش بینی قیمت سهام برای سرمایه گذاران در بازار سهام اهمیت فراوانی دارد. برای حل مسئله ی پیش بینی قیمت سهام می توان از سیستم های هوشمند غیرخطی استفاده نمود. در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای حل این مسئله ارائه می شود.

  • شریف پژوه

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی زمان بندی کار ها

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی زمان بندی کار ها 

مسئله ی زمان‌بندی کارها (Job shop scheduling) یک مسئلهی بهینه‌سازی علوم رایانه و تحقیق در عملیات است که در آن کار های ایده‌آل به منابع در زمان‌های خاصی نسبت داده می‌شوند. در این مسئله n کار j1, j2, …, jn با اندازه‌های متفاوت که باید روی m ماشین یکسان زمان‌بندی شوند در تلاشند تا زمان کل(makespan)  را به حداقل برسانند. زمان کل مجموع زمان لازم برای انجام همه ی کار است. امروزه، این مسئله به عنوان یک مسئله ی پویا مطرح می‌شود، که با ارائه شدن هر کار، الگوریتم پویا باید با اطلاعات موجود تصمیم‌گیری کند قبل از اینکه کار بعدی مطرح شود.

در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای حل مسئله ی زمان بندی کار ها ارائه می شود.

  • شریف پژوه

پیاده سازی پایان نامه: پیش بینی مصرف انرژی ساختمان با استفاده از تکنیک های داده کاوی

پیاده سازی پایان نامه: پیش بینی مصرف انرژی ساختمان با استفاده از تکنیک های داده کاوی

پیش‌بینی هوشمند مصرف انرژی به‌ویژه برای ساختمان‌ها مسئله ی مهمی است، زیرا مصرف انرژی ساختمان‌ها روز به روز در حال افزایش است و تقریباً به 40 درصد مصرف انرژی اولیه در کشورهای توسعه‌یافته می‌رسد. در سال های اخیر مصرف انرژی به دلیل رشد جمعیت به تدریج افزایش یافته است. افزایش مصرف انرژی ساختمان ها، اجباری را در کشورهای مختلف برای مدیریت و کاهش هر چه بیشتر مصرف انرژی به منظور ارتقای بهره وری انرژی ایجاد می کند.

در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای پیش بینی مصرف انرژی ساختمان ارائه می شود.

  • شریف پژوه

پیاده سازی مقاله: تحلیل روش های داده کاوی در پیش بینی ریزش مشتریان مخابرات

پیاده سازی مقاله: تحلیل روش های داده کاوی در پیش بینی ریزش مشتریان مخابرات

چکیده:

امروزه عملیات داده کاوی به صورت گسترده توسط تمامی شرکت ھای مشتری محور، از جمله مخابرات استفاده می شود. مھم ترین چالش و مسیله ای که صنعت مخابرات با آن روبه رو است، ریزش مشتری است. در این مقاله به بررسی تکنیک ھای پیش بینی ریزش مشتریان در مخابرات پرداخته ایم. به این نتیجه رسیدیم که تکنیک ھای مبتنی بر درخت تصمیم گیری دقیق تر از تکنیک ھای مبتنی بر رگرسیون است. روش ھای داده کاوی مبتنی بر شبکه ھای عصبی در مقایسه با تکنیک ھای درخت تصمیم گیری، نتایج بھتری ارایه می دھند. روش ھای مبتنی بر درخت تصمیم به ویژه 0/5C و CART از نظر دقت عملکرد نتایج بھتری نسبت به برخی از تکنیک ھای داده کاوی موجود مانند رگرسیون، دارند.
  • شریف پژوه

پیاده سازی مقاله: تجزیه و تحلیل داده های بزرگ تجاری در رایانش ابری مبتنی بر آپاچی اسپارک

پیاده سازی مقاله: تجزیه و تحلیل داده های بزرگ تجاری در رایانش ابری مبتنی بر آپاچی اسپارک

چکیده:

حجم بالایی از داده های تجاری توسط برنامه های کاربردی یا در محیط وب مرتبا ایجاد می شود و نیاز است که این داده ها مورد تجزیه و تحلیل قرار گرفته تا دانش نهفته درون آنها آشکار شود. روش های یادگیری ماشین و داده کاوی از جمله تکنیک های مهم در تحلیل داده های تجاری است اما چالش آنها در این است که توانایی آنها برای پردازش داده های بزرگ اندک است و نیاز است از روش های توزیع شده آنها استفاده شود. در این پژوهش یک روش مبتنی بر پردازش توزیع شده توسط فناوری آپاچی اسپارک ارائه شده تا روش های داده کاوی و یادگیری ماشین مانند تکنیک های درخت تصمیم گیری، جنگل تصادفی و رگرسیون در این بستر اجرایی شده و تحلیل داده های تجاری در زمان واقعی انجام شود. برای پیاده سازی روش پیشنهادی از داده های مرتبط با مشتریان در کاربردهای تجاری و محیط پردازش ابری آپاچی اسپارک استفاده شده است. نتایج نشان می دهد از بین تکنیک های درخت تصمیم گیری، جنگل تصادفی و رگرسیون در آپاچی اسپارک و حالت غیرتوزیع شده تکنیک رگرسیون دارای حداقل خطای ممکن برای تحلیل داده های تجاری است و از طرفی جنگل تصادفی در بین تکنکی های درخت تصمیم گیری، جنگل تصادفی و رگرسیون چه در حالت توزیع شده و چه در حالت غیرتوزیع شده دارای حداقل زمان اجراء برای تحلیل داده ها است.
  • شریف پژوه

پیاده سازی مقاله: پردازش موازی در داده کاوی

پیاده سازی مقاله: پردازش موازی در داده کاوی

چکیده:

با افزایش انفجار گونه داده های بزرگ در زمینه های صنعتی و علمی، برای کار بر روی این داده ها و تجزیه و تحلیل آنها، سیستم های پردازش داده های بزرگ بسیار ضروری به نظر می رسد. مپ ریدوس و اسپارک دو محدوده محاسبات خوشه ای بسیار محبوب برای تجزیه و تحلیل داده ها در مقیاس بزرگ هستند، در حال حاضر مسلما اسپارک از لحاظ ویژگی هایی مانند تحمل خطا، عملکرد بالای پردازش داده ها در حافظه و مقیاس پذیری، جزء پیشرفته ترین سیستم های محاسباتی داده های بزرگ می باشد. اسپارک یه مدل برنامه ریزی آردیدی (مجموعه داده های توزیع شده) را در اختیار شما قرار می دهد، مدل برنامه نویسی با مجموعه ای از تحول ارائه شده و اپراتورهایی که عملکرد عملیات را می توان توسط کاربران با توجه به برنامه های خود را سفارشی کنند. اسپارک در اصل به عنوان یک سیستم پردازش سریع و کلی ارائه شده است که با توجه به شرایط مختلف از زمان معرفی آن، تلاش زیادی برای انجام کارهای تحقیقاتی روی آن انجام شده است. در این مقاله ما دلایل اهمیت داده پردازی موزای را بررسی نمودیم و در نهایت دو مدل محاسباتی مپ ریدوس و اسپارک را بعنوان ابزارهای رایج و مهم دادهپردازی موازی، بررسی و در مواردی با هم مقایسه نمودیم. در این بررسی نهایتا مشخص شد، بجز عملیات مرتب سازی، اسپارک گزینه بهتری برای داده کاوی موازی است.

  • شریف پژوه

پیاده سازی مقاله: تحلیل سبد خرید مشتریان در خرید اینترنتی با استفاده از تکنیک های داده کاوی

پیاده سازی مقاله: تحلیل سبد خرید مشتریان در خرید اینترنتی با استفاده از تکنیک های داده کاوی

چکیده:

در این مقاله عملیات برخی خریدها با انتخاب تصادفی در یک سایت بازاریابی مورد بررسی قرار می گیرد.این خریدها در فضای بیکران اینترنت که مجموعه ای بسیار بزرگ از شبکه های بزرگ و کوچک به هم پیوستهاست ، انجام می گیرد . اگر به جای رفتن به محیط بیرون از خانه و خرید از فروشگاههای سنتی و مدرن ، با استفاده از اینترنت خرید خود را انجام دهید خرید اینترنتی صورت گرفته است که هزینه آن به صورت آنلاین پرداخت می شود و یا مامور پست کالا را جلوی منزل به مشتری تحویل می دهد و هزینه کالا را پس از تحویل از مشتری دریافت می کند .سبد خرید مشتری شامل کالاهایی است که مشتری از یک فروشگاه اینترنتی خریده است .یعنی ممکن است یکباره چندین کالا خریده باشد .داده کاوی مجموعه ای از روشها در فرآیند کسب دانش است که برای تشخیص الگوها و رابطه های نامعلوم در داده ها مورد استفاده قرار می گیرد . فروش بازاریاب سایت ایران سی نت به عنوان موردانجام شد .در این مقاله سعی weka مطالعه فرض شده است . فرآیند داده کاوی در این پژوهش با استفاده از نرم افزار شده تا رابطه بین خرید چند کالا بررسی شود و پیشنهاد دهیم که اگر یکی از آنها را مشتری خرید ، با استفاده از قوانین کشف شده چه کالاهای دیگری را می تواند انتخاب کند .

  • شریف پژوه

پیاده سازی مقاله: شناسایی کاربران اسپم در شبکه های اجتماعی با استفاده از الگوریتم KNN

پیاده سازی مقاله: شناسایی کاربران اسپم در شبکه های اجتماعی با استفاده از الگوریتم KNN

چکیده:

امروزه با فراگیر شدن اینترنت، استفاده از شبکه های اجتماعی نیز گسترش یافته است. هدف افراد از عضویت در اینگونه شبکه ها به اشتراک گذاشتن داده ها در زمینه های مختلف است. این شبکه ها به کاربران اجازه میدهند تا مطالب خود را در زمینه های گوناگون گسترش دهند. مشکل زمانی پیش می آید که کاربری بخواهد از این قابلیت سوءاستفاده کرده و مطالب اسپم ارسال نماید. ما در این مقاله شناسایی اینگونه کاربران را مد نظر قرار داده ایم. برای بررسی این موضوع از پایگاه داده یکی از این شبکه ها استفاده کردیم. در مرحله یادگیری، به کمک کاربران عضو، اسپمرها را شناسایی کرده و خصوصیاتی را که مرتبط با این گونه کاربران هستند، درنظر گرفته ایم. براین اساس، کاربران جدید با درنظر گرفتن خصوصیاتشان و الگوریتمknn در یکی از دسته های اسپمر یا غیراسپمر طبقه بندی می شوند. در این روش حدود 75 درصد از اسپمرها به درستی تشخیص داده شدهاند. در مرحله بعدی، دسته بندی بر اساس مطالب کاربران انجام می شود. با این روش دقت تشخیص اسپمرها افزایش یافته و به 84 درصد میرسد.

  • شریف پژوه

پیاده سازی مقاله: تشخیص احساس از روی گفتار فارسی با استفاده از ماشین بردار پشتیبان

پیاده سازی مقاله: تشخیص احساس از روی گفتار فارسی با استفاده از ماشین بردار پشتیبان

چکیده:

تشخیص خودکار احساس از روی گفتار مساله بسیار مهم، در عرصه تعامل انسان و ماشین است.قابلیت تشخیص احساس توسط کامپیوتر با دقتی همانند انسان، به منظور ایجاد رابطه طبیعی و دوستانهبین انسان و کامپیوتر، بسیار حائز اهمیت است. با وجود پیشرفتهای گسترده در حوزهً پردازشگفتار، استخراج و درک احساس پنهان در گفتار انسان، همچون خشم، شادی و جز اینها، از یکسو و تولید گفتار احساسی مناسب از سوی دیگر، یکی از چالشهای مهم برای ساخت ماشینهایهوشمند محسوب میشود. در این مقاله، یک سیستم تشخیص خودکار احساس ارائه شده است.سیستم معرفی شده، شامل دو بخش اصلی، استخراج ویژگی و آموزش مدل دسته بند می باشد.درمرحله استخراج ویژگی، ویژگیهای عروضی از جمله فرکانس گام، شدت و ویژگی های کلی ازسیگنال گفتار به ازای شش حس متفاوت خشم، تنفر، ترس، شادی، غم و خنثی استخراج شده است.پس از تشکیل بردار ویژگی، با روش دستهبند ماشین بردار پشتیبان آموزش داده شده اند. در نهایت،نتیجه محاسبات انجام شده حاکی از میانگین دقت 82/744 درصد می باشد که در مقایسه با روش های دیگر از کارایی بالاتری برخوردار است.

  • شریف پژوه

پیاده سازی مقاله: مروری بر روش های پیش بینی نقص های نرم افزاری مبتنی بر یادگیری ماشین

پیاده سازی مقاله: مروری بر روش های پیش بینی نقص های نرم افزاری مبتنی بر یادگیری ماشین

چکیده:

پیش بینی نقص نرم افزار یکی از مهمترین موارد پژوهشی در حوزه مهندسی نرم افزار می باشد. وجود نقص در سیستمنرم افزاری یک تهدید جدی برای کیفیت نرم افزار به شمار میرود و موجب عدم انطباق محصول با نیاز مشتری می شود. ازطرفی یکی از فاکتورهایی که منجر به تعداد بالای خطاهای نرم افزاری و در نتیجه تولید نرم افزاری با کیفیت پایین میشود،محدودیت منابع تضمین کیفیت می باشد. بنابراین با توجه به محدودیت منابع بهتر است ابتدا ماژول هایی که مستعد نقصهستند شناسایی شده، سپس منابع را برای رفع نقص صرف این ماژول ها کنیم. مدلهای تشخیص نقص در ماژول هاینرم افزاری تاکنون توسط محققان زیادی مورد مطالعه قرار گرفته است و این در حالی است که بسیاری از روشهای پیش بینیماژول های نقصدار هنوز در مرحله اولیه می باشند و نیازمند تحقیق بیشتر برای رسیدن به مدل های قوی هستند. دراین مقالهبه بررسی ادبیات مهندسی نرمافزار در مورد پیش بینی نقص های نرم افزاری خواهیم پرداخت. توضیحات این مقاله منعکسکننده اطلاعات اکثر مقالات چاپ شده در زمینه تحلیل و بررسی مدلهای پیش بینی نقص نرم افزاری می باشد.

  • شریف پژوه

پیاده سازی مقاله: پیشبینی بیشینه بار مصرفی در بازار برق با استفاده از سریهای زمانی

پیاده سازی مقاله: پیشبینی بیشینه بار مصرفی در بازار برق با استفاده از سریهای زمانی

چکیده:

یک سری زمانی شامل مجموعه مشاهداتی است که بر حسب زمان مرتب شده باشند،نتایجی که از تحلیل این سریها به دست می آیند دارای کاربردهای اساسی در زمینه های مختلف از جمله اقتصاد و علوم مهندسی هستند. تجزیه و تحلیل چنینمشاهداتی نیازمند روشهایی است که قسمت مهمی از علم آمار را در بر می گیرند. هدف ما در این پروژه برازش یک مدل مناسب بر روی ماکزیمم بار مصرفی پست انتقال چمران شهرستان کرمانشاه در هر روز می باشد. داده های مورد مطالعه شامل ماکزیمم بار مصرفی هر روز و در طول سال 1393 می باشد. به کمک این مدل می توانیم ماکزیمم بار مصرفی را برای آیندهپیش بینی و کنترل نماییم. پارامترهای مختلف سری زمانی با استفاده از نرم افزار MINTAB محاسبه شده است. مطالعات انجام شده بر اساس داده های یک ساله می باشد که چناچه حجم اطلاعات ورودی افزایش یابد و داده های سالهای گذشته نیز به آن اضافه شود نتایج دقیق تری بدست خواهد آمد

  • شریف پژوه

پیاده سازی مقاله: ارائه یک الگوریتم جهت بهبود الگوریتم k-means

پیاده سازی مقاله: ارائه یک الگوریتم جهت بهبود الگوریتم k-means

چکیده:

؛k-means یکی ازمحبوب ترین روش های خوشه بندی می باشد، به این دلیل که سادگی، و سرعت آن در طبقه بندی داده های عظیم بسیار خوب است. با این حال خروجی الگوریتم k-means به انتخاب مراکز خوشه های اولیه بستگی دارد، چون به صورت تصادفی انتخاب می شود. محدودیت دیگر آن تعداد مورد نیاز خوشه ورودی است، که این نیاز به نوعی دانش شهودی در مورد مقدار مناسب k دارد. در این مقاله یک الگوریتم پیشنهاد شده بر اساس k-means که تعیین تعداد خوشه k به عنوان ورودی را نیاز ندارد پیچیدگی زمانی و کیفیت خوشه های تولید شده توسط الگوریتم پیشنهادی با الگوریتم k-means اصلی با استفاده از دو مجموعه داده مختلف، مقایسه شده است.
  • شریف پژوه

پیاده سازی مقاله: بررسی دقت و بخش بندی تصاویر پزشکی با استفاده از الگوریتم k-means

پیاده سازی مقاله: بررسی دقت و بخش بندی تصاویر پزشکی با استفاده از الگوریتم k-means

چکیده:

درباره شایعه خوشه بندی به عنوان یکی از روش های بدون ناظر و مهم در پردازش تصویر جهت قطعه بندی تصاویر مورد استفاده قرار می گیرند. در این روش به پیکسل های متعلق به دامنه تأثیر با توجه به میزان شباهت آن ها به مراکز خوشه ها به چند زیر مجموعه یا خوشه تقسیم می شوند. پرکاربردترین الگوریتم های خوشه بندی عبارتند از الگوریتم K-means و Fuzzy C-means . این مقاله به امکان سنجی قطعه بندی تصاویر پزشکی با استفاده از الگوریتم خوشه بندی K-means می پردازد.
  • شریف پژوه

پیاده سازی مقاله: تشخیص حملات سایبری پیشرفته با استفاده از مدل سازی رفتاری مبتنی بر پردازش زبان طبیعی

پیاده سازی مقاله: تشخیص حملات سایبری پیشرفته با استفاده از مدل سازی رفتاری مبتنی بر پردازش زبان طبیعی

چکیده:

رشته حملات پیچیده و ماندگار نفوذ به شبکه از مراحل نامحسوس و مخفی متعددی تشکیل شده اند. یکی از دلایل ناکارآمدی سامانه های تشخیص نفوذ در برابر این حملات، استفاده از سازوکار دفاعی مبتنی بر آنالیز ترافیک شبکه ای سطح پایین است که در آن به روابط پنهان بین هشدارها توجه نمی شود. فرض ما این است که اطلاعات ساختاری پنهان در داده های ترافیکی وجود دارند و ما می خواهیم در ترافیک شبکه ای قواعدی مانند قواعد زبان تعریف کنیم و آن را برای توصیف الگوهای فعالیت های شبکه ای بدخواهانه به کار بگیریم. به این وسیله می توانیم مسئله کشف الگوهای سوء استفاده و ناهنجاری را همانند مسئله یادگیری ساختارهای نحوی و قطعات مفهومی "زبان شبکه" حل کنیم. در این مقاله برای مدل سازی در مرحله تولید دنباله ها برای اولین بار در حوزه سایبری از یک خوشه بندی جدید به عنوان خوشه بندی MD_DBSCAN که یکی از انواع بهبودیافته خوشه بندی DBSCAN است، استفاده شده است. علاوه بر این، از یک الگوریتم حریصانه با الهام از القاء گرامر در پردازش زبان طبیعی استفاده شده تا با ادغام فعالیت های سطح پایین بتوانیم فعالیت های سطح بالا را کشف کنیم و روابط بین فعالیت های سطوح مختلف را تعریف کنیم. در بخشی از الگوریتم پیشنهادی برای کشف فعالیت های سطح بالا، برای اولین بار معیار شباهت ویرایش در خوشه بندی سلسله مراتبی به معیارهای موجود در الگوریتم پایه اضافه شده است. نتایج نشان می دهد دقت تشخیص در فعالیت های سطح بالا نسبت به فعالیت های سطح پایین با توجه به نمودار ROC حدود 30 % بیشتر است. همچنین، با تنظیم بهترین حد آستانه در الگوریتم تشخیص حملات، با درنظرگرفتن معیار F1 ، برای لغات سطوح یک تا سه به ترتیب به نتایج 3/72 و 2/96 و 4/96 در پنجره پیش بینی با اندازه سه رسیده ایم که به طورکلی حدود 2/. نسبت به الگوریتم پایه بهبود نشان می دهد.
  • شریف پژوه

پیاده سازی مقاله: الگوریتم خوشه بندی اسناد بر پایه الگوریتم K-MEANS بهبود یافته

پیاده سازی مقاله: الگوریتم خوشه بندی اسناد بر پایه الگوریتم K-MEANS بهبود یافته

چکیده:

خوشه بندی یکی از مسائل مهم داده کاوی است که هدف آن گروه گروه کردن تعدادی از اشیاء به طوری است که اشیاء درون یک گروه به هم شباهت بیشتری داشته و اشیاء دو گروه مختلف نسبت به هم متفاوت باشند. در این مقاله به مسئله خوشه بندی اسناد پرداخته شده است. الگوریتم خوشه بندی به کاررفته بر اساس الگوریتم K-Means است. اعمال تغییراتی در این الگوریتم از جمله تعیین تعداد تکرار مرحله پالایش برحسب یک مقدار آستانه، اعمال تکنیک N-Gram و تکنیک های دیگر باعث افزایش درصد موفقیت الگوریتم، بیش از 12 درصد در مجموعه فارسی آزمایش شده و حدود 25 درصد در مجموعه انگلیسی آزمایش شده، شده است.

  • شریف پژوه

پیاده سازی مقاله: تشخیص امضای آفلاین با استفاده از SVM

پیاده سازی مقاله: تشخیص امضای آفلاین با استفاده از SVM

چکیده:

امروزه در بسیاری از معاملات روزمره به ویژه مالی و استفاده از چک ها و وام های بانکی و اسناد مختلف نیاز به امضا را به عنوان یکی از مهم ترین ابزارهای بیومتریک برای تایید هویت شخصی ضرورت داده است. با توجه به اینکه عوارض جانبی از امضا این است که می توانند به منظور جعل کردن اعتبار اسناد سوء استفاده قرار گیرند به همین منظور پزوهش در راه حل های کارامد برای شناخت امضا به روش آفلاین و تایید ان برای جلوگیری از جعل اسناد رو به افزایش است. سیستم شناسایی امضای آفلاین بر روی تصاویر اسکن شده از امضا کار می کند در این مقاله یک روش برای تشخیص آفلاین امضا با استفاده از طبقه بندی کننده SVM (support vector machine) جهت بازشناسی الگو ارائه شده است که به هنگام آموزش با حفظ فاصله اطمینان با اندازه قابل تنظیم مرز جدا کننده ای فرا می گیرد. برای این کار دو روش پیشنهادی معرفی می گردد. جزئیات و نتایج شبیه سازی در این مقاله مورد بحث قرار گرفته است.
  • شریف پژوه
موضوعات
Archive