۶۷ مطلب با کلمه‌ی کلیدی «پیاده سازی مقاله» ثبت شده است

پیاده سازی پایان نامه: بهبود امنیت در شبکه های اینترنت اشیا با استفاده از یادگیری ماشینی

پیاده سازی پایان نامه: بهبود امنیت در شبکه های اینترنت اشیا با استفاده از یادگیری ماشینی

از زمان شروع اینترنت اشیا (IoT)، تعداد دستگاه های اینترنت اشیا متصل به اینترنت به سرعت رشد کرده است. با این حال، بسیاری از دستگاه های اینترنت اشیا فاقد استانداردهای امنیتی هستند که دستگاه های غیر اینترنت اشیا دارند. این بدان معنی است که میلیاردها دستگاه هوشمند می توانند به عنوان بخشی از یک حمله استفاده شوند. پتانسیل بهره برداری از دستگاه های اینترنت اشیا، جستجو برای یافتن اقدامات امنیتی مناسب اینترنت اشیا را بسیار مهم می کند. به منظور رفع این نیاز، این مطالعه راهکاری جدید با استفاده از یادگیری ماشین برای بهبود امنیت IoT پیشنهاد می کند.

  • شریف پژوه

پیاده سازی مقاله: تشخیص جرایم سایبری در ارتباطات برخط با رویکرد داده کاوی

پیاده سازی مقاله: تشخیص جرایم سایبری در ارتباطات برخط با رویکرد داده کاوی

چکیده:

در سال­های اخیر سایت­های شبکه های اجتماعی برخط محبوبیت چشمگیری را به دست آورده­اند. جرایم سایبری از رسانه­های اجتماعی به عنوان پلتفرم جدید در پذیرش انواع مختلف جرایم رایانه­­ای مانند فیشینگ، اسپمینگ، اشاعه بدافزار و اذیت و آزار سایبری استفاده می­کنند. در این تحقیق، با کمک استفاده از اطلاعات مفید در پیام ها، عملکرد تشخیص آزار و اذیت­های سایبری را بهبود داده می شود. انتخاب بهترین مشخصه­ها با قدرت جداکنندگی بالا بین توئیت­های مزاحمت­های سایبری و غیر مزاحمت های سایبری یک فعالیت پیچیده است که نیازمند تلاش قابل ملاحظه­ای در ساخت مدل یادگیری ماشین می­باشد. در این راستا عملکرد پنج روش طبقه بندی بیزساده، ماشین بردار پشتیبان، درخت تصمیم، k- نزدیک­ترین همسایگی و شبکه عصبی را تحت پنج تنظیم مختلف به منظور انتخاب بهترین تنظیم برای مشخصه های پیشنهادی مقایسه شده است و با استفاده از الگوریتم های خفاش و ژنتیک و ازدحام ذرات پارامترهای C و سیگما را بهبود داده شده است و مقایسه­ای بین پنج روش طبقه بندی با پارامترهای پیش فرض و پارامترهایی که با الگوریتم­­های بهینه ساز به دست آورده شده و مشخص شده است که الگوریتم خفاش از بین الگوریتم های دیگر بهینه­ساز بهترین عملکرد را داشته است. با توجه به پژوهشی که انجام شده بیشترین دقت را با مدل SVM به 56/86 و بیشترین صحت را به 14/87 بوده است.

  • شریف پژوه

پیاده سازی مقاله: ارائه یک سیستم نظرکاوی برای تحلیل نظرات کابران در مورد فیلم‌های سینمایی

پیاده سازی مقاله: ارائه یک سیستم نظرکاوی برای تحلیل نظرات کابران در مورد فیلم‌های سینمایی

 
چکیده:
 با استفاده از دانش عقیده کاوی می‌توان دانش بسیار خوبی از عموم جامعه در شبکه‌های اجتماعی درباره موضوعات مختلف به دست آورد. با استفاده از عقیده کاوی می‌توانیم کشف کنیم که افراد چه عقایدی درباره موضوعات مختلف دارند و چه نظراتی داده‌اند که با تحلیل این نظرات نتایج جالبی می‌توانیم به دست آوریم، دانش نظر کاوی زیر مجموعه علم داده کاوی می‌باشد. با تحلیل احساسات و نظرات می‌توانیم دلیل شکست یا موفقیت موضوعات مختلف در جامعه را از دید کاربران به دست آوریم. در این پژوهش ما یک روش جدید برای عقیده کاوی در شبکه‌های اجتماعی درباره فیلم‌های سینمایی ارائه کرده‌ایم. نتیجه این تحقیق نشان می‌دهد که علت موفقیت یا شکست یک فیلم از دید کاربران چه بوده است، در روش پیشنهادی نظرات کاربران ابتدا بر اساس کلمات کلیدی و هشتگ های مهم برچسب گذاری می‌شود که نظر مثبت می‌باشد یا منفی و در ادامه بعد از برچسب گذاری تحلیلی برای نظرات انجام می‌شود که تعداد لایک هر نظر تأثیر بالایی در تحلیل دارد، نتایج شبیه سازی و مقایسه روش پیشنهادی نشان می‌دهد که روش پیشنهادی از دقت بالایی برخوردار می‌باشد و می‌توان از روش پیشنهادی در دیتاست های مختلف فارسی مورد استفاده قرار داد.

  • شریف پژوه

پیاده سازی مقاله: روش جدید تشخیص فیشینگ مبتنی بر ترکیب الگوریتم پنگوئن و داده کاوی

پیاده سازی مقاله: روش جدید تشخیص فیشینگ مبتنی بر ترکیب الگوریتم پنگوئن و داده کاوی

چکیده:

با دسترسی آسان به اینترنت، بسیاری از کسب و کارها فعالیت های خود را در شبکه های وابسته به اینترنت انجام می دهند. اما هموره مخاطرات امنیتی از جمله حملات فیشینگ این کسب و کارها را تهدید می کنند. تعدد ویژگی های صفحات وب، منجر به استفاده از روش های انتخاب ویژگی و ترکیب آنها با روش های یادیگیر به منظور تشخیص فیشینگ شده است. عملکرد مناسب الگوریتم فرا ابتکاری پنگوئن در یافتن پاسخ بهینه، ایده اصلی این مقاله جهت بررسی نحوه عملکرد این الگوریتم در مسئله تشخیص فیشینگ بوده است. بنابراین از تریکب الگوریتم پنگوئن در فاز انتخاب ویژگی با شبکه عصبی مصنوعی در فاز تشخیص فیشینگ استفاده شده است. برای آموزش و ارزیایی روش پینشهادی از یک مجموعه داده با 11055 نمونه وبسایت های فیشینگ و عادی استفاده شده است. نتایج پیاده سازی در محیط متلب نشان می دهد با افزایش اندازه جمعیت و تعداد تکرار در الگوریتم بهینه سازی پنگوئن، مقدار متوسط تابع انتخاب ویژگی 69.57%، و شاخص RMSE حدود 24.56% کاهش یافته است. همچنین روش پیشنهادی در مقایسه با شبکه عصبی مصنوعی چند لایه حدود 29.16% خطای کمتر در تشخیص فیشینگ را نشان می دهد.

  • شریف پژوه

یاده سازی پایان نامه: پیش بینی بستری مجدد در بیمارستان ها با تکنیک های داده کاوی

پیاده سازی پایان نامه: پیش بینی بستری مجدد در بیمارستان ها با تکنیک های داده کاوی

بهداشت و درمان به یکی از بزرگترین صنایع در سطح جهان تبدیل شده است و به همین دلیل منابع زیادی را مصرف می کند. در سال‌های اخیر بستری مجدد در بیمارستان به دلیل هزینه‌های غیرضروری در سیستم مراقبت‌های بهداشتی به موضوعی قابل توجه تبدیل شده است. بسیاری از بستری‌های مجدد قابل پیشگیری به کیفیت پایین مراقبت در طول اقامت بیمار در بیمارستان و همچنین به ضعیف فرآیند ترخیص مربوط می‌شود. در سال های اخیر به کارگیری تکنیک های داده کاوی توانسته مداخلات موثر و پیشگیرانه را برای آن اجرا کند.

  • شریف پژوه

پیاده سازی پایان نامه: داده کاوی برای انتخاب ویژگی در داده های بیان ژن

پیاده سازی پایان نامه: داده کاوی برای انتخاب ویژگی در داده های بیان ژن

شناسایی مهم‌ترین ژن‌ها و توالی‌های ژنی (عنوان ویژگی‌ها) ذخیره‌شده در مجموعه داده‌ای از ریزآرایه‌های بیان ژن یکی از مسائل مهم در حوزه ی پزشکی است. انتخاب مهم‌ترین ژن‌ها و طبقه‌بندی موارد بر اساس ژن‌های انتخابی با استفاده از تکنیک های داده کاوی یکی از راهکار های موجود در این زمینه است.

  • شریف پژوه

پیاده سازی پایان نامه: تشخیص نفوذ با استفاده از روش های ترکیبی داده کاوی

پیاده سازی پایان نامه: تشخیص نفوذ با استفاده از روش های ترکیبی داده کاوی

با رشد سریع اینترنت، حملات سایبری به شبکه ها و سیستم های رایانه ای نیز به سرعت افزایش یافته است. به عنوان یک اقدام احتیاطی در برابر این حملات، سیستم‌های تشخیص نفوذ (IDS) در سیستم‌های شبکه مستقر شده‌اند. سیستم‌های تشخیص نفوذ بخشی از دومین خط دفاعی یک سیستم هستند.. آن ها را می توان همراه با سایر اقدامات امنیتی مانند کنترل دسترسی، مکانیسم های احراز هویت و تکنیک های رمزگذاری به منظور ایمن سازی بهتر سیستم ها در برابر حملات سایبری مستقر کرد. استفاده از ترکیب تکنیک های داده کاوی راهکاری برای ارائه ی یک سیستم تشخیص نفوذ موثر می باشد.

  • شریف پژوه

پیاده سازی پایان نامه: شناسایی موارد پرت در قیمت گذاری مسکن با تکنیک های داده کاوی

پیاده سازی پایان نامه: شناسایی موارد پرت در قیمت گذاری مسکن با تکنیک های داده کاوی

با توجه به اینکه برای افراد شناخت تغییر و تحول هایی که در آینده رخ می دهد اهمیت فراوانی دارد موضوعاتی که پیرامون پیش بینی می باشد برای افراد مورد توجه است. از جمله مواردی که در این بین اهمیت فراوانی دارد موضوعات پیرامون مسائل مالی از جمله پیش بینی قیمت مسکن می باشد. هدف از این تحقیق ارائه ی مدلی برای پیش بینی قیمت مسکن و پس از آن شناسایی موارد پرت در قیمت گذاری های انجام شده در این حوزه است.

  • شریف پژوه

پیاده سازی پایان نامه: تشخیص احتمالات مشکوک به پولشویی با استفاده از تکنیک های داده‌کاوی

پیاده سازی پایان نامه: تشخیص احتمالات مشکوک به پولشویی با استفاده از تکنیک های داده‌کاوی

در سال های اخیر موضوع پولشویی یکی از مباحث مهم اقتصادی می باشد که معضلات فراوانی را برای شرکت های کوچک و بزرگ ایجاد کرده است. از این رو راهکار های متعددی برای حل این مشکل در سراسر جهان پیشنهاد شده است. با توجه به گستردگی داده های موجود در این زمینه یکی از راهکار های حل این مسئله استفاده از تکنیک های داده کاوی می باشد.

  • شریف پژوه

پیاده سازی پایان نامه: پیش بینی میزان بارش فصلی و ماهیانه براساس داده کاوی

پیاده سازی پایان نامه: پیش بینی میزان بارش فصلی و ماهیانه براساس داده کاوی

داده‌کاوی هواشناسی شکلی از داده‌کاوی است که به یافتن الگوهای پنهان در داده‌های هواشناسی که تا حد زیادی در دسترس است می‌پردازد، به طوری که اطلاعات بازیابی شده می‌تواند به دانش قابل استفاده تبدیل شود. آب و هوا یکی از داده های هواشناسی است که سرشار از دانش مهم است. مهمترین عنصر اقلیمی که بر بخش های مختلف مانند کشاورزی تأثیر می گذارد، بارندگی است. بنابراین پیش‌بینی بارندگی در کشورهای مختلف به یک موضوع مهم تبدیل شده است. در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای پیش بینی بارندگی ارائه می شود.

  • شریف پژوه

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی پیش بینی قیمت سهام

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی پیش بینی قیمت سهام 

سرمایه گذاری در سهام عرضه شده در بورس اوراق بهادار یکی از گزینه های پرسود در بازار سرمایه است. با این وجود بازار سهام دارای سیستمی غیر خطی و آشوب گونه است که تحت تاثیر شرایط سیاسی، اقتصادی و روانشناسی می باشد. از این رو نحوه ی مدیریت و پیش بینی قیمت سهام برای سرمایه گذاران در بازار سهام اهمیت فراوانی دارد. برای حل مسئله ی پیش بینی قیمت سهام می توان از سیستم های هوشمند غیرخطی استفاده نمود. در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای حل این مسئله ارائه می شود.

  • شریف پژوه

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی زمان بندی کار ها

پیاده سازی پایان نامه: استفاده از تکنیک های داده کاوی برای حل مسئله ی زمان بندی کار ها 

مسئله ی زمان‌بندی کارها (Job shop scheduling) یک مسئلهی بهینه‌سازی علوم رایانه و تحقیق در عملیات است که در آن کار های ایده‌آل به منابع در زمان‌های خاصی نسبت داده می‌شوند. در این مسئله n کار j1, j2, …, jn با اندازه‌های متفاوت که باید روی m ماشین یکسان زمان‌بندی شوند در تلاشند تا زمان کل(makespan)  را به حداقل برسانند. زمان کل مجموع زمان لازم برای انجام همه ی کار است. امروزه، این مسئله به عنوان یک مسئله ی پویا مطرح می‌شود، که با ارائه شدن هر کار، الگوریتم پویا باید با اطلاعات موجود تصمیم‌گیری کند قبل از اینکه کار بعدی مطرح شود.

در این پروژه، با استفاده از تکنیک های داده کاوی راهکاری برای حل مسئله ی زمان بندی کار ها ارائه می شود.

  • شریف پژوه

پیاده سازی مقاله: زمان بندی وظایف در محیط ابری با استفاده از الگوریتم ژنتیک

پیاده سازی مقاله: زمان بندی وظایف در محیط ابری با استفاده از الگوریتم ژنتیک

چکیده:

با رشد مجازی سازی در سیستم های و تکنولوژی های جالب امروزی ، رایانش ابری به عنوان بستر جدید محاسباتی ظهور کرد. هدف نهایی رایانش ابری جلب رضایت کاربران بر اساس کیفیت سرویس تضمین شده برای آنها و کسب سود برای سرویس دهنده ی رایانش ابری می باشد، بنابراین لازم است که یک الگوریتم زمان بندی به هدف دست پیدا کند. اما مدل های موجود به دلیل اینکه فقط روی افزایش کارایی سیستم کار می کنند با محیط ابر قابل تطبیق نیستند، بطوریکه اکثر روش ها زمان بندی در محاسبات کلاستری فقط در زمینه ی بهینه کردن زمان تکمیل شده کارهای دسته ای، تلاش می کنند. زمان بندهای محیط ابر باید کیفیت سرویس موردنظر کاربر را فراهم کنند تا رضایت وی جلب شود. به همین منظور در این مقاله روشی برای حل مسئله ی زمان بندی بر اساس الگوریتم ژنتیک ارائه خواهد شد. در مدل ارائه شده، زمان بند در هر چرخه ی زمان بندی تابع زمان بندی الگوریتم ژنتیک را فراخوانی می کند، این تابع مجموعه ای از کارهای زمان بندی شده را ایجاد کرده و کیفیت هر یک از مجموعه ها را بر اساس میزان تامین رضایت کاربران و دسترسی پذیری ماشین های مجازی ارزیابی می کند و این تابع تا رسیدن به زمان بندی بهینه ادامه پیدا می کند. نتایج شبیه سازی های انجام شده میزان کارایی و تاثیر بیشتر مدل ارائه شده نسبت به مدل های موجود مانند روش زمان بندی نوبت چرخشی را نشان می دهد.
  • شریف پژوه

پیاده سازی مقاله: تحلیل روش های داده کاوی در پیش بینی ریزش مشتریان مخابرات

پیاده سازی مقاله: تحلیل روش های داده کاوی در پیش بینی ریزش مشتریان مخابرات

چکیده:

امروزه عملیات داده کاوی به صورت گسترده توسط تمامی شرکت ھای مشتری محور، از جمله مخابرات استفاده می شود. مھم ترین چالش و مسیله ای که صنعت مخابرات با آن روبه رو است، ریزش مشتری است. در این مقاله به بررسی تکنیک ھای پیش بینی ریزش مشتریان در مخابرات پرداخته ایم. به این نتیجه رسیدیم که تکنیک ھای مبتنی بر درخت تصمیم گیری دقیق تر از تکنیک ھای مبتنی بر رگرسیون است. روش ھای داده کاوی مبتنی بر شبکه ھای عصبی در مقایسه با تکنیک ھای درخت تصمیم گیری، نتایج بھتری ارایه می دھند. روش ھای مبتنی بر درخت تصمیم به ویژه 0/5C و CART از نظر دقت عملکرد نتایج بھتری نسبت به برخی از تکنیک ھای داده کاوی موجود مانند رگرسیون، دارند.
  • شریف پژوه

پیاده سازی مقاله: تجزیه و تحلیل داده های بزرگ تجاری در رایانش ابری مبتنی بر آپاچی اسپارک

پیاده سازی مقاله: تجزیه و تحلیل داده های بزرگ تجاری در رایانش ابری مبتنی بر آپاچی اسپارک

چکیده:

حجم بالایی از داده های تجاری توسط برنامه های کاربردی یا در محیط وب مرتبا ایجاد می شود و نیاز است که این داده ها مورد تجزیه و تحلیل قرار گرفته تا دانش نهفته درون آنها آشکار شود. روش های یادگیری ماشین و داده کاوی از جمله تکنیک های مهم در تحلیل داده های تجاری است اما چالش آنها در این است که توانایی آنها برای پردازش داده های بزرگ اندک است و نیاز است از روش های توزیع شده آنها استفاده شود. در این پژوهش یک روش مبتنی بر پردازش توزیع شده توسط فناوری آپاچی اسپارک ارائه شده تا روش های داده کاوی و یادگیری ماشین مانند تکنیک های درخت تصمیم گیری، جنگل تصادفی و رگرسیون در این بستر اجرایی شده و تحلیل داده های تجاری در زمان واقعی انجام شود. برای پیاده سازی روش پیشنهادی از داده های مرتبط با مشتریان در کاربردهای تجاری و محیط پردازش ابری آپاچی اسپارک استفاده شده است. نتایج نشان می دهد از بین تکنیک های درخت تصمیم گیری، جنگل تصادفی و رگرسیون در آپاچی اسپارک و حالت غیرتوزیع شده تکنیک رگرسیون دارای حداقل خطای ممکن برای تحلیل داده های تجاری است و از طرفی جنگل تصادفی در بین تکنکی های درخت تصمیم گیری، جنگل تصادفی و رگرسیون چه در حالت توزیع شده و چه در حالت غیرتوزیع شده دارای حداقل زمان اجراء برای تحلیل داده ها است.
  • شریف پژوه

پیاده سازی مقاله: بررسی کاربرد چارچوب های تحلیل عظیم داده ها در پیش بینی زلزله

پیاده سازی مقاله: بررسی کاربرد چارچوب های تحلیل عظیم داده ها در پیش بینی زلزله

چکیده:

این مقاله به بررسی کاربرد چارچوب های عظیم داده ها از جمله آپاچی هادوپ و آپاچی اسپارک در پیش بینی زلزله پرداخته است. برای این منظور، ابتدا چارچوب های هادوپ و اسپارک، نصب و پیکربندی شده، سپس از ابزار تحلیل و داده کاوی رپیدماینر و الگوریتم ماشین بردار پشتیبان غیرخطی با تابع کرنل RBF باتوجه به داده های پژوهش جهت مدل سازی بر روی این 2 چارچوب استفاده گردید. سپس همین فرآیند بدون استفاده از چارچوب های هادوپ و اسپارک تکرار گردید. مقایسه نتایج نشان می دهد؛ در مدلی که از چارچوب های هادوپ و اسپارک بعنوان زیرساخت پردازش استفاده نشده است، زمان اجرا حدودا 4 0 برابر حالتی است که از هادوپ و اسپارک استفاده گردیده است. ولیکن درخصوص خروجی مدل در رابطه با پیش بینی بزرگای زلزله، در هر دو مدل نتایج یکسان بوده و تفاوتی وجود نداشته است.
  • شریف پژوه

پیاده سازی مقاله: پردازش موازی در داده کاوی

پیاده سازی مقاله: پردازش موازی در داده کاوی

چکیده:

با افزایش انفجار گونه داده های بزرگ در زمینه های صنعتی و علمی، برای کار بر روی این داده ها و تجزیه و تحلیل آنها، سیستم های پردازش داده های بزرگ بسیار ضروری به نظر می رسد. مپ ریدوس و اسپارک دو محدوده محاسبات خوشه ای بسیار محبوب برای تجزیه و تحلیل داده ها در مقیاس بزرگ هستند، در حال حاضر مسلما اسپارک از لحاظ ویژگی هایی مانند تحمل خطا، عملکرد بالای پردازش داده ها در حافظه و مقیاس پذیری، جزء پیشرفته ترین سیستم های محاسباتی داده های بزرگ می باشد. اسپارک یه مدل برنامه ریزی آردیدی (مجموعه داده های توزیع شده) را در اختیار شما قرار می دهد، مدل برنامه نویسی با مجموعه ای از تحول ارائه شده و اپراتورهایی که عملکرد عملیات را می توان توسط کاربران با توجه به برنامه های خود را سفارشی کنند. اسپارک در اصل به عنوان یک سیستم پردازش سریع و کلی ارائه شده است که با توجه به شرایط مختلف از زمان معرفی آن، تلاش زیادی برای انجام کارهای تحقیقاتی روی آن انجام شده است. در این مقاله ما دلایل اهمیت داده پردازی موزای را بررسی نمودیم و در نهایت دو مدل محاسباتی مپ ریدوس و اسپارک را بعنوان ابزارهای رایج و مهم دادهپردازی موازی، بررسی و در مواردی با هم مقایسه نمودیم. در این بررسی نهایتا مشخص شد، بجز عملیات مرتب سازی، اسپارک گزینه بهتری برای داده کاوی موازی است.

  • شریف پژوه

پیاده سازی مقاله: تحلیل سبد خرید مشتریان در خرید اینترنتی با استفاده از تکنیک های داده کاوی

پیاده سازی مقاله: تحلیل سبد خرید مشتریان در خرید اینترنتی با استفاده از تکنیک های داده کاوی

چکیده:

در این مقاله عملیات برخی خریدها با انتخاب تصادفی در یک سایت بازاریابی مورد بررسی قرار می گیرد.این خریدها در فضای بیکران اینترنت که مجموعه ای بسیار بزرگ از شبکه های بزرگ و کوچک به هم پیوستهاست ، انجام می گیرد . اگر به جای رفتن به محیط بیرون از خانه و خرید از فروشگاههای سنتی و مدرن ، با استفاده از اینترنت خرید خود را انجام دهید خرید اینترنتی صورت گرفته است که هزینه آن به صورت آنلاین پرداخت می شود و یا مامور پست کالا را جلوی منزل به مشتری تحویل می دهد و هزینه کالا را پس از تحویل از مشتری دریافت می کند .سبد خرید مشتری شامل کالاهایی است که مشتری از یک فروشگاه اینترنتی خریده است .یعنی ممکن است یکباره چندین کالا خریده باشد .داده کاوی مجموعه ای از روشها در فرآیند کسب دانش است که برای تشخیص الگوها و رابطه های نامعلوم در داده ها مورد استفاده قرار می گیرد . فروش بازاریاب سایت ایران سی نت به عنوان موردانجام شد .در این مقاله سعی weka مطالعه فرض شده است . فرآیند داده کاوی در این پژوهش با استفاده از نرم افزار شده تا رابطه بین خرید چند کالا بررسی شود و پیشنهاد دهیم که اگر یکی از آنها را مشتری خرید ، با استفاده از قوانین کشف شده چه کالاهای دیگری را می تواند انتخاب کند .

  • شریف پژوه

پیاده سازی مقاله: شناسایی کاربران اسپم در شبکه های اجتماعی با استفاده از الگوریتم KNN

پیاده سازی مقاله: شناسایی کاربران اسپم در شبکه های اجتماعی با استفاده از الگوریتم KNN

چکیده:

امروزه با فراگیر شدن اینترنت، استفاده از شبکه های اجتماعی نیز گسترش یافته است. هدف افراد از عضویت در اینگونه شبکه ها به اشتراک گذاشتن داده ها در زمینه های مختلف است. این شبکه ها به کاربران اجازه میدهند تا مطالب خود را در زمینه های گوناگون گسترش دهند. مشکل زمانی پیش می آید که کاربری بخواهد از این قابلیت سوءاستفاده کرده و مطالب اسپم ارسال نماید. ما در این مقاله شناسایی اینگونه کاربران را مد نظر قرار داده ایم. برای بررسی این موضوع از پایگاه داده یکی از این شبکه ها استفاده کردیم. در مرحله یادگیری، به کمک کاربران عضو، اسپمرها را شناسایی کرده و خصوصیاتی را که مرتبط با این گونه کاربران هستند، درنظر گرفته ایم. براین اساس، کاربران جدید با درنظر گرفتن خصوصیاتشان و الگوریتمknn در یکی از دسته های اسپمر یا غیراسپمر طبقه بندی می شوند. در این روش حدود 75 درصد از اسپمرها به درستی تشخیص داده شدهاند. در مرحله بعدی، دسته بندی بر اساس مطالب کاربران انجام می شود. با این روش دقت تشخیص اسپمرها افزایش یافته و به 84 درصد میرسد.

  • شریف پژوه

پیاده سازی مقاله: تشخیص احساس از روی گفتار فارسی با استفاده از ماشین بردار پشتیبان

پیاده سازی مقاله: تشخیص احساس از روی گفتار فارسی با استفاده از ماشین بردار پشتیبان

چکیده:

تشخیص خودکار احساس از روی گفتار مساله بسیار مهم، در عرصه تعامل انسان و ماشین است.قابلیت تشخیص احساس توسط کامپیوتر با دقتی همانند انسان، به منظور ایجاد رابطه طبیعی و دوستانهبین انسان و کامپیوتر، بسیار حائز اهمیت است. با وجود پیشرفتهای گسترده در حوزهً پردازشگفتار، استخراج و درک احساس پنهان در گفتار انسان، همچون خشم، شادی و جز اینها، از یکسو و تولید گفتار احساسی مناسب از سوی دیگر، یکی از چالشهای مهم برای ساخت ماشینهایهوشمند محسوب میشود. در این مقاله، یک سیستم تشخیص خودکار احساس ارائه شده است.سیستم معرفی شده، شامل دو بخش اصلی، استخراج ویژگی و آموزش مدل دسته بند می باشد.درمرحله استخراج ویژگی، ویژگیهای عروضی از جمله فرکانس گام، شدت و ویژگی های کلی ازسیگنال گفتار به ازای شش حس متفاوت خشم، تنفر، ترس، شادی، غم و خنثی استخراج شده است.پس از تشکیل بردار ویژگی، با روش دستهبند ماشین بردار پشتیبان آموزش داده شده اند. در نهایت،نتیجه محاسبات انجام شده حاکی از میانگین دقت 82/744 درصد می باشد که در مقایسه با روش های دیگر از کارایی بالاتری برخوردار است.

  • شریف پژوه
موضوعات
Latest Posts