دانلود ترجمه مقاله بررسی اجمالی روش های مختلف برای حل مشکلات داده کاوی – الزویر ۲۰۱۸:در زمان حل کردن مسائل مشخصی که ممکن است از موارد آزمایش شده دارای سطح بالاتری باشند، مانند یک مدل خاص از مقادیر، لازم است که روش و اصول مشخصی اتخاذ شود. اگرچه، برای دنبای کردن گرایش و رفتارهای مشخص داده کاوی، مدل های جهانی بدون موقعیت خاصی، کافی می باشد. تحلیل نتایج برای هرکدام از توصیف گر های ویژگی ها، وجود دارد. درخت جواب. واکنش به افزایش حجم داده ها. • میانگین دقت تغییر نخواهد کرد.
عنوان فارسی مقاله: |
بررسی اجمالی روش های مختلف برای حل مشکلات داده کاوی |
عنوان انگلیسی مقاله: | |
سال انتشار میلادی: | 2018 |
نشریه: |
Database: Elsevier – ScienceDirect (ساینس دایرکت) پروسه علمی کامپیوتر – Procedia Computer Science |
کلمات کلیدی فارسی: | |
کلمات کلیدی انگلیسی: |
Data Mining, the nearest neighbor method, the method of k-nearest neighbor, decision trees, classification, regression, forecasting
|
تعداد صفحات ترجمه شده: | 9 صفحه با فونت ۱۴ B Nazanin |
نویسندگان: |
Kochetov Vadim
|
موضوع: | داده کاوی, |
دسته بندی رشته: | مهندسی کامپیوتر |
فرمت فایل انگلیسی: | 6 صفحه با فرمت pdf |
فرمت فایل ترجمه شده: | Word |
کیفیت ترجمه: | عالی |
نوع مقاله: | isi |
تعداد رفرنس: |
مقاله انگلیسی+ترجمه فارسی
فهرست مطالب
چکیده
۱٫ مقدمه
۲٫ وظایف داده کاوی
مشکل طبقه بندی و رگراسیون
۳٫ دسته بندی مراحل داده کاوی
۴٫ دسته بندی روش های داده کاوی
۵٫ نتیجه گیری
چکیده
این مقاله به امور مهمی در تجزیه و تحلیل مقادیر وسیعی از اطلاعات و مقایسه روش هایی برای جواب دهی به آنها، اختصاص یافته است. تجزیه و تحلیل مقادیر وسیعی از اطلاعات و شناسایی اطلاعات ارزشمند، توسط ابزار داده کاوی فراهم شده است. مفهوم داده کاوی به عنوان استخراج، تجزیه و تحلیل و جمع آوری اطلاعات، ترجمه شده است. بنابر تنوع گسترده ای از الگوها و تشکل های اطلاعاتی مرتبط با اطلاعات سازمان یافته، اطلاعات واقعی همواره توسط ابزارهای یادگیری ماشینی تجزیه و تحلیل نمی شوند. برای تبدیل اطلاعات خام به اطلاعاتی که بتوانند به درستی به وسیله اصول داده کاوی کار کنند، مشکل پیش-پردازش حل شده است. روش های نزدیک ترین همسایگی k و درخت تصمیم، از جمله طبقه بندی داده کاوی و رگراسیون در حوزه های مشخص، این مشکلات را حل کرده است.
Abstract
This paper is devoted to the main tasks in the analysis of large amounts of information and comparison of methods for their solution. The analysis of large volumes of information and identification of valuable knowledge provided by Data Mining tools. The concept of Data Mining is translated as data mining, data analysis, data collection. Due to of the huge variety of data types and forms of organizing information actual data may not always be analyzed by machine learning tools. For the transformation of “raw” data to the data, which can work efficiently Data Mining techniques, solve the problem of pre-processing. The methods k-nearest neighbor and decision trees solve such problems as the Data Mining classification and regression in the specified domains.
نمونه ترجمه مقاله:
- مقدمه
به دلیل تنوع گسترده روش های داده کاوی و انواع مختلف اطلاعات و الگوهای مربوط به ارائه و نمایش اطلاعات، لازم است که محدودیت های کاربری و ارتباط مربوط به روش های مشخص را با توجه به اطلاعات فراهم شده و اهداف کسب شده، تعریف شود. همچنین لازم است چگونگی حل این مسئله با استفاده از روش های داده کاوی از قبیل، طبقه بندی، رگراسیون، خوشه بندی و غیره، درک شود. بعد از موفقیت نتایج پردازش اطلاعات، هر قدم با انتخاب اطلاعات شروع شده و با یک توضیح از غیر متعارف ها در نتایج، پایان می یابد. در این مقاله، مشخصات روش های نزدیک ترین همسایگی k و درخت تصمیم، روش های حل مسئله را در موضوعات مطالعاتی مختلف، مورد مطالعه قرار داده است.
از آنجایی که ما داده ها را برای موضوعات مطالعاتی مختلف مورد مطالعه قرار می دهیم، خصوصیات و روش های اطلاعاتی مورد بحث، با توجه به زمینه های مطالعاتی تغییر خواهند کرد. داده کاوی قدم مهمی در پردازش اطلاعات می باشد. پردازش مطالعات قبلی، کاری طولانی و بسیار زمان گیر می باشد. گاهی اوقات اینکار قسمت عظیمی از کل پردازش داده کاوی را دربر می گیرد. به علاوه منابعی عظیم و زمان زیادی برای انتخاب مدل و آموزش آن صرف می شود.
- وظایف داده کاوی
دسته بندی های زیر برای حل مسئله داده کاوی وجود دارد: یادگیری تحت نظارت (آموزشی به وسیله مدرس) و یادگیری بدون نظارت (آموزشی بدون مدرس). این اصطلاح از یادگیری ماشینی سرچشمه گرفته است. یادگیری ماشینی اصطلاحی است که تمام مجموعه فنون داده کاوی را با هم ترکیب می کند (2).
در مورد تحلیل یادگیری تحت نظارت، حل وظایف در مراحل مختلفی بدست می آید. اولا به وسیله یک الگوریتم داده کاوی، یک مدل از داده های تحلیل شده (دسته بندی شده) ساخته می شود. سپس فراتوصیف کننده ها، آموزش را ایجاد می کنند. به عبارت دیگر، کیفیت این کار را بررسی می کنیم، و اگر رضایت بخش نبود، آموزش های اضافی مربوط به توصیف کننده، وجود خواهد داشت. این کار ادامه پیدا خواهد کرد تا اینکه به یک سطح کیفی مطلوب برسد، و یا اینکه آنقدر واضح نباشد که الگوریتم انتخاب شده با داده های آماده شده به درستی کار نکنند، و یا اینکه داده ها ساختار مورد نظر را که بتوانند شناخته شوند، نداشته باشند. این نوع از مسئله مشکلات طبقه بندی و رگراسیون می باشد.
یادگیری بدون نظارت، وظایف را با یکدیگر ترکیب می کند، از مدل های توصیفی مانند قوانین فراهم آوری تعداد زیادی تهیه کننده عمده فروش برای مشتری، استفاده می کند. قاعدتا اگر این قوانین وجود داشته باشد، مدل باید آنها را نمایش دهد و مسائل مربوط به آموزش آنها را حل کند. مزیت این چنین مسائلی، توانایی حل آنها بدون هیچ دانش اولیه ای درباره داده های تحلیل شده می باشد.
مشکل طبقه بندی و رگراسیون
طبقه بندی یکی از حوزه های مسائل یادگیری ماشینی می باشد، وظایفی که این حوزه، مسائل پیش رو را حل می کند. برای مثال، یک مجموعه مشخص از موضوعات (موارد) وجود دارد که به صورت مشخصی در دسته بندی های مختلف وجود دارند. اینکار همچنین برای مجموعه محدودی از موضوعات که در دسته هایی به صورت شناخته شده پراکنده شده اند، انجام شده است. توزیع موضوعات باقی مانده در دسته بندی ها، نامشخص می باشد.