عنوان فارسی:دانلود ترجمه مقاله کاهش خطی ابعاد برای دستهبندی از طریق کمینه کردن خطای بایز ترتیبی با برنامه برای تشخیص جریان اندازهگیری
دانلود ترجمه مقاله کاهش خطی ابعاد برای دستهبندی از طریق کمینه کردن خطای بایز ترتیبی با برنامه برای تشخیص جریان اندازهگیری – الزوریر ۲۰۱۸:الگوریتم ما از نظر صحت دستهبندی در مقایسه با الگوریتمهای حال حاض مثل LDR مبتنی بر معیار فیشر و معیار چرنف ، بهتر است. قابلیت پیادهسازی الگوریتم ما با اعمال آن در وضعیت تشخیص سلامت با 2 جریان اندازهگیری نیز توضیح داده شده است. با مجموعه داده UCI، الگوریتم پیشنهادی عملکرد بهتری نسبت به الگوریتمهای حال حاضر دارد و صحت دستهبندی آن به میزان 99.4% و 97.5% برای دو جریان اندازهگیری است. چنین صحت بالای دستهبندی بر روی جریان اندازهگیری باعث صرفهجویی بسیار در هزینه نفتی و کارهای گازی میشود.
عنوان فارسی مقاله: |
کاهش خطی ابعاد برای دستهبندی از طریق کمینه کردن خطای بایز ترتیبی با برنامه برای تشخیص جریان اندازهگیری
|
عنوان انگلیسی مقاله: | |
سال انتشار میلادی: | 2018 |
نشریه: |
Database: Elsevier – ScienceDirect (ساینس دایرکت) |
کلمات کلیدی فارسی: |
کاهش ابعادس خطی؛ LDA؛ ناهمواریانس ؛ خطای بیزی؛ تشخیص متر جریان
|
کلمات کلیدی انگلیسی: |
Linear dimensionality reduction
LDA
Heteroscedasticity
Bayes error
Flow meter diagnostics
|
تعداد صفحات ترجمه شده: | 35 صفحه با فونت ۱۴ B Nazanin |
نویسندگان: |
Kojo Sarfo Gyamfi, James Brusey, Andrew Hunt, Elena Gaura,
|
موضوع: | مهندسی الگوریتم ها و محاسبات، هوش مصنوعی |
دسته بندی رشته: | مهندسی کامپیوتر |
فرمت فایل انگلیسی: | 11 صفحه با فرمت pdf |
فرمت فایل ترجمه شده: | Word |
کیفیت ترجمه: | عالی |
نوع مقاله: | isi |
تعداد رفرنس: |
مقاله انگلیسی+ترجمه فارسی
فهرست مطالب
چکیده
کلمات کلیدی
1.مقدمه
2. زمینه و کارهای مرتبط
2.1. معیار فیشر
2.2. معیار Mahalanobis
2.3. معیار Chernoff
3.الگوریتم پیشنهادی
3.1. K=2
3.2. K=3
3.2.1. مرحله 1
3.2.2. مرحله 2
3.3. K کلی
3.3.1. مرحله 1
3.3.2. مرحله 2
3.3.3. مرحله 3
3.4. بهینهسازی خطای بایز
4. برنامه برای تشخیص جریان اندازهگیری
تصویر 1: پیکربندی مبدل اندازهگیر جریان هشت مسیره
جدول 1: لیست و ویژگیهای مجموعه دادهها
5. اعتبارسنجی آزمایشی
5.1. مجموعه دادههای UCI
جدول 2: متوسط صحت دستهبندی (%) با QDA
جدول 3: متوسط صحت دستهبندی (%) با LDA
جدول 4: متوسط صحت دستهبندی: پیشنهادی + LDA در مقابل SVM خطی
5.1.1. نتایج و بحث
تصویر 2: عملکرد LDR روی داده تشخیصی: PCA
تصویر 3: عملکرد LDR روی داده تشخیص: F-LDR
5.2. مجموعه داده تشخیصی USM
تصویر 4: عملکرد LDR روی داده تشخیصی A: M-LDR
تصویر 5: عملکرد LDR روی داده تشخیصی: C-LDR
5.2.1. نتایج و بحث
تصویر 6: عملکرد LDR روی داده تشخیصی اندازهگیر A: پیشنهادی
تصویر 7: متوسط صحت دستهبندی برای اندازهگیر A و B (%). صحت دستهبندی برای الگوریتم پیشنهادی از نظر آماری متفاوت با باقی الگوریتمها به میزان اعتماد 0.01 براساس تست رتبه Wilcoxon است.
6. نتیجهگیری
ترجمه چکیده
این کار با ساخت ترتیبی دستهبندیهای خطی انجام میشود که خطای بایز را با رویه کاهش گرادیان، کمینه میکند که فرض بر نرمال بودن است. ما با آزمایش الگوریتم پیشنهادی را برای 10 مجموعه داده UCI اعتبارسنجی کردیم. الگوریتم ما از نظر صحت دستهبندی در مقایسه با الگوریتمهای حال حاض مثل LDR مبتنی بر معیار فیشر و معیار چرنف ، بهتر است. قابلیت پیادهسازی الگوریتم ما با اعمال آن در وضعیت تشخیص سلامت با 2 جریان اندازهگیری نیز توضیح داده شده است. با مجموعه داده UCI، الگوریتم پیشنهادی عملکرد بهتری نسبت به الگوریتمهای حال حاضر دارد و صحت دستهبندی آن به میزان 99.4% و 97.5% برای دو جریان اندازهگیری است. چنین صحت بالای دستهبندی بر روی جریان اندازهگیری باعث صرفهجویی بسیار در هزینه نفتی و کارهای گازی میشود.
چکیده انگلیسی
– We propose a supervised linear dimensionality reduction algorithm.
– The algorithm reduces the dimensionality of data to Kâ1 for the K-class problem.
– The linearly reduced data is well-suited for Bayesian classification.
– Experiments on UCI datasets are performed for the proposed and existing algorithms.
– The applicability of the algorithm to flow meter diagnostics is also demonstrated.
Supervised linear dimensionality reduction (LDR) performed prior to classification often improves the accuracy of classification by reducing overfitting and removing multicollinearity. If a Bayes classifier is to be used, then reduction to a dimensionality of Kâ1 is necessary and sufficient to preserve the classification information in the original feature space for the K-class problem. However, most of the existing algorithms provide no optimal dimensionality to which to reduce the data, thus classification information can be lost in the reduced space if Kâ1 dimensions are used. In this paper, we present a novel LDR technique to reduce the dimensionality of the original data to Kâ1, such that it is well-primed for Bayesian classification. This is done by sequentially constructing linear classifiers that minimise the Bayes error via a gradient descent procedure, under an assumption of normality.
We experimentally validate the proposed algorithm on 10 UCI datasets. Our algorithm is shown to be superior in terms of the classification accuracy when compared to existing algorithms including LDR based on Fisher’s criterion and the Chernoff criterion. The applicability of our algorithm is then demonstrated by employing it in diagnosing the health states of 2 ultrasonic flow meters. As with the UCI datasets, the proposed algorithm is found to have superior performance to the existing algorithms, achieving classification accuracies of 99.4% and 97.5% on the two flow meters. Such high classification accuracies on the flow meters promise significant cost benefits in oil and gas operations.
نمونه ترجمه مقاله:
1.مقدمه
کاهش خطی ابعاد یک مجموعه داده یک گام پیش پردازشی مهم در یادگیری ماشین به بعضی دلایل است. به یک دلیل، کاهش خطی ابعاد باعث تصویرسازی آسان داده در زمانی میشود که دو یا سه بعد داده کاهش یافته باشد. به دلیل دیگر، انجام LDR قبل از یادگیری میتواند پیچیدگی مدل را کم کرده و همچنین مشکلات مقیاس کم نمونه را در الگوریتمهایی مثل تفکیک کننده خطی فیشر نیز حل کند که باعث یکی شدن ماتریسهای پراکنده میگردد. مهمتر این است که LDR معمولا یادگیری را در ابعاد کم که داده در آن کاهش یافته است را بهبود بخشیده است. معمولا علت، این حقیقت است که نتایج LDR در استخراج موثر ویژگی ازیک مجموعه داده کاربرد دارند و در نتیجه بیشپردازشی کاهش مییابد. در الگوریتمهایی مثل Kنزدیکترین همسایه (KNN)، بهبود عملکرد بدست آمده از LDR نیز به علت این است که LDR اثرات بد ابعاد زیاد را کاهش میدهد.
LDR به چند مشکل مثل تشخیص پزشکی و تشخیص صورت و اشیاء و پیشبینی کلاهبرداری کارت اعتباری اعمال میشود و ابعاد بسیار بالای فضاهای ویژگی را کاهش میدهد. در حقیقت، برنامههای دیگری هستند که کاهش ابعاد در آنها برای بهبود یادگیری اعمال میشود. یک چنین مرحلهای برای تشخیص جریان اندازهگیری است که در بخش 4 توضیح داده شده است.
یکی از مهمترین و پرطرفدارترین تکنیکهای LDR، تحلیل عنصر اصلی (PCA) است که با نشان دادن داده اصلی در یک زیرفضا کار میکند و در آن، واریانس داده در هر تخمین بیشینه میشود. با این حال، وقتی دستهبندی آماری بعد از کاهش ابعاد مطلوب باشد، PCA ممکن است اطلاعات تشریح کلاس[1] را در داده از دست بدهد و مسیرهای واریانس بیشینه لزوما در تضاد و تداخل با مسیرهای تفکیکی کلاس نیستند.
برای بیشینه کردن اطلاعات تشریح کننده کلاس در کنار کاهش خطی ابعاد، LDR به دنبال این است که دستهبندی از برچسبهای کلاس برای آگاهی از انتخاب ماتریس تبدیل M استفاده کند. در این مورد، تابع بهینه هدف به دنبال کمینه کردن خطای بایز در فضای خطی کاهش یافته است. با این حال، به دست آوردن عبارت تحلیلی برای خطای بایز برای توزیع احتمال گسسته سخت است و تخمینهای مختلفی زده میشود که باعث ایجاد تکنیکهای کاهش ابعاد نظارت شده میشود.
[1] class-discriminatory