پرسشکده مرجع پرسش و پاسخ فارسی ایران

مسئله‌ی مهم آن است که هرگز از سؤال‌کردن دست برندارید. برای هر حس کنجکاوی، یک پاسخ وجود دارد.

نمی دانید؟! بپرسید!

می دانید؟! پاسخ دهید!


cross-validation چیست؟

1 پاسخ 1

اعتبارسنجی ضربدری
اعتبارسنجی ضربدری، که گاهی تخمین گردشی  نیز نامیده می شود، یک روش ارزیابی است که مشخص نتایج یک تحلیل آماری بر روی یک مجموعه داده تا چه اندازه قابل تعمیم و مستقل از داده های آموزشی است. این تکنیک بطور ویژه در کاربردهای پیش بینی مورد استفاده قرار می گیرد تا مشخص شود مدل موردنظر تا چه اندازه در عمل مفید خواهد بود. بطور کلی یک دور از اعتبارسنجی ضربدری شامل افراز داده ها به دو زیرمجموعه مکمل، انجام تحلیل بر روی یکی از آن زیرمجموعه ها (داده های آموزشی) و اعتبارسنجی تحلیل با استفاده از داده های مجموعه دیگر است (داده های اعتبارسنجی یا تست). برای کاهش پراکندگی، عمل اعتبارسنجی چندین بار با افرازهای مختلف انجام و از نتایج اعتبارسنجی ها میانگین گرفته می شود.
هنگامیکه جمع آوری داده های بیشتر سخت، پرهزینه و یا غیرممکن باشد. استفاده از اعتبارسنجی ضربدری کمک می کند از فرضیات بایاس شده با داده های فعلی که قابل تعمیم نیستند، دوری شود.

K-Fold
در این نوع اعتبارسنجی داده ها به K زیرمجموعه افراز می شوند. از این K زیرمجموعه، هر بار یکی برای اعتبارسنجی و K-1 تای دیگر برای آموزش بکار میروند. این روال K بار تکرار می شود و همه داده ها دقیقا یکبار برای آموزش و یکبار برای اعتبارسنجی بکار می روند. در نهایت میانگین نتیجه این K بار اعتبارسنجی به عنوان یک تخمین نهایی برگزیده می شود. البته می توان از روش های دیگر برای ترکیب نتایج استفاده کرد. بطور معمول از 10-Fold استفاده می شود.
در روش K-Fold طبقه ای  سعی می شود نسبت داده های هر کلاس در هر زیرمجموعه و در مجموعه اصلی یکسان باشد.

نمونه گیری چندباره تصادفی
در این نوع اعتبارسنجی مجموعه داده ها به دو زیرمجموعه آموزش و تست تقسیم می شود. سپس مدل موردنظر با استفاده از داده های آموزشی آموزش داده می شود و نتیجه با استفاده از داده های تست اعتبارسنجی می شود. این روال چندین بار تکرار می شود و میانگین نتایج به عنوان تخمین نهایی درنظر گرفته میشود. مزیت این روش آن است که نسبت داده های آموزش و تست در هر اجرا به تعداد تاها  وابسته نیست. عیب این روش آن است که بعضی داده ها ممکن است هرگز برای اعتبار سنجی استفاده نشوند و برخی دیگر ممکن است چند بار مورد استفاده قرار گیرند. به عبارت دیگر زیرمجموعه ها می توانند با هم هم پوشانی داشته باشند. این روش در واقع گونه از آزمایشات مونته کارلو  می باشد.

یکی-بیرون
همانطور که از اسم این روش پیداست در هر مرحله یکی از داده ها برای اعتبارسنجی بیرون گذاشته می شود و بقیه داده ها برای آموزش استفاده می شوند. این روش در واقع همان روش K-Fold است که در آن K برابر تعداد داده ها درنظر گرفته شده است. این روش از نظر محاسباتی بسیار پرهزینه است زیرا فرآیند آموزش و اعتبارسنجی به تعداد بسیار زیادی تکرار می شود.



من پاسخ بهتری دارم !


عبارت های جستجو شدهعبارت های جستجو شده

(cross validation چیست) (روش cross validation) (k-fold cross validation چیست؟) (اعتبار سنجی ضربدری) () (cross validation چیست؟) (cross-validation چیست) (روش k-fold) (validation چیست) (آموزش cross validation) (اعتبار cross validation) ("cross validation" "k fold") (cross validtion چیست) (k-fold cross validationچیست؟) ( cross validation چیست ؟) (روشهاي اعتبار سنجي داده ها) (cross validation است كه براي)