جدال پارادایم‌ها: مقایسه جنگل تصادفی دسته‌ای بهینه‌سازی شده و تطبیقی برخط در پیش‌بینی پویای شاخص کل بورس تهران
کد مقاله : 1078-MMAI
نویسندگان
محمدرضا آیت اللهی *1، سید محمدباقر جعفری2
1دانشگاه تهران
2دانشکدگان فارابی ، دانشگاه تهران
چکیده مقاله
پیش‌بینی رفتار آتی بازار پرنوسانی مانند بورس تهران، چالشی جذاب و پر اهمیت است. این پژوهش با هدف مقایسه کارایی دو رویکرد بنیادی یادگیری ماشین، دسته‌ای و برخط، به میدان آمده است تا پاسخی برای پیش‌بینی افزایش معنادار (بیش از 0.6%) شاخص کل طی افق پنج روز کاری ارائه دهد. با اتکا بر داده‌های روزانه شاخص کل از آغاز سال 1397 تا اردیبهشت 1404 و استخراج زرادخانه‌ای شامل 78 ویژگی تکنیکال، حجمی، زمانی و تاخیری پس از پالایش دقیق، دو مدل جنگل تصادفی به نبرد فراخوانده شدند. مدل اول، یک جنگل تصادفی دسته‌ای (Batch RF)، توسط ابزار پیشرفته آپتونا بر اساس داده‌های آموزش تا پایان 1402 کالیبره و سپس در بوته آزمون داده‌های دیده نشده آتی قرار گرفت. مدل دوم، جنگل تصادفی تطبیقی (ARF) از کتابخانه نوآورانه ریور، با اتکا بر پارامترهای استاندارد و با رویکردی پویا و برخط، بر روی کل جریان داده به محک گذاشته شد. ارزیابی جامع با مجموعه‌ای از سنجه‌های کلیدی (صحت، F1، Precision، Recall، AUC) و تحلیل بصری ماتریس‌های درهم‌ریختگی و منحنی‌های ROC و PR، تصویری روشن از توانمندی‌های هر رویکرد ترسیم کرد. نتایج نشان می‌دهد که مدل تطبیقی ARF، علی‌رغم عدم بهینه‌سازی هایپرپارامتر، در طول کل دوره شبیه‌سازی ، عملکرد کلی قوی‌تر و متعادل‌تری، به‌ویژه در شناسایی فرصت‌های رشد، نسبت به مدل دسته‌ای بهینه‌سازی‌شده (ارزیابی شده بر روی دوره آزمون) به نمایش گذاشت (AUC کلی 0.795 در مقابل 0.574 بر روی تست). این یافته، برتری بالقوه پارادایم یادگیری تطبیقی را در فهم و پیش‌بینی بازار مالی پویای بورس تهران، برجسته می سازد.
کلیدواژه ها
کلیدواژگان: پیش‌بینی شاخص کل بورس تهران، یادگیری ماشین، جنگل تصادفی تطبیقی، یادگیری برخط، مهندسی ویژگی.
وضعیت: پذیرفته شده مشروط برای ارائه شفاهی
login