مدل یادگیری ماشین ترکیبی دو مرحله ای برای پیش بینی قیمت بیت کوین با فرکانس بالا بر اساس شاخص های فنی ، تجزیه حالت تغییر و رگرسیون بردار پشتیبانی

ساخت وبلاگ

با توجه به پویایی ذاتی هرج و مرج و فراکتال در سری قیمت بیت کوین ، این مقاله یک مدل پیش بینی قیمت بیت کوین دو مرحله ای را با ترکیب مزیت تجزیه حالت تغییر (VMD) و تجزیه و تحلیل فنی ارائه می دهد. VMD سیگنال های نویز و نوسانات تصادفی در داده های قیمت را با تجزیه داده ها در توابع حالت متغیر از بین می برد ، در حالی که تجزیه و تحلیل فنی از روندهای آماری به دست آمده از فعالیت تجاری گذشته و تغییرات قیمت برای ساخت شاخص های فنی استفاده می کند. رگرسیون بردار پشتیبانی (SVR) ورودی را از ترکیبی از شاخص های فنی (TI) و توابع حالت تنوع بازسازی شده (RVMF) می پذیرد. این مدل در دوره ای که با آشفتگی اقتصادی بی سابقه به دلیل بیماری همه گیر Covid-19 انجام می شود ، آموزش داده ، تأیید و آزمایش می شود و امکان ارزیابی مدل در حضور بیماری همه گیر را فراهم می کند. مدل هیبریدی ساخته شده از مدل SVR منفرد استفاده می کند که فقط از ویژگی های Ti و RVMF استفاده می کند. توانایی پیش بینی قیمت بیت کوین در داخل دقیقه ای ، تمایل زیادی برای کاهش قرار گرفتن در معرض سرمایه گذاران در برابر ریسک دارد و تضمین های بهتری به بازده سالانه می دهد.

1. معرفی

بیت کوین ، که بزرگترین رمزنگاری با سرمایه در حدود 125 میلیارد دلار در بازار محسوب می شود [1] ، بزرگترین جریان بیت کوین خود را تجربه کرده و همچنین در دوره همه گیر COVID-19 نیز از بین رفته است. این باعث شده است که یک قیمت ناپایدار داخلی منجر به عدم قطعیت قیمت شود و از پتانسیل آن به عنوان ارز استفاده شود و به این ترتیب به عنوان یک ارز دیجیتال بسیار بی ثبات در نظر گرفته می شود [2]. عوامل مختلف به نوسانات در قیمت بیت کوین کمک می کنند ، که شامل اندازه بازار کوچک تجارت بیت کوین بر خلاف دارایی های مالی معمولی مانند سهام ، ارزهای فیات و اوراق است. فعالیت معدن نظارت نشده ؛خبرها و رویدادها؛در دسترس بودن آن برای تجارت 24/7 ؛نقدینگی پایین که باعث افزایش نوسانات قیمت می شود. تغییر احساسات ؛گمانه زنی های غیرمتمرکز و زیاد. این نوسانات قیمت بالا پیش بینی کارآمد قیمت آن را دشوار می کند. حتی بیشتر ، تغییرات ساختاری در قیمت بیت کوین در نتیجه تأثیر COVID-19 وجود دارد. مقاله "آنچه با بازار بیت کوین اتفاق می افتد" منتشر شده در وب سایت Chainalaliss [3] نشان دهنده پاسخ بیت کوین به همه گیر Covid-19 است. از 9 مارس 2020 ، بازارهای مبادله بیت کوین طی یک دوره هشت روزه 1. 1 میلیون بیت کوین دریافت کرده اند که در 13 مارس 2020 به 319،000 بیت کوین رسید. این به طور قابل توجهی با میانگین 52،000 بیت کوین در روز قبل از 9 مارس 2020 متفاوت بود. همچنین ، میانگین روزانه بیت کوین که به بازارهای مختلف مبادله بیت کوین ارسال شده است که در 12 مارس 2020 تا 13 مارس 2020 فروخته می شود ، همچنین نه بار افزایش یافته است. این فشار فروش باعث شده قیمت بیت کوین به تقریباً 37 ٪ کاهش یابد.

بازار بیت کوین یک بازار ناکارآمد است. از این رو ، بازار تمام اطلاعات موجود را برای تعیین قیمت منصفانه برای بیت کوین در بر نمی گیرد [4-6]. مرجع [4] نتیجه گرفت که بازده بیت کوین فرضیه بازار کارآمد را برآورده نمی کند. با استفاده از داده ها در فرکانس های مختلف ، تجزیه و تحلیل پنجره با هم همپوشانی و عدم هم زدن ، [5] پویایی کارآیی اطلاعاتی بیت کوین را مورد بررسی قرار داد و نتیجه گرفت که بازار بیت کوین یک بازار ناکارآمد است. مرجع [6] با بررسی کارآیی 31 رمزنگاری برتر ارز توسط سرمایه بازار ، از این ادعا حمایت کرد. این نشان می دهد که می توان پیش بینی قیمت را بر اساس اطلاعات تاریخی کشف کرد.

سه نوع مدل پیش بینی سری زمانی در ادبیات ارائه شده است: مدل های آماری ، مدل های هوش مصنوعی و مدل های ترکیبی. در دهه های گذشته ، محققان از مدلهای آماری معمولی مانند مدل های اتورگرایی (AR) استفاده کرده اند [7] ، میانگین متحرک خودجوش (ARMA) [8] ، میانگین متحرک یکپارچه خودجوش (ARIMA) [9] و رگرسیون خطی چند متغیره [10]برای پیش بینی قیمت بیت کوین. مدل های آماری برای سیستم های هرج و مرج (مانند بازار رمزنگاری) با بسیاری از عدم قطعیت ها مناسب نیستند زیرا آنها نیاز به داده های سری زمانی دارند که تحت فرضیه های پیشینی خاص ، مانند ثابت بودن قرار بگیرند [11]. با این حال ، سری قیمت بیت کوین غیر ایستگاه و غیرخطی است [12]. همانطور که در [13] بیان شد ، مدل های پیش بینی معمولی مانند مدل های رگرسیون به سختی می توانند دینامیک غیرخطی را در بیشتر داده های سری زمانی ضبط کنند. این موارد حاکی از آن است که در برخی از شاخص های فنی که به عنوان ویژگی های پیش بینی استفاده می شود ، خصوصیات ذاتی عدم تحرک و غیرخطی بودن وجود دارد. به همین ترتیب ، پیش بینی قیمت بیت کوین با استفاده از مدلهای آماری به خطاهای بزرگ محدود می شود. داده های سری زمانی با این حقایق تلطیف شده را می توان با استفاده از مدل های غیرخطی مانند مدل های یادگیری ماشین و تکنیک های تجزیه ، به طور مؤثر مورد بررسی قرار داد. مدل های یادگیری ماشین ، که زیر مجموعه ای از هوش مصنوعی هستند ، در نتیجه پیشرفت هوش محاسباتی مورد توجه بسیاری قرار گرفته اند. آنها روشهای مبتنی بر داده هستند که به هیچ فرضیه ای که آپریوری انجام می شود متکی نیستند و بنابراین برنامه های متنوعی دارند. رگرسیون بردار پشتیبانی (SVR) ، نوعی از مدل یادگیری ماشین ، به دلیل توانایی یادگیری غیرخطی قوی خود به یک الگوریتم محبوب برای مشکلات مختلف پیش بینی تبدیل شده است [14 ، 15]. اما ، عملکرد مدل های یادگیری ماشین به ماهیت و ویژگی های داده ها بسیار وابسته است [16] که باعث می شود مدل های یادگیری ماشین به طور عمیق از ویژگی های درونی سری بیت کوین استفاده کنند. همچنین ، با توجه به پویایی غیرخطی سری بیت کوین ، که شامل شکستگی ذاتی و هرج و مرج آن است ، مدلهای پیش بینی تک مرحله ای برای پیش بینی قیمت بیت کوین با دقت بسیار بالا کافی نیستند.

مرجع [14] یک مدل SVR مبتنی بر تجزیه حالت تجربی (EMD) و AR برای پیش بینی بار الکتریکی پیشنهاد کرد. با استفاده از داده های نامتعادل، مدل ترکیبی پیشنهادی بهتر از مدل SVR اصلی عمل کرد. با استفاده از شاخص های فنی میانگین متحرک به عنوان ورودی برای خودرگرسیون غیرخطی مبتنی بر پرسپترون چندلایه با ورودی های برون زا، [17] قیمت بیت کوین را پیش بینی کرد. مرجع [12] سری قیمت بیت کوین درون روز را با استفاده از مدل مجموعه ای VMD و مدل افزایشی تعمیم یافته (GAM) پیش بینی کرد. مدل VMD-GAM با یک مدل مجموعه ای از EMD و GAM مقایسه شد. نویسنده به این نتیجه رسید که VMD-GAM بهتر از EMD-GAM عمل می کند. همانطور که توسط [18] اشاره شد، VMD بهتر از سایر ابزارهای تجزیه سیگنال عمل می کند زیرا الایاسینگ مودال و استحکام نویز را حذف می کند. مرجع [19] یک مدل پیش بینی ترکیبی برای شاخص های قیمت سهام با استفاده از شبکه VMD و واحدهای بازگشتی دردار (GRU) ساخت. مدل ساخته شده با استفاده از VMD یا GRU عملکرد بهتری نسبت به مدل های منفرد داشت. مرجع [20] در مطالعات خود به این نتیجه رسیدند که مدل ترکیبی پیشنهادی (EMD-SVM) بهتر از مدل پیش بینی فردی عمل می کند. واضح است که در پیش بینی سری های زمانی آشفته، ثابت شده است که مدل های هیبریدی بهتر از همتایان خود عمل می کنند.

علاوه بر این، [21] نشان داد که قیمت بیت کوین به شدت توسط احساسات و شتاب بازار به جای مبانی اقتصادی زیربنایی تحریک می شود. از این رو، ما از شاخص های فنی به عنوان ویژگی هایی برای پیش بینی قیمت بیت کوین در روز یک دقیقه استفاده می کنیم. مزیت شاخص های فنی به عنوان ویژگی به این دلیل است که آنها فقط به داده های تاریخی قیمت بیت کوین نیاز دارند و به هیچ بنیاد اقتصادی وابسته نیستند. مرجع [22] یک مدل مبتنی بر درخت طبقه بندی برای پیش بینی بازگشت بیت کوین با استفاده از 124 شاخص فنی ساخت. آنها به این نتیجه رسیدند که کلان داده و تحلیل تکنیکال در پیش بینی بازده بیت کوین کارآمد هستند. اخیراً، [23] مناسب بودن شبکه های عصبی با یک جزء کانولوشن را به عنوان یک مدل طبقه بندی برای شش ارز رمزنگاری محبوب (بیت کوین، دش، اتر، لایت کوین، مونرو و ریپل) بر اساس شاخص های فنی بررسی کرده است. نتایج نشان دهنده مناسب بودن شاخص های فنی به عنوان ورودی برای پیش بینی ارزهای دیجیتال است.

یک چارچوب جدید مبتنی بر یک الگوریتم تجزیه (تجزیه حالت متغیر) که قادر به ضبط ماهیت هرج و مرج سری بیت کوین است ، در ادبیات برای پیش بینی سری زمان ارائه شده است. در تجزیه حالت متغیر (VMD) ، انتخاب یک مدل بهینه شامل پتانسیل مدل برای نمونه برداری از پویایی اساسی (حالت های متغیر) از سری اصلی و شدت سر و صدای آن است [24]. از این رو ، قیمت بیت کوین به اجزای عملکرد عملکرد متغیر ثابت (VMFS) تجزیه می شود. این VMF ها در سری جدید بازسازی می شوند که عملکرد پیش بینی بهتری نسبت به VMF های اصلی دارند. سری بازسازی شده با شاخص های فنی با ابعاد بالا به عنوان ویژگی هایی برای مدل پیش بینی SVR همراه است. این مدل ترکیبی به افزایش دقت پیش بینی کمک می کند.

آیا به عنوان یکی از بی ثبات ترین دارایی ها ، آیا قیمت بیت کوین در میان همه گیر Covid-19 قابل پیش بینی است؟آیا ترکیبی از شاخص های فنی و سری VMF ویژگی بهینه برای پیش بینی قیمت بیت کوین با فرکانس بالا در این بیماری Covid-19 را فراهم می کند؟با توجه به ویژگی های مختلف به عنوان چنین مجموعه ای از آموزش مجزا ، چگونه می توان عملکرد عمومی سازی یک مدل بردار پشتیبانی را که به داده ها آموزش داده شده اندازه گیری کنیم؟این سؤالاتی است که ما در این مقاله به دنبال آن هستیم. سهم این مقاله چهار برابر است: (1) تعیین یک متریک عملکرد جدید برای ارزیابی اثربخشی VMF بازسازی شده در انتخاب یک حالت بهینه

مقدار به نام سیگنال متوسط اختلاف مطلق (SAAD) ، (2) ارزیابی پیش بینی قیمت داخلی بیت کوین خارج از نمونه در میان همه گیر Covid-19 با استفاده از هیبرید شاخص های فنی (TI) و عملکردهای حالت تنوع (RVMF) به عنوان ویژگی های مدل پیش بینی SVR ، (3) ارزیابی و مقایسه عملکرد پیش بینی کننده دو ویژگی (TI و RVMF) با مدل ترکیبی در میان Covid-19 ، و (4) اضافه کردن به شواهد تجربی کمیاب مدل ترکیبی با استفادهSVR ، TI و RVMF در پیش بینی قیمت بیت کوین یک دقیقه ای.

بقیه مقاله به شرح زیر سازماندهی شده است: بخش 2 مواد و روشهای ساخت داده های مدل های پیش بینی ، نتایج تجربی و بحث در مورد مطالعه را در بخش 3 ارائه می دهد. و نتیجه گیری در بخش 4 بیان شده است.

2. مواد و روشها

در این بخش ، مفاهیم نظری برای اجرای مدل پیش بینی SVR-TI-RVMF به تفصیل شرح داده شده است. روش مورد استفاده برای مدل پیش بینی پیشنهادی و معیارهای ارزیابی نیز در این بخش شرح داده شده است.

2. 1شاخص های فنی و انتخاب ویژگی با استفاده از الگوریتم Boruta

تجزیه و تحلیل فنی دارایی براساس این فرضیه است که تمام اطلاعات مهم در مورد آن دارایی در قیمت و/یا سایر داده های بازار مانند قیمت پایین ، قیمت بالا ، قیمت باز و حجم معامله شده موجود است. در این مقاله از 30 شاخص فنی (TI) به عنوان فضای ویژگی اولیه استفاده می شود که قیمت بیت کوین را مشخص می کند. جدول 1 لیست شاخص های فنی اولیه را قبل از انتخاب ویژگی ارائه می دهد. یک بررسی جامع از این شاخص های فنی در [25] ارائه شده است.

میز 1 شاخص های فنی.

انتخاب ویژگی یک گام مهم است که زیر مجموعه ای از ویژگی ها را پیدا می کند که ویژگی های نشانگر فنی reductant را به حداقل می رساند و ارتباط را با پیش بینی به حداکثر می رساند. این امر به جلوگیری از لعنت ابعاد کمک می کند و در نتیجه دقت پیش بینی را بهبود می بخشد. در این مقاله از الگوریتم Boruta برای انتخاب ویژگی استفاده می شود. الگوریتم Boruta (BA) یک الگوریتم انتخاب ویژگی است که از یک رویکرد بسته بندی ساخته شده بر روی الگوریتم Random Forest (RF) برای انتخاب مهمترین ویژگی ها برای یک مدل پیش بینی استفاده می کند. BA می تواند به طور موثری تعامل بین متغیرها را انجام دهد و تمام ویژگی ها را در نظر بگیرد ، که مربوط به متغیر نتیجه است. TBA به شرح زیر اجرا می شود: مرحله 1. مرحله 2 کپی از شاخص های فنی تولید کنید. به طور تصادفی شاخص های فنی اصلی و تکراری را تغییر دهید تا همبستگی آنها با متغیر نتیجه مرحله 3 را از بین ببرد. با استفاده از الگوریتم RF ، شاخص های فنی کلیدی را بر اساس مقادیر متوسط بالاتر مرحله 4 جستجو کنید. با استفاده از میانگین/انحراف استاندارد ، محاسبه کنید

نمره مرحله 5. از ویژگی های تکراری و نشانگر فنی ، حداکثر نمره مرحله 6 را پیدا کنید. برای کمتر از ویژگی نشانگر فنی ، آن ویژگی شاخص فنی مرحله 7 را حذف کنید. مراحل 1-6 را تا زمان تکمیل تکرار تکرار کنید

2. 2تجزیه حالت متغیر (VMD)

از الگوریتم VMD برای تجزیه یک سیگنال ورودی با ارزش واقعی در مجموعه حالت ها استفاده می شود

، همچنین توابع حالت متنوع (VMF) نامیده می شود ، که در آن هر VMF یک ویژگی منحصر به فرد دارد. هر VMF دارای یک دامنه فرکانس منحصر به فرد است که از سیگنال ورودی حاصل می شود. هر VMF نیز فرض می شود که عمدتا در یک پالس مرکز جمع و جور است

، و حالت ها همزمان از دیدگاه بهینه سازی محدب استخراج می شوند. الگوریتم VMD را می توان به عنوان یک فرمول تغییر محدود ، بیان کرد ،

نرم افزار مفید تریدر...
ما را در سایت نرم افزار مفید تریدر دنبال می کنید

برچسب : نویسنده : احمد شاملو بازدید : 28 تاريخ : شنبه 31 تير 1402 ساعت: 18:56