این مطالعه به بررسی اینکه آیا یک روش جدید یادگیری ماشین می تواند با دقت بیشتری حرکت قیمت سهام را پیش بینی کند.
طراحی/روش شناسی/رویکرد
این مطالعه یک مدل یادگیری عمیق ترکیبی جدید ، باقیمانده-CNN-SEQ2SEQ (RCSNET) را برای پیش بینی روند حرکت قیمت سهام ارائه می دهد. RCSNET مدل میانگین متحرک یکپارچه خود را (ARIMA) ، شبکه عصبی حلقوی (CNN) و دنباله به توالی (SEQ2SEQ) مدل حافظه طولانی مدت (LSTM) ادغام می کند.
یافته ها
مدل ترکیبی قادر به پیش بینی هر دو مؤلفه سری زمانی خطی و غیرخطی از مجموعه داده های سهام است. LSTM های CNN و SEQ2SEQ می توانند به طور مؤثر برای مدل سازی پویا از الگوهای کوتاه مدت و طولانی مدت در پیش بینی سری زمانی غیرخطی ترکیب شوند. نتایج آزمایشی نشان می دهد که مدل پیشنهادی از مدل های پایه S& P 500 از ژانویه 2000 تا آگوست 2016 بهتر است.
اصالت/ارزش
این مطالعه مدل ترکیبی RCSNET را برای مقابله با این چالش با ترکیب هر دو مدل خطی و غیر خطی توسعه می دهد. شواهد جدیدی در پیش بینی حرکت قیمت سهام بورس به دست آمده است.
کلید واژه ها
استناد
ژائو ، ی. و چن ، ز. (2022) ، "پیش بینی حرکت قیمت سهام: شواهد جدید از یک مدل یادگیری عمیق ترکیبی هیبریدی" ، مجله مطالعات تجارت و اقتصادی آسیا ، جلد. 29 شماره 2 ، صص 91-104. https://doi.org/10. 1108/jabes-05-2021-0061
ناشر
انتشارات زمرد محدود
کپی رایت © 2021 ، یانگ ژائو و ژونگلو چن
مجوز
حق استفاده مجدد مجوز فقط در مجله مطالعات تجاری و اقتصادی آسیا منتشر شده است. منتشر شده توسط انتشارات زمرد محدود. این مقاله تحت مجوز Creative Commons Attribution (CC با 4. 0) منتشر شده است. هر کسی ممکن است آثار این مقاله (برای اهداف تجاری و غیر تجاری) را تولید کند ، توزیع ، ترجمه کند و ایجاد کند. شرایط کامل این مجوز ممکن است در http://creativeecommons.org/licences/by/4. 0/legalcode مشاهده شود
1. معرفی
به طور گسترده ای اذعان می شود که پیش بینی روند حرکت قیمت سهام یک مشکل مالی دشوار است. پیش بینی نسبتاً دقیق حرکت قیمت آینده سهام ، سود سرمایه گذاران را به حداکثر می رساند. با این حال ، برای تغییرپذیری و بی ثباتی بازار سهام ، هنوز یک سوال باز است.
به طور کلی ، روش های پیش بینی سهام سنتی عمدتا شامل دو دسته است که تجزیه و تحلیل فنی و تجزیه و تحلیل اساسی هستند. تجزیه و تحلیل بنیادی ، محیط مالی شرکت ، عملیات ، شاخص های کلان اقتصادی و خرد اقتصادی را برای پیش بینی قیمت سهام تجزیه و تحلیل می کند. در حقیقت ، در سالهای اخیر ، به عنوان رشد گسترده محتوای اینترنت ، تکنیک توسعه پردازش زبان طبیعی (NLP) سرمایه گذاران را قادر می سازد تا روند حرکت بازار را بصورت آنلاین ضبط کنند. با این حال ، کیفیت محتوای آنلاین بورس تضمین نشده است و نمی تواند محتوای کم کیفیت و حتی از جمله اخبار و نظرات جعلی را حذف کند. یعنی تجزیه و تحلیل اساسی بر اساس روشها مدل سازی دشوار است. بنابراین ، در این کار ، به روش های تحلیل فنی مربوط می شود.
روشهای تجزیه و تحلیل فنی بر اساس داده های سری زمانی تاریخی. پیش بینی حرکت قیمت سهام به عنوان یک مشکل پیش بینی سری زمانی تلقی می شود. به طور کلی ، به جای پیش بینی سهام اصلی ، داده های سری قیمت سهام در دو مؤلفه ، که یک خطی و غیر خطی هستند ، انتزاع می شوند. از این رو ، ما می توانیم پیش بینی های سهام خطی و غیر خطی را تحقیق کنیم. مدل های سری زمانی خطی کلاسیک ، از جمله مدل وکتور Autoregression (VAR) و مدل میانگین متحرک یکپارچه خود (ARIMA) (LTKEPOHL ، 2005) ، برای پیش بینی سری زمان خطی در بسیاری از زمینه ها مانند اقتصادی اثبات شده است (Hamilton ، 1989) و پیش بینی قیمت برق (Contreras و همکاران ، 2003) ، در عین حال عملکرد ضعیفی برای پیش بینی غیرخطی دارند. از طرف دیگر ، مدلهای پیش بینی زمان غیرخطی سنتی ، مانند دستگاه بردار پشتیبانی (SVM) (Hossain et al. ، 2009) ، شبکه عصبی (BP) (NN) (Maier and Dandy ، 2000) ، متخصص در تخصص درتوصیف داده های غیر خطی ، در حالی که در داده های خطی و پیش بینی سریال زمانی بدتر از آن بدتر است.
یک مدل پیش بینی موفق سری سهام باید دو نکته را برآورده کند: اولا ، مدل باید برای داده های خطی و غیر خطی مناسب باشد زیرا داده های حرکت سهام حاوی هر دو است. ثانیا ، این مدل می تواند الگوهای چند فرکانس (کوتاه مدت و بلند مدت) را برای پیش بینی های دقیق قسمت غیر خطی ضبط کند.
در سالهای اخیر ، بر اساس رشد سریع توانایی محاسبات رایانه ها و داده های عظیم ، روشهای یادگیری عمیق به طور وحشیانه در تشخیص گفتار پذیرفته شده است (هینتون و همکاران ، 2012) ، طبقه بندی تصویر ، انتقال دستگاه (چو و همکاران ، 2014) و منطقه دیگر ، که از انواع مشتقات شبکه عصبی مصنوعی (ANN) تشکیل شده اند ، مانند شبکه عصبی حلقوی (CNN) و شبکه عصبی مکرر (RNN). مدل های CNN با استخراج ویژگی های محلی در سطوح مختلف دانه بندی از تصاویر ورودی ، عملکرد تشخیص تصویر برجسته را انجام می دهند. RNN (همانطور که در شکل 1 (a) نشان داده شده است) نوعی از مدل غیر خطی است ، و علاوه بر این ، این توانایی را دارد که وابستگی های طولانی مدت را مدل کند ، و این باعث می شود که هم برای داده های غیر خطی و هم طولانی مناسب باشدوابستگی های مدت. با این حال ، وابستگی های طولانی مدت توسط RNN سنتی تشخیص داده می شود و از ناپدید شدن شیب رنج می برد (بنگیو و همکاران ، 2002). برای حل این مشکل ، واحدهای حافظه طولانی مدت (LSTM) (همانطور که در شکل 1 (b) نشان داده شده است) (Hochreiter and Schmidhuber ، 1997) و واحد مکرر دروازه (GRU) (Chung et al. ، 2014) به دست آورده اندموفقیت بزرگ در دامنه های مختلف مانند نسخه رایانه و NLP.
با موفقیت اخیر یادگیری عمیق ، ما مدل ترکیبی باقیمانده-CNN-SEQ2SEQ (RCSNET) را برای مقابله با این چالش با ترکیب هر دو مدل خطی و غیر خطی توسعه می دهیم. در شکل 2 ، این مدل از لایه ARIMA ، لایه CNN ، لایه SEQ2SEQ LSTM و لایه کاملاً متصل (FC) تشکیل شده است. از این رو ، این مدل قادر به پیش بینی هر دو سری زمانی خطی و غیر خطی است و همچنین می تواند الگوهای فرکانس را به طور جداگانه در لایه LSTM SEQ2SEQ ادامه دهد. به طور کلی ، بر اساس ویژگی های فوق ، ما آن را برای پیش بینی روند حرکت سهام اعمال می کنیم.
بقیه این کار به شرح زیر برنامه ریزی شده است: در بخش 2 آثار اولیه و مرتبط را ارائه می دهیم. بخش 3 جزئیات مدل RCSNET ارائه شده در این مطالعه را ارائه می دهد. مقایسه بین نتایج مدل ما و مدلهای سنتی در بخش 4 نشان داده شده است. نتیجه گیری و کار آینده در بخش 5 نمایش داده می شود.
2. آثار اولیه و مرتبط
این مطالعه شامل سه گروه از تحقیقات در درجه اول ، یعنی مدل های خطی ، مدل های غیر خطی و مدل های ترکیبی است. بنابراین ، مدل های خطی سنتی ، مدل های غیر خطی و مدل های ترکیبی برای پیش بینی حرکت سهام در این بخش ذکر شده است.
2. 1 مدل خودکار
مدل ARIMA یکی از متداول ترین مدل های خودرگرسیون است که به طور گسترده مورد مطالعه قرار گرفته است (همیلتون، 1989؛ کنترراس و همکاران، 2003). این مدل های خطی را می توان به طور موثر برای پیش بینی رفتار اقتصادی و مالی به کار برد (تسی، 2005؛ سیمز، 1980). مدل ARIMA به طور کلی به صورت ARIMA (p، d، q) بیان می شود، که در آن p، d و q پارامترهایی هستند که توسط اعداد صحیح غیر منفی تشکیل شده اند. p مجموعه ای برای تعداد تاخیرهای زمانی مدل خودرگرسیون (ترتیب اصطلاحات AR) است. d نشان دهنده ترتیب تفاوت ها و q نشان دهنده ترتیب مدل میانگین متحرک است. مدل ARIMA به صورت زیر فرموله شده است:
جایی که φ i پارامتر قسمت اتورگرسیو مدل را نشان می دهد، θj پارامتر قسمت میانگین متحرک مدل است. علاوه بر این، ϵ t عبارت خطا در زمان t است، و ϵ t - j عبارت های خطا را که معمولاً فرض می شود مستقل باشند، از یک توزیع نرمال که میانگین آن صفر است، نشان می دهد. x t نشان دهنده نتیجه پیش بینی روش خودرگرسیون است.
2. 2 مدل شبکه عصبی پس انتشار
شبکه عصبی پس انتشار (BPNN) یکی از ضروری ترین شبکه های عصبی مصنوعی است که توسط روملهارت و همکاران پیشنهاد شده است. در سال 1986 (Rumelhart et al., 1988). به طور گسترده ای در پیش بینی و پیش بینی استفاده می شود. JZ Wang و همکاران. برای پیش بینی قیمت سهام، موجک زدایی از نویز مبتنی بر انتشار معکوس (WDBP) NN (وانگ و همکاران، 2011) را پیشنهاد کردند. M Gken و همکارانیک NN با انتخاب مناسب ترین شاخص های فنی برای پیش بینی بازار سهام (Gken et al., 2016) در سال 2016 ارائه کرده اند. در این مطالعه، فرض می کنیم که BPNN از لایه های غیر خطی با تابع سیگما σ ( ) تشکیل شده است. عملکرد فعالما سه لایه شامل لایه ورودی، مخفی و خروجی طراحی می کنیم. هر لایه داخلی به طور کامل به لایه قبلی مرتبط است.
که در آن W i یک ماتریس وزن i (ماتریس پارامتر) برای لایه i است، b i عبارت بایاس است. پس از آموزش، hمننتیجه پیش بینی مدل BPNN را نشان می دهد.
2. 3 مدل شبکه عصبی بازگشتی
RNN نوعی ANN است که خود را از طریق داده های پی در پی به هم متصل می کند و یک گردش مستقیم را تشکیل می دهد. این امر باعث می شود رفتار زمانی پویا نشان دهد. انواع مختلفی از RNN وجود دارد ، از جمله RNN ساده ، LSTM و غیره. مدل RNN قادر به گرفتن قانون داخلی طولانی مدت و غیر خطی داده ها با سلولهای حافظه دروازه است. از این رو ، می تواند محتوای بلند مدت داده های سری زمانی را به خاطر بسپارد. Ew Saad و همکاران. از نوع تأخیر زمان ، NN های مکرر و احتمالی برای روند حرکت قیمت سهام بهره برداری کرده اند (سعد و همکاران ، 1998). CM KUAN و همکاران. عملکرد پیش بینی خارج از نمونه RNN ها را از طریق داده های نرخ ارز تجربی بررسی کرده اند (کوان و لیو ، 1995). یک "گیت فراموشی" ، که توسط F Gers ارائه شده است ، به یک سلول LSTM اجازه می دهد تا در یک زمان مناسب خود را بازسازی کند و از این طریق منابع داخلی را در طول پیش بینی آزاد کند (گرز و همکاران ، 2000).
2. 3. 1 مدل شبکه عصبی مکرر ساده
یک مدل RNN ساده می تواند با استفاده از حافظه داخلی آن با سری زمانی ورودی ها مقابله کند. ورودی به روش یک خوراک استاندارد در هر مرحله زمان پخش می شود. اتصالات پشتی ثابت باعث می شود واحدهای زمینه ای یک نسخه از مقادیر واحدهای پنهان قبلاً را در تمام مدت نگه دارند. معادلات توسط:
در مدل ، x = (x 1 ، x 2 ،… ، x t) ، h t و y t به ترتیب بردار ورودی ، بردار پنهان و بردار خروجی (پیش بینی) را نشان می دهد.(w ، u ، b) ماتریس پارامتر و بردار هستند. علاوه بر این ، σ عملکرد فعال سازی است. y t نشان دهنده خروجی پیش بینی است.
2. 3. 2 مدل حافظه بلند و کوتاه مدت ساده
مدل LSTM ساده از واحدهای LSTM تشکیل شده است. یک سلول ، یک دروازه ورودی ، یک دروازه خروجی و یک دروازه فراموش شده در یک واحد LSTM وجود دارد. معادلات توسط:
جایی که w ، w i ، w o و u f ، u i ، u o به ترتیب وزن های ورودی و اتصالات مکرر را جمع می کنید. دروازه ورودی i t ، دروازه خروجی ، c ^ t مقدار وضعیت واحد به روز شده را نشان می دهد و Gate F T و سلول حافظه C T را در فعال سازی محاسبه شده ، که عملکرد سیگموئید است ، فراموش می کند. H T بیانگر خروجی مدل برای پیش بینی است.
2. 3. 3 مدل ترکیبی
یک مدل ترکیبی مدلی است که دو یا چند مدل پایه از انواع مختلف را برای دستیابی به یک مدل بهتر ترکیب می کند ، که به طور گسترده مورد بررسی قرار گرفته است. پینگ فنگ پی و همکاران. مدل ترکیبی ترکیب ARIMA را با SVM ها بر اساس داده های سری زمانی تحقیق کرد (PAI and Lin ، 2005). آنها یک روش ترکیبی را برای پیش بینی قیمت سهام از طریق استفاده از برتری مدل های ARIMA و SVM پیشنهاد دادند. آشو جین و همکاران. یک مدل NN سری زمانی ترکیبی ایجاد کرده اند ، که می تواند از مزایای روش های سنتی سری زمانی و ANN ها استفاده کند (Jain and Kumar ، 2007). یک چارچوب ترکیبی از SVM با رویکرد همسایه K-Nearest برای پیش بینی شاخص های بازار سهام هند که توسط نایاک و همکاران ارائه شده است.(2015). Fa Gers و همکاران. یک مدل ترکیبی را طراحی کرده است که یک MLP و LSTM مبتنی بر پنجره را برای پیش بینی ترکیب می کند (گرز و همکاران ، 2001) در سال 2002. یک MLP مبتنی بر پنجره در درجه اول آموزش داده شد ، سپس وزن آن یخ زده شد ، و در نهایت ، LSTM به کار گرفته شدخطای پیش بینی در این مدل را کاهش دهید.
داده های سری زمانی سهام دارای مؤلفه وابستگی خطی و غیرخطی هستند.
مؤلفه غیر خطی داده های سری زمانی سهام حاوی الگوهای طولانی و کوتاه است.
از این رو ، ما یک مدل ترکیبی برای حل این مشکلات برای پیش بینی روند حرکت سهام طراحی می کنیم.
3. مدل باقیمانده-CNN-SEQ2SEQ
در این بخش جزئیات مدل پیش بینی سری زمانی سهام بحث شده است. RCSNET از لایه های ARIMA ، CNN ، SEQ2SEQ LSTM و FC تشکیل شده است. عملکرد عینی و استراتژی بهینه سازی نیز مورد بحث قرار گرفته است.
3. 1 بیانیه مشکل و الگوریتم
این مشکل به طور معمول به شرح زیر است: با توجهمقدار داده های پیش بینی شده x پیش بینی ، x پیش بینی = f (x 1 ، x 2 ، ⋯ ، x t). بشریافتن مناسب ترین پارامترهای RCSNET برای پیش بینی حرکت سهام بسیار مهم است.
RCSNet ابتدا مولفه وابستگی خطی را توسط مدل ARIMA استخراج می کند. سپس، سری زمانی خطای باقیمانده (داده های هدف خروجی پیش بینی ARIMA را کم می کند) به عنوان مولفه غیرخطی مشاهده می شود. لایه CNN برای استخراج الگوهای معاملاتی کوتاه مدت و بلند مدت استفاده می شود. پس از لایه CNN، سری زمانی خطای باقیمانده از الگوهای مختلف توسط لایه Seq2Seq پیش بینی می شود تا نتایج پیش بینی میانی غیرخطی تولید کند. در نهایت، لایه FC به طور مشترک نتایج پیش بینی نهایی را با استفاده از نتایج میانی خطی و غیرخطی خروجی می دهد. به طور کلی، RCSNet را می توان به صورت زیر توصیف کرد:
مدل خطی ورودی x t را تا گام زمانی t می برد و خروجی x ^ t + h را تولید می کند، که همان چیزی است که مدل ARIMA برای یک افق h پیش بینی می کند. x t + h مقدار واقعی t + h را نشان می دهد. مدل های خطی باقیمانده e t + h را با تفریق x ^ t + h و مقدار واقعی بدست می آوریم. e t + h دارای الگوهای معاملاتی چند فرکانس است و الگوی معاملاتی فرکانس را توسط لایه CNN استخراج می کنیم. یک Seq2Seq LSTM برای مدل سازی باقیمانده های غیرخطی استفاده می شود که ورودی آن باقیمانده فرکانس فرکانس e ^ t + h است. هدف Seq2Seq LSTM پیش بینی خطایی است که مدل خطی در پیش بینی بعدی خود برای مرحله زمانی t + h ایجاد می کند. سپس خروجی مدل نهایی با ترکیب پیش بینی e ^ t + h با پیش بینی مدل های خطی x ^ t + h ایجاد می شود. الگوریتم کلی برای RCSNet:
3. 2 لایه میانگین متحرک یکپارچه اتورگرسیو
RCSNet از مدل ARIMA به عنوان فیلتر خطی استفاده می کند. مدل Seq2Seq LSTM با محاسبه باقیمانده مدل خطی (جزء غیر خطی) آموزش داده می شود. همانطور که شکل 3 نشان می دهد، فیلتر ARIMA می تواند مولفه خطی را از سری داده های سهام تاریخی تشخیص دهد و سپس می توانیم سری داده های غیر خطی را بدست آوریم.
3. 3 لایه شبکه عصبی کانولوشنال
لایه دوم RCSNet که برای استخراج الگوهای کوتاه و بلند در بعد زمانی طراحی شده است، یک لایه شبکه کانولوشن بدون ادغام است. لایه CNN از چندین فیلتر با ارتفاع w تشکیل شده است که برابر با تعداد متغیرها تنظیم شده است. فیلتر k-امین از ماتریس ورودی X عبور می کند. الگوهای بلندمدت منعکس کننده فرکانس معاملات فصل، ماه هستند، در حالی که الگوهای کوتاه مدت فراوانی معاملات هفته، روز را بیان می کنند. به دلیل در نظر گرفتن انواع مختلف الگوهای فرکانس معاملاتی، این احتمال وجود دارد که سری زمانی را دقیقاً پیش بینی کنیم.
جایی که × محاسبه حلزون را نشان می دهد ، و خروجی H K یک بردار است که فقط یک ستون در کار ما دارد. این کار هر بردار H K از طول T را با صفر در سمت چپ ماتریس ورودی X پر می کند. اندازه ماتریس خروجی لایه حلقوی M C ∗ T است ، که در آن M C مقدار فیلترها را نشان می دهد.
3. 4 SEQ2SEQ لایه حافظه طولانی مدت
با الهام از موفقیت ترجمه ماشین (چو و همکاران ، 2014) ، ما قدرت مدل SEQ2SEQ را در NLP تشخیص داده ایم. به طور خاص ، دو مؤلفه مهم مدل استاندارد SEQ2SEQ را تشکیل می دهند ، یکی رمزگذار و دیگری رمزگذار است. پیشین ورودی منبع X را به یک نمایش بردار نقشه می کند ، در حالی که دومی یک سری خروجی را بر اساس منبع تولید می کند. رمزگذار و رمزگذار LSTM هستند. با انتقال آخرین وضعیت حافظه رمزگذار به رمزگذار به عنوان وضعیت حافظه اصلی ، رمزگذار قادر به دسترسی به اطلاعات از رمزگذار است. ورودی و خروجی به طور کلی از LSTM های مختلفی استفاده می کنند که پارامترهای ترکیبی خاص خود را برای ضبط الگوهای مختلف ترکیبی دارند. ما یک مدل LSTMS SEQ2SEQ را برای پرداختن به مسئله پیش بینی سری زمانی غیر خطی به عنوان لایه سوم اعمال می کنیم. شکل 4 مدل تشکیل شده توسط یک رمزگذار و رمزگشایی را نشان می دهد. در قسمت رمزگذار ، از مکانیسم ورودی LSTM برای ورود به داده های سری استفاده می شود. در قسمت رمزگشگر ، یک مکانیسم LSTM خروجی برای رمزگشایی حالتهای پنهان رمزگذار در تمام مراحل زمانی قبل از آن استفاده می شود.
3. 4. 1 رمزگذار
ماژول رمزگذار قابل ملاحظه ای LSTM است. این می تواند سری ورودی را در یک نمایش مشخص رمزگذاری کند. به عنوان مثال ، با توجه به n سری ورودی x = (x 1 ، x 2 ، · · · ، x t) ∈ R n × t ، که در آن اندازه پنجره دنباله را نشان می دهد. ما از رمزگذار در یادگیری یک تابع نقشه برداری از x t تا h t (در مرحله زمان t) ، h t = f e n c (h t 1 ، x t) استفاده می کنیم ، جایی که h t ∈ R m حالت مخفی رمزگذار در زمان t است ، m نشان می دهد اندازه اندازهحالت پنهان و علاوه بر این ، f e n c یک عملکرد فعال سازی غیر خطی را نشان می دهد. در زمان T ، هر واحد LSTM دارای یک سلول حافظه با حالت C E N C (T) است. c ^ e n c (t) مقدار واحد به روز شده واحد را برای رمزگذار نشان می دهد. سه دروازه سیگموئید وجود خواهد داشت که دسترسی به سلول حافظه را کنترل می کنند: Gate F E N C (T) ، دروازه ورودی I E N C (T) و دروازه خروجی O E N C (T) را فراموش کنید. به روزرسانی واحد LSTM به شرح زیر خلاصه می شود:
نرم افزار مفید تریدر...
ما را در سایت نرم افزار مفید تریدر دنبال می کنید
برچسب :
نویسنده : احمد شاملو
بازدید : 26
تاريخ : پنجشنبه
1 تير
1402 ساعت: 0:33