هوش مصنوعی برای مدیریت نمونه کارها: از Markowitz گرفته تا یادگیری تقویت

ساخت وبلاگ

AI for portfolio management

هوش مصنوعی ، یادگیری ماشین ، داده های بزرگ و سایر کلمات کلیدی تقریباً در هر زمینه ای از امور مالی ، تصمیم گیری را مختل می کند. در دفتر پشتیبان ، یادگیری ماشین به طور گسترده ای برای ناهنجاری های نقطه ای در سیاهههای مربوط به اجرای ، برای مدیریت ریسک و تشخیص معاملات کلاهبرداری استفاده می شود. در دفتر جلو ، هوش مصنوعی برای تقسیم مشتری و پشتیبانی و قیمت گذاری مشتقات استفاده می شود.

اما مطمئناً ، جالب ترین کاربردهای هوش مصنوعی در امور مالی در سمت خرید است و مربوط به جستجوی سیگنال پیش بینی کننده در سر و صدا و صید آن است که آلفا است. آنها شامل می شوند اما محدود به پیش بینی سری زمانی نیستند ، تشخیص تغییر سرعت رژیم، تقسیم بازار و البته مدیریت نمونه کارها دارایی.

این مقاله کاملاً به مسئله دوم اختصاص دارد - ما روشهای ریاضی کلاسیک را برای بهینه سازی نمونه کارها ، بدون نظارت ، رویکردهای یادگیری ماشین نظارت شده ، عوامل یادگیری تقویت و برخی از گزینه های عجیب و غریب دیگر مرور خواهیم کرد. مطالب این موضوع با تخصص داخلی آزمایشگاه نورون ها که من بنیانگذار و CTO هستم و دوره ای که در مدرسه تابستانی علوم داده UCU تدریس می کردم ، کاملاً ارتباط دارد. مثل همیشه ، می توانید تمام کد منبع را در GitHub و نتایج آزمایشات بیشتر در این مقاله پیدا کنید.

فقط در صورتی که نمی دانید چیست

اگر این محتوای آموزشی عمیق برای شما مفید است ، می توانید در لیست پستی تحقیقات هوش مصنوعی ما مشترک شوید تا هنگام انتشار مطالب جدید ، هشدار داده شود.

بهینه سازی کلاسیک

عنوان وظیفه در حال حاضر به ما می گوید که ما در حال کار بر روی مشکل بهینه سازی هستیم: به حداکثر رساندن یا به حداقل رساندن برخی از عملکردها با توجه به پارامترهای آن. در مورد ما ، ما می خواهیم بازده را به حداکثر برسانیم در حالی که ریسک را با توجه به میزان پولی که در هر دارایی در نمونه کارها خود اختصاص می دهیم به حداقل می رسانیم. از نظر لیمن:

ما 1 میلیون دلار داریم و باید آن را بین دارایی های مختلف (یا به صورت نقدی) تقسیم کنیم به گونه ای که در پایان دوره زمانی این 1 میلیون دلار به همان اندازه که می تواند با حداقل خطر از دست دادن پول رشد کند.

مرز کارآمد مارکوویتز

اگر فرض کنیم که همه سرمایه گذاران موجود در بازار منطقی هستند ، در هر زمان ممکن از خطرات خودداری کنید و هدف آن حداکثر رساندن بازده مورد انتظار آنها هستیم ، می توانیم تمام پرتفوی های ممکن را در طرح 2D با ریسک و بازده مورد انتظار به عنوان محور ترسیم کنیم.

AI for portfolio management

تجسم مرزی کارآمد: https://investinganswers.com/dtionary/h/harry-markowitz

تصمیم بهینه را می توان با حداکثر رساندن بازده مورد انتظار (محاسبه شده از حرکات قبلی دارایی) و به حداقل رساندن ریسک مرتبط (به عنوان نوسانات دارایی) یافت. نسبت بازده مورد انتظار تقسیم شده توسط ریسک ، نسبت شارپ نامیده می شود و نمونه کارها با نسبت حداکثر شارپ را می توان با یک ابزار بهینه سازی نسبتاً استاندارد یافت.

اهداف سفارشی

البته معیارهای بهینه سازی متفاوتی وجود دارد که ممکن است هدف ما باشد. چه می شود اگر ما حتی به بازده مورد انتظار اهمیتی نداریم و فقط می خواهیم خطر را به حداقل برسانیم؟

عملکرد بهینه سازی نمونه کارها حداقل واریانس

یا شاید ما می خواهیم نمونه کارها خود را تا حد امکان متنوع کنیم؟

AI for portfolio management

حداکثر عملکرد بهینه سازی نمونه کارها متنوع سازی

یا احتمالاً فقط در دارایی های دفع شده سرمایه گذاری می کنند؟یا شاید برابری خطرات موجود در هر یک از دارایی ها را اطمینان دهید؟

AI for portfolio management

عملکرد بهینه سازی نمونه کارها مشارکت در ریسک برابر

نمونه های بیشتری از معیارهای بهینه سازی را در اینجا بررسی کنید ، مهمترین بخش در مورد آن این است که می توانید خود را با مراقبت از اهداف تجاری خود طراحی کنید.

یادگیری بدون نظارت

همچنین ، مشکل بهینه سازی نمونه کارها بسیار شبیه به کار یادگیری بدون نظارت یا کار یادگیری بازنمایی است: داشتن مجموعه ای از دارایی ها باید آنها را بر اساس سودآوری آنها به برخی "خوشه ها" گروه بندی کنیم و پس از اختصاص بودجه بیشتر در مورد پیش بینی کننده ترین و کمترطرف مقابلاز چه الگوریتمی می توانیم برای این منظور استفاده کنیم؟

پرتوهای ویژه

AI for portfolio management

نمونه ای از مؤلفه های اصلی مختلف یک نمونه کارها: https://systematicedge. wordpress.com/2013/06/02/principal-component-analysisn-in-portfolio-management/

یکی از اولین مدل های یادگیری بدون نظارت که در کلاس یادگیری ماشین با آنها آشنا می شوید ، تجزیه و تحلیل مؤلفه اصلی (PCA) است. این داده های چند بعدی را به مجموعه متغیرهای خطی غیر همبسته تجزیه می کند ، جایی که اولین متغیر (که به آن مؤلفه اصلی نیز گفته می شود) بیشترین تنوع را در داده ها توضیح می دهد ، و تمام متغیرهای بعدی با داشتن حداکثر واریانس در حالی که متعامد متغیر قبلی است ، طبقه بندی می شوندبشرچگونه می توانیم از آن برای مدیریت نمونه کارها استفاده کنیم؟بسیاری از ایده ها منتشر می شوند ، رایج ترین آنها می گوید که اولین مؤلفه اصلی به عنوان تقریب بازار عمل می کند ، از این رو ، انتخاب مؤلفه های دوم و سایر مؤلفه ها با استراتژی های بازار ارتباط برقرار نمی کند ، این همان چیزی است که بیشتر سرمایه گذاران می خواهند.

خطر خودکار

AI for portfolio management

تجسم ایده کلی در پشت شبکه های عصبی AutoEncoder: https://sefiks.com/2018/03/21/autoencoder-neural-networks-for-unsupervised-leaing/

PCA ابزاری عالی است ، اما فقط به وابستگی خطی بین محور داده متکی است. یکی از گزینه های دیگر ، که امکان کاهش ابعاد غیر خطی را فراهم می کند ، مبتنی بر شبکه های عصبی-AutoEncoders است. آنها می توانند داده های ورودی را در برخی از بردار کم بعدی و پس از بازگرداندن ورودی از این نمایندگی "فشار دهند". ایده AutoEncoder می تواند از بسیاری جهات برای انتخاب نمونه کارها مورد سوء استفاده قرار گیرد ، یکی از آنها مربوط به ارزیابی ریسک انجام شده توسط دارایی خاص است: اگر برخی از حرکات دارایی نتواند به خوبی احیا شود (مقدار پیش بینی شده با تفاوت زیادی با آن متفاوت استاز نظر ، بیایید بگوییم ، میانگین خطای مربع) از نمایندگی کم بعدی-این با خطر بالاتر (و احتمالاً سود بالاتر) همراه است. لطفاً نمونه ای از این نوع نمونه کارها را در بخش آزمایش مشاهده کنید.

برابری ریسک سلسله مراتبی

AI for portfolio management

از نظر هندسی ، یک ماتریس کواریانس از دارایی های موجود در نمونه کارها یک نمودار کامل (در سمت چپ) است ، آیا می توانیم یک مدل مبتنی بر درخت را بفهمیم که بهینه تر باشد؟

یکی از روشهای مدیریت نمونه کارها مبتنی بر بهینه سازی ، یک مدل برابری ریسک است. همچنین به عنوان یک مشکل بهینه سازی بیان شده است ، جایی که ما خطر را نسبت به منابع سرمایه اختصاص می دهیم. مشکل این رویکرد (و در واقع ، بیشتر رویکردهای شرح داده شده در این مقاله) هنگامی که ما با اوراق بهادار با اندازه بسیار عظیم کار می کنیم بالغ می شود - اگر ما ارتباطات بین دارایی ها را از نظر هندسی نشان دهیم ، آنها به شکل نمودار کامل خواهند بود(تصویر بالا را ببینید) ، که یک توضیح بیش از حد در دنیای سلسله مراتب است. راه حل دوباره در یادگیری بدون نظارت نهفته است ، اما با بهره برداری از الگوریتم های خوشه بندی سلسله مراتبی که به ماتریس کواریانس اعمال می شود. پس از پیدا کردن خوشه های دارایی ، می توانیم خطر را دوباره به صورت بازگشتی بر آنها قرار دهیم. روش سطح بالا که در زیر شرح داده شده است:

AI for portfolio management

توصیف سطح بالا از الگوریتم بهینه سازی نمونه کارها Portfolio (HRP)

یادگیری تحت نظارت

رویکردهای بهینه سازی و بازنمایی بسیار جالب و قانونی به نظر می رسد ، اما آنها یک اشکال اساسی دارند: آنها فقط از اطلاعات مربوط به حرکات دارایی گذشته و همبستگی های گذشته بدون هیچ گونه فرضیه ای در مورد رفتار آینده خود سوء استفاده می کنند. آیا ما موافق هستیم که در آینده دارایی همانند گذشته حرکت خواهد کرد؟نه واقعا! به همین دلیل ما به برخی از راهها برای بهره برداری از پیش بینی های مربوط به آینده به عنوان وزن تخصیص نیاز داریم.

پیش بینی وزن

AI for portfolio management

https://www.sciencedirect.com/science/article/pii/s0378437107001938

این ایده بسیار ساده است: اگر بتوانیم از هر مدل برای پیش بینی حرکت قیمت در آینده استفاده کنیم ، می توانیم از این پیش بینی در مورد وزن تخصیص استفاده کنیم. البته ، ما باید این پیش بینی ها را عادی کنیم تا مبلغ آنها برابر با یک باشد ، اما این یک مرحله فنی است و می توان با SoftMax با دمای تنظیم شده یا حتی با استفاده از L1-Normalization انجام داد. نکته جالب اینجاست که اگر با یادگیری ماشین بیزی یا مدلهایی مانند Arima کار کنیم ، می توانیم خطر پیش بینی را نیز در نظر بگیریم. در این مقاله ، ما از ساده ترین الگوریتم پیش بینی استفاده خواهیم کرد: هموار سازی نمایی ، اما می توانید به راحتی آن را به عنوان مثال ، یادگیری عمیق با استفاده از سایر آموزش های وبلاگ من گسترش دهید.

یادگیری تقویت کننده

چگونه در مورد غواصی عمیق تر و درمان تخصیص دارایی نه تنها به عنوان یک مشکل بهینه سازی یک مرحله ای ، بلکه به عنوان کنترل مداوم نمونه کارها با پاداش تأخیر؟بیایید از تخصیص بهینه به سرزمین کنترل بهینه حرکت کنیم و در یک دنیای داده محور ، از طریق الگوریتم های مختلف یادگیری تقویت کننده قابل حل است. آنها پیش بینی نمی کنند و ساختار بازار را به طور ضمنی یاد نمی گیرند. آنها کارهای بیشتری انجام می دهند: مستقیماً سیاست تغییر وزنه ها را به صورت پویا در بازار به طور مداوم در حال تغییر یاد بگیرید!

آموزش عمیق Q

تصویری از یک عامل یادگیری تقویت برای تصمیم گیری در مورد زمان ورود یا ترک موقعیت https://hackeoon.com/the-self-leaing-quant-d3329fcc9915

ایده یادگیری Q که برای مدیریت نمونه کارها اعمال می شود به شرح زیر است: ما می توانیم بازار را با برخی از ایالت ها توصیف کنیم و با انجام برخی اقدامات در این بازار و رفتن به ایالت ما پاداش می گیریم (ارزش نمونه کارها را بر اساس وزنهای ما تغییر دادکاربردی). نام "Q-Leaing" از عملکرد Q (S ، A) ناشی می شود ، که بر اساس وضعیت بازار S و اقدام A (در مورد ما ، این وزن تخصیصی است) پاداش مورد انتظار را برمی گرداند. امروز این عملکرد می تواند با شبکه های عصبی عمیق تقریب شود و ما می توانیم چنین مدلی را برای بهینه سازی نسبت شارپ یا هر معیار دیگر آموزش دهیم ، اما نه فقط برای یک تخصیص واحد بلکه برای دنباله ای از تخصیص نمونه کارها ، جایی که ما از Q آموزش دیده استفاده خواهیم کردعملکرد برای انتخاب اقدامات بهینه. اگر برای جزئیات بیشتر کد منبع را بررسی می کنید ، لطفاً توجه کنید که برای فضای اقدام مداوم با یادگیری تقویت عمیق ، ما باید از برخی ترفندها استفاده کنیم.

ارزیابی در طبیعت

بررسی فوق بدون ارزیابی کمی در مورد داده های واقعی چیزی نیست. من دو معیار زیر را پیشنهاد می کنم:

  • ETF از دوره استنفورد ؛
  • نمونه کارها Cryptocurrencies Top-15 ؛

در هر دو مورد ، ما از تخصیص مساوی به عنوان معیار استفاده خواهیم کرد و تمام مدلهایی را که قبلاً در مورد کمی مورد بحث قرار دادیم مقایسه خواهیم کرد. انیمیشن های زیر هر دو منحنی سهام و وزن تخصیص را نشان می دهند. همچنین ، لطفاً ، کد موجود در GitHub را بررسی کنید.

توجه: این آزمایشات فقط برای اهداف تجسم و ارائه نشان داده شده است. در زندگی واقعی ، الگوریتم های مدیریت دارایی باید تخصیص وزن دوباره داشته باشند و با گذشت زمان دوباره آموزش داده شوند و با دقت بیشتری از جمله جستجوی هایپرپارامتر انجام شوند. همچنین ، آنها نیاز به آزمایش و ارزیابی با روشی بسیار سختگیرانه تر دارند. نکته آخر اینکه باید سیستم مدیریت ریسک قوی بر روی هر یک از استراتژی های معاملاتی شما ساخته شود ، با این وجود آنها در حالت پشتی یا تجارت کاغذ انجام می دهند.

مجموعه داده ETF

در این آزمایش ، ما از 180 روز معاملاتی برای تصمیم گیری استفاده می کنیم (تخمین ماتریس کواریانس ، سری زمانی پیش بینی ، اتصالات Autoencoder یا RL عامل و غیره) و برای 180 روز آینده ، ما دارایی ها را با توجه به وزنهای موجود در آن نگه می داریمالگوریتم. پس از این دوره برگزاری ، روش وزن مجدد دوباره شروع می شود.

نرم افزار مفید تریدر...
ما را در سایت نرم افزار مفید تریدر دنبال می کنید

برچسب : نویسنده : احمد شاملو بازدید : 36 تاريخ : شنبه 3 تير 1402 ساعت: 14:17