Статья о прогнозировании



бет2/8
Дата02.12.2023
өлшемі301,5 Kb.
#194749
түріСтатья
1   2   3   4   5   6   7   8
Байланысты:
перевод

Ключевые слова:прогнозирование криптовалют; прогнозирование временных рядов; глубокое обучение; машинное обучение; ансамблевое моделирование; преобразователь временного синтеза; рекуррентные нейронные сети; биткойн


  1. Введение


Криптовалюты — это виртуальные валюты, основанные на технологии блокчейн. Они получили широкое распространение на рынке с момента появления Биткойна в 2009 году, самой популярной криптовалюты на данный момент. Множество различных субъектов торгуют криптовалютами и инвестируют в криптофонды и компании; по данным CoinMarketCap [1], глобальная рыночная капитализация криптовалют достигла оценочной стоимости в 932,49 миллиарда долларов США в сентябре 2022 года. Хотя инвестиции принесли прибыльную прибыль, повсеместные колебания цен на большинство криптовалют делают такие инвестиции сложными и рискованными. Например, цена Биткойна была очень нестабильной с момента его выхода на рынок, достигая пиков до +122% и
+1360% в 2016 и 2017 годах соответственно [2]. Только в 2017 году в Ethereum, XRP и Litecoin наблюдались аналогичные колебания.2].
По этим причинам инвесторам необходим подход к прогнозированию, чтобы эффективно

доступе и распространяется на условиях лицензии Creative Com Attribution (CC BY) (http Creativecommons.org/licenses/b).
4.0/).
и Монс с:// да/
улавливать колебания цен на криптовалюту, чтобы минимизировать риск и увеличить свою прибыль. Более того, можно использовать прогнозы волатильности для оценки колебаний их цен, что полезно для разработки и анализа количественных финансовых торговых стратегий [3]. Однако аналогично прогнозированию цен на акции, рынок которых также динамичен и сложен [4], цена криптовалюты


Прогнозирование2023 год,5, 196–209. часhttps://doi.org/10.3390/forecast5010010 https://www.mdpi.com/journal/forecasting

В настоящее время прогнозирование рассматривается как одна из наиболее сложных задач прогнозирования в финансовой сфере.5]. Большинство успешных исследователей приводят эту проблему в качестве примера прогнозирования временных рядов [6–11], поскольку идея состоит в том, чтобы использовать исторические и текущие данные о ценах для прогнозирования будущих цен на определенный период времени или в определенный момент в будущем. Анализ временных рядов также применяется, например, при прогнозировании погоды и прогнозировании спроса в розничной торговле и закупках.
В литературе применение статистических методов является традиционным подходом к прогнозированию
временных рядов. Такие методы используют статистические формулы и теории для моделирования и выявления закономерностей во временных рядах. Наиболее часто используемыми статистическими моделями являются модель авторегрессионного интегрированного скользящего среднего (ARIMA) и ее варианты, экспоненциальное сглаживание, многомерная линейная регрессия, многомерная векторная авторегрессионная модель и расширенная векторная авторегрессионная модель.12]. Кроме того, при прогнозировании будущих цен на криптовалюты наиболее популярным примером является ARIMA [13]. Исследователи обычно используют эту модель для прогнозирования цен на биткойны [6,14,15]. Также применялись и другие модели, такие как модели обобщенной авторегрессии условной гетероскедастичности (GARCH) для прогнозирования волатильности криптовалют.16,17] и диффузионные процессы в вероятностном прогнозировании криптовалют [18].

Другая область исследований использует модели машинного обучения (ML), такие как машины повышения стохастического градиента [19], линейная регрессия, случайный лес, машины опорных векторов и k- ближайшие соседи [20]. Используя исторические данные, эти методы направлены на выявление наиболее влиятельных функций, которые определяют будущие цены на криптовалюту, чтобы повысить точность прогнозов.


Третий блок работ использует модели глубокого обучения (DL) для прогнозирования цен на
криптовалюту после их недавнего широкого успеха в количественном финансировании.21]. Нейронные сети, рекуррентные нейронные сети (RNN), такие как вентильная рекуррентная единица (GRU) и длинная краткосрочная память (LSTM), временные сверточные сети (TCN) и гибридные архитектуры, применялись для прогнозирования цен на Биткойн, Эфириум и Лайткойн. , например [7,9,11]. Подходы DL считаются эффективными при прогнозировании временных рядов, поскольку они устойчивы к шуму, могут обеспечить встроенную поддержку последовательностей данных и могут изучать нелинейные временные зависимости от таких последовательностей.22].
Хотя в литературе предлагаются статистические методы, методы МО и ДО, нет четких
доказательств того, какой из этих подходов лучше. Действительно, исследование разрознено и ему не хватает общности, поскольку оно сосредоточено на прогнозировании цены одной криптовалюты среди небольшого числа самых популярных криптовалют (в основном биткойнов). Более того, чрезмерная сложность архитектуры моделей делает их внедрение в реальный сценарий очень сложным, поскольку реализация, обучение и прогнозирование стоят дорого.
Наконец, при различных наборах данных, стратегиях предварительной обработки и экспериментальных методологиях сравнения подходов непоследовательны, эксперименты трудно воспроизвести, и поэтому их результаты ненадежны.
Основная цель данной статьи — преодолеть эти ограничения и пролить свет на эффективность наиболее популярных подходов, предложенных на данный момент в литературе для решения задачи прогнозирования цен на криптовалюту. Поэтому в качестве основного вклада мы разрабатываем структуру для сравнения широко используемых статистических подходов, подходов машинного обучения и глубокого обучения при прогнозировании цен пяти популярных криптовалют, то есть Ripple (XRP), биткойнов (BTC), Litecoin (LTC), Ethereum ( ETH) и Monero (XMR). Выбранные сети DL включают в себя различные архитектуры, такие как сверточные нейронные сети, рекуррентные нейронные сети и преобразователи. Насколько нам известно, мы также первые, кто предложил использовать преобразователь временного слияния (TFT) в качестве подхода DL для прогнозирования цен на криптовалюту. Кроме того, мы исследуем использование гибридных моделей и ансамблей, чтобы определить, может ли комбинация нескольких моделей повысить точность прогнозов.

Чтобы преодолеть высокие колебания и волатильность цен на криптовалюту, мы преобразуем нестационарные временные ряды в стационарные, применяя устранение тренда. Прогнозные модели обучаются и тестируются на наборе данных за 5-летний период, который мы собрали с онлайн-платформ для торговли криптовалютами. Наша методология оценки охватывает более одного года


данные и являются инкрементными с ежемесячными временными окнами. Результаты показывают, что подходы DL лучше, чем ML и статистические подходы, а для моделей DL сложные архитектуры превосходят менее сложные. Чтобы обеспечить воспроизводимость и стимулировать вклад в будущие исследования, мы открываем исходный код набора данных и кода экспериментов (https://github.com/ katemurraay/tsa_crt, по состоянию на 15 января 2023 г.), поскольку мы считаем, что наша работа станет для практиков важной отправной точкой для исследования прогнозирования цен на криптовалюту.
Оставшаяся часть статьи структурирована следующим образом: Раздел2представляет
сравнение моделей, сбор и предварительную обработку данных и, наконец, описывает методологию эксперимента; Разделы3и4изложить результаты экспериментов и обсудить их выводы соответственно; наконец, раздел5делает выводы и иллюстрирует планы на будущее.

  1. Материалы и методы

В нашей структуре мы предполагаем наличие набора данных размероммс детализацией ежедневного интервала, т. е. каждый экземпляр набора данных относится к дате с меткой времени.тя,я€(1,м), гдеттм обозначают самые ранние и самые последние точки данных, доступные в наборе данных, соответственно. Обозначим черезйтзначение целевой переменной в метке временитя, то есть цену криптовалюты, которую нужно предсказатяь. Мы также обозначаем черезИкстя
функции, доступные на данный моменття;Икст"я="йт я-л , . . . , йт я],-1
гдел— длина окна, рассматриваемая моделями как входные данные. Наша цель — построить прогнозные
модели, которые изучают функциюж(Икст"="йт,см. раздеял2.1списяок моделей, которые мы используем в этом исследовании. Эта обучающая задача является типичным примером одномерного анализа временных рядов, поскольку только одна переменная (т. е. цена криптовалюты,й) меняется со временем.
В оставшейся части этого раздела мы описываем модели прогнозирования, сбор данных и их предварительную обработку, а также экспериментальную методологию, которую мы используем для сравнения моделей.



    1. Прогнозные модели

Ниже мы приводим подробную информацию о статистических, ML, DL, гибридных и ансамблевых моделях, которые мы сравниваем.

  • Авторегрессионное интегрированное скользящее среднее (ARIMA). Это обобщение более простой модели ARMA (авторегрессионное скользящее среднее). Традиционный трехэтапный процесс построения моделей ARIMA с помощью [13] включает в себя идентификацию модели, оценку параметров и, наконец, диагностику моделирования и его проверку. По сути, прогноз найтцель значение представляет собой линейную комбинациюйтзначения дотцельвременная меткаяи ошибки прогнозирования, сделанные для того же самогойИкстценности. Примеры использования

я
ARIMA включают прогнозирование спроса на воздушный транспорт [23,24], долгосрочный прогноз
дохода [25] и прогноз цен на электроэнергию на следующий день [26]. ARIMA эффективно предсказала цены BTC в [6,14,27].

  • k-ближайший сосед (kNN). Первоначально подходящая для задач классификации, kNN представляет собой непараметрическую модель, которая была успешно расширена и использована для задач регрессии при анализе временных рядов. Предсказыватьйтцель,kNN вычисляеткнаиболее похожий Икстценности дляИкст цель.Тогда прогнозированиейцельпредставляет собой средневзвешенное значениеокейтя

я
ценности. Модель kNN использовалась в финансовом прогнозировании [28], прогноз цен на рынке электроэнергии [29], и в предсказании Биткойна [30].

  • Регрессия опорных векторов (SVR). Созданный на основе машин опорных векторов для классификации, SVR обеспечивает как линейную, так и нелинейную регрессию. Подобно kNN, SVR — это непараметрическая методология, представленная [31]. SVR стремится максимизировать эффективность обобщения при разработке функций регрессии [32]. SVR применялся для решения различных задач временных рядов, таких как прогнозирование гарантийных претензий [32], прогнозирование уровня глюкозы в крови [33], а также для прогнозов акций на финансовом рынке [34]. Примеры использования SVR для прогнозирования цен на криптовалюту можно найти в [20,21].

  • Регрессор случайного леса (RF). По сути, это ансамбль деревьев решений, каждое из которых построено на случайном подмножестве обучающего набора. Прогнозы RF выполняются путем усреднения прогнозов отдельных деревьев. Ключевыми преимуществами RF являются его способность к обобщению и минимальная чувствительность к гиперпараметрам.35]. RF использовался в задачах временных рядов для прогнозирования инцидентов кибербезопасности [36], для прогнозирования выбросов метана при использовании угольных шахт [37], а также для ежемесячного прогнозирования

колебания температуры [35]. В прогнозировании криптовалют RF использовался для прогнозирования BTC в [20] и BTC, ETH и XRP в [19].

  • Долговременная краткосрочная память (LSTM). Это тип RNN, способный изучать долговременные зависимости и, следовательно, подходящий для анализа временных рядов [38]. Хотя LSTM имеют цепочечную структуру, аналогичную обычным RNN, в повторяющемся модуле LSTM взаимодействуют четыре нейронных слоя, т. е. два во входных воротах, один в воротах забывания и один в выходных воротах. Входной вентиль добавляет или обновляет новую информацию, а вентиль забывания удаляет ненужную информацию. Выходной вентиль в конечном итоге передает обновленную информацию в следующую ячейку LSTM. Примеры использования LSTM можно найти в краткосрочном прогнозировании скорости движения [39], прогнозирование траекторий развития здравоохранения на основе медицинских записей [ 40] и прогнозирование уровней водоносных горизонтов [41]. Модель также оказалась успешной для прогнозирования цен на криптовалюту [7–9].

  • Закрытый рекуррентный блок (ГРУ). Хотя модель GRU похожа на LSTM, первая повышает

вычислительную эффективность второй, поскольку в интерполяции используется меньше внешних стробирующих сигналов. Следовательно, соответствующие параметры уменьшаются. ГРУ использовалось для краткосрочного прогнозирования службы проката велосипедов [42], прогнозы сетевого трафика [43] и прогнозирование загрязнения воздуха частицами [44]. ГРУ было обнаружено в [10] для успешного прогнозирования цен BTC, ETH и LTC.

  • ЛСТМ-ГРУ (ГИБРИД). Этот метод был предложен Patel et al. [11], чтобы воспользоваться

преимуществами LSTM и GRU. Их исследование показало, что этот гибридный подход эффективно прогнозирует ежедневные цены Litecoin и Monero, поэтому мы включаем его сюда. Комбинации LSTM и GRU успешно применялись для прогнозирования цен на воду [45].

  • Сеть временной свертки (TCN). Представлено Бай, Колтером и Колтуном [46], TCN — это вариант архитектуры сверточной нейронной сети, в котором используются расширенные, причинные, одномерные сверточные слои. Причинные извилины TCN предотвращают утечку будущих данных во входные данные. TCN получили широкое распространение при прогнозировании временных рядов. Например, TCN могут производить краткосрочный прогноз ветровой энергии [47], прогнозировать запахи конструкции точно в срок [48] и прогноз волатильности акций [49]. Кроме того, TCN эффективно прогнозировал еженедельные цены на Ethereum.50].

  • Трансформатор временного синтеза (TFT). Представлен [51], архитектура TFT построена на архитектуре ванильного трансформатора. TFT — это один из новейших подходов глубокого обучения для прогнозирования временных рядов. Его конструкция включает в себя новые компоненты, такие как вентильные механизмы, сети переменных секций, статические ковариаты, интервалы прогнозирования и временную обработку. TFT применялся и в других задачах временных рядов, таких как прогнозирование уровней pH в водоемах.52], прогнозирование спроса на рейсы [53] и прогнозирование будущих уровней осадков [54]. Насколько нам известно, мы первые, кто применил его для прогнозирования цен на криптовалюту.

Мы используем регрессор голосования для ансамбля, комбинацию различных базовых индукторов, используя модели, описанные выше. Всего мы строим 502 ансамбля, по одному на каждую возможную комбинацию. Прогноз ансамбля дается путем усреднения прогнозов отдельных моделей, составляющих ансамбль. Обратите внимание, что каждая отдельная модель обучалась отдельно и независимо.
В нашем сравнении можно было бы изучить другие подходы к прогнозированию временных рядов, например, функциональный анализ данных для прогнозирования цен на электроэнергию [55,56], групповой метод обработки данных и адаптивная система нейро-нечеткого вывода для прогнозирования неисправностей [ 57] и мультимодальная графовая нейронная сеть для прогнозирования финансовых временных рядов [58].
Однако мы ограничили наш выбор наиболее популярными и репрезентативными моделями, предложенными в каждой категории (т. е. статистическими, ML и DL) в литературе, поскольку полное и исчерпывающее сравнение методов временных рядов выходит за рамки этой статьи.



    1. Сбор данных

Данные были собраны с Binance.com (https://www.binance.com/en, по состоянию на 13 июля 2022 г.) и Investing.com (https://www.investing.com, по состоянию на 13 июля 2022 г.).
Binance.com — крупнейший в мире и самый популярный в мире портал обмена криптовалютами для ежедневной торговли. Он предоставляет ряд функций, специфичных для криптовалютных продуктов, включая рыночную информацию о тысячах криптовалют. Investing.com выступает в качестве глобального портала для информации и анализа фондового рынка на многих финансовых рынках мира. Для нашего исследования мы выбрали пять популярных в литературе криптовалют, а именно: XRP, Биткойн (BTC), Litecoin (LTC), Ethereum (ETH) и Monero (XMR).
В процессе сбора данных в качестве основного ресурса использовался Binance API, который дополнялся информацией, полученной с Investing.com, когда возникали пропущенные значения (например, когда цена закрытия XMR не была доступна в определенный день). Срок сбора данных варьируется от 1 июня 2017 года до 31 мая 2022 года, то есть пять лет. Сводная информация о полученных наборах данных представлена в таблице.1и ковариаты, доступные дляя-th экземпляр каждого набора данных:
1   2   3   4   5   6   7   8




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет