∑ня=1(
йтя − й)2
В приведенных выше уравнениях (3)–(
я6),
йтистинная цена криптовалюты после нормализации,
ŷт пр
яогнозируемое значение,
йявляется средним из прогнозируемых значений, и
нуказывает их количество. Обратите внимание, что метрика R-квадрата подчеркивает дисперсию модели по отношению к общей дисперсии. Следовательно, в отличие от других показателей ошибок, чем выше значение R-квадрата, тем выше производительность модели.
Результаты
В этом разделе сообщаются результаты экспериментов и сравниваются регрессионные модели с точки зрения точности и времени вычислений. Мы оцениваем как их средние, так и криптоспецифичные показатели. Затем мы изучаем результаты ансамблей и вклад каждой отдельной модели в производительность ансамбля.
Индивидуальные модели
Стол2показывает среднюю производительность каждой модели, рассчитанную для всех криптовалют.
Модели ранжируются по RMSE в порядке возрастания.
Во-первых, мы наблюдаем, что рейтинг моделей одинаков по всем показателям точности (за очень немногими исключениями). LSTM демонстрирует лучшую производительность с постоянным отрывом от других моделей. Значения каждой метрики довольно близки, поскольку мы вычисляем их на основе нормализованной прогнозируемой цены, а не на основе данных без тренда. Модели рекуррентных нейронных сетей занимают первые три позиции в рейтинге, за ними следуют KNN и подход сверточной сети. Интересно, что ARIMA работает лучше, чем TFT, RF и SVR.
Что касается времени, необходимого для обучения и развертывания моделей, подходы DL, как и ожидалось, дороже по сравнению с машинным обучением и статистическими методами. В целом все модели дают прогнозы за достаточно короткое время, поэтому их можно использовать в некоторых онлайн-конфигурациях. В частности, для обучения и вывода используется ГИБРИД (LSTM-GRU Hybrid в разделе2.1) и TFT самые дорогие соответственно. Напротив, модели ML выполняются значительно быстрее. KNN обеспечивает хороший компромисс между точностью и вычислительными затратами.