ПОДОВЖЕННЯ РЯДІВ ДАНИХ ЗА ЗНАЧЕННЯМИ ПОКАЗНИКІВ СХОЖИХ РЯДІВ

Автор(и)

  • Анастасія Геннадіївна Батурінець Дніпровський національний університет імені Олеся Гончара, Ukraine https://orcid.org/0000-0001-6302-565X
  • Світлана Валентинівна Антоненко Дніпровський національний університет імені Олеся Гончара, Ukraine https://orcid.org/0000-0001-6611-4543

DOI:

https://doi.org/10.24025/2306-4412.3.2021.244266

Ключові слова:

часові ряди, регресія, поповнення даних, машинне навчання, sklearn, недостатність даних, гідрологія

Анотація

Проблема недостатності інформації суттєво впливає на вибір підходів та методів аналізу рядів даних, а також на якість отримуваних результатів. Зважаючи на таку проблему, автори роботи вважають, що актуальним є питання розробки й аналізу підходів та моделей для подовження рядів даних. Основною задачею є описання та реалізація технології подовження рядів даних. В основу реалізації технології закладено використання значень схожих рядів даних як ознак для подовження певного ряду даних, представленого тими ж показниками, що й схожі ряди даних. В роботі описано схему визначення схожих рядів даних. Згідно з цією схемою найбільш схожими рядами даних є такі, що мають найменше значення відстані та сильний прямий кореляційний зв’язок, обчислені між потенційно схожим рядом та рядом, для якого буде відбуватися подовження. Для подовження ряду розглядаються сім моделей. За результатами обчислювального експерименту встановлено, що найкращі результати отримано при використанні двох моделей: суми зважених значень по групі схожих рядів та середньозважених значень по групі схожих рядів, з коригуванням на середнє значення ряду, для якого виконується подовження. В результаті проведеного аналізу можна дійти висновку про можли-вість використання розробленої технології для вирішення задачі подовження рядів даних. При подальших дослідженнях планується використання отриманих результатів для розробки та аналізу методів поповнення пропущених значень у часових рядах.

Біографії авторів

Анастасія Геннадіївна Батурінець, Дніпровський національний університет імені Олеся Гончара

асистент

Світлана Валентинівна Антоненко, Дніпровський національний університет імені Олеся Гончара

к. т. н, доцент

Посилання

E. Kovpak, F. Orlov, "Comparative analysis of machine learning models and regressions for prediction the car price", Visnyk Kharkivskoho natsionalnoho universytetu imeni V. N. Karazina. Seriia: Ekonomichna, iss. 97, pp. 31-40, 2019 [in Ukrainian].doi: 10.26565/2311-2379-2019-97-04.

M. S. Khan, "Water quality prediction and classification based on principal component regression and gradient boosting classifier approach", Journal of King Saud University-Computer and Information Sciences, 2021. doi:10.1016/j.jksuci.2021.06.003.

Assem Haytham et al., "Urban water flow and water level prediction based on deep learning", Joint European Conf. on Machine Learning and Knowledge Discovery in Databases, Springer, Cham, pp. 317-329, 2017.doi: 10.1007/978-3-319-71273-4_26.

V. D. Derbentsev, H. I. Velykoivanenko, and N. V. Datsenko, "Machine learning ap-proach for forecasting cryptocurrencies time series", Neiro-nechitki tekhnolohii modeliuvannia v ekonomitsi, no. 8, pp. 65-93, 2019 [in Ukrainian].

Yu. L. Khlevna, and Yu. S. Bura, "Infor-mation software for real estate prices prediction by machine learning", Sciences of Europe, iss. 71-1, pp. 54-62, 2021 [in Ukrainian].doi: 10.24412/3162-2364-2021-71-1-54-62.

Yu. O. Andrusenko, "Analysis of the basic models for forecasting time series", Zbirnyk naukovykh prats Kharkivskoho natsional-noho universytetu Povitrianykh Syl, iss. 3 (65), pp. 91-96, 2020 [in Ukrainian].doi.org/10.30748/zhups.2020.65.14.

V. A. Artemenko, and V. V. Petrovich, "Improving the quality of forecasting of hydro-logical time series", Avtomobilni dorohy i dorozhnie budivnytstvo: sci. and techn. coll., iss. 92, pp. 114-127, 2014 [in Russian].

C. Chen, Q. Hui, Q. Pei, Y. Zhou, B. Wang, N. Lv, and J. Li, "CRML: A convolution re-gression model with machine learning for hydrology forecasting", IEEE Access, vol. 7, pp. 133839-133849, 2019.doi:10.1109/ACCESS.2019.2941234.

S. K. Jain at al., "A brief review of flood forecasting techniques and their applica-tions", Int. J. River Basin Manag., vol. 16, pp. 329–344, 2018.doi:10.1080/15715124.2017.1411920.

Д. А. Тамбиева, Е. В. Попова, и Ш. Х. Салпагарова, "К проблеме недостаточности информации. Малые выборки или "очень короткие" временные ряды", По-литематический сетевой электронный научный журнал Кубанского государственного аграрного университета, № 107, с. 126-141, 2015.

Random Forest Regressor [Online]. Availa-ble: http://surl.li/aidsj. [12] K-Neighbors Regressor. [Online]. Available: http://surl.li/aidsk.

SVR. [Online]. Available: http://surl.li/aidsm.

Gradient Boosting Regressor. [Online]. Available: http://surl.li/aidsn. [15] scikit-learn. [Online]. Available: https://scikit-learn.org/stable/index.html.

##submission.downloads##

Опубліковано

2021-10-22

Як цитувати

Батурінець, А. Г., & Антоненко, С. В. (2021). ПОДОВЖЕННЯ РЯДІВ ДАНИХ ЗА ЗНАЧЕННЯМИ ПОКАЗНИКІВ СХОЖИХ РЯДІВ. Вісник Черкаського державного технологічного університету, (3), 78–86. https://doi.org/10.24025/2306-4412.3.2021.244266

URN