ПОДОВЖЕННЯ РЯДІВ ДАНИХ ЗА ЗНАЧЕННЯМИ ПОКАЗНИКІВ СХОЖИХ РЯДІВ
DOI:
https://doi.org/10.24025/2306-4412.3.2021.244266Ключові слова:
часові ряди, регресія, поповнення даних, машинне навчання, sklearn, недостатність даних, гідрологіяАнотація
Проблема недостатності інформації суттєво впливає на вибір підходів та методів аналізу рядів даних, а також на якість отримуваних результатів. Зважаючи на таку проблему, автори роботи вважають, що актуальним є питання розробки й аналізу підходів та моделей для подовження рядів даних. Основною задачею є описання та реалізація технології подовження рядів даних. В основу реалізації технології закладено використання значень схожих рядів даних як ознак для подовження певного ряду даних, представленого тими ж показниками, що й схожі ряди даних. В роботі описано схему визначення схожих рядів даних. Згідно з цією схемою найбільш схожими рядами даних є такі, що мають найменше значення відстані та сильний прямий кореляційний зв’язок, обчислені між потенційно схожим рядом та рядом, для якого буде відбуватися подовження. Для подовження ряду розглядаються сім моделей. За результатами обчислювального експерименту встановлено, що найкращі результати отримано при використанні двох моделей: суми зважених значень по групі схожих рядів та середньозважених значень по групі схожих рядів, з коригуванням на середнє значення ряду, для якого виконується подовження. В результаті проведеного аналізу можна дійти висновку про можли-вість використання розробленої технології для вирішення задачі подовження рядів даних. При подальших дослідженнях планується використання отриманих результатів для розробки та аналізу методів поповнення пропущених значень у часових рядах.
Посилання
E. Kovpak, F. Orlov, "Comparative analysis of machine learning models and regressions for prediction the car price", Visnyk Kharkivskoho natsionalnoho universytetu imeni V. N. Karazina. Seriia: Ekonomichna, iss. 97, pp. 31-40, 2019 [in Ukrainian].doi: 10.26565/2311-2379-2019-97-04.
M. S. Khan, "Water quality prediction and classification based on principal component regression and gradient boosting classifier approach", Journal of King Saud University-Computer and Information Sciences, 2021. doi:10.1016/j.jksuci.2021.06.003.
Assem Haytham et al., "Urban water flow and water level prediction based on deep learning", Joint European Conf. on Machine Learning and Knowledge Discovery in Databases, Springer, Cham, pp. 317-329, 2017.doi: 10.1007/978-3-319-71273-4_26.
V. D. Derbentsev, H. I. Velykoivanenko, and N. V. Datsenko, "Machine learning ap-proach for forecasting cryptocurrencies time series", Neiro-nechitki tekhnolohii modeliuvannia v ekonomitsi, no. 8, pp. 65-93, 2019 [in Ukrainian].
Yu. L. Khlevna, and Yu. S. Bura, "Infor-mation software for real estate prices prediction by machine learning", Sciences of Europe, iss. 71-1, pp. 54-62, 2021 [in Ukrainian].doi: 10.24412/3162-2364-2021-71-1-54-62.
Yu. O. Andrusenko, "Analysis of the basic models for forecasting time series", Zbirnyk naukovykh prats Kharkivskoho natsional-noho universytetu Povitrianykh Syl, iss. 3 (65), pp. 91-96, 2020 [in Ukrainian].doi.org/10.30748/zhups.2020.65.14.
V. A. Artemenko, and V. V. Petrovich, "Improving the quality of forecasting of hydro-logical time series", Avtomobilni dorohy i dorozhnie budivnytstvo: sci. and techn. coll., iss. 92, pp. 114-127, 2014 [in Russian].
C. Chen, Q. Hui, Q. Pei, Y. Zhou, B. Wang, N. Lv, and J. Li, "CRML: A convolution re-gression model with machine learning for hydrology forecasting", IEEE Access, vol. 7, pp. 133839-133849, 2019.doi:10.1109/ACCESS.2019.2941234.
S. K. Jain at al., "A brief review of flood forecasting techniques and their applica-tions", Int. J. River Basin Manag., vol. 16, pp. 329–344, 2018.doi:10.1080/15715124.2017.1411920.
Д. А. Тамбиева, Е. В. Попова, и Ш. Х. Салпагарова, "К проблеме недостаточности информации. Малые выборки или "очень короткие" временные ряды", По-литематический сетевой электронный научный журнал Кубанского государственного аграрного университета, № 107, с. 126-141, 2015.
Random Forest Regressor [Online]. Availa-ble: http://surl.li/aidsj. [12] K-Neighbors Regressor. [Online]. Available: http://surl.li/aidsk.
SVR. [Online]. Available: http://surl.li/aidsm.
Gradient Boosting Regressor. [Online]. Available: http://surl.li/aidsn. [15] scikit-learn. [Online]. Available: https://scikit-learn.org/stable/index.html.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
URN
Ліцензія
Авторське право (c) 2021 Анастасія Батурінець, Світлана Антоненко

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial 4.0 International License.
Автори, які публікуються в цьому збірнику, погоджуються з наступними умовами:
Автори залишають за собою право на авторство своєї роботи та передають збірнику право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License CC BY-NC, яка дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи в цьому збірнику.
Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи в тому вигляді, в якому її опубліковано цим збірником (наприклад, розміщувати роботу в електронному сховищі установи або публікувати в складі монографії), за умови збереження посилання на першу публікацію роботи в цьому збірнику.
Політика збірника наукових праць дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).