МОДИФІКОВАНИЙ МЕТОД ВИЯВЛЕННЯ ФЕЙКОВИХ НОВИН НА ОСНОВІ АЛГОРИТМІВ МАШИННОГО НАВЧАННЯ

Анатолій Санжаровський; Василь Юрчишин

doi:10.24025/2306-4412.2.2023.279984

Автор(и)

Анатолій Санжаровський Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна http://orcid.org/0000-0002-6307-925X
Василь Юрчишин Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна http://orcid.org/0000-0001-7550-9213

DOI:

https://doi.org/10.24025/2306-4412.2.2023.279984

Ключові слова:

алгоритмічно-програмний метод, алгоритми машинного навчання, методи виявлення та розпізнавання фейків, BERT, LSTM, Passive-Aggressive Classifier

Анотація

Об’єктом дослідження є процес аналізу інформації в соціальних медіа для виявлення фейкових новин. Предметом дослідження є розроблення програмного забезпечення алгоритмічно-програмного методу для виявлення фейкових новин. Мета роботи полягає у підвищенні середньої точності процесу виявлення фейкових новин в соціальних медіа шляхом розробки та реалізації алгоритмічно-програмного методу виявлення фейкових новин на основі алгоритмів машинного навчання. Використано різноманітні методи наукових досліджень: аналізу для з'ясування переваг та недоліків існуючих методів виявлення фейкових новин; порівняння – при виборі найбільш оптимальної мови програмування та середовища програмування для розробки програмного забезпечення для виявлення фейкових новин; метод огляду існуючої літератури з виявлення фейкових новин, включаючи академічні публікації, технічні звіти та онлайн-ресурси; метод експертної оцінки, за допомогою якого було отримано інформацію щодо ефективності різних методів виявлення фейкових новин. Завдяки використання цих методів було отримано комплексне розуміння проблеми виявлення фейкових новин та розроблено ефективне програмне забезпечення для виявлення фейкових новин. Наукова новизна роботи полягає в тому, що було запропоновано модифікований алгоритмічно-програмний метод виявлення фейкових новин на основі алгоритмів машинного навчання, який відрізняється від наявних методів використанням ансамблю з трьох алгоритмів, результати кожного з яких використовуються для вибору компактніших спеціалізованих моделей для наступних алгоритмів, що в підсумку дозволяє пришвидшити процес виявлення фейкових новин в тексті на 30% у порівнянні з аналогами, а також зменшити середню хибність на 25%. Практична цінність отриманих в роботі результатів полягає в тому, що розроблене програмне забезпечення алгоритмічно-програмного методу для виявлення фейкових новин сприятиме зменшенню поширенню фейків та допомогатиме їх виявленню.

Біографії авторів

Анатолій Санжаровський, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

магістр

Василь Юрчишин, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

канд. техн. наук, доцент

Посилання

А. Санжаровський, та В. Юрчишин, "Алгоритмічно-програмний метод для виявлення фейкових новин на основі алгоритмів машинного навчання", на П’ятнадцятій наук. конф. магістрантів та аспірантів Прикладна математика та комп’ютинг (ПМК-2022), Київ, 16-18 листоп. 2022, с. 499-504.

Study: On Twitter, false news travels faster than true stories. [Online]. Available: https://news.mit.edu/2018/study-twitter-false-news-travels-faster-true-stories-0308. Accessed on: Jan. 20, 2023.

Disinformation risk assessment: The online news market in the United States. [Online]. Available: https://www.disinformationindex.org/country-studies/2022-12-16-disinformation-risk-assessment-the-online-news-market-in-the-united-states/. Accessed on: Jan. 20, 2023.

H. Alcott, and M. Gentzkow, "Social media and fake news in the 2016 election", Journal of Economic Perspectives, vol. 31 (2), pp. 211-236. doi: 10.1257/jep.31.2.211.

K. Shu, A. Sliva, S. Wang, J. Tang, and H. Liu, "Fake news detection on social media: A data mining perspective", ACM SIGKDD Explorations Newsletter, vol. 19, iss. 101, pp. 22-36, Sept. 2017. doi: 10.1145/3137597.3137600.

K. Sharma, F. Qian, H. Jiang, and N. Ruchansky, "Combating fake news: A survey on identification and mitigation techniques", ACM Transactions on Intelligent Systems and Technology, vol. 10 (3), pp. 1-42, Apr. 2019. [Online]. Available: https://www.researchgate.net/publication/332434399_Combating_Fake_News_A_Survey_on_Identification_and_Mitigation_Techniques. Accessed on: Jan. 20, 2023. doi: 10.1145/3305260.

B. D. Horne, and S. Adali, "This just in: Fake news packs a lot in title, uses simpler, repetitive content in text body, more similar to satire than real news", ArXiv abs/1703.09398, 2017. [Online]. Available: https://www.semanticscholar.org/paper/This-Just-In%3A-Fake-News-Packs-a-Lot-in-Title%2C-Uses-Horne-Adali/f8366afaf58bbb9db151a1168bb6f14b618955b4. Accessed on: Jan. 20, 2023.

D. Rothman, "Transformers for natural language processing: Build innovative deep neural network architectures for NLP with Python, PyTorch, TensorFlow, BERT, RoBERTa, and more"; Birmingham, UK: Packt Publishing Ltd. Birmingham Mumbai, 2021.

P. Bahad, P. Saxena, and R. Kamal, "Fake news detection using bi-directional LSTMrecurrent neural network", Procedia Comput. Sci., vol. 165, pp. 74-82, 2019. [Online]. Available: https://doi.org/10.1016/j.procs.2020.01.072. Accessed on: Jan. 20,

S. M. Padnekar, G. S. Kumar, and P. Deepak, "Bilstm-autoencoder architecture for stance prediction", in Proc. 2020 Int. Conf. on Data Science and Engineering (ICDSE), Kochi, India, pp. 1-5, Dec. 3-5, 2020.

E. Amer, K.-S. Kwak, and S. El-Sappagh, "Context-based fake news detection model relying on deep learning models". Electronics, vol. 11 (8), p. 1255, 2022. [Online]. Available: https://doi.org/10.3390/electronics11081255. Accessed on: Jan. 20, 2023

A. Malakhov, A. Patruno, and S. Bocconi, "Fake news classification with BERT". [Online]. Available: http://ceur-ws.org/Vol-2882/paper38.pdf. Accessed on: Jan. 20, 2023.

D. Jacob, C. Ming-Wei, L. Kenton, and T. Kristina, "BERT: Pre-training of deep bidirectional transformers for language understanding". [Online]. Available: https://arxiv.org/pdf/1810.04805.pdf. Accessed on: Jan. 20, 2023.

Fake News Detection Using Passive-Aggressive Classifier. [Online]. Available: https://link.springer.com/chapter/10.1007/978-981-15-7345-3_13. Accessed on: Jan. 20, 2023.

D. Arthur, and S. Vassilvitskii, "k-means++: The advantages of careful seeding". [Online]. Available: https://theory.stanford.edu/~sergei/papers/kMeansPP-soda.pdf. Accessed on: Jan. 20, 2023.

D. P. Kingma, and J. L. Ba, "Adam: A method for stochastic optimization". [Online]. Available: https://arxiv.org/abs/1412.6980. Accessed on: Jan. 20, 2023.

МОДИФІКОВАНИЙ МЕТОД ВИЯВЛЕННЯ ФЕЙКОВИХ НОВИН НА ОСНОВІ АЛГОРИТМІВ МАШИННОГО НАВЧАННЯ

Автор(и)

DOI:

Ключові слова:

Анотація

Біографії авторів

Анатолій Санжаровський, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Василь Юрчишин, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Посилання

##submission.downloads##

Опубліковано

Як цитувати

Номер

Розділ

URN

Ліцензія

Автори, які публікуються в цьому збірнику, погоджуються з наступними умовами:

Інформація