МОДИФІКОВАНИЙ МЕТОД ВИЯВЛЕННЯ ФЕЙКОВИХ НОВИН НА ОСНОВІ АЛГОРИТМІВ МАШИННОГО НАВЧАННЯ
DOI:
https://doi.org/10.24025/2306-4412.2.2023.279984Ключові слова:
алгоритмічно-програмний метод, алгоритми машинного навчання, методи виявлення та розпізнавання фейків, BERT, LSTM, Passive-Aggressive ClassifierАнотація
Об’єктом дослідження є процес аналізу інформації в соціальних медіа для виявлення фейкових новин. Предметом дослідження є розроблення програмного забезпечення алгоритмічно-програмного методу для виявлення фейкових новин. Мета роботи полягає у підвищенні середньої точності процесу виявлення фейкових новин в соціальних медіа шляхом розробки та реалізації алгоритмічно-програмного методу виявлення фейкових новин на основі алгоритмів машинного навчання. Використано різноманітні методи наукових досліджень: аналізу для з'ясування переваг та недоліків існуючих методів виявлення фейкових новин; порівняння – при виборі найбільш оптимальної мови програмування та середовища програмування для розробки програмного забезпечення для виявлення фейкових новин; метод огляду існуючої літератури з виявлення фейкових новин, включаючи академічні публікації, технічні звіти та онлайн-ресурси; метод експертної оцінки, за допомогою якого було отримано інформацію щодо ефективності різних методів виявлення фейкових новин. Завдяки використання цих методів було отримано комплексне розуміння проблеми виявлення фейкових новин та розроблено ефективне програмне забезпечення для виявлення фейкових новин. Наукова новизна роботи полягає в тому, що було запропоновано модифікований алгоритмічно-програмний метод виявлення фейкових новин на основі алгоритмів машинного навчання, який відрізняється від наявних методів використанням ансамблю з трьох алгоритмів, результати кожного з яких використовуються для вибору компактніших спеціалізованих моделей для наступних алгоритмів, що в підсумку дозволяє пришвидшити процес виявлення фейкових новин в тексті на 30% у порівнянні з аналогами, а також зменшити середню хибність на 25%. Практична цінність отриманих в роботі результатів полягає в тому, що розроблене програмне забезпечення алгоритмічно-програмного методу для виявлення фейкових новин сприятиме зменшенню поширенню фейків та допомогатиме їх виявленню.
Посилання
А. Санжаровський, та В. Юрчишин, "Алгоритмічно-програмний метод для виявлення фейкових новин на основі алгоритмів машинного навчання", на П’ятнадцятій наук. конф. магістрантів та аспірантів Прикладна математика та комп’ютинг (ПМК-2022), Київ, 16-18 листоп. 2022, с. 499-504.
Study: On Twitter, false news travels faster than true stories. [Online]. Available: https://news.mit.edu/2018/study-twitter-false-news-travels-faster-true-stories-0308. Accessed on: Jan. 20, 2023.
Disinformation risk assessment: The online news market in the United States. [Online]. Available: https://www.disinformationindex.org/country-studies/2022-12-16-disinformation-risk-assessment-the-online-news-market-in-the-united-states/. Accessed on: Jan. 20, 2023.
H. Alcott, and M. Gentzkow, "Social media and fake news in the 2016 election", Journal of Economic Perspectives, vol. 31 (2), pp. 211-236. doi: 10.1257/jep.31.2.211.
K. Shu, A. Sliva, S. Wang, J. Tang, and H. Liu, "Fake news detection on social media: A data mining perspective", ACM SIGKDD Explorations Newsletter, vol. 19, iss. 101, pp. 22-36, Sept. 2017. doi: 10.1145/3137597.3137600.
K. Sharma, F. Qian, H. Jiang, and N. Ruchansky, "Combating fake news: A survey on identification and mitigation techniques", ACM Transactions on Intelligent Systems and Technology, vol. 10 (3), pp. 1-42, Apr. 2019. [Online]. Available: https://www.researchgate.net/publication/332434399_Combating_Fake_News_A_Survey_on_Identification_and_Mitigation_Techniques. Accessed on: Jan. 20, 2023. doi: 10.1145/3305260.
B. D. Horne, and S. Adali, "This just in: Fake news packs a lot in title, uses simpler, repetitive content in text body, more similar to satire than real news", ArXiv abs/1703.09398, 2017. [Online]. Available: https://www.semanticscholar.org/paper/This-Just-In%3A-Fake-News-Packs-a-Lot-in-Title%2C-Uses-Horne-Adali/f8366afaf58bbb9db151a1168bb6f14b618955b4. Accessed on: Jan. 20, 2023.
D. Rothman, "Transformers for natural language processing: Build innovative deep neural network architectures for NLP with Python, PyTorch, TensorFlow, BERT, RoBERTa, and more"; Birmingham, UK: Packt Publishing Ltd. Birmingham Mumbai, 2021.
P. Bahad, P. Saxena, and R. Kamal, "Fake news detection using bi-directional LSTMrecurrent neural network", Procedia Comput. Sci., vol. 165, pp. 74-82, 2019. [Online]. Available: https://doi.org/10.1016/j.procs.2020.01.072. Accessed on: Jan. 20,
S. M. Padnekar, G. S. Kumar, and P. Deepak, "Bilstm-autoencoder architecture for stance prediction", in Proc. 2020 Int. Conf. on Data Science and Engineering (ICDSE), Kochi, India, pp. 1-5, Dec. 3-5, 2020.
E. Amer, K.-S. Kwak, and S. El-Sappagh, "Context-based fake news detection model relying on deep learning models". Electronics, vol. 11 (8), p. 1255, 2022. [Online]. Available: https://doi.org/10.3390/electronics11081255. Accessed on: Jan. 20, 2023
A. Malakhov, A. Patruno, and S. Bocconi, "Fake news classification with BERT". [Online]. Available: http://ceur-ws.org/Vol-2882/paper38.pdf. Accessed on: Jan. 20, 2023.
D. Jacob, C. Ming-Wei, L. Kenton, and T. Kristina, "BERT: Pre-training of deep bidirectional transformers for language understanding". [Online]. Available: https://arxiv.org/pdf/1810.04805.pdf. Accessed on: Jan. 20, 2023.
Fake News Detection Using Passive-Aggressive Classifier. [Online]. Available: https://link.springer.com/chapter/10.1007/978-981-15-7345-3_13. Accessed on: Jan. 20, 2023.
D. Arthur, and S. Vassilvitskii, "k-means++: The advantages of careful seeding". [Online]. Available: https://theory.stanford.edu/~sergei/papers/kMeansPP-soda.pdf. Accessed on: Jan. 20, 2023.
D. P. Kingma, and J. L. Ba, "Adam: A method for stochastic optimization". [Online]. Available: https://arxiv.org/abs/1412.6980. Accessed on: Jan. 20, 2023.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
URN
Ліцензія
Авторське право (c) 2023 Анатолій Санжаровський, Василь Юрчишин
Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial 4.0 International License.
Автори, які публікуються в цьому збірнику, погоджуються з наступними умовами:
Автори залишають за собою право на авторство своєї роботи та передають збірнику право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License CC BY-NC, яка дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи в цьому збірнику.
Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи в тому вигляді, в якому її опубліковано цим збірником (наприклад, розміщувати роботу в електронному сховищі установи або публікувати в складі монографії), за умови збереження посилання на першу публікацію роботи в цьому збірнику.
Політика збірника наукових праць дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).