Aвтоматизована побудова реєстру ризиків у розробці ПЗ на основі issue-трекінгу в GitHub projects
DOI:
https://doi.org/10.33216/1998-7927-2025-293-7-17-30Ключові слова:
issue-трекінг GitHub, реєстр ризиків, автоматизована класифікація, управління якістю ПЗ, технічний борг, Python-скрипт, прогнозування ризиківАнотація
У статті розглянуто актуальну проблему автоматизації процесу побудови реєстру ризиків у розробці програмного забезпечення на основі аналізу даних issue-трекінгу в GitHub Projects. В умовах зростання складності програмних продуктів та високої динаміки змін життєвого циклу ІТ-проєктів традиційні ручні підходи до ідентифікації ризиків дедалі більше втрачають свою ефективність через затримки оновлення інформації та значні людські витрати. Автором запропоновано концепцію та реалізовано прототип Python-скрипта, який забезпечує автоматизоване вилучення, попередню обробку, багаторівневу класифікацію та формування структурованого реєстру ризиків, що дозволяє інтегрувати цей процес безпосередньо у звичний життєвий цикл управління якістю проєкту. Запропонований підхід ґрунтується на класифікації ризиків за визначеною таксономією, що охоплює сім основних типів: інженерні, середовищні, процесні, пов’язані з обмеженнями, безпекові, поведінкові та зовнішні ризики. Для кожної групи ризиків визначено перелік релевантних ключових слів і текстових індикаторів, що забезпечує ефективну роботу алгоритму keyword matching у поєднанні з аналізом labels, коментарів та стану задач. У межах апробації скрипт було протестовано на штучно сформованому датасеті, що містить понад 150 завдань (issues) з різноманітними текстами, наближеними до реальної практики відкритих проєктів. Важливою особливістю прототипу є можливість мультикласової класифікації, коли одна задача може одночасно відповідати кільком групам ризиків, що адекватно відображає міждисциплінарність сучасних проблем у сфері розробки ПЗ. Ефективність роботи скрипта забезпечується високою швидкодією: середній час обробки повного масиву даних не перевищує 1,5 секунди, що дозволяє інтегрувати рішення у регулярні CI/CD-конвеєри через GitHub Actions. Стаття також окреслює методологічну базу прогнозування ефективності розробленого підходу з використанням даних із сучасних досліджень, зокрема результатів моделі BEACon-TD, яка продемонструвала F1-міру понад 0.81–0.86 на реальних наборах issue-трекінгу. Це дозволяє аналітично прогнозувати потенційну точність запропонованого підходу на рівні 80–85% за належного донавчання та адаптації ключових слів під специфіку проєкту. Запропоноване рішення дозволяє не лише виявляти проблемні зони на ранніх етапах, але й формувати основу для подальшої прогнозної аналітики щодо впливу ризиків на часові, фінансові та якісні параметри розробки. Крім того, скрипт створює структурований реєстр у форматах JSON та Excel із налаштованим оформленням і надає візуалізацію розподілу типів ризиків за допомогою діаграм у Matplotlib, що підвищує прозорість та зручність використання результатів аналізу. Отримані дані можуть інтегруватися у системи управління якістю або передаватися стейкхолдерам для своєчасного прийняття рішень. У підсумку доведено, що запропонована автоматизована побудова реєстру ризиків на основі GitHub Projects є перспективним напрямом удосконалення процесів управління якістю ПЗ та управління технічним боргом, а розроблений прототип демонструє приклад практичної реалізації цієї концепції у поєднанні з гнучкими підходами Agile та DevOps.
Посилання
1. Shivashankar K., Orucevic M., Maritsdatter Kruke M., Martini A. BEACon-TD: Classifying Technical Debt and its types across diverse software projects issues using transformers. Journal of Systems and Software. 2025. №226. ISSN 0164-1212. DOI: https://doi.org/10.1016/j.jss.2025.112435.
2. Tang B., Zhang S., Zhu F., Ye A. CAPRA: Context-Aware patch risk assessment for detecting immature vulnerability in open-source software. Computers & Security. – 2025. №157. ISSN 0167-4048. DOI: https://doi.org/10.1016/j.cose.2025.104540.
3. Basile C., De Sutter B., Canavese D., Regano L., Coppens B. Design, implementation, and automation of a risk management approach for man-at-the-End software protection. Computers & Security. 2023. №132. ISSN 0167-4048. DOI: https://doi.org/10.1016/j.cose.2023.103321.
4. Van Can A.T., Dalpiaz F. Locating requirements in backlog items: Content analysis and experiments with large language models. Information and Software Technology. 2025. №179. ISSN 0950-5849. DOI: https://doi.org/10.1016/j.infsof.2024.107644.
5. Ramachandran S., Agrahari R., Mudgal P., Bhilwaria H., Long G., Kumar A. Automated Log Classification Using Deep Learning. Procedia Computer Science. 2023. №218. С. 1722–1732. ISSN 1877-0509. DOI: https://doi.org/10.1016/j.procs.2023.01.150.
6. Liu Z. Design of a Full-Process Transaction Monitoring and Risk Feedback System for DevOps Based on Microservices Architecture and Machine Learning Methods. Procedia Computer Science. 2025. №262. С. 948–954. ISSN 1877-0509. DOI: https://doi.org/10.1016/j.procs.2025.05.129.
7. Almaiah M.A., Saqr L.M., Al-Rawwash L.A., Altellawi L.A., Al-Ali R., Almomani O. Classification of Cybersecurity Threats, Vulnerabilities and Countermeasures in Database Systems. Computers, Materials and Continua. 2024. №81, вип. 2. С. 3189–3220. ISSN 1546-2218. DOI: https://doi.org/10.32604/cmc.2024.057673.
8. Hasani H., Freddi F., Piazza R. AI-driven automated and integrated structural health monitoring under environmental and operational variations. Automation in Construction. 2025. №176. ISSN 0926-5805. DOI: https://doi.org/10.1016/j. autcon.2025.106222.
9. Farkas Z., Országh E., Engelhardt T., Zentai A., Süth M., Csorba Sz., Jóźwiak Á. Emerging risk identification in the food chain – A systematic procedure and data analytical options. Innovative Food Science & Emerging Technologies. 2023. №86. ISSN 1466-8564. DOI: https://doi.org/ 10.1016/j.ifset.2023.103366.
10. Habib A.K.M.A., Hasan M.K., Hassan R., Islam S., Abbas H.S. False data injection attack dataset for classification, identification, and detection for IIoT in Industry 5.0. Data in Brief. 2025. №61. ISSN 2352-3409. DOI: https://doi.org/10.1016/j. dib.2025.111692.
11. Hassan M., Salbitani G., Carfagna S., Khan J.A. Deep learning meets marine biology: Optimized fused features and LIME-driven insights for automated plankton classification. Computers in Biology and Medicine. 2025. №192, ч. A. ISSN 0010-4825. DOI: https://doi.org/10.1016/j.compbiomed.2025.110273.
12. Sánchez-Hernández A., Román D., Javadi P., Domingo I. Leveraging GIS and SfM photogrammetry for monitoring and risk assessment of rock art sites. Digital Applications in Archaeology and Cultural Heritage. 2025. №37. ISSN 2212-0548. DOI: https://doi.org/10.1016/j.daach.2025.e00413.
13. Santarsiero G. Automated assessment of bridge guardrails for regional prioritization based on open-source data and deep learning algorithms. Results in Engineering. 2025. №26. ISSN 2590-1230. DOI: https://doi.org/10.1016/j.rineng.2025.105210.
14. Hossain S.T., Yigitcanlar T., Nguyen K., Xu Y. Platform urbanism for resident safety: A real-time predictive microclimate risk monitoring and alert system. /Urban Climate. 2025. №61. ISSN 2212-0955. DOI: https://doi.org/10.1016/j.uclim. 2025.102445.