Фреймворк для систематизації методів науки про дані
Main Article Content
Анотація
Бурхливий розвиток науки про дані призвів до накопичення великої кількості моделей, методів і технік, які показали доцільність свого застосування. Як показав аналіз публікацій, систематизація методів і технік науки про дані є актуальною задачею, але в більшості результати релевантні до вирішення конкретної прикладної задачі. В роботі розроблено не орієнтований на конкретну предметну область та задачу фреймворк для систематизації методів науки про дані. Трирівнева ієрархія метамодель-метод-техніка впорядковує залежності між існуючими методами та техніками та знижує складність їх розуміння. Перший рівень структури складають три метамоделі: препроцесингу, моделювання та візуалізації даних. На другому рівні розташовані методи, які відповідають метамоделям. На третьому рівні зібрані основні техніки, згруповані відповідно до методів. Також описано принципи використання ієрархії. Для цього формально визначено типовий процес вирішення завдання з залученням методів науки про дані та сформульовано алгоритм використання фреймворку. Метод ситуаційногоаналізу застосовано для того, щоб пересвідчитися в працездатності фреймворку. Розглянуто чотири кейси застосування методів науки про дані для вирішення практичних завдань, які описані в сучасних публікаціях. Показано, що описані рішення повністю узгоджуються з запропонованою ієрархією методів фреймворку. Визначено рекомендовані напрямки застосування фреймворку та його обмеження: об’єкти обраної галузі повинні бути описані лише структурованими або напівструктурованими ознаками. На завершення наведено шляхи подальших досліджень.