Розпізнавання сутностей у графі знань
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Харківський національний автомобільно-дорожній університет
Abstract
Метою роботи є підвищення ефективності ідентифікації та профілювання організацій у великомасштабних графах знань шляхом розробки методів та алгоритмів розпізнавання сутностей. Об’єктом дослідження є процес інтеграції та аналізу інформації про організації у розподілених інформаційних системах. Предметом дослідження є моделі, методи та алгоритми розпізнавання сутностей (Entity Resolution) та кластеризації на графах знань. У роботі запропоновано гібридний підхід, що поєднує структурний аналіз графа (его-мережі, локальне збагачення, обмеження глибини пошуку) та машинне навчання для класифікації зв’язків, а також застосування графових ембеддінгів і щільнісної кластеризації. Реалізовано конвеєр обробки, який включає підготовку даних, побудову графа, аналіз компонент зв’язності, декомпозицію та ML-етапи з формуванням «Golden Record»/профілю «Client 360». Практичні результати демонструють підвищення точності ідентифікації до рівня понад 80%, зменшення обчислювальних витрат за рахунок обмеження глибини пошуку (N=8 покриває близько 97% релевантних шляхів) та покращення якості сегментації бізнес-груп через Node2Vec+DBSCAN. Отримані рішення можуть бути використані для задач KYB/AML, зокрема в умовах масштабування та інтеграції даних з різних джерел.
Description
Citation
Помазанов, Я. В. Розпізнавання сутностей у графі знань : дипломна робота … магістра : F3 Комп’ютерні науки / Помазанов Ярослав Владиславович. – Харків : ХНАДУ, 2025. – 97 с.