Семантическая нарезка и Онтологический RAG (GraphRAG)

Эта область — передовой край исследований (R&D) в области генеративного ИИ. Готовых, простых стандартов здесь нет: индустрия только переходит от классических векторных баз к гибридным системам, объединяющим векторный поиск с графами знаний (Knowledge Graphs). Подходы вроде Microsoft GraphRAG или онтологических движков только начинают стандартизироваться.

Когда компании запускают классический векторный RAG, они быстро упираются в технологический тупик. Модель отлично находит точечные факты («Каков размер суточных в командировке в Париж?»), но полностью проваливается на вопросах, требующих сопоставления нескольких документов или понимания сложной структуры компании («Какие сервисы пострадают, если мы отключим СУБД базы биллинга, и кто за них отвечает?»).

Причина этого провала кроется в фундаментальном ограничении плоского векторного представления и наивной нарезки текста.

Почему плоский векторный поиск ломается на сложных данных

Механическая нарезка (Naive Chunking): Большинство систем режут документы на чанки фиксированного размера (например, по 500 символов с нахлестом). В результате важная таблица параметров рвется посередине, логическое условие отделяется от своего контекста, а имя файла или название раздела теряется. ИИ получает кусок текста «…данный параметр равен 5», но не знает, к какому продукту или версии это относится.
Семантическая слепота векторов: Векторные эмбеддинги измеряют «похожесть» слов по смыслу, но они не понимают точных логических отношений. Для вектора фразы «Сервис А зависит от Сервиса Б» и «Сервис Б зависит от Сервиса А» будут практически идентичны по близости, хотя системная логика в них строго противоположна.
Проблема многошагового вывода (Multi-hop Reasoning): Чтобы ответить на сложный вопрос, нужно связать факты из разных источников: документ X ссылается на сервис Y, а документ Z описывает уязвимость в Y. Плоский поиск найдет либо только X, либо только Z, и ИИ не сможет построить логическую цепочку.

Эволюционное решение №1: Семантическая нарезка (Content-Aware Chunking)

Вместо глупой нарезки по количеству символов передовые компании переходят на семантическое разбиение с сохранением иерархии: * Разбиение по синтаксису (Structural Parsing): Парсеры анализируют заголовки (H1, H2, H3), списки, абзацы, таблицы и блоки кода (AST-деревья). Чанк никогда не режется посреди предложения или логического блока. * Инъекция контекста (Context Injection): В начало каждого извлеченного чанка ИИ автоматически дописывает мета-контекст. Например: [Документ: Спецификация API] → [Раздел: Авторизация] → [Версия: 2.1] → Текст чанка… Это гарантирует, что при поиске ИИ всегда знает происхождение (provenance) и применимость каждого фрагмента.

Эволюционное решение №2: Онтологический RAG и GraphRAG

Наиболее мощным ответом на ограничения векторов стало объединение языковых моделей с Графами Знаний (Knowledge Graphs). Этот подход называется GraphRAG или Ontology-Based RAG.

Вместо того чтобы хранить документы как разрозненный набор текстовых чанков, система строит структурированный граф, где: * Узлы (Nodes) — это конкретные сущности компании (Проекты, Сервисы, Люди, Решения, Версии API, Документы). * Ребра (Edges) — это строго типизированные, проверенные связи между ними (зависит_от, отвечает_за, реализует, устарел_из-за, документирует). * Онтология (Ontology) — строгое подмножество правил и классов (vocabulary), описывающее структуру бизнеса (например, как это сделано в ThinkWork или AXKH от TecAce).

Как работает гибридный поиск в GraphRAG

Пользователь задает вопрос: «Какие модули ядра затронет обновление библиотеки авторизации?»
ИИ-планировщик (Planner) обращается к графу и находит узел Библиотека Авторизации.
Через обход графа (Graph Traversal) система мгновенно и со 100% точностью извлекает все связанные узлы: сервисы, которые её используют, команды, которые ими владеют, и документацию к этим сервисам.
Модель (LLM) получает на вход не просто похожие тексты, а строгую семантическую карту связей и синтезирует абсолютно точный, проверяемый ответ с точной трассировкой (lineage).

Полезные материалы и ссылки

Building AXKH on Ontology-Based RAG — кейс компании TecAce по превращению 12,000 разрозненных корпоративных документов в живой граф знаний на основе онтологического RAG для ответов на сложные логические вопросы.
ThinkWork: Memory Graph Concepts — техническая концепция двухуровневого графа знаний от ThinkWork: базовый граф страниц и управляемая бизнес-онтология для точной работы ИИ-агентов.
Knowledge Graphs Meet LLMs: Structured RAG Architectures — подробный разбор Элейна Циммерманна о синергии структурной строгости графов знаний и синтезирующей способности LLM для борьбы с галлюцинациями.
KGRAG (Knowledge Graph RAG) on GitHub — опенсорсный оркестратор структурных графов знаний, разработанный для заземления (grounding) ИИ в строгих фактах вместо неточного векторного поиска.
Knowledge Representation for RAG Systems: Data Prep Guide — руководство от NextPage по подготовке данных, объединению семантического поиска с таксономиями, онтологиями и ролевыми метками доступа.
HyGRAG: A Unified Framework for Relation-Aware Graph RAG — научная статья на arXiv (2026), описывающая фреймворк иерархического гибридного графа для двухуровневого извлечения знаний (на уровне текстовых чанков и логических сущностей).
Finding What Matters: Anchoring Context Knowledge with Evolving Indices — исследование алгоритма KAIR (2026), динамически строящего в контексте ИИ эволюционирующий индекс связей для повышения точности рассуждений в RAG.