Задачи извлечения фактов из текста

EKG Language Processing – инструмент извлечения фактов из текста. Вот примеры задач, которые можно решать с его помощью:

  • создание диалоговых помощников - чат-ботов, корпоративной базы знаний с диалоговым интерфейсом с использованием RAG по структурированным данным и текстам;
  • автоматическая обработка сообщений в службу техподдержки: классификация, определение массовых проблем и сбоев, определение предмета обращения и так далее;
  • анализ договорных документов: определение сторон договора, предмета договора, объема обязательств, дополнительных условий;
  • анализ организационно-распорядительных документов, а также стандартов и другой нормативной документации: поиск определений терминов, требований, обязанностей – в том числе с целью поиска дублирований или противоречий;
  • извлечение фактов из различных текстовых отчетов, аналитических записок, публикаций и др.
  • нормализация номенклатуры изделий, наполнение справочников MDM, генерация содержимого базы данных на основе текстовых списков и не нормализованных таблиц

Решение таких задач позволит бизнесу:

  • сэкономить время, которое сотрудники тратят на чтение и анализ документов,
  • повысить доступность информации (вручную нужный документ или факт можно и не найти),
  • обогатить содержимое корпоративных баз данных, собрать больше информации для анализа,
  • ускорить обработку обращений клиентов, улучшить качество организационно-распорядительных документов,
  • автоматизировать контроль выполнения требований этих документов.

Наш продукт имеет примеры коммерческого использования и приносит реальную пользу организациям!

Рекомендуем познакомиться с описанием ИИ-ассистента для службы техподдержки с поиском по базе знаний и инцидентам Jira. Смотрите также подробное описание использования нашего продукта для классификации обращений в техподдержку.

Наша технология и преимущества

Мы используем подход GraphRAG, направленный на извлечение точных фактов из текста, их преобразование в граф знаний, и использование графа как структурированных данных и источника для формирования контекста для LLM. Это позволяет решать задачи, не доступные для решения "в лоб" большими языковыми моделями (LLM) или обычным RAG. Наш подход минимизирует галлюцинации и повышает точность ответов.

Алгоритм работы EKG LP таков:

  • извлечь чистый текст из анализируемого документа (PDF, офисные форматы)
  • выполнить грамматический разбор каждой фразы документа
  • построить концептуальную схему предметной области, описанной в документе
  • извлечь конкретные факты и представить их в соответствии с концептуальной схемой
  • интегрировать сведения из разных документов, объединив их концептуальные схемы и фактическую информацию
  • выполнить полезную работу: записать извлеченную структурированную информацию в базу данных, сформировать ответы на вопросы и так далее.

Свяжитесь с нами