EKG Language Processing – инструмент извлечения фактов из текста. Вот примеры задач, которые можно решать с его помощью:
- автоматическая обработка сообщений в службу техподдержки: классификация, определение массовых проблем и сбоев, определение предмета обращения и так далее;
- анализ договорных документов: определение сторон договора, предмета договора, объема обязательств, дополнительных условий;
- анализ организационно-распорядительных документов, а также стандартов и другой нормативной документации: поиск определений терминов, требований, обязанностей – в том числе с целью поиска дублирований или противоречий;
- извлечение фактов из различных текстовых отчетов, аналитических записок, публикаций и др.
Решение таких задач позволит бизнесу:
- сэкономить время, которое сотрудники тратят на чтение и анализ документов,
- повысить доступность информации (вручную нужный документ или факт можно и не найти),
- обогатить содержимое корпоративных баз данных, собрать больше информации для анализа,
- ускорить обработку обращений клиентов, улучшить качество организационно-распорядительных документов,
- автоматизировать контроль выполнения требований этих документов.
Наш продукт имеет примеры коммерческого использования и приносит реальную пользу организациям!
Рекомендуем познакомиться с подробным описанием использования нашего продукта для классификации обращений в техподдержку.Уникальность нашего решения состоит в том, что оно опирается на грамматический разбор каждой фразы документа, переходит с уровня слов на уровень концептов, и извлекает из текста точные факты. Вероятность ошибки при таком способе обработки крайне низка, а ценность и точность получаемого результата – напротив, высока. Это позволяет решать даже такие задачи, которые пока не под силу большим языковым моделям (LLM), которые лишь генерирует вероятностный ответ на определенный вопрос, или другим средствам NLU (Natural Language Understanding), которые в основном сводятся к нечетким инструментам классификации высказываний. Наш подход является более частным (узким), но намного лучше подходящим для решения задач бизнеса, в которых цена ошибки высока. Известно немало примеров, когда «галлюцинации» LLM приводили к серьезным потерям для бизнеса. Наш продукт не галлюцинирует!
Алгоритм работы EKG LP таков:
- извлечь чистый текст из анализируемого документа (PDF, офисные форматы)
- выполнить грамматический разбор каждой фразы документа
- определить, относится ли каждая фраза или группа фраз к искомому типу фраз: определение, требование, обязательство, сообщение об ошибке и т.д.
- сформировать «смысловой портрет» высказывания – формализованную структуру, передающую его смысл
- заменить в «смысловом портрете» леммы на концепты
- выполнить требуемую обработку: найти дубли или противоречия, классифицировать высказывания, записать извлеченную информацию в базу данных, сформировать ответы на вопросы и так далее.