IntegraLLM: AI-платформа для цифровой трансформации муниципального управления

Проект по автоматизации анализа и структурирования нормативно-правовых актов с использованием локальных нейросетей. Разработан и внедрен для оптимизации работы органов местного самоуправления.

Автор и архитектор: Кузнецов Сергей

Описание проблемы

750+ часов ручного труда на пути к цифровизации

В рамках перехода органов местного самоуправления на единую цифровую платформу «Госвеб» возникла задача по миграции архива документов. Необходимо было вручную проанализировать, структурировать и перенести более 3000 нормативно-правовых актов. По предварительной оценке, это потребовало бы свыше 750 часов монотонной работы сотрудников, что приводило к значительным временным и бюджетным издержкам.

Цифровая трансформация

Цели проекта

Решить задачу по миграции 3000+ НПА на платформу «Госвеб» без привлечения подрядчиков и расходования бюджета.

Сократить трудозатраты сотрудников (оценочно >750 часов) на ручной перенос и разметку документов.

Создать универсальный и многоразовый инструмент для автоматической семантической разметки и публикации документов в будущем.

Используемые технологии

GPU: NVIDIA GeForce RTX 4070 Ti Super

Backend: Python, Flask (для API).

LLM-инфраструктура: Локально развернутые большие языковые модели (LLM) под управлением фреймворка vLLM для максимальной производительности на собственном оборудовании

•Mistral-7B-Instruct-v0.3-GPTQ

•Mistral-7B-Instruct-v0.2-GPTQ

•Qwen2.5-14B-Instruct-GPTQ

Frontend и интеграция: PHP (в виде плагина для WordPress для создания интуитивно понятного интерфейса для сотрудников, а также сокращение затрат по разработке административной панели), JavaScript, REST API.

Методология разработки: AI-Driven Development. Для ускорения разработки и минимизации затрат на команду программистов использовались AI-ассистенты (Gemini и ChatGPT) в качестве команды junior-разработчиков при написании кода.

Результаты

Все цели были достигнуты, так как был создан масштабируемый продукт, а не разовое решение.

Эффективность рассчитывалась по двум ключевым метрикам: 

  • прямая экономия бюджета (стоимость услуг подрядчиков)
  • экономия человеко-часов, пересчитанная в денежный эквивалент.

Проект доказал, что даже силами одного специалиста, но с применением современных подходов (локальные LLM, AI-ассистенты в разработке), можно создавать сложные и эффективные MVP ИТ-решения с применение систем ИИ.

Источники данных для первичной настройки параметров запуска LLM модели и извлечения признаков

  • API интерфейс для работы с порталом «Официальный интернет-потал правовой информации», раздел «Официальное опубликование» publication.pravo.gov.ru

Информация о работе проекта

С целью определения характеристик запуска LLM разработан сервис Hardware Benchmark. Запуск сервиса реализован через плагин Wordpress. Модель последовательно запускается с разными параметрами в сторону уменьшения нагрузки и фиксируется максимальные рабочие параметры, которые «держит» GPU.

После диагностики возможности запуска LLM, в разделе LLM Server Control можно запустить/остановить LLM модель с работающими параметрами.

Показатели работы GPU после запуска Mistral-7B-Instruct-v0.3-GPTQ с  максимально работающими параметрами полученными с помощью сервиса Hardware Benchmark

В разделе Run Full Prompt & Parameter Optimization производится первичный оптимальный поиск параметров для запуска LLM модели и Prompts с помощью спарсенных данных портала publication.pravo.gov.ru. Необходимо подгрузить json-файл c описанием файлов и их признаков, а также указать директорию хранения файлов.

Результаты загрузки файла json с описательными признаками документов для исследования в LLM и подстройки параметров

Результаты работы Run Full Prompt & Parameter Optimization можно посмотреть в блоке View Optimization Results

После выполнения диагностики и настройки можно запускать сервис по пакетной загрузке и обработке НПА по извлечению признаков. Для НПА состоящего из отдельных документов реализован функционал по объединению в один общий pdf.

Реализована возможность производить обработку директорий с файлами, при условии, что одна папка содержит файлы одного НПА.

После обработки необходимого числа файлов, результаты работы можно выгрузить в формате пригодном для загрузки на портал «Госвеб».

Дополнительно реализован функционал обработки документов через Telegram-бота. При загрузке документов в Telegram, возвращается архив для загрузки в «Госвеб».

Протестируйте AI-ядро в Telegram

Для демонстрации ключевой функции проекта запущен Telegram-бот. Отправьте ему документ (PDF, DOCX), и он вернет извлеченные из него структурированные данные и атрибуты.

Обратите внимание: Бот работает на базе локального сервера и предназначен для демонстрации технологии. Возможны временные перерывы в работе в связи с плановым обслуживанием и развертыванием новых версий.