OVEERMOONБлог
·7 мин чтения

Распознавание накладных, УПД и ТОРГ-12 нейросетью

Как ИИ распознаёт накладные, УПД, ТОРГ-12 и счета-фактуры и заносит данные в 1С: точность, форматы, проверка. Что автоматизировать первым.

Распознавание накладных, УПД и ТОРГ-12 нейросетью

Бухгалтерия и склад тонут в бумаге: накладные, УПД, ТОРГ-12 и счета-фактуры приходят пачками, а сотрудник вручную переносит каждую строку в 1С. Распознавание накладных нейросетью снимает этот ручной ввод: ИИ читает документ, вытаскивает реквизиты и номенклатуру, сверяет с базой и заносит в учётную систему. Ниже разберём, что именно извлекается из каждого типа первички, где возникают сложности и как посчитать эффект до запуска.

Почему ручной ввод первички — это дорого

Один оператор за смену обрабатывает ограниченное число документов, и каждая позиция — это риск опечатки в количестве, цене или ставке НДС. По рынку до двух третей времени учётного сотрудника уходит на рутину: открыть скан, найти нужное поле, перепечатать, сверить. Чем больше поставщиков, тем больше форм, и тем дольше человек ищет, где в этой конкретной накладной указан ИНН или номер счёта-фактуры.

Ошибка ручного ввода всплывает позже — при сверке с поставщиком, при налоговой проверке, при инвентаризации. Исправление стоит дороже, чем сам ввод: нужно поднять оригинал, переоформить проводку, иногда — пересдать отчётность. Автоматическое распознавание убирает первопричину: данные попадают в систему один раз и из самого документа, а не из памяти человека.

Что извлекается из разных типов документов

Каждый вид первички устроен по-своему, и набор полей отличается. ИИ работает не по жёсткому шаблону «поле в координатах X-Y», а понимает структуру документа: находит шапку, табличную часть и подвал независимо от того, какую форму использует поставщик.

Тип документа Извлекаемые поля Нюансы распознавания
Товарная накладная (ТОРГ-12) Поставщик, покупатель, ИНН/КПП, номер и дата, номенклатура построчно, количество, цена, сумма, итоги Многостраничные таблицы, переносы строк, рукописные пометки и подписи в подвале
УПД Все реквизиты счёта-фактуры плюс данные отгрузки, статус (1 или 2), ставки и суммы НДС, основание Один документ совмещает счёт-фактуру и накладную; важно правильно определить статус
Счёт-фактура Номер, дата, продавец, покупатель, грузоотправитель, номенклатура, ставка и сумма НДС, страна, ГТД Корректировочные и исправленные версии, разные ставки НДС в одной таблице
Расходная накладная / приходная Контрагент, склад, позиции, количество, цена Внутренние формы без жёсткого ГОСТа, печати поверх текста
Акт выполненных работ Стороны, номер, дата, перечень работ/услуг, суммы, НДС Свободный формат, описания услуг текстом, отсутствие табличной части

Для бухгалтерии критична табличная часть: именно номенклатура, количество, цена и НДС формируют проводки. Современные модели читают таблицу построчно, сохраняя связь «товар — количество — цена — сумма», и отдельно собирают итоги, чтобы проверить, что сумма строк сходится с финальной цифрой документа.

Где ИИ ошибается и как это обрабатывается

Распознавание упд и накладных усложняют несколько типичных вещей. Печать, поставленная поверх реквизитов, перекрывает цифры. Рукописные правки — дописанное от руки количество или зачёркнутая цена — встречаются на бумажных оригиналах. Поставщики используют десятки разных форм: у одного шапка слева, у другого справа, у третьего своя верстка из 1С или SAP. Многостраничные накладные разрывают таблицу между листами, и систему нужно «склеить» позиции в один документ.

Хорошая система не делает вид, что распознала всё идеально. Она проставляет уровень уверенности по каждому полю. Если сумма строк не сходится с итогом, если ИНН не проходит контрольную проверку, если ставка НДС не соответствует сумме налога — документ уходит в очередь на ручную проверку, а не молча попадает в учёт с ошибкой. Оператор видит скан и распознанные данные рядом, поправляет одно-два подсвеченных поля и подтверждает. Так человек работает только с исключениями, а не со всем потоком.

Распознавание счетов-фактур требует особой аккуратности с НДС: разные ставки в одной таблице, корректировочные документы, страна происхождения и номер ГТД. Эти поля проверяются арифметически и по справочникам, чтобы в декларацию не попала неверная сумма налога.

Как номенклатура сопоставляется с базой 1С

Распознать текст позиции — половина дела. Главная боль — сопоставить «Молоко питьевое 3.2% 1л» из накладной поставщика с карточкой товара в вашей базе, где он заведён как «Молоко 3,2%, 1000 мл». Поставщики пишут названия по-своему, сокращают, меняют порядок слов, путают единицы измерения.

ИИ решает это не точным совпадением строки, а семантическим сопоставлением: модель понимает, что это один и тот же товар, даже при разной формулировке. Подсказками служат артикул, штрихкод, единица измерения и цена. Логика работает так:

  1. Система ищет точное совпадение по артикулу или штрихкоду поставщика, если он есть в карточке.
  2. Если кода нет — подбирает кандидатов по смыслу названия и единице измерения.
  3. Предлагает оператору лучший вариант с процентом совпадения, остальные показывает списком.
  4. Решение человека запоминается: в следующий раз эта позиция от этого поставщика сопоставляется автоматически.

Со временем доля автоматических сопоставлений растёт, потому что система накапливает соответствия «название поставщика — ваша карточка». Новые и спорные позиции остаются на человеке, рутина уходит ИИ. Именно по такому принципу выстраивает интеграцию с 1С, CRM и СЭД OVEERMOON: ИИ-агенты находят, проверяют и заносят данные, а спорные случаи отдают человеку с уже подсвеченной причиной.

Для среднего и крупного бизнеса важно, где это всё работает. Если документы содержат персональные данные и коммерческую тайну, обработка в закрытом контуре на отечественных LLM решает вопрос с 152-ФЗ и требованиями к КИИ: данные не уходят во внешние сервисы.

Что автоматизировать первым и как посчитать эффект

Начинать стоит не со всего потока сразу, а с самого массового и однотипного документа. Чаще всего это товарные накладные и УПД от постоянных поставщиков: их много, формы повторяются, а сопоставление номенклатуры быстро выходит на автомат. Акты и редкие формы подключают позже.

Чтобы решение окупалось, зафиксируйте метрики до старта:

  • Сколько документов в месяц обрабатывается вручную и сколько позиций в среднем в каждом.
  • Сколько минут уходит на ввод одного документа и сколько стоит час оператора.
  • Доля ошибок ввода и стоимость их исправления.
  • Срок от поступления документа до проведения в учёте.

После запуска сравните те же цифры: время на документ, долю автоматически проведённых без правок, число исправлений. Распознавание первички в среднем сокращает ручной ввод в разы, а реальный эффект виден уже на первом месяце по разнице во времени обработки.

Показатель До После (ориентир)
Время на ввод документа минуты ручной перепечатки секунды на проверку
Доля документов без ручных правок 0% растёт по мере обучения
Ошибки ввода зависят от усталости ловятся проверками автоматически
Срок до проведения в учёте часы-дни минуты

Часто задаваемые вопросы

Какая точность у распознавания накладных?

Зависит от качества скана и типа поля. Печатный текст и числа из шапки распознаются почти безошибочно, табличная часть — чуть сложнее из-за переносов и печатей. Ключевой момент не в проценте, а в том, что система помечает неуверенные поля и отправляет их на проверку, поэтому в учёт не попадают тихие ошибки.

Нужно ли заранее настраивать шаблон под каждого поставщика?

Нет. Современные модели понимают структуру документа, а не координаты полей, поэтому работают с разными формами без ручных шаблонов. Настройка нужна только для нестандартных внутренних бланков, и она делается один раз.

В каких форматах принимаются документы?

PDF, сканы и фотографии (JPG, PNG), многостраничные файлы. Бумажные оригиналы оцифровываются на сканере или через мобильное приложение. Электронные документы из ЭДО обрабатываются напрямую без распознавания, потому что данные уже структурированы.

Останутся ли данные внутри компании?

Да, если разворачивать систему в закрытом контуре на отечественных LLM. Тогда документы и персональные данные не покидают периметр, что закрывает требования 152-ФЗ и регламентов по КИИ. Это и есть легальная альтернатива недоступным облачным сервисам.

Что делать дальше

Возьмите за июнь стопку накладных и УПД от двух-трёх постоянных поставщиков, замерьте время ручного ввода и долю ошибок — это ваша точка отсчёта. Затем запустите распознавание на этом же потоке и сравните цифры через месяц. Если ручной ввод сократился в разы, а проверки ловят ошибки до проводки — масштабируйте на остальных поставщиков и подключайте акты.

Другие статьи