OVEERMOONБлог
·6 мин чтения

Распознавание и обработка счетов нейросетью

Как нейросеть распознаёт счета: достаёт реквизиты, ИНН, суммы и НДС, сверяет контрагента и переносит данные в 1С без ручного ввода.

Распознавание и обработка счетов нейросетью

Счета приходят пачками: на почту, в мессенджеры, фотографиями от менеджеров и просто стопкой на стол бухгалтеру. Каждый нужно открыть, перепечатать реквизиты и суммы в учётную систему, проверить контрагента и не пропустить ошибку. Распознавание счетов нейросетью убирает эту ручную работу: система читает документ, достаёт данные, сверяет их и отдаёт готовую запись в учёт. Дальше о том, как она разбирает счёт на поля, ловит ошибки и справляется с нестандартными формами.

Что нейросеть достаёт из счёта

Счёт — это набор полей в свободной вёрстке, и каждый поставщик оформляет его по-своему. Задача модели — не просто прочитать текст, а понять, где здесь что, и разложить по нужным реквизитам.

Из типового счёта или счёта-фактуры система извлекает:

  • поставщика и покупателя с реквизитами: наименование, ИНН, КПП;
  • номер и дату документа;
  • позиции номенклатуры с количеством и ценой;
  • ставки и суммы НДС;
  • итоговую сумму к оплате;
  • банковские реквизиты для платежа.

Ключевое отличие от старого шаблонного OCR в том, что нейросеть ориентируется по смыслу, а не по фиксированным координатам на странице. Шаблонный распознаватель надо настраивать под каждую форму: сдвинулась таблица — и он теряет данные. Модель понимает, что «ИНН» рядом с десятизначным числом и есть ИНН, в каком бы углу счёта он ни стоял, поэтому работает с документами от разных поставщиков без отдельной настройки под каждого.

Как идёт распознавание: от файла до данных

На входе подходит почти всё: PDF, скан, JPG или PNG, фотография счёта с телефона. Система переводит изображение в текст и раскладывает его по полям.

Точность зависит от качества исходника. На чистых печатных сканах распознавание счетов доходит до 98–99%. На фото плохого качества, мятых документах и термобумаге она ниже, в районе 88–92%. Грамотная система не скрывает этого: документы с низкой уверенностью она не проводит молча, а помечает на проверку человеку. Это и есть правильная логика — типовое идёт автоматически, сомнительное попадает к оператору с уже подсвеченными спорными полями.

Проверка и сверка: где система ловит ошибки

Распознать — половина дела. Главную ценность даёт следующий шаг, на котором система проверяет данные до того, как они попадут в учёт.

Контрагент

Поставщик сверяется с государственными реестрами (ЕГРЮЛ/ЕГРИП) по ИНН. Так отсекаются опечатки в реквизитах и счета от контрагентов, которых стоит проверить отдельно.

Суммы и НДС

Система пересчитывает арифметику: совпадают ли суммы позиций с итогом, верно ли посчитан НДС по ставке. Расхождение в контрольной сумме — частый признак ошибки в исходном документе или в распознавании, и его видно сразу, а не на сверке в конце квартала.

Дубли и сверка между документами

Нейросеть отлавливает повторно присланные счета, чтобы один и тот же не оплатили дважды. А если счёт идёт в связке с накладной и счётом-фактурой, система сопоставляет их между собой и с заказом: совпадают ли позиции, количество и цены. Эта трёхсторонняя сверка вручную съедает массу времени, а автоматически проходит за секунды.

Перенос в учётную систему

Проверенные данные не остаются в отдельном окне, а отправляются туда, где с ними работают. Для большинства российских компаний это 1С — система создаёт документ поступления, привязывает его к нужному контрагенту и договору, подставляет номенклатуру. Бухгалтеру остаётся подтвердить запись, а не набирать её с нуля.

Здесь и кроется разница между «сервисом распознавания» и рабочей автоматизацией. Само по себе распознавание отдаёт данные в виде таблицы — дальше их всё равно надо куда-то переносить. Ценность появляется, когда данные доезжают до учётной системы по правильному маршруту, с привязкой к договору и со снятием дублей. Поэтому в OVEERMOON мы настраиваем не только распознавание счетов, но и проверку с переносом в вашу систему, и отвечаем за метрику, а не за факт установки сервиса.

Что делать с нестандартными и сложными счетами

Идеальных счетов не бывает, и именно на исключениях ломаются дешёвые коробочные решения.

Разная вёрстка от поставщиков для современной модели не проблема — она ориентируется по смыслу. Сложнее с фотографиями плохого качества, бледной печатью и термобумагой: здесь система честно ставит низкую уверенность и отправляет счёт на проверку, вместо того чтобы угадать сумму. Рукописные пометки и совсем нетиповые формы тоже уходят человеку.

Со временем точность на ваших поставщиках растёт: система настраивается на формы, которые приходят чаще всего, и доля документов, проходящих без вмешательства, увеличивается. Поэтому оценивать решение лучше не по одному тестовому счёту, а по реальному потоку за пару недель — он показывает, какая часть действительно идёт на автомате, а какая требует контроля.

Как оценить эффект

Считать просто. Возьмите свой поток счетов за месяц и время на один документ. Если в обработку приходит, скажем, 500 счетов и на каждый уходит несколько минут ручного ввода и проверки, это десятки часов работы. Автоматизация оставляет человеку только подтверждение и разбор исключений, а механический ввод убирает. До старта зафиксируйте время на документ и долю ошибок, после — сравните: именно эти две цифры показывают, окупилось ли внедрение. Распознавание счетов — частный, но самый массовый случай ИИ-обработки документов; как он встраивается в общую картину, мы описали в обзоре ИИ-автоматизации бизнеса.

Путь одного счёта

Поставщик прислал счёт-фактуру PDF на почту. Система забирает вложение, распознаёт его и раскладывает поля: видит ИНН поставщика, номер и дату, три позиции номенклатуры, ставку НДС 20% и итог. Дальше идёт проверка. ИНН сходится с данными ЕГРЮЛ, сумма позиций совпадает с итогом, такого счёта в базе ещё не было, значит дубля нет. Система привязывает документ к карточке этого поставщика и открытому договору, создаёт поступление в 1С и ставит бухгалтеру задачу подтвердить. Весь путь от письма до записи занимает секунды, человеку остаётся финальный клик.

Если бы на счёте была бледная печать и сумма читалась плохо, документ остановился бы на этапе проверки с пометкой о низкой уверенности и ушёл бы человеку, а не в учёт с ошибкой. Так система экономит время на массовом потоке и не создаёт скрытых проблем на сложных случаях.

Часто задаваемые вопросы

Какая точность распознавания счетов?

На чистых печатных сканах около 98–99%. На фото плохого качества и термобумаге ниже, 88–92%. Важнее не сама цифра, а то, что система помечает неуверенные документы на проверку и сверяет данные с реестрами и контрольными суммами, а не проводит вслепую.

Нужно ли настраивать шаблон под каждого поставщика?

Нет. В отличие от шаблонного OCR, нейросеть ориентируется по смыслу и распознаёт счета разной вёрстки без отдельного шаблона. На частых поставщиках точность со временем только растёт.

Что делать со счетами в виде фото с телефона?

Их система тоже принимает. Если фото читаемое, счёт обрабатывается автоматически; если качество низкое, документ уходит на проверку с подсвеченными спорными полями. Молча провести сомнительные данные система не должна.

Как это связано с 1С?

Проверенные данные переносятся прямо в 1С: создаётся документ поступления с привязкой к контрагенту и договору. Бухгалтер подтверждает запись вместо ручного ввода. Связку с конкретной конфигурацией настраивают под ваш процесс.

Что в итоге

Распознавание счетов нейросетью снимает с бухгалтерии самую массовую рутину: чтение, ввод реквизитов и сумм, сверку контрагента и НДС, отлов дублей. Человек переключается с перепечатывания на контроль исключений, а данные попадают в учётную систему быстрее и с меньшим числом ошибок. Начать стоит со своего реального потока счетов и зафиксированной метрики времени на документ.

Хотите автоматизировать обработку счетов в своей системе? Оставьте заявку на аудит — посмотрим на ваш поток и формы счетов и покажем, какую часть можно вести без ручного ввода.

Другие статьи