Распознавание и обработка счетов нейросетью
Как нейросеть распознаёт счета: достаёт реквизиты, ИНН, суммы и НДС, сверяет контрагента и переносит данные в 1С без ручного ввода.

Счета приходят пачками: на почту, в мессенджеры, фотографиями от менеджеров и просто стопкой на стол бухгалтеру. Каждый нужно открыть, перепечатать реквизиты и суммы в учётную систему, проверить контрагента и не пропустить ошибку. Распознавание счетов нейросетью убирает эту ручную работу: система читает документ, достаёт данные, сверяет их и отдаёт готовую запись в учёт. Дальше о том, как она разбирает счёт на поля, ловит ошибки и справляется с нестандартными формами.
Что нейросеть достаёт из счёта
Счёт — это набор полей в свободной вёрстке, и каждый поставщик оформляет его по-своему. Задача модели — не просто прочитать текст, а понять, где здесь что, и разложить по нужным реквизитам.
Из типового счёта или счёта-фактуры система извлекает:
- поставщика и покупателя с реквизитами: наименование, ИНН, КПП;
- номер и дату документа;
- позиции номенклатуры с количеством и ценой;
- ставки и суммы НДС;
- итоговую сумму к оплате;
- банковские реквизиты для платежа.
Ключевое отличие от старого шаблонного OCR в том, что нейросеть ориентируется по смыслу, а не по фиксированным координатам на странице. Шаблонный распознаватель надо настраивать под каждую форму: сдвинулась таблица — и он теряет данные. Модель понимает, что «ИНН» рядом с десятизначным числом и есть ИНН, в каком бы углу счёта он ни стоял, поэтому работает с документами от разных поставщиков без отдельной настройки под каждого.
Как идёт распознавание: от файла до данных
На входе подходит почти всё: PDF, скан, JPG или PNG, фотография счёта с телефона. Система переводит изображение в текст и раскладывает его по полям.
Точность зависит от качества исходника. На чистых печатных сканах распознавание счетов доходит до 98–99%. На фото плохого качества, мятых документах и термобумаге она ниже, в районе 88–92%. Грамотная система не скрывает этого: документы с низкой уверенностью она не проводит молча, а помечает на проверку человеку. Это и есть правильная логика — типовое идёт автоматически, сомнительное попадает к оператору с уже подсвеченными спорными полями.
Проверка и сверка: где система ловит ошибки
Распознать — половина дела. Главную ценность даёт следующий шаг, на котором система проверяет данные до того, как они попадут в учёт.
Контрагент
Поставщик сверяется с государственными реестрами (ЕГРЮЛ/ЕГРИП) по ИНН. Так отсекаются опечатки в реквизитах и счета от контрагентов, которых стоит проверить отдельно.
Суммы и НДС
Система пересчитывает арифметику: совпадают ли суммы позиций с итогом, верно ли посчитан НДС по ставке. Расхождение в контрольной сумме — частый признак ошибки в исходном документе или в распознавании, и его видно сразу, а не на сверке в конце квартала.
Дубли и сверка между документами
Нейросеть отлавливает повторно присланные счета, чтобы один и тот же не оплатили дважды. А если счёт идёт в связке с накладной и счётом-фактурой, система сопоставляет их между собой и с заказом: совпадают ли позиции, количество и цены. Эта трёхсторонняя сверка вручную съедает массу времени, а автоматически проходит за секунды.
Перенос в учётную систему
Проверенные данные не остаются в отдельном окне, а отправляются туда, где с ними работают. Для большинства российских компаний это 1С — система создаёт документ поступления, привязывает его к нужному контрагенту и договору, подставляет номенклатуру. Бухгалтеру остаётся подтвердить запись, а не набирать её с нуля.
Здесь и кроется разница между «сервисом распознавания» и рабочей автоматизацией. Само по себе распознавание отдаёт данные в виде таблицы — дальше их всё равно надо куда-то переносить. Ценность появляется, когда данные доезжают до учётной системы по правильному маршруту, с привязкой к договору и со снятием дублей. Поэтому в OVEERMOON мы настраиваем не только распознавание счетов, но и проверку с переносом в вашу систему, и отвечаем за метрику, а не за факт установки сервиса.
Что делать с нестандартными и сложными счетами
Идеальных счетов не бывает, и именно на исключениях ломаются дешёвые коробочные решения.
Разная вёрстка от поставщиков для современной модели не проблема — она ориентируется по смыслу. Сложнее с фотографиями плохого качества, бледной печатью и термобумагой: здесь система честно ставит низкую уверенность и отправляет счёт на проверку, вместо того чтобы угадать сумму. Рукописные пометки и совсем нетиповые формы тоже уходят человеку.
Со временем точность на ваших поставщиках растёт: система настраивается на формы, которые приходят чаще всего, и доля документов, проходящих без вмешательства, увеличивается. Поэтому оценивать решение лучше не по одному тестовому счёту, а по реальному потоку за пару недель — он показывает, какая часть действительно идёт на автомате, а какая требует контроля.
Как оценить эффект
Считать просто. Возьмите свой поток счетов за месяц и время на один документ. Если в обработку приходит, скажем, 500 счетов и на каждый уходит несколько минут ручного ввода и проверки, это десятки часов работы. Автоматизация оставляет человеку только подтверждение и разбор исключений, а механический ввод убирает. До старта зафиксируйте время на документ и долю ошибок, после — сравните: именно эти две цифры показывают, окупилось ли внедрение. Распознавание счетов — частный, но самый массовый случай ИИ-обработки документов; как он встраивается в общую картину, мы описали в обзоре ИИ-автоматизации бизнеса.
Путь одного счёта
Поставщик прислал счёт-фактуру PDF на почту. Система забирает вложение, распознаёт его и раскладывает поля: видит ИНН поставщика, номер и дату, три позиции номенклатуры, ставку НДС 20% и итог. Дальше идёт проверка. ИНН сходится с данными ЕГРЮЛ, сумма позиций совпадает с итогом, такого счёта в базе ещё не было, значит дубля нет. Система привязывает документ к карточке этого поставщика и открытому договору, создаёт поступление в 1С и ставит бухгалтеру задачу подтвердить. Весь путь от письма до записи занимает секунды, человеку остаётся финальный клик.
Если бы на счёте была бледная печать и сумма читалась плохо, документ остановился бы на этапе проверки с пометкой о низкой уверенности и ушёл бы человеку, а не в учёт с ошибкой. Так система экономит время на массовом потоке и не создаёт скрытых проблем на сложных случаях.
Часто задаваемые вопросы
Какая точность распознавания счетов?
На чистых печатных сканах около 98–99%. На фото плохого качества и термобумаге ниже, 88–92%. Важнее не сама цифра, а то, что система помечает неуверенные документы на проверку и сверяет данные с реестрами и контрольными суммами, а не проводит вслепую.
Нужно ли настраивать шаблон под каждого поставщика?
Нет. В отличие от шаблонного OCR, нейросеть ориентируется по смыслу и распознаёт счета разной вёрстки без отдельного шаблона. На частых поставщиках точность со временем только растёт.
Что делать со счетами в виде фото с телефона?
Их система тоже принимает. Если фото читаемое, счёт обрабатывается автоматически; если качество низкое, документ уходит на проверку с подсвеченными спорными полями. Молча провести сомнительные данные система не должна.
Как это связано с 1С?
Проверенные данные переносятся прямо в 1С: создаётся документ поступления с привязкой к контрагенту и договору. Бухгалтер подтверждает запись вместо ручного ввода. Связку с конкретной конфигурацией настраивают под ваш процесс.
Что в итоге
Распознавание счетов нейросетью снимает с бухгалтерии самую массовую рутину: чтение, ввод реквизитов и сумм, сверку контрагента и НДС, отлов дублей. Человек переключается с перепечатывания на контроль исключений, а данные попадают в учётную систему быстрее и с меньшим числом ошибок. Начать стоит со своего реального потока счетов и зафиксированной метрики времени на документ.
Хотите автоматизировать обработку счетов в своей системе? Оставьте заявку на аудит — посмотрим на ваш поток и формы счетов и покажем, какую часть можно вести без ручного ввода.