OCR - это системы оптического распознавания символов, также известные на испанском языке как оптическое распознавание символов. OCR - это программное обеспечение, которое позволяет распознавать текст, создавать его изображение для преобразования в последовательность символов, а затем сохранять их в заданном формате, который можно использовать в этих программах редактирования текста. Другими словами, благодаря этой новой технологии любой тип текста или документа, включая файлы PDF, отсканированные документы или даже изображения, снятые с цифровых камер, можно преобразовать в данные, чтобы иметь возможность редактировать.
Эта программа работает следующим образом: сначала она анализирует каждую часть изображения рассматриваемого документа; распределить страницу по частям, таким как таблицы, изображения, текстовые блоки среди прочего; затем строки распределяются по словам, чтобы впоследствии стать символами; и поскольку символы уже указаны, программа выполняет сравнение с группой изображений шаблона. Это происходит в соответствии с серией гипотез о каждом персонаже; и на основе этих гипотез анализируются различные варианты разделения строк на слова и слов на символы. И именно после большого количества анализа и обработки гипотез программа наконец представляет уже распознанный и преобразованный в новый формат текст..
Следует отметить, что сегодня на компьютерном рынке существует ряд программ, основанных на OCR, таких как OmniPage, Abbyy Fine Reader или READiris. YY, которые обладают способностью не только анализировать и распознавать текст как таковой, но также распознавать формат и стиль, но с определенными ограничениями, таким образом, требуя, чтобы текст после анализа был отредактирован для внесения необходимых корректировок. требуется.