перейти к основному тексту

Извлечение текста из отсканированных изображений (OCR)

Сканирование текста в отсканированных журналах и газетах и его отображение в текстовом редакторе.

Примечание.

  • Можно извлекать текст при сканировании с помощью пунктов Документ (Document), Другое (Custom) или ScanGear.
  • Экраны для сканирования документов используются в качестве примеров в следующих описаниях.
  1. Запустите программу IJ Scan Utility.

  2. Щелкните Параметры... (Settings...).

    рисунок: IJ Scan Utility

    Появится диалоговое окно «Параметры».

  3. Щелкните Сканирование документа (Document Scan).

    рисунок: Диалоговое окно «Параметры»

    Примечание.

    • Для параметра Разрешение (Resolution) можно установить только значение 300 dpi или 400 dpi, если функция Начать опт. распозн. (Start OCR) выбрана в окне Параметры приложения (Application Settings).
  4. Выберите Начать опт. распозн. (Start OCR) в группе Параметры приложения (Application Settings), затем выберите приложение, в котором требуется отобразить результат.

    рисунок: Диалоговое окно «Параметры»

    Примечание.

    • Если совместимое приложение не установлено, после сканирования изображения из него извлекается текст, который отображается в текстовом редакторе. При сканировании двух или нескольких документов извлеченный текст помещается в один текстовый файл.
      Отображение текста зависит от значения параметра Язык документа (Document Language) в диалоговом окне Параметры (Общие параметры) (Settings (General Settings)). Выберите язык для текста, который необходимо извлечь, в меню Язык документа (Document Language) и выполните сканирование.
    • Приложение можно выбрать во всплывающем меню.
  5. Щелкните OK.

    рисунок: Диалоговое окно «Параметры»

    Отобразится главный экран IJ Scan Utility.

    Примечание.

  6. Щелкните Документ (Document).

    рисунок: IJ Scan Utility

    Начинается сканирование.

    После сканирования изображения сохраняются в соответствии с параметрами, а извлеченный текст отображается в указанном приложении.

    Примечание.

    • Чтобы отменить сканирование, щелкните Отмена (Cancel).
    • Текст, отображаемый в текстовом редакторе, служит только для справки. Текст, содержащийся на изображении документов перечисленных ниже типов, может распознаваться неправильно.

      • Документы, содержащие шрифт размером менее 8 или более 40 пунктов (при разрешении 300 dpi)
      • Документы, размещенные с наклоном
      • Документы, загруженные в перевернутом виде, или документы с неправильной ориентацией текста (повернутые символы)
      • Документы, содержащие специальные шрифты, эффекты, текст, набранный курсивом или написанный от руки
      • Документы с близко расположенными строками
      • Документы с текстом на цветном фоне
      • Документы, содержащие текст на нескольких языках