Топ 5

Autodesk 3ds Max 2017

Autodesk 3ds Max представляет собой комплексное...

PRO100 5.20 с пакетом библиотек

PRO100 представляет собой вполне самостоятельную...

КОМПАС 3D версия 16

КОМПАС-3D — это программное обеспечение,...

Autodesk AutoCAD 2017

AutoCAD 2017 - Данный программный продукт...

ArchiCAD 20

Венгерская компания официально заявила о...

Что лучше распознает PDF ?

Что лучше распознает PDF ?


Какой из способов распознавания текст из изображений и PDF лучше – ABBYY Fine Reader, MS Office 2013 (Word) или Диск Google (OCR)? Рассмотрим каждый способ по-отдельности, преимущества и недостатки, и как использовать. Об оптическом распознавании MS Office 2013 и Google Drive более подробно – не каждый знает, что такое вообще есть. В конце сравним результаты перевода трех программ и подведем итоги.


Пожалуй, ABBYY Fine Reader самый распространенный и рекомендуемый в сети способ распознавания текста, но он имеет свои недостатки. Относительно недавно ряды конкурентов пополнили MS Office 2013 и облако Google. О том, что последние два распознают текст PDF даже не каждый знает. Так что рассмотрим особенности работы каждого из способов подробно. Вконце статьи сравним результаты распознавания.

ABBYY Fine Reader

Преимущества:

1. Одно из самых лучших приложений для распознавания текста изображений и PDF. Качество распознавание высокое.

2. Будет уперто обрабатывать самые расплывчатые тексты, даже если в результате выдаст непонятные иероглифы.

3. Переводит не только PDF, но и DJVU, и изображения любых форматов.

Недостатки:

1. ABBYY Fine Reader платный продукт. Так что или придется заплатить, или искать «крякнутые» версии и ключи. Так как работники ABBYY довольно тщательно следят за ссылками на пиратские версии, найти приложение с «таблеткой» не всегда легко.

2. Fine Reader – это мощная, поэтому тяжеловесная система оптического распознавания. Его возможности довольно велики.Но зачастую пользователю нужны всего 1-2 функции, например, перевести изображение в MS Word. Для машин со средними характеристиками (около 2 Гб ОЗУ) работа ABBYY Fine Reader на фоне вполне ощутимая.

Как использовать?

1. Установите ABBYY Fine Reader.

2. Запустите и сразу увидите опции распознавания.

3. Когда перевод закончится, сохраняйте в нужном формате.


MS Office 2013

Преимущества:

1. Качество извлечения текста на высоте. Некоторые элементы переводит лучше, чем ABBYY Fine Reader.

2. Быстрый и удобный в работе. Все, что нужно сделать, - это нажать правой кнопкой мышки на PDF-файл и выбрать «Открыть с помощью/Word». Несмотря на то, что MS Office 2013 мощный офисный процессор, запускается он быстро и использует относительно немного ОЗУ.

Недостатки:

1. Microsoft Office 2013 – платный офисный пакет.

2. Не распознает DJVU и изображения.

3. Когда MS Office конвертирует PDF, все другие открытые документы в Word зависают – ждут пока процесс завершится.

Как использовать?

1. Установить MS Word 2013;

2. Правой кнопкой на файле PDF, «Открыть с помощью», выбираем “Word”;

Что лучше распознает PDF ?


3. Сначала файл откроется в безопасном режиме, то есть редактировать вы его не сможете. Но вверху будет кнопка, которая предложит конвертировать PDF в Word.

Что лучше распознает PDF ?


В облаке Google эта опция называется OCR – оптическое распознавание символов в Google Документах.

Преимущества:

1. Google Drive – бесплатный сервис, не требует дополнительного ПО на компьютере - только интернет и браузер.

2. Диск Google кроме того, что выдаст вам редактируемый текст, еще и сохранить для вас рисунок этой страницы. То есть вдокументе вы получаете изменяемый текст и фотографию страницы в оригинале. Таким образом удобно исправлять неточности распознавания.

Недостатки:

3. Размер изображений и PDF для перевода ограничен – всего 2 Мб. Если PDF-файл большой, то сервис обработает только первые 10 страниц.

4. Необходим доступ к интернету.

5. Не распознает DJVU.

6. OCR-алгоритм на этапе разработки и тестирования, поэтому Ulead VideoStudio 11 Plus скачать бесплатно распознает текст не очень хорошо. Пока в первую очередь предназначен для работы с латиницей. Тексты на кириллице распознает тоже, но допускает много ошибок.

7. Если текст непонятный, то просто оставит его как картинку.

Как использовать?

8. Создайте аккаунт Google, то есть зарегистрируйтесь на Gmail.

9. Зайдите в браузер, а там на Google Drive.

10. В «облаке» нажимайте на кнопку «Настройки» (справа сверху), пункт «Настройки загрузки», выбирайте «Извлечь текст из загруженных изображений и PDF» (название может выглядеть немного иначе).


Что лучше распознает PDF ?


11. Загрузите нужную картинку/PDF-файл. Начнется загрузка и конвертация. Когда процесс закончится, можете открыть файл в «облаке» и посмотреть, что получилось.

Что лучше распознает PDF ?



Что лучше распознает?

ABBYY Fine Reader и MS Office 2013 извлекают текст из PDF в одинаково хорошем качестве. По собственному опыту могу сказать, что MS Office лучше распознает формулы, а Fine Reader – таблицы. Хотите, поэкспериментируйте сами. Google Drive пока в хвосте – во-первых, слишком много ограничений; во-вторых, много не распознает.

Для примера рассмотрим один и тот же файл, переведенный в текст разными способами: Fine Reader, MS Office 2013 и ДискGoogle. Первые три файла – результат перевода текста и формул, следующие три – таблицы.


Что лучше распознает PDF ?


Что лучше распознает PDF ?



Что лучше распознает PDF ?

С текстом хорошо справились MS Office и Fine Reader. Google Drive – тоже неплохо. А вот формулы лучше всего отобразил MS Office – видимо, большой набор распознаваемых символов.

Что лучше распознает PDF ?


Что лучше распознает PDF ?


Что лучше распознает PDF ?


Таблицы лучше всех отобразил продукт ABBYY. В случае с MS Office 2013 некоторые таблицы съехали. Но, по крайней мере, они есть – их просто нужно подтянуть вручную. Google Drive таблиц не увидел вообще - только текст.

Итоги

Лучшие системы оптического распознавания текста – ABBYY Fine Reader и MS Office 2013. Каждый имеет свои сильные и слабые стороны. ABBYY переводит разные форматы: PDF, DJVU, PNG, GIF, JPG. MS Office 2013 зато шустрее и проще.

Нельзя сказать, что Google Диск совсем уж плох. Он, во-первых, новенький (только тестируется), во-вторых – предназначен для других целей, как и указано на официальном сайте. OCR от Google в первую очередь служит для распознавания небольших только-что сделанных фотографий текста. Удобный для моментальной обработки на мобильных устройствах – планшетах и смартфонах.

Похожее:
  • 3ds Max. Эффективная визуализация травы при помощи VRayProxy

    3ds Max. Эффективная визуализация травы при помощи VRayProxy

    Подробный урок по созданию травы в пакете трехмерной графики 3ds Max. Используются только стандартные средства самого пакета и визуализатора VRay....
  • Зонирование помещений в программе Архикад

    Зонирование помещений в программе Архикад

    Данный урок посвящён сразу нескольким темам: применение зон для определения S помещений, их объёмов, вывод в таблицу данных при помощи интерактивных каталогов....
  • Начало работы в 3ds Max

    Начало работы в 3ds Max

    Сегодня поговорим о самых необходимых предметах дизайнера. Красивый вид окна необходим, а вот настройка параметров полезна и облегчает работу. Речь пойдёт о настройках 3ds Max....
Добавить комментарий:
Имя:*
E-Mail:
Комментарий:
Полужирный Наклонный текст Подчеркнутый текст Зачеркнутый текст | Выравнивание по левому краю По центру Выравнивание по правому краю | Вставка смайликов Вставка ссылкиВставка защищенной ссылки Выбор цвета | Скрытый текст Вставка цитаты Преобразовать выбранный текст из транслитерации в кириллицу Вставка спойлера
Вопрос:
пять минус три
Ответ:*
Введите код: *
Новинки

Что представляет из себя зазеркалье AutoCAD

Что такое система AutoCAD? Это целый мир, если...

Что лучше распознает PDF ?

Какой из способов распознавания текст из...

Создание трехмерной проекции в AutoCAD

Строить двухмерную проекцию, несомненно,...

Методика 3D проектирования

В настоящее время о трехмерном проектировании...
Комментарии
Microsoft Office 2013 Professional Plus SP1 - RUS
 
Написал: Tamara
 
Для меня офис 2013 года самый удобный на данный момент, я к нему уже привыкла, пусть сейчас есть уже...
PRO100 5.20 с пакетом библиотек
 
Написал: Дмитрий
 
Я тоже перед тем как начать ремонт в своей квартире предварительно в программе про100 спланировал и ...
КОМПАС 3D версия 16
 
Написал: Семен
 
С начало не сразу разобрался в программе, столько функций, кнопок, подразделений, но сейчас уже комп...
ArchiCAD 20
 
Написал: Svetlana
 
Устанавливала архикад на виндовс восемь и на видновс десять, везде работает без нареканий, можно пол...
Autodesk AutoCAD 2017
 
Написал: никита
 
Новая версия порадовала, быстро установил и работает без накладок, наличие русскоязычного интерфейса...