Diplomguide.ru
Пошаговое руководство для дипломников
дипломы,курсовые,рефераты,контрольные,диссертации,отчеты на заказ
Диплом на заказ

Лень писать диплом? Тогда закажи его на zaochnik.com. Это одно из лучших агенств, рекомендую...

Понравился сайт?



Если Вы выбрали быстрый путь написания теоретической главы, о котором мы говорили в параграфе 2.1., вероятней всего Вам не обойтись без сканирования документов. В ином случае, этот пункт можете пропустить и начинать конспектировать материалы найденные в библиотеке.

Перед началом сканирования нужно определиться, что именно Вы хотите использовать при написании работы. А для этого нужно сначала просмотреть имеющуюся литературу и выделить карандашом нужные моменты.

Когда я впервые сканировал статью из журнала для своей первой курсовой, для меня это занятие было невообразимо сложным. В результате нескольких часов работы со сканером и FineReader’ом у меня на выходе вышла бредятина, не поддающаяся редактированию. В итоге пришлось все набирать руками. Чтобы у Вас не случилось подобного, рассмотрим подробнее все технические моменты сканирования.

Для сканирования нам, конечно же, потребуется сканер. Его не обязательно покупать. Можно, например, на время взять на время у товарища. Я пользуюсь сканером CanoScan Lide 60.  Это хоть и не самая новая модель, но мне очень нравится этот компактный, быстрый и удобный в работе “девайс”. Если Вы взяли на время сканер, для того чтобы он работал нужно сначала установить программу-драйвер. Драйвера и руководство по установке всегда можно найти на установочном диске, который прилагается к устройству или скачать на сайте у производителя. После установки драйвера, подключите сканнер к компьютеру с помощью соединительного шнура. Теперь можно уже непосредственно приступить к сканированию.

Но сначала немного теории. Вы должны знать, что процесс сканирования состоит из двух этапов:

1. Непосредственно сканирование документа. На этом этапе сканнер как бы фотографирует поверхность сканируемого документа и сохраняет полученное изображение на компьютер в виде обычного файла .jpg .gif или в другом формате;

2. Распознавание документа. Это процесс преобразования текста из изображения сделанного сканером в обычный тест, который потом можно сохранить в Word и редактировать. Распознавание осуществляется без участия сканера, с помощью специальной программы (самая популярная Adobe FineReader). Таким образом, Вы можете сначала отсканировать несколько листов текста и сохранить их в виде изображения и только потом преобразовывать в текст.

Итак, начнем этап первый - сканирование:

- запускаем драйвер сканера: Пуск - Все программы - Canon - ScanGear (название драйвера я указываю для своего сканера). Появится окно драйвера:

Canon - ScanGear

- открываем крышку сканера и кладем книгу, журнал или их копию текстом вниз, как можно ровнее по отношению к краям рабочей поверхности сканера:

Положить книгу в сканер

Здесь очень важно сделать так, чтобы крышка сканера как можно плотнее прижимала сканируемый документ, не допуская попадания внешнего освещения не рабочую поверхность сканера, которая соприкасается с документом;

- выполним необходимые установки в драйвере сканнера. Первым делом нужно установить разрешение, в котором будет отсканирован документ. Разрешение - это показатель, который определяет уровень детализации объекта при сканировании и определяется в точках на дюйм (dpi, или т/д). Чем больше разрешение, тем качественнее получается изображение. Но, при сканировании текстовых документов нет смысла устанавливать максимальное разрешение, поскольку толку от этого будет ноль. Кроме того, сканирование с большим разрешением занимает больше времени. Я рекомендую устанавливать разрешение в пределах 400-500 т/д (dpi). При такой настройке изображения получаются достаточно качественными для хорошего их распознания, а сам процесс сканирования не занимает много времени. Предлагаю посмотреть на скриншот установок моего принтера:

Параметры сканирования

Для начала нужно перейти в "Расширенный режим". Источником всегда будет "Планшет" (планшетный сканер). Цветной режим лучше установить "Черно-белый", ведь для сканирования текста нам цвета не нужны, а это уменьшит размер изображений на выходе. Разрешение, как я уже сказал, следует установить 400 т/д. Выходной размер изображения - обязательно "А4". Теперь можно смело жать на кнопку "Сканировать". Мой сканер устроен таким образом, что сначала запоминает отсканированные изображения во внутренней памяти, и только при закрытии окна драйвера предлагает сохранить их на компьютер. Мне остается только указать место, куда будут сохранены результаты работы.

У вас должны получаться файлы такого типа:

Отсканированный документ

При увеличении такого изображения должен быть отчетливо виден текст.

Второй этап - распознание полученных изображений и их преобразование в текст. Как я уже говорил, для этого понадобится специальная программа - FineReader. Скачайте программу по этой ссылке (32Мб). Пароль к архиву с программой - "diplomguide.ru". Предложенная мной версия не требует установки (portable). В папке с программой будет множество разных файлов, но Вам нужен только один - FineReader.exe. Двойной клик на этом файле запустит программу на Вашем компьютере. Окно FineReader имеет следующий вид:

Окно FineReader

После установки языка, на котором напечатаны отсканированные Вами ранее документы, можно начинать распознание. Если в тексте присутствует сразу два языка (например, русский и английский) установку сделайте соответственно.

Чтобы начать распознание нажмите на стрелку справа от первой кнопки Сканировать - а затем - Открыть изображение:

Открыть изображение в файнридере

Откроется окно выбора изображений. Откройте папку в которую Вы сохранили отсканированные изображения, нажмите CTRL + A (английское) на клавиатуре и нажмите на кнопку Открыть.

Выбор картинки для распознавания

После этого слева в окне FineReader'а появятся эскизы добавленных файлов, по центру - на данный момент выделенный эскиз в увеличенном виде, снизу - еще большее увеличение, а справа результат распознания:

Результат распознания

Для примера я взял всего два изображения. На скриншоте выше выделено первое из них, его сейчас и распознаем. Как видите, изображение отсканировано вертикально, чтобы распознать текст снимок нужно сначала развернуть на 90 градусов. Для этого воспользуемся кнопками развернуть на 90 градусов и развернуть на 90 градусов. Следующим шагом нужно указать программе, какую именно часть изображения нужно распознать, а также задать тип данных, которые должны получиться на выходе текст, таблица или изображение. Для этого существуют кнопки, соответственно: Текст Таблица Изображение. Например, если нужно отметить текстовый блок, нажимаем левой кнопкой на Распознать как текст, после этого нажимаем левой кнопкой мышки в левом верхнем углу текстового блока и, удерживая левую кнопку, перетягиваем в правый нижний угол. Для примера я полностью подготовил к распознанию одно изображение:

Разметка в файнридере

Как видите, все текстовые блоки в примере выше выделены зеленым, а рисунки - красным. Таблицы подготавливаются к распознанию аналогично. Для этого предназначена кнопка Распознать как таблицу. Для того, чтобы перейти к следующему снимку, кликните левой кнопкой мыши на его эскизе слева. Таким образом подготавливаются к распознанию все полученные в результате сканирования изображения. После того, как подготовка изображений завершена, следует выделить их все. Для этого кликните левой кнопкой в пустом месте на панели эскизов (она называется Пакет) и нажмите Ctrl+A (английское) на клавиатуре. Далее кликните на кнопку Распознать и подождите пока FineReader преобразует изображения в текст. После этого можно сохранять полученный текст в Word с помощью кнопки Сохранить, после нажатия на которую откроется окно Мастер сохранения результатов. В нем необходимо выбрать формат для сохранения - Microsoft Word, а также поставить отметку чтобы сохранились все страницы:

Мастер сохранения результатов

После нажатия кнопки ОК программа создаст документ Word и вставит в него текст из распознанных страниц в том порядке, в котором они находятся на панели эскизов (Пакет). Полученный документ сразу же сохраните в папку в файловой структуре дипломной работы и можете приступать к редактированию. Как это делается, описано в моем бесплатном курсе.

И последний момент. Эсли Вы сканировали газету или журнал, текст там часто дается в виде колонок (как в рассматриваемом примере выше). Эти колонки в Ворде нужно преобразовать в одну. Выделите текст в виде колонок и выполните команду: Формат - Колонки - Одна - ОК. Только после этого можно ставить Книжную ориентацию в Параметрах страницы, отступы полей, шрифт и т.д.