Тема : Робота з програмами abbyy fineReader та Pragma




Скачати 128.62 Kb.
НазваТема : Робота з програмами abbyy fineReader та Pragma
Дата конвертації23.06.2013
Розмір128.62 Kb.
ТипДокументы
mir.zavantag.com > География > Документы
Практична робота №12
Тема: Робота з програмами ABBYY FineReader та Pragma.

Мета: Навчитися обробляти відскановані зображення та виконувати переклад тексту.
Технічне забезпечення: персональний комп’ютер

Програмне забезпечення: ОС Windows, операційна система Windows, ABBYY FineReader7.0 Pragma5.x.

Загальні теоретичні відомості


Основні елементи вікна програми FineReader

Програма FineReader 7.0 призначена для роботи в операційній системі Windows і підтримує всі вимоги, що пред'являються до дотатків Windows. Завдяки цьому при першому погляді на вікно програми FineReader стає, за великим рахунком, ясно, як слід з нею працювати. Запуск програми здійснюється через Головне меню, в якому після установки програми з'являються відповідні пункти.

^ Робоча зона вікна

Р
обоча зона вікна програми FineReader розбита на декілька окремих областей. По лівому краю розташовується вертикальна панель Пакет Ця панель містить список всіх графічних зображень, що вимагають перетворення в текст. Передбачається, що все це сторінки одного і того ж документа, які після розпізнавання мають бути об'єднані в єдиний: текстовий файл. Вигляд використовуваного значка показує, чи було вже проведений розпізнавання цієї сторінки або ще ні.

У нижній частині робочої області розташовується панель, що показує фрагмент відсканованого зображення в збільшеному вигляді. Ця панель допомагає побачити реальні знаки на зображенні і зрозуміти, чи правильно було проведено розпізнавання. Ця панель використовується також в ході «навчання» програми.

Остання частина робочої області відводиться для розміщення вікон документів Кожна графічна сторінка може відображуватися в цій області в двох видах: як вихідне зображення і в текстовому вигляді після розпізнавання. Вікна мають відповідні назви — Зображення або Текст.

^ Панелі інструментів

У верхній частині вікна програми FineReader розташовуються рядок меню і панелі інструментів. Панелі інструментів можуть включатися або відключатися через меню Вигляд.

^ Панель Стандартна

Панель інструментів Стандартна містить кнопки для відкриття і створення документів, а також для стандартних операцій з буфером обміну. Останні кнопки цієї панелі дозволяють перемикатися між сторінками одного пакету, а також змінювати невдале або помилкове представлення документа. Також ця панель містить списки, що розкриваються, які дозволяють вибрати мову документа (або вказати, що перед нами змішаний двомовний документ).

^ Панель Scan&Read

Найбільш важливою серед панелей інструментів є Scan&Read. Кнопки панелі Scan&Read відповідають основним операціям, що виконуються в ході сканування і розпізнавання тексту. Всі кнопки мають розкриваючі стрілки, що дозволяють провести налаштування відповідної операції або вибрати спосіб її проведення. Детальніше ми поговоримо про ці операції дещо пізніше, а зараз відзначимо лише, що першою кнопкою цієї панелі запускається майстер, який дозволяє виконати відразу всі необхідні операції по скануванню і розпізнаванню документа.

^ Панель Інструменти

Панель Інструменти використовується лише на певному етапі розпізнавання а саме при управлінні сегментацією документа. У тих випадках коли послідовність фрагментів тексту на сторінці нестандартна або неочевидна панель інструментів дозволяє вказати, які саме фрагменти сторінки слід включити в підсумковий документ, і задати їх порядок.

^ Панель Форматування

Нарешті панель Форматування дуже нагадує таку ж панель в різних текстових процесорах і служить для тієї ж мети: дозволяє змінювати оформлення тексту отриманого в ході розпізнавання текстового документа.

^ 13.5. Порядок операцій в програмі FineReader

Програма FineReader бере на себе всю роботу, починаючи з паперового орипгинала і закінчуючи готовим (і навіть відформатованим) електронним текстовим документом. Для зручності користувача ця робота представляється як послідовність з п'яти етапів, кожен з яких може мати різну тривалість і різну міру автоматизації:

  • сканування документа;

  • сегментація документа;

  • розпізнавання документа;

  • перевірка орфографії;

  • збереження документа.

Сканування документа

Перший етап — це, як неважко здогадатися, власне сканування документа. Це чисто технічна операція, яку, як ми вже говорили, виконує спеціальний пристрій — сканер. Завдання програми FineReader полягає в тому, аби прийняти відскановане зображення (або зображення) і зберегти їх у вигляді, зручному для подальшої обробки.

Для проведенні сканування за допомогою програми FineReader треба включити сканер і запустити цю програму. Сканування проводиться по клацанню на кнопці Сканувати на панелі інструментів Scan&Read. Для цього можна також скористатися клавіатурною комбінацією CTRL+K.

Програма FineReader здатна або використовувати драйвер TWAIN, або взаємодіяти із сканером безпосередньо. Як правило, використовувати протокол TWAIN не має сенсу, оскільки це додає зайву проміжну операцію. Його використовують лише при необхідності точного налаштування (і перевірки параметрів сканування), при скануванні сторінок одного документа, що мають якість друку, що сильно розрізняється, а також в тих випадках, коли сканер не підтримується програмою безпосередньо.

Драйвер TWAIN слід також використовувати, якщо ви хочете зберегти в електронній формі і кольорові ілюстрації. Пряме управління скануванням в програмі FineReader завжди проводить лише чорно-біле сканування, яке дозволяє отримати текст документа і відбувається набагато швидше.

Аби вказати використовуваний драйвер, а також змінити деякі інші налаштування, слід виконати Сервис/Опции і вдіалоговому вікні Опції вибрати драйвер і виконати інші налагодження програми.

Само сканування проводиться в автоматичному режимі і вимагає лише технічного втручання користувача, наприклад перегортання сторінок сканованого документа. Всі дії користувача в рамках програми FineReader в цей час заблоковані спеціальним діалоговим вікном, що повідомляє про те, що в даний час йде процес сканування.

^ Сегментація документа

Другий необхідний етап обробки документа — це сегментація сторінки. На початоку цього етапу на екрані є вікно Зображення, що містить зображення розпізнаваної сторінки. В принципі, це зображення може бути отримане не лише шляхом сканування, але i будь-яким іншим способом, наприклад шляхом «перехоплення» зображення на екрані.

Дуже часто сторінка документа, наприклад книги, може містити фрагменти тексту, що йдуть не в природному порядку. Під природним порядком розуміються рядки, що починаються від лівого поля і йдуть до правого. Самі рядки читаються зверху вниз. Якщо текст оформлений в декілька колонок, містить ілюстрації, можливо забезпечені підписами, окремі врізання в рамках і табличні дані, дотримання «природного порядку» може так заплутати справу, що отриманий електронний документ виявиться абсолютно даремний.

Тому на етапі сегментації текст сторінки розбивається на блоки — фрагменти тексту, кожен з яких може розпізнаватися в природному порядку. Створювані блоки нумеруються і текст, що міститься в блоках включається в документ в порядку нумерації. Блоки накладаються на зображення сторінки документа у вигляді кольорових прямокутників, у верхньому лівому кутку яких розташовується порядковий номер. Новий блок створюється протягуванням миші по діагоналі створюваного прямокутника. В ході протягування блок виділяється пунктирною рамкою, яка у момент створення блоку перетворюється на суцільну зелену лінію, що характеризує блок текстом.

Серед наявних блоків один завжди є поточним. Поточний блок обводиться жирнішою лінією, а його вершини помічаються маркерами зміни розмірів. Перетягання цих маркерів дозволяє змінити розмір або положення блоку.

Для додавання області до блоку або видалення частини блоку, для переміщення блоку або перенумерации блоків, для додавання або видалення кордонів вічок в блоках-таблицях використовуються кнопки панелі Інструменти.

Програма FineReader підтримує декілька типів блоків, які обробляються по-різному. Аби змінити тип блоку, слідує клацнути в межах блоку правою кнопкою миші і вибрати відповідний пункт підміню Тип блоку в контекстному меню.

^ Розпізнавання тексту

Власне розпізнавання тексту є автоматичним процесом, що не вимагає і не допускає втручання користувача. Це основний етап роботи програми, заради якого, власне кажучи, вона і створювалася.Запустити розпізнавання тексту можна клацанням на кнопці Розпізнати відкриту сторінку на панелі інструментів Scan&Read. Під час виконання розпізнавання на екран видається діалогове вікно Розпізнавання, основне призначення якого — надати можливість переривання роботи.

Рядки, у міру їх обробки, забарвлюються в блакитний колір. Якщо розпізнавання йде успішно, то жодній додатковій інформації на екрані не з'явиться до закінчення розпізнавання. Розпізнаний текст буде поміщений у вікно Текст. Інакше діалогове вікно Розпізнавання буде розширено і в нім з'являться поради, що пояснюють причини, які можуть заважати успішному розпізнаванню тексту.

Якщо труднощі пояснюються невірними налаштуваннями, наприклад помилково вказаною мовою документа, то слід перервати процес розпізнавання, змінити налаштування належним чином і повторити розпізнавання. Інколи необхідно повернутися до етапу сканування і повторити його при більш відповідних налаштуваннях сканера.

Проте буває і так, що ненадійне розпізнавання викликане особливостями використаного шрифту або іншими причинами, дію яких неможливо усунути простою зміною налаштувань. У такій ситуації програма FineReader може регулярно допускати однотипні помилки, наприклад, завжди невірно розпізнавати певний символ.

^ Завершальні операції

Останні два етапи операції є завершальними. Питання про їх необхідність і спосіб виконання вирішує сам користувач. Після того, як процес розпізнавання завершився, потрібно оцінити якість отриманого документа (і, можливо, виправити помилки розпізнавання) і зберегти його.

^ Перевірка і редагування документа

Користувач має можливість редагування отриманого документа засобами, що нагадують редактор WordPad або навіть Word. Крім того, є можливість автоматичної перевірки орфографії, що враховує особливості розпізнавання. Для цієї мети необхідно клацнути на кнопці Перевірити на панелі інструментів Scan&Read.

В ході перевірки орфографії виділяються не лише слова, відсутні в словнику, але і ті, в яких є ненадійно розпізнані символи. Завдяки цьому процес перевірки орфографії дозволяє виявити як друкарські помилки вихідного документа і помилки редагування, так і дефекти розпізнавання навіть в тому випадку, якщо в результаті підміни одного-двох символів все одно вийшло «грамотне» слово.

^ Збереження документа

Готовий текст необхідно зберегти. Програма FineReader надає декілька можливостей збереження або використання отриманого тексту. Кнопка з цифрою 4 на панелі інструментів Scan&Read має різний вигляд, залежно від того, який останній варіант збереження використовувався. В цьому випадку повторне клацання на цій кнопці запускає той же самий спосіб збереження.

Для того, щоб побачити всі пропоновані варіанти збереження, слід клацнути на розкриваючій кнопці і ознайомитися з меню, що відкрилося. Як завжди в системі Windows, пункт, відповідний заданому за умовчанням способу збереження, виділяється напівжирним шрифтом.

Найбільш стандартному варіанту збереження відповідає команда Зберегти у файл. В цьому випадку відкривається стандартне діалогове вікно Збереження, в якому можна вказати типа документа, що зберігається, а також те, які з розпізнаних сторінок слід зберегти.

Список, що розкривається, визначає тип документа, містить в цьому діалоговому вікні множина варіантів. Наприклад, підтримується декілька варантів збереження форматування тексту (файли .DOC, .RTF), можливість використання формату HTML, збереження неформатованого тексту, а також різні способи збереження документа у вигляді таблиці або бази даних (.XLS, .DBF, .CSV і так далі).

Текст можна також не зберігати у файл, а передавати в іншу програму для подальшої обробки. Універсальним прийомом в даному випадку є використання буфера обміну. Проте для додатків, що відносяться до пакету Microsoft Office (або що дотримують стандарти Microsoft Office), можлива так само: пряма передача даних в потрібну програму. Зокрема, можлива пряма передача даних в програми Word і Excel. Пункти, що відповідають іншим додаткам, можуть з’являтись в цьому меню після установки цих додатків.
^

Переклад тексту


Клацання мишки по значку Pragma активізує переклад тексту активного додатка. Це може бути документ, Веб-сторінка, повідомлення електронної пошти або будь-яка інша текстова інформація.

Переклад в активному додатку працює в MS Word, Internet Explorer, Outlook, Outlook Express, WordPad, Блокнот (Notepad) і деяких інших.

Якщо переклад неможливий у вибраному додатку, буде видано відповідне повідомлення. В цьому випадку можна буде спробувати перевести в режимі Швидкого перекладу.

Переклад здійснюється для виділеного фрагмента тексту. Якщо виділення немає, то переводитися весь документ від початку до кінця.
^

Вибір напряму перекладу


Процес перекладу в додатку починається з визначення напряму перекладу (з якої мови на яку).

У цьому вікні можна задати тематику тексту, його мову і мову на яку необхідно перевести. Перемикання здійснюється клацанням мишки. При наведенні покажчика мишки на елемент діалогового вікна з'являється підказка.

Якщо немає необхідності змінювати кожного разу напрям перекладу, то це вікно можна "заховати" відзначивши відповідне поле галочкою.

ЗАУВАЖЕННЯ! Якщо вікно напряму перекладу заховане і виникає необхідність знову включити його, для цього необхідно замість одинарного клацання мишки по значку Pragma виконати подвійне клацання.
^

Вибір режиму перекладу


Режим перекладу - це задання вікна в якому відбуватиметься переклад, а також спосібу збереження тексту, що перекладається. Як і у вікні вибору напряму перекладу, всі перемикання тут виконуються клацанням мишки.

Є два варіанти перекладу:

  • ^ Переклад в тому ж вікні. Кожен параграф вихідного тексту переводиться і замінюється по місцю. Вихідний документ замінюється на його переклад. При повторному запуску перекладеного документа на переклад відбувається відновлення вихідного документа.

  • ^ Переклад в іншому вікні. Копія тексту переноситься в інше вікно (якщо вікно відсутнє, то воно створюється) і виконується його переклад. Вихідний документ залишається незмінним.

Для варіанту перекладу в іншому вікні можливі дві модифікації:

  • ^ Додати в кінець. Якщо в іншому вікні вже існує текст (повторний переклад), то додавання проводиться в кінець документа.

  • Додати із заміною. Якщо в іншому вікні вже існує текст, то перед додаванням вікно очищається.

Відмітьте, при перекладі в одному вікні можлива лише заміна вихідного тексту.
ЗАУВАЖЕННЯ. При перекладі в MS Word в іншому вікні можлива деяка втрата точності форматування перекладеного документа. При перекладі в тому ж вікні формат перекладеного документа максимально відповідає початковому.
^

Процес перекладу


Процес перекладу динамічно відображується в робочому вікні додатка, а також в діалоговому вікні прогресу. При необхідності процес перекладу може бути перерваний натисненням клавіші Esc або клацанням мишки по червоній кнопці у вікні.

Швидкий переклад працює лише при відкритому вікні швидкого перекладу.

Вікно мінімізоване по розмірах і містить лише перемикач функцій, робочу область і рядок стану. Воно завжди розташовується поверх всіх вікон для того, щоб результат перекладу був видний.

^ Перемикач функцій.

  • Переклад. Якщо кнопка втоплена, переклад починається автоматично при збереженні тексту в буфері обміну. Інакше, у вікні відображується вміст буфера обміну.

  • Копіювати. При втопленій кнопці перекладений текст відразу ж зберігається в буфері обміну на місці вихідного тексту.

  • У рядку. Переклад невеликих фраз і слів, які можуть бути введені уручну в рядку.

  • Закрити. Швидкий переклад припиняється при закритті вікна або його мінімізації.

^ Робоча область.

У робочій області відображується вміст буфера обміну або результат перекладу. Це вікно використовується лише для перегляду без можливості редагування тексту. При необхідності набору і перекладу тексту можна використовувати кнопку "В рядку".

^ Рядок стану.

Окрім коментаря в рядку стану відображується напрям перекладу (з мови - на мову) і тематика тексту. Цей рядок не лише відображує інформацію, але дозволяє також поміняти її через меню.

Відповідне випадаюче меню з'являється при клацанні мишки по необхідному полю рядка стану.

При запуску Швидкого перекладу мова тексту визначається автоматично.

Функція швидкого перекладу добре працює при перекладі невеликих фрагментів тексту. Найбільш зручний наступний алгоритм роботи:

  1. Запустити Швидкий переклад

  2. Кнопки Переклад і Копіювати мають бути втоплені

  3. У робочому вікні виділити параграф (деякі редактори виділяють параграф по подвійному кліку мишки)

  4. Помістити виділенний фрагмент в буфер натисненням комбінації клавіш Ctrl + C

  5. У вікні Швидкого перекладу з'явиться перекладений текст

  6. Вставити перекладений текст на місце виділеного початкового - клавіші Ctrl + V

  7. Перевірити і відкоректувати перекладений текст

  8. Повторюйте пункти 3 - 7 для подальших фрагментів тексту.
^

Порядок виконання роботи


  1. Вивчити загальні принципи роботи з програмами розпізнавання та перекладу тексту.

  2. Завантажити програму FineReader 7.0.

  3. Відкрити пакет відсканованого зображення.

  4. Виконати сегиентацію та розпізнавання документа.

  5. Передати результати рзпізнавання в MS Word.

  6. За допомогою програми Pragma5.х виконати переклад тексту.

  7. Відркдагувати прекладений текст і зберігти його в фал.

Контрольні питання:

        1. З яких основних пристроїв складається сканер?

        2. Які типи сканерів Вам відомі?

        3. З яких етапів складається робота в програмі FineReader 7.0?

        4. В яких випадках використовується функція Швидкого перекладу програми Pragma5.х і за яким алгоритмом зручно ним користуватись?

Схожі:

Тема : Робота з програмами abbyy fineReader та Pragma iconТема : Використання службових програм для оптимізації роботи системи
Мета: Навчитися користуватися службовими програмами Scandisk, Defrag та сервісними програмами DrWeb, WinZip. Отримати навички форматування...
Тема : Робота з програмами abbyy fineReader та Pragma iconГлаза Сфинкса abbyy fineReader 11 «фон Деникен Эрих. Глаза Сфинкса»:...
Да, жили — утверждает Деникен в своей захватывающей книге. Какой корифей генной инженерии придумал их и создал? Остроумно соединяя...
Тема : Робота з програмами abbyy fineReader та Pragma iconТема : Робота в мережі
Тема: Робота в мережі Internet. Робота з поштовим клієнтом. Реєстрація в службі обміну миттєвими повідомленням. Реєстрація на форумі...
Тема : Робота з програмами abbyy fineReader та Pragma iconТема : Робота в мережі
Тема: Робота в мережі Internet. Робота з поштовим клієнтом. Реєстрація в службі обміну миттєвими повідомленням. Реєстрація на форумі...
Тема : Робота з програмами abbyy fineReader та Pragma iconМетодичні рекомендації до практичних занять з гігієни та екології для студентів
Л. П. Козак (теми 15, 16), ас. Н. В. Москвяк (теми 2,14 – практичні роботи, тема 6 – самостійна робота), ас. Я. М. Ямка (теми 4,...
Тема : Робота з програмами abbyy fineReader та Pragma iconМетодичні рекомендації до самостійної роботи з гігієни
Л. П. Козак (теми 15, 16), ас. Н. В. Москвяк (теми 2,14 – практичні роботи, тема 6 – самостійна робота), ас. Я. М. Ямка (теми 4,...
Тема : Робота з програмами abbyy fineReader та Pragma iconТема : Робота в середовищі розробки програм
Тема: Робота в середовищі розробки програм. Створення програм з використанням базових алгоритмічних структур: слідування, розгалуження,...
Тема : Робота з програмами abbyy fineReader та Pragma iconДипломна робота тема

Тема : Робота з програмами abbyy fineReader та Pragma iconРозклад консультацій у 2013 роц І для вступу на навчання за освітньо-професійними...

Тема : Робота з програмами abbyy fineReader та Pragma iconКнига написана в 1942-43 гг. Перевод И. Череватой по изданию: Lewis C. S
Клайв Стейплз. Любовь. Страдание. Надежда: Притчи. Трактаты: Пер с англ. М.: Республика, 1992. 432 с. Isbn 5--250--01733--9 При наборе...
Додайте кнопку на своєму сайті:
Школьные материалы


База даних захищена авторським правом © 2013
звернутися до адміністрації
mir.zavantag.com
Головна сторінка