695.46K

Програмний модуль розпізнавання тексту з растрових зображень

1.

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
НАЦІОНАЛЬНИЙ АВІАЦІЙНИЙ УНІВЕРСИТЕТ
Навчально-науковий інститут Комп’ютерних інформаційних
технологій
Кафедра Комп’ютеризованих систем управління
Дипломний проект
Тема: «Програмний модуль розпізнавання тексту з
растрових зображень»
Виконавець: Назаренко О.І.
Керівник: Нечипорук О.П.

2.

Актуальність
Методи розпізнавання
тексту
Переваги
Недоліки
Шаблонні методи
Достатньо висока точність
розпізнавання дефектних
символів (склеєних або
розірваних)
Неможливість розпізнати
шрифт, який хоч трохи
відрізняється від
закладеного в систему
Структурні, або топологічні,
методи
Висока точність(≈95% ) та
швидкодія (1000 образів/с)
Ідентифікація знаків, що
мають дефекти
Ознакові методи
Простота реалізації, хороша
узагальнююча здатність,
стійкість до зміни форми
символів, низька кількість
відмов, висока швидкодія
Нестійкість до дефектів
зображення, на етапі
вилучення ознак
відбувається безповоротна
втрата частини інформації
про символ
Методи на основі нейронної
мережі
Стійкість до шумів вхідних
даних, адаптація до змін,
відмовостійкість, висока
швидкодія
Дають приблизну відповідь
2

3.

Актуальність
3

4.

1. Об’єкт проектування
– розпізнавання
тексту з растрових зображень.
2. Предмет проектування – програмний
модуль розпізнавання тексту з растрових
зображень.
3. Мета дипломного проекту – розробити
програмний модуль розпізнавання тексту з
растрових зображень для розпізнавання
спеціальних математичних символів та
перенесення результатів розпізнавання до
текстового редактору Microsoft Office Word.
4

5.

Завдання проектування
1. Проаналізувати сучасні програмні рішення
розпізнавання тексту з растрових зображень.
2. Проаналізувати методи розпізнавання тексту
з растрових зображень.
3. Розробити структуру програмного модуля
розпізнавання тексту з растрових зображень.
4. Реалізувати
алгоритм
розпізнавання
спеціальних текстових символів на основі
нейронної мережі.
5. Реалізувати алгоритм передачі спеціальних
текстових символів в MS Office Word.
6. Проаналізувати роботу програмного модуля.
5

6.

Структура програмного модуля
Інтерфейс
Блок
збереження
вхідних
даних
Блок
виведення
рішень в MS
Office Word
Блок
навчання
Блок
розпізнавання
символу
6

7.

Схема алгоритму роботи модуля
Початок
Введення
символу
1
Режим
навчання
ввІмкнено
0
1
Провести
навчання
Символ
введено
коректно
0
Очистити поле
вводу
Розпізнати
символ
1
Запис у
файл
Розпізнано
вірно
0
Записати в
пам’ять
1
Введення
формули
завершено
0
Вивести в
Word
Кінець
7

8.

Структура нейронної мережі
8

9.

Процедура навчання нейронної мережі
Введення образу
Розпізнавання образу
[навчити існуючому символу]
Обрати символ зі списку
[навчити новому символу]
Введення імені символу
Запис імені символу в пам'ять
Запис образу в пам'ять символа
9

10.

Алгоритм виведення результатів
Початок
formula[]
Нульовий символ з
масиву Formula
знаходиться в масиві
nary_symbols
0
1
Символ n-aрної операції
дорівнює елементу масиву
nary_codes з індексом символу
в масиві nary_symbols
Символ n-aрної операції
дорівнює інтегралу
i = 1..formula.Lenght
0
Символ
знаходиться в
масиві letters
1
Записати в form_exit
елемент масиву letter_codes
З індексом символу в масиві
letters
Записати символ в
form_exit
Вивести в
Word
Кінець
10

11.

Приклад роботи
програмного модуля
11

12.

Приклад роботи
програмного модуля
12

13.

Таблиця результатів
роботи модуля
Відсоток розпізнавання символу
Група символів
Програмний
модуль
РТРЗ
Символи грецького
ABBYY
FineReader
OmniPage
85,6
90,1
89,1
Символи латиниці
84,4
93,9
97,2
Арифметичні операції
89,9
98,9
94,5
Цифри
85,3
98,9
98,2
95,1
35,8
33,4
88,67
83,52
82,48
алфавіту
Спеціальні математичні
символи
Середнє значення
13

14.

Висновки
1. Проаналізовано сучасні програмні рішення
розпізнавання тексту з растрових зображень та
методи розпізнавання тексту з растрових
зображень
і
обрано
технологію
з
використанням нейронної мережі.
2. Розроблено структуру програмного модуля
розпізнавання тексту з растрових зображень,
яка містить блок розпізнавання на основі
нейронної мережі.
14

15.

Висновки
3. Реалізовано
алгоритм
розпізнавання
спеціальних текстових символів на основі
нейронної мережі, що дозволило розпізнавати
спеціальні математичні символи.
4. Реалізовано алгоритм передачі спеціальних
текстових символів в MS Office Word, що
дозволило коректно відображати спеціальні
математичні символи в MS Office Word.
15

16.

Висновки
5. Проаналізовано роботу програмного модуля.
Середній відсоток розпізнавання символів
незалежно від групи становить 88,67%,
порівняно з аналогами на ринку OCR систем
є в середньому на 5,67 % вищим показником
6. Практична
значимість
результатів
проектування полягає в розпізнаванні
рукописного тексту та оцифрування даних,
що розміщені на паперових носіях, зокрема
математичних формул.
16

17.

Дякую за увагу
English     Русский Правила