Вдоконалення методу бінаризації кольорових зображень тексту з використанням класифікатора за мінімумом відстані

Main Article Content

Marina V. Polyakova
Alexandr G. Nesteryuk

Анотація

Системи оптичного розпізнавання символів на зображеннях використовуються для конвертації книг і документів в електронний вигляд, для автоматизації систем обліку в бізнесі, при розпізнаванні маркерів технологіями доповненої реальності та ін. Якість оптичного розпізнавання символів за умови застосування бінаризації в значній мірі визначається якістю відділення пікселів переднього плану від фону. Проаналізовано методи бінаризації зображень тексту та відзначено недостатню якість бінаризації. Щоб підвищити якість бинаризации кольорових зображень тексту, доцільно для поділу пікселів зображення на два класи, «Передній план» і «Фон», використовувати замість евристичного вибору порога класифікаційні методи. Як напрямок досліджень вибрано вдосконалення існуючого методу бінаризації кольорових зображень тексту шляхом використання класифікатора за мінімумом відстані. Для скорочення обсягу оброблюваної інформації до застосування класифікатора доцільно виділити блоки пікселів для подальшої обробки. Це виконувалося за допомогою аналізу зв'язкових компонент на оригінальному документі. Розроблено вдосконалений метод бінаризації кольорових зображень тексту із застосуванням аналізу зв'язкових компонент та класифікатора за мінімумом відстані. Дослідження розробленого методу показало, що він краще існуючих методів бінаризації за показниками завадостійкості бінаризації, але гірший за показником, що характеризує похибку визначення границь об'єктів. Серед помилок розпізнавання частіше пікселі зображень з класу з міткою «Передній план» неправильно ставилися до класу з міткою «Фон». Запропонований метод бінаризації при єдиності прототипів класів рекомендується використовувати в задачах обробки кольорових зображень друкованого тексту, для якого похибка визначення меж символів в результаті бинаризации компенсується товщиною букв. При множинності прототипів класів запропонований метод бінаризації рекомендується використовувати в задачах обробки кольорових зображень рукописного тексту, якщо не потрібна висока швидкодія. Вдосконалений метод бінаризації показав свою працездатність у випадках повільного зміни кольору і освітленості тексту і фону, проте стрибкоподібні зміни кольору і освітленості, а також текстурований фон не дозволяють забезпечити необхідну для вирішення практичних завдань якість бінаризації.

Downloads

Download data is not yet available.

Article Details

Тематика

Розділ

Інженерія програмного забезпечення та системний аналіз

Автори

Біографії авторів

Marina V. Polyakova, Одеський національний політехнічний університет, просп. Шевченка, 1,Одеса, Україна, 65044

доктор технічних наук, професор кафедри Прикладної математики і інформаційних технологій

Alexandr G. Nesteryuk, Одеський національний політехнічний університет, просп. Шевченка, 1,Одеса, Україна, 65044

кандидат технічних наук, доцент кафедри Комп’ютерних систем

Схожі статті

Ви також можете розпочати розширений пошук схожих статей для цієї статті.