Создана новая система распознавания манускриптов

 


Система предназначена для распознавания плохо читаемых, поврежденных манускриптов и архитектурных чертежей. По словам разработчиков, она способна детектировать различные вариации разнообразных символов (букв, рисунков, значков), например, буквы в написании разными почерками.

Для анализа символов BSM разделяет распознаваемый документ на области и подобласти с помощью решетки, сохраняет информацию о каждой ячейке решетки и регистрирует различия между символами. Затем система распознает и классифицирует символы. Отличие BSM от многих аналогичных систем - распознавание различных типов символов с помощью разных процессов.

Для оценки эффективности системы исследователи создали базу данных музыкальных нот и архитектурных символов. Первая состоит из более 2,1 тыс. образцов нот, написанных 24 различными людьми, а вторая - из более 2,7 тыс. образцов ручного написания архитектурных символов, собранных в 14 групп. Каждая группа включает примерно 200 типов символов, написанных 13 различными людьми. В результате тестов BSM на этих данных оказалось, что система правильно распознает более 98% нот и 90% архитектурных знаков.


Источник: CNews.ru