Добавить новость
Добавить компанию
Добавить мероприятие
Технологии ABBYY помогают Институту востоковедения РАН в лингвистических исследованиях
21.12.2010 15:01
версия для печати
Институт востоковедения РАН – академическое научное учреждение, ведущее фундаментальные исследования в области востоковедения. Научные изыскания института охватывают различные отрасли знания: историю, политику, экономику, религию, языки стран Ближнего и Дальнего Востока. Для решения ежедневных исследовательских задач ИВ РАН была необходима удобная встраиваемая технология распознавания, которая бы обеспечила тесную интеграцию процессов распознавания и верификации текстов с оригинальными процедурами лингвистического анализа, разработанными специалистами института. Решение ABBYY FineReader Engine 9.0 было выбрано как наиболее отвечающее потребностям ИВ РАН. Теперь при обработке текстов на японском и китайском языках специалистам учреждения доступна широкая функциональность технологии ABBYY, в том числе инструменты коррекции отсканированного изображения для более качественного распознавания, функции анализа расположения блоков текста на странице и определения его ориентации. Также с помощью ABBYY FineReader Engine разработчикам ИВ РАН удалось реализовать удобный интерфейс верификации результатов распознавания. В процессе обработки текстов приложение строит гипотезы для неуверенно распознанных символов и предлагает их пользователю в виде контекстно-оптимизированных списков. Эта функция оказалась особенно полезна, учитывая сложность японского и китайского языков, отличающихся большим количеством символов, графической вариативностью, отсутствием чётко выраженных межсловных границ. В результате специалисты ИВ РАН добились заметного повышения точности распознавания текстов, при этом процесс оцифровки документов ускорился в несколько раз. «Точное воспроизведение исходного документа в электронном виде необходимо для его корректного лингвистического анализа. Это особенно важно при оцифровке текстов, написанных идеографическим письмом, в котором отдельные символы обозначают не звуки, а целые слова или их значимые части. В таких случаях любая ошибка в распознавании может существенно исказить исходный смысл текста. С технологией ABBYY мы смогли перевести процесс оцифровки документов на японском и китайском языках на качественно новый уровень», – говорит Александр Костыркин, специалист Отдела языков и народов Азии ИВ РАН. Редактор раздела: Алена Журавлева (info@mskit.ru) Рубрики: ПО Ключевые слова: ABBYY
наверх
Для того, чтобы вставить ссылку на материал к себе на сайт надо:
|
|||||
А знаете ли Вы что?
ITSZ.RU: последние новости Петербурга и Северо-Запада13.11.2024 Т2 запустил первый тариф после ребрендингаз> 31.10.2024 «Осенний документооборот – 2024»: взгляд в будущее системы электронного документооборотаз>
|
||||