Проект
Retail Company
Подтвердили возможность технической реализации распознавания текста в реальном времени
Задача
Проверить техническую возможность разработки приложения, которое способно распознавать текст и конвертировать его в читаемый вид.
Трудности
В приложении использовался сторонний фреймворк Tesseract. Не было возможности повлиять на успешность распознавания, так как она зависела от многих факторов: качество исходного изображения, освещенность, шрифт и угол съемки.
Реализация
Чтобы подтвердить концепцию, в рамках одного приложения были интегрированы два разных подхода. С одной стороны, мы использовали нативные компоненты iOS Vision и MLCore, а с другой, third-party подход Tesseract.
Vision определяет наличие символов в каждом кадре видео. Tesseract распознает текст в конкретно выбранном кадре видео.
Мы работали с инструментами исключительно как потребители, так как основная цель на тот момент заключалась в демонстрации вариантов распознавания визуальных образов, а также, анализе возможностей iOS 11 по части машинного обучения.
Приложение было написано за 2 часа. Клиент получил подтверждение того, что такую функцию можно реализовать и использовать в рамках более сложных приложений.
Заинтересовало?
Оставьте свои контакты, чтобы мы обсудили вашу задачу
Проект
10+
лет на рынке