В реальности вы легко читаете всевозможный печатный текст и все, что вас окружает.Возможно, вы никогда не задумывались о том, что делать со слабовидящими людьми?
Статистические данные показывают, что в Китае насчитывается около 17 миллионов людей с нарушениями зрения, что эквивалентно более чем 1 из каждых 100 человек с нарушениями зрения. Но мы редко видим их в повседневной жизни, потому что люди с нарушениями зрения имеют много неудобств в повседневной жизни, а выход на улицу для них опасен. Может ли ИИ стать их «глазами»?
Будьте их глазами: история приложений для блотинга и слабовидящих
Если бы у вас было только одно приложение на телефоне, какое бы вы выбрали? Слабовидящий Ань Чжи твердо дал ответ - рисование линиями. Поскольку приложение для рисования линий позволяет ему с плохим зрением «видеть» мир по-другому, слова больше не являются недосягаемыми. Он использовал Бай Се, чтобы «видеть» красивые стихи и «слушать» движущуюся музыку.Даже когда он поднимался наверх один и не мог видеть пола, Бай Ся точно давал ему ответ и спасал его из затруднительного положения. Приложение заставило его, вздохнувшего когда-то от «слов», смелее выходить из дома и участвовать в яркой жизни.
«Рисование линий — это мои глаза.» Сяоцзе, которая также является слабовидящим человеком, никогда не колеблясь хвалит рисование линий и даже прямо говорит, что рисование линий — это инструмент для выживания партнеров с нарушениями зрения. Рисование линий помогло ему решить жизненные проблемы, от всех видов электроприборов, цифровых продуктов, инструкций по лекарствам до упаковки различных туалетных принадлежностей, он также может рассказать историю книжки с картинками милой маленькой племяннице. Если нет рисования линий, для него это невообразимо.
Почему линейный рисунок считался сокровищем для слабовидящих? Приложение для рисования линий - это простое и эффективное программное обеспечение для распознавания текста OCR. Оно не только простое и удобное в использовании, но и красивое по дизайну. Оно может легко реализовать серию процессов "фотографирование - распознавание текста - результаты чтения". В то же время рисование линий адаптировано к функции специальных возможностей мобильных телефонов, и слабовидящие могут очень легко управлять им на мобильном телефоне.
Первоначальное значение слова «линейный рисунок» — это техника литературного письма. Г-н Лу Синь однажды сформулировал эту технику в двенадцати словах, то есть «иметь истинное значение, идти на побелку, быть менее надуманным и не выпендриваться". Тао Синьлэ, разработчик приложения для рисования линий, как раз такой человек, он наблюдал актуальные потребности разных групп людей и использовал коды виртуального мира, чтобы удовлетворить нуждающихся в реальном мире, сделав их жизнь лучше. и удобнее.
Мысленное путешествие разработчиков приложения для отслеживания белого: разделение на разные сценарии и оптимизация деталей продукта
Вам может быть трудно представить, что Тао Синьлэ, как личный разработчик, впервые разработал приложение для рисования линий для своей девушки. Девушка Тао Синьлэ любит читать и часто делает заметки. Чтобы уменьшить нагрузку транскрипции, она пыталась использовать все виды программного обеспечения для распознавания текста, представленные на рынке в то время, но она обнаружила, что некоторые из программ имеют громоздкие процедуры работы, некоторые из них были дорогими, а некоторые были неточными... Увидев, что ее подруге больно, Тао Синьлэ немедленно решил создать инструмент распознавания текста с хорошим опытом и хорошим эффектом для своей подруги, и быстро применил его в действии. Это может быть уникальный роман разработчика.
Однако процесс разработки приложения полон неизвестных и проблем. В условиях того времени огромной проблемой при разработке программного обеспечения с функцией OCR было: как сделать распознавание текста быстрым и точным. Поэтому он исследовал производителей, которые предоставляют эту услугу на рынке, и сравнил продукты разных производителей, пытаясь идентифицировать изображения разных сцен, и найти тот, который обладает лучшим эффектом распознавания. Таким образом, он обнаружил, что возможности технологии OCR и пользовательский опыт открытой платформы Baidu Brain AI являются лучшими, особенно точность распознавания опережает других производителей, поэтому в 2017 году он без колебаний выбрал технологию OCR Baidu, и она используется до сих пор.
Тем не менее, превосходная базовая технология не означает все. Baidu Brain OCR предоставила около 60 технических возможностей.Хорошая технология также должна применяться для сопоставления сценариев, чтобы иметь большую ценность.
Поэтому Тао Синьлэ сначала провел детальное исследование сценариев использования линейного рисования, таких как: студенты используют PPT в классе для извлечения текста и создания заметок, сотрудники предприятия сканируют бумажные контракты в электронные версии и создают PDF-файлы, а бумажные формы преобразуются в Электронные версии Excel, Переведите текст на картинке, учитель берет и распознает тестовый вопрос и перерабатывает тестовый вопрос, юрист использует его для извлечения текста на бумажном документе и т. д. В частности, он уделяет внимание и исследует особые потребности людей с нарушениями зрения.
После рассмотрения пользовательских сценариев использования происходит непрерывная полировка продукта. В то время часто возникали ошибки в распознавании изображений при преобразовании текста в текст.Чтобы решить эту проблему, перед распознаванием приложение для рисования линий выполняло некоторую техническую обработку, например, как сжать изображение, чтобы обеспечить четкость и минимизировать размер изображения; когда длинное изображение автоматически обрезается, положение пустой строки длинного изображения определяется и автоматически обрезается, а текст не обрезается; как автоматически сегментировать статью, чтобы ее было легче читать читателей читать и так далее. Этот изысканный дизайн продукта обеспечивает четкость изображений и упрощает идентификацию текстовой информации. После распознавания функция корректуры штрихового рисунка может отображать результат распознавания и исходное изображение на одном интерфейсе, что удобно для пользователей, чтобы быстро найти место, которое необходимо изменить, и редактировать на этой основе.
Опираясь на превосходные алгоритмы глубокого обучения Baidu и модели предварительного обучения, основанные на массивных высококачественных данных, а также на возможности предварительной обработки изображений приложения White Line, точность распознавания ключевых полей составляет 99%+. Увидев улыбающееся лицо своей подруги при рисовании штрихами, Тао Синьлэ почувствовал, что все того стоит, и надеялся, что больше людей смогут насладиться этим счастьем.
В основе успеха: с сердцем «мастера» вырезайте свет из продуктов
Тао Синьлэ, программист, всегда был «мастером», когда дело касалось создания продуктов. Тао Синьлэ упомянул, что ИИ столкнется со многими трудностями в процессе приземления, и много раз он будет идти вперед, наступая на яму. Когда мы сталкиваемся с неразрешимыми проблемами, нам нужно продолжать учиться и преодолевать трудности.
Технология Baidu Brain OCR работает бок о бок с бесчисленным множеством разработчиков, таких как Тао Синьлэ. Как одно из первых крупномасштабных применений технологий искусственного интеллекта, технология OCR продолжает делать прорывы в промышленных приложениях. Технология Baidu Brain OCR может предоставлять многосценарные, многоязычные, высокоточные услуги обнаружения и распознавания текста.Ряд показателей ICDAR занимает первое место в мире, и она широко используется для удаленной аутентификации личности, финансового и налогового возмещения, электронная документация и другие сценарии.Это повышение эффективности дает пользователям более интеллектуальный опыт работы с приложениями.
Конечно, для применения технологии ИИ требуется не только такая платформа, как Baidu Brain, которая обеспечивает ведущие технологические возможности ИИ, но и больше разработчиков, таких как Тао Синьлэ, которые могут использовать свое воображение для применения ИИ в более реальных сценариях для удовлетворения потребностей различных пользователей. Потребности групп, даже легко упускаемые из виду люди с ограниченными возможностями, делают общество более «ИИ». В то же время, чтобы снизить порог самостоятельного обучения моделей распознавания текста OCR для независимых разработчиков и предприятий, Baidu Brain запустила первую в отрасли платформу самообучения EasyDL OCR, обеспечивающую беспороговое, индивидуальное, недорогое универсальное распознавание текста. Услуги по обучению моделей. Обеспечивая высокую точность, он может удовлетворить потребности разнообразных сценариев и эффективно обеспечить безопасность данных.
В эту эпоху технологий, расширяющих возможности людей, дизайн продукта является результатом всеобъемлющей концепции. Приложение Baitra, у которого более 8 миллионов пользователей, стало продуктом из уст в уста в отрасли. Считается, что в будущем все больше и больше разработчиков будут создавать более интеллектуальные приложения в сочетании со сценариями с помощью технологии искусственного интеллекта и услуг, предоставляемых открытой платформой Baidu Brain AI, что сделает жизнь большего числа людей удобнее и лучше.
Немедленно испытайте возможности распознавания текста Baidu OCR бесплатно:ai.baidu.com/tech/ocr