Другое

Существующие приложения Google для распознавания речи

Lorem ipsum dolor

Компания Google активно внедряет распознавание речи во многие собственные приложения и инструменты. Вообще, распознавание речи — это сравнительно недавняя функция. Она стала возможной из-за быстрого развития технологий искусственного интеллекта.

Когда-то распознавание голоса было чем-то невообразимым и нереальным. Если помните, был даже фантастический фильм 90-х годов, в котором героиня-писательница произносила фразы в микрофон, а они тут же транслировались на экране компьютера. А сейчас кто удивится таким действиям? Практически никто, потому что в каждом современном смартфоне есть такая возможность, представленная в каком-либо приложении или инструменте. Найти такие приложения в Google Play вообще не составляет труда.

Google и распознавание речи

Компания Google активно участвует в новейших технологических разработках. Она одна из первых, кто создал беспилотный автомобиль. Также ее постоянно можно заметить во многих технологических инновационных разработках. Распознавание речи — не исключение, поэтому Гугл создал специализированный сервис по распознаванию голоса — Google Speech API.

Google Speech API

Это сервис, который дает возможность применять распознавание речи от компании Гугл в ваших собственных целях. Использование Google API дает возможность заменить даже живого оператора на телефонной линии, где в основном ведется однообразный разговор, к примеру, при бронировании билетов на какой-нибудь транспорт и др. 

Уже сейчас система распознавания голоса от Google применяется во многих сервисах жизнедеятельности человека:

  • в качестве первоначального оператора, которому нужно определить, к какому специалисту переориентировать клиента;

  • когда нужно уточнить или распознать адрес доставки;

  • если нужно аутентифицировать по голосу своих клиентов, когда они осуществляют запрос каких-нибудь конфиденциальных сведений;

  • когда нужно предоставлять по телефону большой объем однообразной справочной информации своим клиентам;

  • в сферах голосового самообслуживания клиентов

  • и др.

Чтобы подключить Google Speech API, нужно выполнить следующие действия:

  1. Скачать GoogleSpeechAPI.zip. В архиве будут находиться 2 сценария действий. Один предполагает проводить запись голосовых сообщений как эталон использования сервиса. Второй — это отправка записанных сообщений на сервера Гугл для распознавания этих сообщений.

  2. После распаковки архива вам станет доступен модуль «Администрирование». Там нужно будет найти вкладку «Внутренние номера», куда необходимо добавить внутренний номер и указать, по какому сценарию должны развиваться диалоги.

  3. Позвоните на указанный внутренний номер и проговорите какой-нибудь текст. Потом нажмите на «звездочку», и через короткое время у вас появится текст, который вы проговорили. Это даст возможность проанализировать, как работает сервис, правильно ли он распознает голос. Можно провести собственный анализ и при необходимости подкорректировать работу Google Speech API.

Использование Google Speech API дает множество преимуществ вашему бизнесу. Однако нужно понимать, что любые передаваемые данные «оседают» на серверах Гугл. Поэтому когда речь идет о конфиденциальности, то тут нужно хорошо все обдумать. Потому что Гугл и «конфиденциальность» или «приватность» это далеко не синонимы.

Google-распознавание речи в приложениях

Приведем несколько примеров, где реально используется распознавание голоса от Google. Возможно, это не так масштабно, как можно реализовать при помощи Google Speech API, но это дает понимание того, как вообще это работает и где можно применять эту технологию, если вы не являетесь владельцем крупного бизнеса.

5 популярных приложений, где используют распознавание голоса Гугл:

  1. Gboard. Хорошо известная фирменная клавиатура Google, которая установлена по умолчанию на многих Андроид-гаджетах. С одной стороны, клавиатура нужна для ввода текста «руками», но с другой стороны, распознавание речи на ней работает отлично, так как в этом задействованы все наработки компании Google.

  2. Evernote. Это очень популярное приложение для создания заметок. Помимо стандартного ввода текста, оно поддерживает и распознавание речи, что существенно ускоряет запись заметок.

  3. Speechnotes. В своей работе использует распознавание речи от Google. Основная его функция — это перевод голоса в текст. Идеально подходит тем, кому нужно очень много печатать.

  4. Speechtexter. Также использует технологии Гугл для распознавания голоса. В его собственный словарь можно добавить слова-сокращения, которые часто используете в тексте. Это приложение и будет распознавать — это его особенность и главное отличие от подобных ему приложений.

  5. T2S. Данное приложение очень качественно задействовало распознавание речи от Google. Оно призвано преобразовывать речь в текст, однако может также воспроизводить выделенный текст и экспортировать аудиозаметку в аудиофайл.

Заключение

Как видно, распознавание речи от Google можно использовать для больших и мелких целей. То есть можно задействовать эту технологию для модернизации собственного бизнеса, в качестве замены операторов на телефоне. Но также эту технологию можно использовать в более мелких целях — при создании приложений на Android.

То, что распознавание голоса работает хорошо, уже никто не может подвергнуть сомнению. Но технологии движутся вперед семимильными шагами, и распознавание голоса тоже. Поэтому заметна постоянная тенденция к улучшению и расширению функциональности распознавания. К чему это приведет? Время покажет, а пока нужно использовать эти возможности на полную.

 

Схожие статьи

Enterprise: определение, сфера применения и зачем он нужен
Другое

Enterprise: определение, сфера применения и зачем он нужен

Разработка ПО и стадии жизненного цикла программного обеспечения
Другое

Разработка ПО и стадии жизненного цикла программного обеспечения

Видеокарты Turing. Особенности новой серии видеокарт от NVIDIA
Другое

Видеокарты Turing. Особенности новой серии видеокарт от NVIDIA

Управление ходом исполнения программного кода в ЯП Crystal.(06)
Другое

Управление ходом исполнения программного кода в ЯП Crystal.(06)