Лучшее программное обеспечение для диктовки в 2022 году

Лучшее программное обеспечение для диктовки в 2022 году

Программное обеспечение для диктовки прошло долгий путь с момента его первого коммерческого выпуска в начале 1990-х годов. Тогда оно было неуклюжим, медленным и разочаровывающим для тех из нас, кто только начинал его использовать. Сегодня технология диктовки ушла на несколько лет вперед. Теперь вы можете диктовать так быстро, как вам хочется, и быть уверенным, что по крайней мере 90% сказанного вами будет точно расшифровано. Кроме того, у вас будет несколько языков на выбор и голосовые команды для дальнейшего повышения производительности. В этой статье я расскажу вам о различных типах программ для преобразования речи в текст, о том, почему вам стоит их попробовать, и дам советы по получению наилучших результатов. И, конечно же, я представлю подробный обзор наших лучших программ для диктовки.

Оглавление статьи:

Лучшее программное обеспечение для диктовки

Что такое программное обеспечение для диктовки?

Когда вы будете искать в Интернете программное обеспечение для диктовки, имейте в виду, что оно может включать в себя различные типы приложений и услуг. Термины «программное обеспечение для диктовки», «речь в текст», «распознавание голоса», «голос в текст» и «распознавание речи» могут означать программу, которая преобразует ваш голос в текст на экране в режиме реального времени. Но иногда в поиск по этим терминам попадают продукты, которые предоставляют нечто совершенно иное. Например, некоторые продукты транскрибируют аудиофайлы в текст, но не транскрибируют ваш голос в текст в режиме реального времени. Другие продукты рекламируют себя как персональные помощники с искусственным интеллектом (выполняющие все компьютерные задачи с помощью речи) и могут включать компонент диктовки. Также вы можете встретить компании, которые предоставляют услуги транскрипции — используют людей для расшифровки ваших голосовых файлов в текст.  Кроме того, есть помощники ИИ, встроенные во многие устройства, которыми мы пользуемся каждый день: Siri от Apple, Alexa от Amazon и Cortana от Microsoft.

Они прекрасно подходят для планирования встреч, прослушивания музыки и поиска места, где можно поесть, но они не предназначены для расшифровки ваших статей, встреч и других документов. В этом обзоре мы сосредоточились на программном обеспечении, отдельном или встроенном в устройство, предназначенном для транскрибирования речи в текст.  Зачем вам это нужно? Прежде всего, программное обеспечение для диктовки обеспечивает доступ к технологиям и повышает продуктивность работы для людей с ограниченными возможностями — как физическими, так и языковыми. Например, если вы не можете пользоваться руками, вы все равно можете работать на компьютере, создавать документы и выходить в Интернет с помощью технологии диктовки. А люди с хроническими заболеваниями, такими как синдром запястного канала, могут избежать повторяющихся нагрузок, которые возникают при наборе текста, просто используя свой голос.  Но поскольку за последние 20 лет технология усовершенствовалась, а стоимость снизилась, программное обеспечение для диктовки теперь доступно каждому как инструмент для повышения производительности практически мгновенно. Посмотрите, как изменилась рабочая среда после принятия COVID-19: все больше людей работают из дома, что означает больше возможностей для таких вещей, как диктовка электронных писем. Студенты могут писать рефераты и записывать лекции, в зависимости от возможностей программного обеспечения. А обычные пользователи могут надиктовывать заметки, список покупок, текст или напоминание во время выполнения других задач, что делает многозадачность реальностью. Подумайте: прогуливаясь, вы одновременно «пишете» свой следующий роман.

Что делает приложение для диктовки лучшим?

Все наши обзоры лучших приложений написаны людьми, которые потратили большую часть своей карьеры на использование, тестирование и написание статей о программном обеспечении. Мы проводим десятки часов, исследуя и тестируя приложения, используя каждое приложение так, как оно должно использоваться, и оценивая его по критериям, которые мы установили для данной категории. Нам никогда не платят за размещение в наших статьях каких-либо приложений или за ссылки на какие-либо сайты — мы ценим доверие читателей, которые доверяют нам предлагать достоверные оценки категорий и приложений, которые мы рассматриваем. Удивительно, как далеко продвинулись программы для диктовки за 20 с лишним лет с тех пор, как я впервые попробовал их. Тогда я бы не стал рекомендовать его случайному пользователю — слишком много работы за слишком малое вознаграждение. Но теперь мне действительно приятно видеть, как ваши слова проносятся по экрану, словно вы диктуете своему персональному помощнику. А благодаря использованию искусственного интеллекта, который распознает вашу речь с тем большей точностью, чем чаще используются приложения, трудно ошибиться — независимо от платформы.  В моих тестах точность была первым элементом, на который я обращал внимание при выборе программного обеспечения. Затем следовала простота использования, включая наличие голосовых команд. Например, требует ли программа, чтобы пользователь сказал «вставить точку», а не просто «точка»? Последний вариант, хотя и может быть менее интуитивным вначале, вскоре становится привычным и экономит время в долгосрочной перспективе. Также учитывалось количество поддерживаемых языков и диалектов и универсальность приложения (например, можно ли использовать его в различных приложениях для диктовки?).

Советы по использованию программного обеспечения для распознавания голоса

Хотя программы для диктовки довольно хорошо распознают различные голоса, они не идеальны. Вот несколько советов, как сделать так, чтобы оно работало как можно лучше.

  1. Говорите естественно (с оговорками). Приложения для диктовки со временем изучают ваш голос и особенности речи. И если вы собираетесь провести с ними какое-то время, вы хотите, чтобы вам было удобно. Говорите естественно. Если изначально точность не достигает 90%, попробуйте произносить более четко. 
  2. Пунктуация. Когда вы диктуете, вы должны произносить каждую точку, запятую, вопросительный знак и так далее. Программа не настолько умна, чтобы понять это самостоятельно.
  3. Выучите несколько команд. Потратьте время на изучение нескольких простых команд, таких как «новая строка» для ввода перевода строки. Существуют различные команды для создания текста, редактирования и управления устройством. Команды могут отличаться в разных приложениях, поэтому выучите те, которые относятся к выбранному вами инструменту.
  4. Знайте свои ограничения. Особенно на мобильных устройствах, некоторые инструменты имеют ограничение по времени прослушивания — иногда всего 10 секунд. Время от времени поглядывайте на экран, чтобы убедиться, что вы не превысили лимит.
  5. Практика. Для того чтобы привыкнуть к программам распознавания голоса, требуется время, но чем больше вы практикуетесь, тем легче становится. Некоторые более сложные приложения предлагают вам тренироваться, читая отрывки или выполняя другие короткие упражнения. Не избегайте учебников, справочных меню и экранных шпаргалок.

Советы по выбору микрофонов для диктовки

В программах для диктовки ваш голос улавливается микрофоном, который встроен в ваше устройство (компьютер, планшет, мобильный телефон) или является частью определенного программного пакета (например, Microsoft Office). Для случайных пользователей диктофона, записывающих заметки и списки покупок, встроенный микрофон должен работать нормально. Но если вы используете его более интенсивно — постоянно пишете контент, диктуете встречи, отправляете электронные письма — подумайте о чем-то, что более эффективно улавливает звуковые волны вашего голоса.  По цене менее 100 долларов США есть множество вариантов гарнитур с микрофонами или внешних микрофонов, используемых подкастерами и интервьюерами на YouTube. Для этого теста я использовал USB-гарнитуру средней ценовой категории от Jabra для всех приложений, кроме мобильных. Она легкая, очень удобная и имеет достаточно хорошее качество звука/голоса. Если вы предпочитаете не быть привязанным к устройству, то вам больше подойдут беспроводные варианты, такие как Jabra Elite 45h (99 долларов). А высоко оцененный USB-микрофон Blue Snowball (79 долларов) имеет классный ретро-образ и собственную регулируемую подставку. 

Как мы тестировали приложения для диктовки

Для справедливого определения точности я использовал один и тот же сценарий из 207 слов для всех тестов. В нем есть разные длины предложений, несколько абзацев, имена собственные и несколько цифр. Как уже упоминалось, я использовал среднюю по цене гарнитуру в качестве микрофона для всех приложений, кроме мобильных. В моем помещении для тестирования было очень мало фонового шума.  При первоначальной оценке 12 приложений я диктовал сценарий один раз, используя основные пунктуационные команды, отмечал точность в процентах пропущенных или неправильно написанных слов и записывал свои мысли о простоте использования и универсальности. Когда я сузил окончательный список, я повторно протестировал каждое приложение с тем же сценарием, записал точность и попробовал другие функции, такие как обмен файлами и использование одной и той же программы в нескольких местах (например, Google Docs и Word). Имейте в виду, что многие из этих приложений становятся более точными, чем больше раз вы их используете, поэтому упомянутые цифры точности, вероятно, улучшатся при дальнейшем использовании. Кроме того, поскольку я читал по «сценарию», мой темп речи, вероятно, был быстрее, чем у обычного человека, который диктует свои мысли.

Лучшие бесплатные программы для диктовки для устройств Apple — Apple Dictation (iOS, iPadOS, macOS)

Один из лучших инструментов для диктовки можно найти на Mac, iPhone или iPad. Встроенная функция диктовки Apple, работающая на основе Siri (мы не удивимся, если однажды эти две функции объединятся), поставляется в составе настольных и мобильных операционных систем Apple. На устройствах iOS вы используете ее, нажав значок микрофона на основной клавиатуре. На настольном компьютере его можно включить, перейдя в Системные настройки > Клавиатура > Диктовка, а затем использовать сочетание клавиш для его активации в приложении. По умолчанию для работы «Диктовки Apple» требуется интернет, а также ограничение по времени — около 30 секунд для каждого фрагмента речи. Чтобы снять эти ограничения, включите функцию Enhanced Dictation, для которой требуется OS X v10.9 или более поздняя версия или iPhone 6s или новее. Расширенная диктовка добавляет локальный файл на ваше устройство, чтобы вы могли диктовать в автономном режиме. Вы можете форматировать и редактировать текст с помощью простых команд, таких как «новый абзац» или «выделить предыдущее слово». Совет: во время обучения вы можете просматривать доступные команды в небольшом окне, как маленькую шпаргалку. Apple также предлагает расширенные команды для создания собственных.

  • Цена Apple Dictation: Входит в комплект поставки устройств с macOS, iOS и iPadOS
  • Точность диктовки Apple: В тесте из 207 слов 20 слов оказались неточными, но следует учитывать, что для проведения теста я использовал одолженный MacBook Pro, поэтому система распознавания речи Siri впервые услышала мой голос. Обычные пользователи Siri, скорее всего, получат лучшие результаты.  
  • Рекомендация: Я рекомендую Apple Dictation при использовании расширенной диктовки. Стандартная версия немного раздражает и неудобна для сообщений длительностью более 40 секунд. Для коротких сообщений на мобильных устройствах она работает отлично. Для непрерывного диктовки лучше использовать Enhanced Dictation.
  • Apple Dictation поддерживает языки: Расширенная диктовка поддерживает 20 языков. Диктовка Apple по умолчанию поддерживает 31 язык: Арабский, каталанский, китайский, хорватский, чешский, датский, голландский, английский, финский, французский, немецкий, греческий, иврит, венгерский, индонезийский, итальянский, японский, корейский, малайский, норвежский, польский, португальский, румынский, русский, словацкий, испанский, шведский, тайский, турецкий, украинский и вьетнамский.

Лучшие бесплатные программы для диктовки для Windows — Распознавание речи в Windows 10 (Windows)

Поскольку Windows 11 вышла недавно (октябрь 2021 года), я решил протестировать как новую функцию диктовки (переименованную в «голосовой набор текста»), так и версию Windows 10 («распознавание речи»). Обе функции включены в соответствующие операционные системы, и ничего дополнительно устанавливать не нужно. Чтобы начать диктовать в любой из ОС, откройте приложение и на клавиатуре нажмите клавишу с логотипом Windows + H. В верхней части экрана появится значок микрофона и серое поле. Убедитесь, что ваш курсор находится в том месте, где вы хотите диктовать. Когда микрофон будет готов к диктовке, он скажет «Прослушивание». У вас есть около 10 секунд, чтобы начать говорить, прежде чем микрофон отключится. Если это произойдет, просто нажмите на него снова и подождите, пока не появится надпись Прослушивание. Чтобы остановить диктовку, снова нажмите на значок микрофона или скажите «Хватит говорить».   В ходе моего тестирования Windows 10 допустила всего три ошибки, и все это были слова, которые пропустили все остальные приложения. В остальном она обеспечила практически безупречную диктовку. Напротив, Windows 11 (которую я загрузил после тестирования 10) содержала 13 ошибок в каждом из двух случаев, когда я тестировал ее, что делает Windows 10 явным победителем по точности.  Каждая ОС включает около трех десятков команд для знаков препинания, символов и завершения действий в документе. Windows 10 включает семь языков диктовки, но команды доступны только на американском английском. В Windows 11 количество распознаваемых языков увеличено до 36, а также добавлено несколько диалектов и команд для всех этих языков.  Хотя обе версии просты в использовании, Windows 10 с большим отрывом превосходит их по точности. Это делает ее лучшим бесплатным выбором для пользователей Windows.

  • Цена распознавания речи в Windows 10: Входит в состав Windows 10; функция распознавания речи включена в более ранние версии Windows, а также в новый выпуск Windows 11.
  • Точность распознавания речи в Windows 10: В тесте на транскрипцию 207 слов система распознавания речи с первой попытки ошиблась всего в трех словах, что составляет 98,6% точности, а также перепутала команду пунктуации точки с самим словом. Система Windows Speech Recognition стала одной из лучших по точности, и только Gboard сравнялся с ней.
  • Рекомендации: Функция работает в любом приложении или браузере, которые я пробовал, что делает ее удобным инструментом. Если вы являетесь пользователем Windows 10 и не возражаете против периода «обучения» голоса, вы сможете использовать эту функцию с пользой. 
  • Поддерживаемые языки распознавания речи Windows 10: Если не считать отдельно различные диалекты, Windows Speech Recognition поддерживает такие языки: Китайский упрощенный, английский, французский, немецкий, итальянский (Италия), португальский (Бразилия) и испанский.

Лучшее настраиваемое программное обеспечение для диктовки — Dragon от Nuance (Android, iOS, macOS, Windows)

В 1990 году появился Dragon Dictate как первое программное обеспечение для диктовки. Тридцать лет спустя мы имеем Dragon от Nuance, лидера в отрасли и дальнего родственника той первой версии. Благодаря разнообразию программных пакетов и мобильных приложений для различных случаев использования (например, юридических, медицинских, правоохранительных органов), Dragon может работать со специализированной отраслевой лексикой и обладает отличными функциями, такими как возможность расшифровки текста из загруженного вами аудиофайла.  Для этого теста я использовал Dragon Anywhere, мобильное приложение компании Nuance, поскольку это единственная версия — среди других дорогих пакетов — доступная в бесплатной пробной версии. Она включает в себя множество функций, которых нет в других, например, функцию Words, которая позволяет добавлять слова, которые трудно распознать и произнести по буквам. Например, если вы живете на улице Эйххорн, Dragon услышит это как «I corn». Чтобы избежать этого, добавьте его в Words и произнесите это слово (в микрофон), чтобы натренировать программу.  В программе также предусмотрены сокращения. Если вы хотите сократить весь адрес до одного слова, перейдите в раздел Автотекст, дайте ему имя («адрес») и введите свой адрес: 1000 Eichhorn St., Davenport, IA 52722 и нажмите Save. В следующий раз, когда вы будете диктовать и говорить «адрес», вы получите весь текст. Для просмотра текстовых команд во время диктовки нажмите на значок пузырька комментариев или скажите «Что я могу сказать?», и появится меню команд.  Закончив диктовку, вы можете отправить ее по электронной почте, поделиться (например, на Google Drive, Dropbox), открыть в Word или сохранить в Evernote. Эти действия можно выполнить вручную или по голосовой команде (например, «сохранить в Evernote»). После того как вы дадите название, оно автоматически сохранится в Documents для последующего просмотра или обмена. Точность хорошая и улучшается по мере использования: при первом тестировании я допустил 13 ошибок, а при втором — только девять.

  • Цена Dragon от Nuance: $15/месяц за Dragon Anywhere (iOS и Android); от $200 до $500 за пакеты для настольных компьютеров
  • Точность Dragon от Nuance: Точность Dragon Anywhere составила 96% во время моего второго теста для сценария из 207 слов.
  • Рекомендации: Поскольку Dragon — это относительно крупная инвестиция, вы должны быть серьезно настроены на регулярное использование диктовки. Я рекомендую попробовать Dragon Anywhere бесплатно в течение семи дней, чтобы узнать, как он вам понравится.
  • Поддерживаемые языки Dragon by Nuance: Dragon Anywhere доступен на английском (США, Великобритания, Канада) и немецком языках. Настольные продукты Dragon доступны на нескольких языках, которые зависят от версии, и включают голландский, английский, французский, немецкий, итальянский и испанский.

Лучшие бесплатные программы для диктовки для мобильных устройств — Gboard (Android, iOS)

Отличное приложение Gboard от Google, которое включает диктовку, работает как на Android, так и на iOS. Чтобы воспользоваться им, зайдите в любое место, где можно набирать текст (электронная почта, браузер, текст, документ), и на экране появится клавиатура. Нажмите на значок микрофона в правом верхнем углу клавиатуры и начните говорить, когда появится запрос. Он очень быстро запишет ваш голос в текст так же быстро, как вы говорите. Удивительно, как быстро он транскрибирует. И не только это, но и высокая точность. Это единственное приложение, которое записало «birdcast» (хотя и без заглавных букв), название сайта о птицах, и допустило всего три ошибки при диктовке. Примечание: Если вы прекратите говорить примерно на 10 секунд, микрофон отключится, и вам придется снова нажать на него.   У вас есть возможность персонализировать приложение, что позволяет Gboard распознавать ваши особенности использования голоса и улучшать их, повышая точность со временем. Я надиктовывал тексты в машине с включенным радио, и все еще почти идеально. Кроме того, он отлично справляется с заиканием, что, вероятно, является результатом изучения моих речевых паттернов.  Примечание: Я пользуюсь Gboard уже около шести лет. Он изучил мой голос и речевые паттерны, поэтому неудивительно, что в моем тесте он оказался самым точным.

  • Цена Gboard: Бесплатно
  • Точность Gboard: При расшифровке отрывка из 207 слов Gboard допустил всего три ошибки.
  • Рекомендация: Gboard выдает ваши слова на экран так быстро, как вы их произносите. Тем, кто говорит быстрее, это будет удобно, а другим, возможно, придется привыкать. Если вы хотите надиктовывать тексты, электронные письма или любые другие короткие заметки, используйте Gboard.  
  • Поддерживаемые языки Gboard: Не считая отдельных диалектов, Gboard поддерживает 69 языков: Африканский, арабский, азербайджанский, белорусский, болгарский, каталанский, китайский, хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, греческий, хауса, иврит, хинди, венгерский, исландский, индонезийский, итальянский, японский, корейский, латышский, македонский, малайский, мальтийский, норвежский, персидский, польский, португальский, румынский, русский, сербский, словацкий, словенский, испанский, суахили, шведский, турецкий, украинский, вьетнамский, валлийский, зулусский и другие.

Лучшая программа для диктовки для набора текста в Google Docs — Голосовой набор текста в Google Docs (Web в Chrome)

В Google Docs есть функция диктовки, которая отличается высокой точностью и простотой использования и называется голосовым набором текста Google Docs, но для доступа к этой функции необходимо использовать Chrome. Просто перейдите в меню Инструменты > Голосовой ввод, и слева появится значок микрофона. Нажмите на него и начните говорить. Если вы будете бездействовать около 30 секунд, микрофон автоматически остановится. Нажмите на него снова, чтобы возобновить разговор. Этот же процесс можно использовать для диктовки заметок докладчика в презентации Slides.  Если вам нужна помощь или вы хотите получить список команд, нажмите на вопросительный знак в значке микрофона. Справа появится справка, где вы можете прокрутить или найти голосовые команды, такие как пунктуация, форматирование текста, редактирование и даже перемещение по документу.    

  • Голосовой набор текста в Google Docs цена: Бесплатно
  • Точность голосового набора текста в Google Docs: Из 207 продиктованных слов девять были набраны неправильно, что дает точность 96%. Большинство ошибок было связано с написанием слов с заглавной буквы в середине предложений, таких как «несказанный», «упадок» и «открытие».
  • Рекомендация: Если вы являетесь опытным пользователем Google Docs и хотите иметь возможность диктовки, голосовой набор текста — отличный выбор благодаря своей точности и множеству голосовых команд.  
  • Поддерживаемые языки для голосового набора текста в Google Docs: Голосовой набор текста работает на этих языках и включает множество диалектов: Африканский, амхарский, арабский, армянский, азербайджанский, бахаса индонезия, баскский, бенгальский, болгарский, каталанский, китайский, хорватский, чешский, датский, голландский, английский, фарси, филиппинский, финский, французский, галисийский, грузинский, немецкий, греческий, гуджарати, иврит, хинди, венгерский, исландский, итальянский, японский, яванский, каннада, кхмерский, корейский, лаосский, латышский, литовский, малаялам, малайский, маратхи, непали, норвежский, польский, португальский, румынский, русский, словацкий, словенский, сербский, сингальский, испанский, сунданский, суахили, шведский, тамильский, тайский, турецкий, украинский, урду, вьетнамский, зулусский.

Лучшая бесплатная программа для диктовки для периодического использования — SpeechTexter (Web в Chrome, Android)

SpeechTexter поддерживается только через браузер Chrome или с помощью мобильного приложения для Android (iPhone и iPad не поддерживаются). Многие бесплатные сайты для диктовки содержат раздражающее количество рекламы, но в этом приложении ее всего одна-две. И у них есть политика конфиденциальности, в которой говорится, что, хотя они не хранят ваш текст, он обрабатывается на серверах Google. Просто имейте это в виду. Для начала выберите язык. (Для носителей английского языка существует впечатляющее количество 16 различных диалектов из таких стран, как Гана, Гонконг и Пакистан, а всего 73 различных языка). Затем в левом верхнем углу нажмите кнопку Start и начинайте. Пока вы говорите, ваша речь ненадолго фиксируется во всплывающем окне, а затем быстро транскрибируется на экране с небольшой задержкой. По мере того как вы говорите, в правом нижнем углу в реальном времени отображается количество слов.  Голосовые команды удобно расположены справа от главного окна. Если вы хотите создать собственную команду, нажмите на значок карандаша, затем на знак плюс и добавьте команду. Я добавил команду «кавычки» для кавычек и изменил команду «точка» на «стоп». Вы можете редактировать свою речь, как в любой базовой программе обработки текстов, а затем сохранить ее в виде файла .txt или Word. Включение функции автосохранения предотвращает потерю работы при случайном закрытии браузера или окна. Если это произойдет, просто откройте сайт, и на экране появится ваша предыдущая диктовка.

  • Цена SpeechTexter: Бесплатно
  • Точность SpeechTexter: В отрывке из 207 слов SpeechTexter допустил 10 неточностей (точность 95%). Наиболее распространенной ошибкой было случайное написание слов заглавными буквами в середине предложений, что неудивительно, поскольку он работает на том же речевом движке, что и Google Docs (см. результаты точности выше).
  • Рекомендации: Если вы используете Chrome и иногда нуждаетесь в диктовке, SpeechTexter — хороший выбор благодаря своей точности и простоте использования.
  • Поддерживаемые языки SpeechTexter: SpeechTexter поддерживает преобразование речи в текст на 73 языках, плюс десятки диалектов.

Подходит ли вам голосовая диктовка?

Большинство программ для диктовки не идеальны, но их точность превосходна. Это, а также бесплатные версии, поставляемые с большим количеством устройств и приложений, делают использование этой технологии — по крайней мере, для быстрых задач, таких как создание заметок, — простым решением.  Если вы проводите много времени за написанием текстов по работе или даже для развлечения, имеет смысл попробовать диктовку, чтобы почувствовать, как произносить слова, которые обычно выходят через пальцы. Для многих пользователей это может оказаться самым сложным моментом. Когда (и если) вы привыкнете диктовать свои мысли, вам будет трудно вернуться к набору текста.

Наш проект поддержало государство в виде гранта на развитие алгоритмов!
This is default text for notification bar

Конкуренты скликивают рекламу?

Подключите защиту бесплатно и проверьте, сколько ботов кликают на вашу контекстную рекламу Яндекс.Директ и оцените потери вашего бюджета. Никаких финансовых обязательств.