Программа для перевода текст в аудио онлайн


Перевод речи в текст: топ-5 программ

Ни одна программа не сможет полностью заменить ручную работу по расшифровке записанной речи. Однако существуют решения, которые позволяют существенно ускорить и облегчить перевод речи в текст, то есть, упростить транскрибацию.

Содержание:1. RealSpeaker2. Сайт speechpad.ru 3. Сервис dictation.io4. Dragon Dictation5. Speechlogger

Транскрибация – это запись аудио или видео-файла в текстовом виде. Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег.

Перевод речи в текст полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

Опишем наиболее эффективные инструменты, доступные на ПК, мобильные приложения и онлайн-сервисы.

1 RealSpeaker

Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.

Практика показывает, что программа корректно расставляет знаки препинания, не допускает орфографических ошибок. Поэтому редактировать полученный текст придется недолго.

Может воспринимать 13 языков мира. Существует бета-версия программы, которая раздается бесплатно. Программу можно не устанавливать, а при наличии интернета просто воспользоваться онлайн-сервисом.

Рис. 1. Говорим, а сервис RealSpeaker в режиме онлайн это печатает

Я попробовала этот сервис в режиме онлайн, не скачивая бесплатный вариант программы. Мне он понравился.

1) Чтобы перевести речь в текст онлайн, переходим по ссылке

http://www.realspeaker.me/ru

2) Нажимаем кнопку «Старт». Соглашаемся на использование микрофона.

Рис. 2. Нажимаем «Диктовать», затем внятно говорим, а RealSpeaker записывает это

3) Четко произносим текст. Если нужны знаки препинания, то прямо так и говорим в конце предложения: «точка» или «знак вопроса», либо «восклицательный знак».

4) Текст, который в то время, когда мы говорим, печатается сам – просто чудо!

  • Когда текст надиктован, выделяем его,
  • копируем в буфер обмена (например, с помощью горячих клавиш Ctrl+C),
  • переходим в текстовый редактор, в соцсеть или куда-то еще, где нужно вставить текст,
  • ставим там курсор и жмем горячие клавиши Ctrl+V.

Посмотрите видео «2 0 RealSpeaker (русская версия)», где разработчик в режиме онлайн показывает, как он говорит, а в это время текст с помощью его сервиса печатается на экране:

2 Сайт speechpad.ru

Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.

https://speechpad.ru/

Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».

Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.

Рис. 3. Сервис speechpad

Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.

Список видео-уроков по работе с speechpad:

https://speechpad.ru/help.php

Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:

Видео «транскрибирование аудио»

 

Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.

3 Сервис dictation.io

Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст.

Рис. 4. Сервис dictation.io

Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет  от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.

Перейти на сервис:

https://dictation.io/

1 на рис. 4 – русский язык можно выбрать в конце страницы. В браузере Google Chrome язык выбирается, а в Мозилле почему-то нет такой возможности.

Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.

4 Dragon Dictation

Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.

Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.

Приложение Dragon Dictation   используют обладатели яблочных гаджетов, например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Приду туда, можно будет посмотреть на текст в заметке, и не надо слушать.

5 Speechlogger

Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:

https://chrome.google.com/webstore/detail/speech-recognition-transl/jjgohjmefljmabkekbfgfhockfegohfp?hl=ru

Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества.

Какую бы программу вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы. Только так можно получить безукоризненный текст без ошибок.

Также полезные сервисы:

Программы для создания электронной книги

Оповещения Google Alerts – зачем и как пользоваться, примеры использования

P.P.S. Чтобы подписаться на получение новых статей, которых еще нет на блоге: 1) Введите Ваш e-mail адрес в эту форму: 2) На Ваш e-mail придёт письмо для активации подписки. Обязательно кликните по указанной там ссылке, чтобы подтвердить добровольность своей подписки: подробнее с видеоуроком

www.compgramotnost.ru

Как перевести текст в аудио

   Друзья! В самой первой статье нашего сайта рассказывается о трёх помощниках слабовидящим пользователям ПК, которые обеспечивают комфортную работу на компьютере, практически не напрягая глаз. Экранный диктор может прочитать любой текст на экране компьютера. Это очень удобно, но нам приходится сидеть за монитором.

   Если же нам нужно, например, изучать какой- то учебник, но не хочется сидеть за компом, можно перевести текст учебника в аудиофайл, например, в MP3 и слушать его, сидя на любимом диване или в кресле. А поможет нам в этом замечательная и бесплатная программа Govorilka.

 

 

       Как Вы понимаете, программа позволяет также перевести Ваши любимые электронные книги в аудиоформат и слушать их, например, в аудиоплеере, занимаясь домашними делами.

   Кроме того в программе, по умолчанию, установлены дикторы с голосами на русском и английском языках, что может пригодиться Вам на начальном этапе изучения английского языка.

  

Вот, например, как прозвучит текст знаменитой песни Мерлин Монро.

 

   И ещё несколько возможностей программы Govorilka.

1.  Программа открывает большие текстовые файлы в кодировках DOS и Windows. Вы можете копировать и вставлять в программу тексты из файлов MS Word и HTML, причём размер этих файлов не ограничен.

2.  Программа позволяет устанавливать новые голоса и пополнять словари произношений, которые позволяют корректировать произношение отдельных слов и словосочетаний.

3.  Запись речи осуществляется в распространённые аудиоформаты WAV и MP3. При Записи речь автоматически разбивается на несколько аудиофайлов, что очень удобно использовать затем при прослушивании, например, в MP3-плеерах.      

 

УСТАНОВКА ПРОГРАММЫ

Последнюю версию программу Govorilka 2.22 можно скачать с сайта разработчика по ссылке: СКАЧАТЬ Govorilka     

   Установка программы стандартная и не требует особых знаний компьютера. Вам лишь следует точно выполнять указания установщика.

Однако, если у Вас на компьютере ещё не был установлен экранный диктор NVDA и Вы впервые ставите Говорилку, обратите внимание на следующее:     

 В Windows XP и Windows Vista по-умолчанию уже установлена библиотека SAPI 5 и один американский голос. Так что английские тексты можно слушать сразу после установки программы. Русскоязычные голоса необходимо устанавливать отдельно (если они не установлены).   

 

 

Оптимальная последовательность установки Говорилки:

 

11. Скачать и установить самую свежую версию Говорилки.

2. Скачать и установить (если не установлен) хороший речевой движок. Например, Acapela Elan Nikolai. Установочный пакет легко находится в Интернете поиском: acapela elan tts . 

 

 Программу вместе с речевым движком Николай можно скачать со стороннего сервиса. Но эта ссылка может быть изменена автором сайта.

Пока программу можно скачать по ссылке: СКАЧАТЬ Govorilka + Николай.

 

Здесь через торрент-файл можно скачать сразу:

—  саму программу Govorilka 2.22,

—  речевой движок Николай, полное название движка: Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai_MmE255,

—  словарь ударений и правильных произношений для программ синтезации речи: Russian Nicolai.dic. Обновлённую версию этого словаря можно скачать также по ссылке: СКАЧАТЬ Russian Nicolai.dic.

 

 

Я рекомендую скачать программу именно с диктором Николай, потому что, на мой взгляд, это лучший на сегодня русскоговорящий диктор. Он хорошо произносит слова на русском языке, чего нельзя, правда, сказать про произношение английских слов. Но для чтения электронных книг, это лучший вариант. Вот послушайте!

 

 

 

  Давайте рассмотрим пошаговую установку программы:

 

  1.  После скачивания программы нужно разархивировать полученный файл

2.  Открыть папку с программой,

3.  Установить программу Govorilka2.22. При установке желательно не изменять предлагаемую установщиком директорию.

4.Установить Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai_MmE255.

5. Скопировать в разархивированной ранее папке словарь Digalo Russian Nicolai.dic и вставить его в папку с программой C:Program FilesГоворилкаDic.

6. Запустить Говорилку и в окне Голос выбрать ELAN TTS Russian (Nicolai 16Khz), Если голос уже стоит то, надо выбрать любой другой, затем снова ELAN TTS Russian (Nicolai 16Khz), иначе возможны неправильные установки.

7. В окне Словари выбрать Digalo Russian Nicolai. 

 

 

НАСТРОЙКА ПРОГРАММЫ

   После установки программы можно зайти в меню Файл, выбрать строку Открыть и в новом окне выбрать нужный текстовый файл на Вашем компьютере.

   Текст также можно вставить в окно из буфера обмена, скопировав его предварительно в другой программе или на странице интернета.

Затем нажать кнопку с треугольником и прослушать текст. Правда при этом может оказаться, что шрифт текста очень маленький, а голос еле слышен.

Однако это поправимо. Программа Govorilka имеет очень простой, удобный интерфейс. Давайте настроим программу.

1.  Прежде всего, нужно нажать кнопку «Дополн.», после чего в верхней части программы откроется расширенная панель с дополнительными параметрами.

2.  Здесь можно выбрать понравившийся голос, установить его громкость, высоту и скорость. Можно одновременно настроить 8 разных вариантов произношений для восьми окон.

3.  На нижней строчке панели расположены 8 кнопок: от 1 до 8, которые позволяют моментально открыть любой из восьми, загруженных Вами текстов.

4.  Каждый из восьми текстов можно настроить по-разному. Чтобы настроить шрифт в первом окне, нажмите кнопку 1.

 

 

5.  В меню Сервис выберите строчку Настройка текущего текстового окна.

6.  В открывшемся окне выберите вкладку Вид, а затем Шрифт.

7.  Открывшееся окно позволит выбрать нужный шрифт и фон окна.

8.  Теперь, поставив курсор в начало текста и, нажав кнопку с треугольником, Вы сможете, если захотите, следить за произносимым текстом. При этом прочитанный текст будет выделяться другим цветом.

9.  Остановить чтение Вы сможете в любой момент, нажав кнопку справа от кнопки с треугольником.

 

 

 

ЗАПИСЬ ТЕКСТА В ЗВУКОВОЙ ФАЙЛ

 

Чтобы перевести текст в аудиоформат:

 —  откройте одну из восьми страниц, на которой находится нужный текст,  

—  на панели управления, слева от кнопки «Дополн.» найдите и нажмите кнопку со значком плеера,   

—  в открывшемся окне, в строке Выходной файл выберите папку для сохранения и введите название будущего аудиофайла,  

 

—  при записи текстов большого размера аудио будет разбита на несколько файлов. Размер каждой части можно выбрать в строке Размер части: от 1 Мб до 512 Мб,  

—  нажмите OK,  

—  в новом открывшемся окне Вы сможете контролировать процесс записи. В результате в заданную Вами папку будут выведены один или несколько аудиофайлов Вашего текста. 

 

   Теперь Вы можете не смотреть на экран, изучая какой-нибудь учебник и не сидеть за компьютером читая любимую электронную книгу.

   Чтобы слушать тексты на плеере, записывайте аудиофайла небольшого размера. А объёма в 512 Мб хватит на внушительный текст, который можно прослушать с компьютера, сидя в удобном кресле.  

   А пока, садитесь по удобнее и послушайте, как некоторые умельцы научили петь Говорилку:   

    Программа Govorilka является простой, но довольно эффективной программой. Если Вы в ней разобрались, то теперь сможете с лёгкостью освоить программу Балаболка.

   Это программа, мне кажется немного сложнее, но имеет больше функций. В частности возможность использования голосов на других языках кроме русского и английского, например, можно установить диктора на французском и даже украинском языках. Балаболка также является бесплатной программой.  

 

  Для записи аудиофайлов из текста Вы также можете использовать платную программу BookMania, которая была создана специально для записи аудиофайлов из текста.

 

Желаю всем удачи, и берегите своё зрение!

 

 

helptobrowse.ru

Программы для перевода аудио голоса в текст

В нашем современном, насыщенном событиями мире, скорость работы с информацией является одним из краеугольных камней достижения успеха. От того как насколько быстро мы получаем, создаём, перерабатываем информацию зависит наша рабочая производительность и продуктивность, а значит и наш непосредственный материальный достаток. Среди инструментов, способных повысить наши рабочие возможности, важное место занимают программы для перевода речи в текст, позволяющие существенно увеличить скорость набора нужных нам текстов.  В данном материале я расскажу, какие существуют популярные программы для перевода аудио голоса в текст, и каковы их особенности.

Изучаем программы для перевода речи в текст

Содержание статьи

Приложение для перевода аудио голоса в текст – требования к системе

Большинство ныне существующих программ для перевода голоса в текст имеют платный характер, предъявляя ряд требований к микрофону (в случае, когда программа предназначена для компьютера). Крайне не рекомендуется работать с микрофоном, встроенным в веб-камеру, а также размещённым в корпусе стандартного ноутбука (качество распознавания речи с таких устройств находится на довольно низком уровне). Кроме того, довольно важно иметь тихую окружающую обстановку, без лишних шумов, способных напрямую повлиять на уровень распознавания вашей речи.

При этом большинство таких программ способны не только трансформировать речь в текст на экране компьютера, но и использовать голосовые команды для управления вашим компьютером (запуск программ и их закрытие, приём и отправление электронной почты, открытие и закрытие сайтов и так далее).

Интересно: Как проверить микрофон на компьютере или ноутбуке?

Пишите голосом комфортно

Программа преобразования речи в текст

Перейдём к непосредственному описанию программ, способных помочь в переводе речи в текст.

Программа «Laitis»

Бесплатная русскоязычная программа для распознавания голоса «Laitis» обладает хорошим качеством понимания речи, и, по мнению её создателей, способна практически полностью заменить пользователю привычную клавиатуру. Программа хорошо работает и с голосовыми командами, позволяя с их помощью выполнять множество действий по управлению компьютером.

Для своей работы программа требует обязательного наличия на ПК скоростного интернета (в работе программы используются сетевые сервисы распознавания голоса от «Google» и «Yandex»).  Возможности программы позволяют, также, управлять с помощью голосовых команд и вашим браузером, для чего необходима установка на веб-навигатор специального расширения от «Laitis» (Chrome, Mozilla, Opera).

«Dragon Professional» — расшифровка аудиозаписей в текст

На момент написания данного материала цифровой англоязычный продукт «Dragon Professional Individual» является одним из мировых лидеров по качеству распознаваемых текстов. Программа понимает семь языков (с русским пока работает лишь мобильное приложение «Dragon Anywhere» на Android и iOS), обладает высоким качеством распознавания голоса, умеет выполнять ряд голосовых команд. При этом данный продукт имеет исключительно платный характер (цена за основную программу составляет 300 долларов США, а за «домашнюю» версия продукта «Dragon Home» покупателю придётся выложить 75 американских долларов).

Для своей работы данный продукт от «Nuance Communications» требует создания своего профиля, который призван адаптировать возможности программы под специфику вашего голоса. Кроме непосредственной диктовки текста, вы можете обучить программу выполнять ряд команд, тем самым делая своё взаимодействие с компьютером ещё более конгруэнтным и удобным.

«RealSpeaker» — сверхточный распознаватель речи

Программа для трансформации голоса в текст «RealSpeaker»  кроме стандартных для программ такого рода функций, позволяет задействовать возможности веб-камеры вашего ПК. Теперь программа не только считывает аудио составляющую звука, но и фиксирует движение уголков губ говорящего, тем самым более корректно распознавая выговариваемые им слова.

«RealSpeaker» считывает не только аудио, но и визуальную составляющую процесса речи

Приложение поддерживает более десяти языков (в том числе и русский), позволяет распознавать речь с учётом акцентов и диалектов, позволяет транскрибировать аудио и видео, даёт доступ к облаку и многое другое. Программа условно бесплатна, за платную версию придётся заплатить вполне реальные деньги.

«Voco» — программа быстро переведёт голос в текстовый документ

Ещё один преобразователь голоса в текст – это платный цифровой продукт «Voco», цена «домашней» версии которого ныне составляет около 1700 рублей. Более продвинутые и дорогие варианты данной программы – «Voco.Professional» и «Voco.Enterprise» имеют ряд дополнительных возможностей, одной из которых является распознавание речи из имеющихся у пользователя аудиозаписей.

Среди особенностей «Voco» отмечу возможность дополнения словарного запаса программы (ныне словарный запас программы включает более 85 тысяч слов), а также её автономную работу от сети, позволяющую не зависеть от вашего подключения к Интернету.

Среди плюсов «Voco» — высокая обучаемость программы

Приложение включается довольно просто — достаточно дважды нажать на клавишу «Ctrl».

Рекомендую: ТОП 12 программ для записи видео с экрана

«Gboard» — мобильное приложение преобразователь записи в текст

Мобильное приложение «Gboard» является популярным приложением для Android и iOS, позволяя осуществлять длительный голосовой ввод с дальнейшей трансформацией сказанного в стандартный текст (конвертация голоса в текст). Для задействования режима голосового ввода достаточно нажать и удерживать сенсорную клавишу пробела (Space) на клавиатуре, после чего вы сможете говорить так долго как захотите — всё сказанное вами будет переведено программой в текст.

Для активации голосового ввода в «Gboard» достаточно нажать и удерживать пробел

Приложение абсолютно бесплатно, поддерживает несколько десятков языков, среди которых и русский.

Заключение

Выше мной были перечислены программы для перевода вашей аудио записи голоса в текст, описан их общий функционал и характерные особенности.  Большинство подобных продуктов обычно имеет платный характер, при этом ассортимент и качество русскоязычных программ качественно уступает англоязычным аналогам. Особое внимание при работе с подобными приложениями рекомендую уделить вашему микрофону и его настройкам – это имеет важное значение в процессе распознавания речи, ведь плохой микрофон может свести на нет даже самый качественный софт рассмотренного мной типа.

it-doc.info

КАК ПРЕОБРАЗОВАТЬ ТЕКСТ В АУДИО

.

Возьмем любой текстовый документ. И открываем его в программе TextAloud(см. ниже). Программа на английском, но простая. Открыть документ можно через меню: File - Open. Или используя буфер обмена, выбрав: File - New article и вставив в окно программы свой тхт из буфера обмена. Затем нажав кнопку То file. Нужно запомнить куда программа сохранит готовый файл. Для русских текстов в окне Voice нужно чтоб был выбран голосовой движок Николая или Алены(см. ниже), мне больше нравится тембр голоса Николая. Резюме: 1.Закачать программу TextAloud. 2.К ней движок Николай. 4.Открыть текстовый файл или вставить текст из буфера обмена в окно TextAloud. 5.Записать аудио файл. 6.Наслаждаемся проделанной работой.

P.S. 1. - Не преобразовывайте большие текстовые файлы, лучше копировать текст кусками по 5-15 страниц, размер аудио файлов не будет очень большим. 2. - Если нужно перевести в аудио PDF документ: берем программу STDUViewer или любую которая может переводить PDF в TXT - режим Т(выделить текст). Копируем текст в буфер обмена и работаем как с любым текстовым документом.

ПРОГРАММЫ ДЛЯ ПРЕОБРАЗОВАНИЯ ТЕКСТА В АУДИО

Все программы в этом обзоре созданы (или имеют как функцию) для преобразования текста в аудио с помощью установленных голосовых движков, поэтому в описании буду указывать их особенности и личное мнение. Уточню некоторые нюансы. Программа может работать с голосовыми движками под SAPI 4 или 5, либо с обеими. Например, если только под SAPI 4, то с движками Digalo и Acapela. Текст. форматы – читаемые программой текстовые файлы. Аудио – поддерживаемые программой формат записи аудиофайлов. Интонация – набор настроек голосового движка. В стандартной «комплектации» (без интонации) можно изменять скорость, тембр и громкость речи только для всего текста, однако некоторые программы выделяют диалоги, повествования, комментарии и т.д., для каждой из них можно определить свой набор настроек(скорость, тембр и громкость). Это (то, что выделяют программы из текста) и буду указывать в пункте «Интонация».

Название TextAloud загрузить (depositfiles, vip-file) Автор NextUp TechnologiesСайт http://www.nextup.com/ Язык английскийПоддержка SAPI 4 и 5Текст.форматы txt,html,rtf,doc,pdfАудио mp3. Описание: Программа читает тексты, письма, Web страницы и документы которые Вы хотели бы услышать. Работы со словарями. Перекодировка текста на лету без воспроизведения! Учеба программы: интонации и дикции. Рекомендуем с голосовым движком Алена.

Название ICE Book Reader Pro (загрузить) Автор ICE GraphicsСайт http://www.ice-graphics.comЯзык русскийПоддержка SAPI 4 и 5Текст.форматы txt,rf,doc,htm,shtml,xml,xhtml,pdb,prc,tcr,lit,chm,fb2,xmlАудио wav,mp3Описание Это мощная читалка электронных текстов (книг), с возможностью записи аудиокниг. Минимум настроек - проста и удобна в эксплуатации.

Название AbooАвтор Петрухин Д.Сайт http://parovoz.com.ua/aboo/Язык русскийПоддержка SAPI 5Текст.форматы txt,html,htm,rtf,docАудио mp3Интонация обычный, диалог, примечаниеОписание Компактная программка с необходимым минимумом функций. Работа со словарями на зачаточном уровне. Работы с буфером обмена нет.

Название AudioBookАвтор Podlenko O.N.Сайт http://kom-pas.narod.ru/audiobook_net.htmЯзык русскийПоддержка SAPI 4 и 5Текст.форматы txt,html,htm,rtf,docАудио wav,mp3,wma,ogg,vox,au,aiffИнтонация автор, речь,реч м.,реч ж.,англОписание Компактная программа; возможности редактора словаря слабые; иногда «глючит»; не работает без .NET Framework версии 2.0.50727; может автоматически очищать текст от ошибок с произношением типа "ПРОСТРАНСТВА" на Digalo и Elan; автоматически разбивает книгу на фрагменты при записи

Название AudioBookMakerАвтор Anton RyazanovСайт http://www.audiobookmaker.com/Язык русскийПоддержка SAPI 4Текст.форматы txt,html,htm,shtml,rtf,docАудио mp3Интонация нетОписание Устаревшая уже программа, которая не имеет возможность выбора ускоренной записи; не регулируются настройки движка Elan (Nikolai16).

Название Govorilka (загрузить)Автор Anton RyazanovСайт http://www.vector-ski.com/vecsЯзык русскийПоддержка SAPI 4Текст.форматы txt,html,htm,shtml,rtf,docАудио mp3Интонация нетОписание. Это обновленный AudioBookMaker, с улучшенным интерфейсом и работы со словарями, но не работает настройка громкости; открывает большие файлы в DOS и Windows кодировке; чтение текста из буфера обмена.

Название KooBAudioАвтор Павлов М.Д.Сайт http://www.koobaudio.narod.ru/Язык русскийПоддержка SAPI 5Текст.форматы txt,html,htm,rtf,doc,fb2Аудио mp3Интонация повествование,речь,речь2, комментарииОписание Неплохая программа, которая разработана и "заточена" специально под движок ELAN Speech Cube Russian Nikolai; пакетная обработка; широкие возможности работы со словарями; собственный алгоритм обработки текста словарями для исправления произношения ударений движком; можно настроить форматирование имени и тэгов MP3 файлов; есть возможность разделения книги по оглавлению.

Название 2nd Speech CenterАвтор Zero LeeСайт http://www.zero2000.com/Язык английскийПоддержка SAPI 4 и 5Текст.форматы txt,html,htm,rtf,doc,eml,pdfАудио wav,mp3Интонация нетОписание Мощная на первый взгляд, но слабая по возможностям программа. Грузит процессор по полной. Работы со словарями нет. Ошибки при работе с движками. Есть работа с буфером.

Одна из лучших программ это - MP3book2005. Автор Шойтов-Харитановский В.Ю.Сайт http://mp3book2005.narod.ruЯзык русскийПоддержка SAPI 5Текст.форматы txtАудио wav,mp3,wma,ogg,amr,vmoОписание: Добротная программа, с приятным интерфейсом; Хорошие возможности работы со словарями; пакетная обработка; используемый алгоритм кодирования в MP3 позволяет полностью избавиться от неприятного "металлического" звучания; интегрированная система поиска "Библиотекарь" позволит очень быстро и просто найти нужное произведение; предварительная обработка текста с использованием функции "Поиск новых слов " позволит исключить их неправильное произношение в тексте произведения; функция "Поиск омографов" (слов с одинаковым написанием, но разным произношением). Используя возможности программы MP3book2005 и возможности современного компьютерного синтеза речи Вы сможете делать аудиокниги своими руками для себя и даже открыть собственную студию. Программа позволяет делать аудиозаписи различных форматов, как для традиционных MP3-плееров, так и для прослушивания аудиокниг на мобильных телефонах, причем наличие плеера на них не обязательно! Достаточно встроенного в мобильник диктофона и необходимого количества свободной памяти! Сменные flash-карты, только плюс.

Название BalabolkaАвтор FunnyWords (Ilya Morozov)Сайт http://www.cross-plus-a.comЯзык русскийПоддержка SAPI 4 и 5Текст.форматы txt,html,rtf,doc,pdfАудио mp3Интонация нетОписание Вполне качественная программа без особых «изысков»; проверка орфографии, словарь ударений для Katerina; ошибки при использовании словарей от движка Elan.

Название ABMSubtitlesАвтор Anton RyazanovСайт http://www.vector-ski.com/vecsЯзык русскийПоддержка SAPI 4Текст.форматы txt,srtАудио wavИнтонация нетОписание Программа для чтения субтитров голосом и записи в wav. Немного сырая и малопригодная для этих целей, т.к. длинные фразы в диалогах не успевает проговорить и начинает следующую.

ВыводыЛучшие программы TextAloud, ICE Book, MP3Book2005, и Balabolka. Взято на сайте http://sovserv.ru.

 

 

s30215098031.mirtesen.ru

Программы для расшифровки аудиозаписей в текст

Сразу нужно сказать — программы, автоматически распознающей и переводящей речь в текст, не существует. Во всяком случае, пока. Поэтому расшифровка записей в текст на данный момент производится только вручную. В этой статье представлен обзор программ, помогающих сделать этот нелегкий процесс более удобным, быстрым и качественным.

RSplayer  V1.4 Данная программа имеет много возможностей по обработке аудиофайлов, но здесь мы рассмотрим только использование ее для расшифровки аудио.

Для удобства расшифровки аудиофайлов в программе предусмотрен простой текстовый редактор, в верхней части окна которого размещается аудиоплейер. Существуют следующие комбинации клавиш: левый Alt – курсорная стрелка вниз – остановка воспроизведения, левый Alt – курсорная стрелка вверх – возобновление воспроизведения с позиции минус пять секунд от позиции остановки воспроизведения (очень удобная функция для расшифровщика). Эти же комбинации клавиш действуют из всех программ Windows, что позволяет использовать для расшифровки, например, Microsoft Word.

Программа проста в использовании, все, что вам необходимо сделать для работы — это загрузить запись в программу, запустить воспроизведение и набивать текст, используя для остановки и возобновления указанные выше комбинации клавиш.

Программа для обработки и расшифровки аудиозаписей в текст RSplayer  V1.4 распространяется бесплатно; скачать ее, а также получить более подробную информацию о ней можно на сайте разработчика http://www.recsound.org/rsplayer.html

Dragon Dictate — это американская программа для распознавания речи (естественно, английской), используется для перевода речи в текст, а также для передачи голосовых команд компьютеру. На Dragon Dictate были основаны отечественные версии «Диктант»,"Комбат", "Горыныч", «Диктограф».

Прямо скажем, все отечественные программы оставляют желать лучшего.С настройкой программ придется изрядно повозиться — настроить их на тембр собственной речи, занести новые слова в словарь. Впрочем, чем больше работаешь в этих программах, тем больше они «привыкают» к голосу и понимают вас, но для этого нужно время, и немалое.

Вряд ли хоть одну из них можно считать полноценной программой для транскрипции речи в текст.  Даже в идеальных условиях, при отсутствии шумов, при четком произношении — ошибок масса. Кроме того, приходится постоянно отвлекаться на просмотр вводимого текста, постоянно исправлять неточности. В итоге скорость расшифровки раза в 2 ниже, чем при вводе вручную с клавиатуры.

Что касается расшифровки интервью, семинаров, конференций пр., то названные программы для подобной работы не подходят совершенно, так как понимают речь только своего «хозяина». Желающие поближе познакомиться с различными "горынычами" найдут в Интернете большое количество бесплатных версий этих программ.

Транскрайбер «Цезарь» от Центра Речевых Технологий. Удобная программа, легкая в эксплуатации, работа ведется в редакторе Microsoft Word (в 2003 и в 2007), есть функция шумоочистки и замедления голоса, что иногда очень спасает при расшифровке «сложных» записей.

Для тех, у кого большой опыт расшифровки и хорошая скорость печати, наоборот, есть функция ускорения записи. Управление воспроизведением осуществляется как автоматически на панели транскрайбера, так и с помощью специальной ножной педали, которая предоставляется в комплекте с программой. Есть автоматическая проверка орфографии, что позволит избежать ошибок и опечаток.

Очень удобно то, что заранее можно задать имена участников и потом вводить их одним нажатием клавиши, что также ускоряет работу. "Цезарь" поддерживает расшифровку звука во всех распространенных форматах. Минус у этой программы только один — она платная.

Узнать более подробную информацию о программе можно на сайте Центра Речевых Технологий http://www.speechpro.ru/product/transcription/cesar

Вместо «Цезаря» можно не менее успешно использовать проигрыватель AIMP — отличный бесплатный вариант, скачать можно на официальном сайте http://www.aimp.ru/.

В настройках отрегулируйте функции «Немного перейти назад» и «Немного перейти вперед» — они нужны, чтобы заново прослушать последний фрагмент или перейти на фрагмент вперед.

Вызвав эквалайзер, можно уменьшить значение Speed и увеличить значение Pitch. При этом скорость воспроизведения замедлится, но высота голоса (если правильно подобрать Pitch) — не изменится. Постарайтесь так подобрать эти два параметра, чтобы можно было практически синхронно со звуком набирать текст, только иногда останавливая запись. Если все удобно и правильно настроить, то набор будет занимать гораздо меньше времени.

Программу для расшифровки аудио Express Scribe легко бесплатно скачать в Интернете. Поддерживает огромное количество форматов записи, имеет интеграцию с Microsoft Word. Доступна отмотка назад по нажатию одной кнопки, интервал отмотки в секундах можно настраивать любой.

Также изменяется скорость проигрывания, есть функция шумоочистки. Программа хорошая, легкая в освоении, несмотря даже на то, что интерфейс на английском языке, так что можно смело рекомендовать ее для работы. TextService активно использует эту программу для расшифровки интервью, круглых столов, конференций, семинаров, и др.

Надеемся, статья пригодится и поможет в выборе программ для расшифровки аудиозаписей. Учитывая черепашью скорость развития анализаторов речи, похоже, что работа стенографисток, машинисток и операторов будет актуальна еще очень долгое время. И может это и к лучшему, ведь ни одна программа не сможет до конца понять человеческую речь, верно интерпретировать речевые и эмоциональные акценты. Плюс к этому стенографистки-машинистки сохранят свою работу — борьба с безработицей)

В свою очередь хотим напомнить, что готовы выполнить для вас расшифровку аудиозаписи в текст любой тематики в любое время дня и ночи, что конечно сэкономит ваше время.

txt-service.com

Как преобразовать аудио файл в текст

Вы скажите, уважаемый читатель, что чудес не бывает! И с Вами нельзя не согласиться, однако, если посмотреть на некоторые современные интернет технологии, то задумаешься, а может быть есть они, чудеса техники. 
Ну, например, Вы говорите, а в это же время синхронно появляется текст, Вы можете записать его в выбранном формате (допустим в Word)  на  языке ввода. То есть, если аудио файл вводится на испанском языке, то и текст будет набираться на испанском языке.
Или другой пример, Вы записали на иностранном языке в видео или аудио формате интересующую Вас информацию, а затем преобразуете её в текстовый файл, который можете перевести и прочитать уже на своём родном языке, изучить или передать заинтересованным лицам, или просто сохранить на любом цифровом носителе. Ну разве это не чудо?
Да, действительно, уже не чудо, а просто возможность с помощью специальных программ преобразовывать аудио файлы в текстовые файлы. И сегодня я хочу Вас познакомить с такими программами их ещё называют голосовым блокнотом. С одной такой программой я научился совсем недавно работать. Полную информацию о ней Вы найдёте на сайте http://speechpad.ru.

Видео объяснение работы с голосовым блокнотом Speechpad.ru

Познакомиться с работой этой программы можно на вышеназванном сайте на странице: «Видео уроки от Speechpad.ru», а вот и ссылка на эту страницу speechpad.ru/help.php, где размещены 7 видео уроков, изучив их Вы сможете самостоятельно работать в этом голосовом блокноте.
Предлагаю посмотреть один из видео уроков, из которого Вы узнаете, как войти в кабинет пользователя голосового блокнота и какие функции в нём доступны пользователю.

 Новинка: плагин-«Голосовой набор текста»

И в заключение этого поста мне хочется познакомить Вас, уважаемый читатель, ещё с одной чудесной возможностью, которую предоставил всем нам, Виктор Шурыгин, он является автором плагина «Голосовой набор текста».
Этот плагин http://s.info-teach.ru/url_36_14.html можно установить на любом сайте, блоге, которые работают на «движке» WordPress, и тексты можно создавать без использования клавиатуры, а просто произносить вслух, в микрофон то, о чём хотели написать.
Бывает иногда так, что мысли бегут вперёд и мы не успеваем их запечатлеть на бумаге или экране монитора, поэтому, что-то упускаем или забываем, я имею ввиду мысли, идеи и т. д., а при этом методе вероятность такого рода потерь сократиться, я думаю многие со мной согласятся.
Единственное условие для оптимальной работы плагина, это наличие высокоскоростного Интернет соединения, так как при невысоких скоростях, Вы не получите хороших результатов, в чём я убедился на собственном опыте.
И ещё Вам на ПК необходимо установить расширение: https://chrome.google.com/webstore/detail/voice-search/hhfkcobomkalfdlmkongnhnhahkmnaad 
Итак, посмотрите два видео-урока о том, как работает этот плагин, как сделать его установку на сайт, блог, а также как выполнить его настройку, обо всём этом рассказывает его автор Виктор Шурыгин.
 

 Уважаемые, друзья, напишите, пожалуйста, в комментариях к этому посту о Вашем опыте при работе с плагином, всё ли у Вас получилось или есть проблемы. Жду Ваших отзывов.

 

 

 

 

Поделиться в соц. сетях

Share On:

About The Author

One Response

takmak51.ru

Voco: Windows-приложение для преобразования речи в текст

Александр Ерохин

Чувствуется, что программа заточена под русский язык, в отличие от целого ряда аналогов. Поэтому при наборе меньше ошибок, особенно при расстановке знаков препинания. Без проблем скачивается и устанавливается, хотя даже базовая версия весит 941 мегабайт. Удобна в эксплуатации, хотя требует качественной гарнитуры. Профессиональная версия, по сравнению с базовой, на мой взгляд все-таки дороговата. В целом рекомендую тем, для кого набор текстов постоянная работа, но нет времени и желания осваивать слепую печать.

Майя Булякарова

В целом программа очень порадовала, не смотря на некоторые трудности, которые не критичны для ее использования. Конечно, печатать гораздо быстрее, но перепечатывать рукописный текст программа помогает все же быстрее.Voco отличная программа и думаю в дальнейшем будет еще лучше и мне приятно было ее использовать и пользоваться ей в дальнейшем.

Дарья Вивдюк

Хорошая программа, среди других аналогичных значительно выделяется, хотелось бы улучшить качество распознавания не очень качественных записей.

Елена Тороп

Я занимаюсь расшифровкой аудио-и видеозаписей. Благодаря использованию программы Voco.Prof с наушниками и педалью, удалось повысить скорость распознавания текста ровно в 2 раза. К сожалению, в своей работе я зачастую имею дело с непрофессиональными записями (тренинги, телефонный разговоры и пр.), поэтому распознавание текста из аудиофайлов в программе Voco не совсем устраивает (не помогло и повышение точности распознавания). Но Ваша программа постоянно совершенствуется, надеюсь в новой версии распознавание непрофессиональных записей будет лучше. И еще, что мне хотелось бы видеть в вашей программе - возможность вставлять тайм-коды, поскольку зачастую заказчики просят это делать. Мне нравиться, как это реализовано в программе lossPlay. В остальном же - программа замечательная! Желаю вам дальнейших успехов в ее совершенствовании!

Виктор

Слышал об этой программе и искал её давно! И вот, наконец, воспользовался! Приходилось диктовать довольно длинные документы, потому не всегда программа распознаёт некоторые слова, особенно - специфичные. Пришлось наговорить в словарь много редко употребляемых профессиональных юридических терминов. Но, уверен, что со временем и сама программа усовершенствуется, и я приспособлюсь, да и не сомневаюсь, что и вы её доведёте до высшего уровня! Хотя меня устраивает и в таком состоянии! Ведь всё равно в жизни не бывает"по-щучьему велению"! Нужно и самому работать! В целом устраивает, за что вам очень благодарен! Рад, что пользуюсь одним из первых! И советую своим знакомым её! УДАЧИ вам!

Пользователь из Казахстана

Буду рекомендовать другим!!! Отличный продукт, продуманный маркетинг.

Бохонько Иван.

Еще раз спасибо большое. Отдельно хочу лично поблагодарить всех разработчиков voco за великолепное творение!!! Программа сделанная вами, это поистине уникальная разработка! Искреннее вам всем спасибо! Низкий вам поклон за труд, и многая лета !!!

Илья Баскакин, переводчик:

Приятно поразило то, что она вообще работает. Честно говоря, не ожидал, что с безударными, редуцируемыми русскими флексиями кому-то удастся хотя бы в таком объеме разобраться. Т.е. движок выше всяких похвал. Попробовал с помощью Voco сделать пару заказов - в принципе, работать можно, но какого-то однозначного выигрыша во времени не получилось. Намертво вколоченные за четверть века рефлексы письменного переводчика корежить непросто. Хотя и полезно с т.зр. убегания от старины Альцгеймера :) Справедливости ради, к Dragon это в равной степени относится.

Сергей Денисенко

Пишу контент сайта. Много информации в виде мысли. Программа позволяет продумывать текст не отвлекаясь на печать. Очень удобно. Благодарю Вас.

Александр Макаров:

Понятный и простой интерфейс, что радует. Распознавание быстрое, но много ошибок. Однако их легко править, так как всё синхронно. В целом хорошо, учитывая отсутствие аналогов.

www.speechpro.ru


Смотрите также