Экспертный контент для блога. Как превратить аудиозапись в текст

Интервью

Нам повезло с проектом – предпринимателю нужно было наполнять блог в телеграм и наполнять его экспертным контентом. Бесконечно… Мы конечно согласились. Не так уж часто приходят крупные заказчики надолго.

Конечно клиенту хотелось, чтобы в его тг публиковались именно его мысли. Никто с этим и не спорил. Конечно, а чьи же? С целью получить крупную порцию этих мыслей мы предложили брать аудио-интервью. Потом превращать их в текст и записывать основные мысли.

С какими трудностями мы столкнулись

Итак, первое интервью есть – это 44 минуты слов, произносимых с высокой скоростью и приправленных айти-терминами, английскими словами и множественными словами-паразитами.

Я уверена, что любой человек, если он не профессиональный ведущий, говорит примерно так же, как и наш клиент. Конечно, есть люди, которые часто дают интервью, и они уже привыкли говорить четко и с расстановкой. Остальные – обычно говорящие граждане…

Как аудио- или видеозапись превратить в текст

Полученную аудиозапись предстояло превратить в текст. И сделать это надо было чем быстрее, тем лучше. У нас не было времени на медленные танцы, и каждый день был нужен новый пост. Хорошо, что есть очень умный парень по имени Гугл. Считается, что он знает все. Задаем в поиск: «как взять интервью у клиента онлайн и расшифровать аудио». И вот что получаем:

Ксан из гугла Как превратить аудиозапись в текст

Засада в том, что нужно открывать все сервисы по порядку и проверять.

Speechpad. Онлайн-сервис Speechpad позволяет бесплатно через браузер Google Chrome переводить речь в текст. Это просто: нужно нажать Shift+Ctrl+S. Появится микрофон. Дальше включаем запись, и появляется текст. Чего проще? Но текст у меня больше странички не записывался. Большие тексты транскрибировать невозможно, наверное их нужно было сжимать. Но времени на это не было.

Остальные почти все оказались платными. И на многих нужно было регистрироваться.

Так, на zapisano.org – нужно было платить от 19 до 15 рублей за одну минуту. Написано, что это «единственный в России» сервис транскрибирования с личными кабинетами.

realspeaker.net – более скромный, и расшифровка 1 минуты аудио стоит 16 рублей. Да не жалко 1600 рублей, например. Но это же не решение проблемы! Интервью у нас будет не одно, и не два.

Про Express Scribe написано что-то очень красивое – и бесплатный, и профессиональный, и с множеством функций, «включая управление скоростью воспроизведения, механизм интеграции речи в текст и управление педалями». Сервис нужно было скачивать.

Времени не было, но попробую обязательно. Потом.

Нейронка

В телеграме я нашла чат-бот SaluteSpeech, и это спасло меня на какое-то время. Запись была, напомню, на 44 минуты и весила она примерно 40 Мб. Все действия были «связанные одной целью и скованные одной цепью», как в старой песне Nautilus.

Это когда: чат-бот расшифрует аудио, если файл весит не больше 20 Мб. А если больше, его нужно поделить. Ищем сервис, который поможет в этом…

От больших аудио- чат-бот отказывается. Получается – взять и поделить (как у Шарикова в «Собачьем сердце»). Для этого нашелся прекрасный сервис: products.aspose.app. Интуитивно понятный.

Файлов получилось 13, на это ушло минут 40. Загружаю в бот, он выдает небольшие стенограммы, уходит еще час как минимум.

Тексты без точек и запятых. Их нужно перенести в гуглдок и редактировать ручками (и головой, конечно). Это очень сложно еще и потому, что сам наш герой говорит практически скороговоркой. Кое-как пишем первые посты, где находим хоть что-то понятное. И не факт, что это нравится клиенту.

Делаю вывод: да, с помощью вышеупомянутых сервисов превратить аудиофайл в текст можно. Если:

  • файл не очень большой,
  • спикер говорит внятно и членораздельно,
  • вы понимаете в теме,
  • у вас есть достаточно времени для редактирования.
  • Но мы же обещали, мы можем все! Значит, разбираемся дальше.

Есть контакт

Когда было написано уже постов 10, клиент прислал еще один материал:  Zoom-конференцию, и здесь все было намного проще. У Zoom много возможностей, но опять-таки – в них нужно разбираться. В саппорте у Zoom – десятки советов. И первый – нужно зарегистрироваться и войти в учетную запись. А функция расшифровки аудиосвязи поддерживает только английский язык. Так как я не полиглот и русскоязычный копирайтер, мне тоже это не подходило.

А в самом Zoom на самом деле очень много полезного. Но, как в и Фейсбуке, – очень сложно найти концы (читай, начало) своей проблемы.

И тут судьба (читай Гугл) меня забрасывает на еще один очень сервис, который за меня решил вопрос: https://speechlogger.appspot.com/ru/.

Сервис для перевода аудио в текст

Я даже на всякий пожарный стала расшифровывать по кусочкам – как бы ничего не пропало. Но это было лишнее. Тут и правда все просто: включаешь микрофончик, а потом запись (на чем угодно, хоть на телефоне), делаешь хороший звук. И все – можно идти заниматься своими делами.

Текст будет сам по себе появляться, при этом можно включить «Автопунктуацию». И даже можно записывать английскую речь, которая будет автоматически переводиться в превращаться в текст на русском.

Как работать с клиентом

Итак, текст у меня был, но какой! Никакой)). Что говорил человек? Было принято решение обговорить с ним подробнее детали. О чем?

  • Попросить подумать, чем именно он хочет поделиться в блоге
  • Разделить все пришедшие мысли на этапы
  • Подумать о темах для каждого этапа
  • Ответить по пунктам на вопросы, которые мы составим для каждой темы.
  • И для каждой же отдельно делать небольшие аудиофайлики.

После этого, я думаю, аудиозаписи можно будет записывать намного проще. Посмотрю, что получится. И поделюсь, конечно. Может, кому-то пригодится.

Закажите тексты для сайта

Заполните короткий бриф, и мы свяжемся с вами в ближайшее время!