Нам повезло с проектом – предпринимателю нужно было наполнять блог в телеграм и наполнять его экспертным контентом. Бесконечно… Мы конечно согласились. Не так уж часто приходят крупные заказчики надолго.
Конечно клиенту хотелось, чтобы в его тг публиковались именно его мысли. Никто с этим и не спорил. Конечно, а чьи же? С целью получить крупную порцию этих мыслей мы предложили брать аудио-интервью. Потом превращать их в текст и записывать основные мысли.
С какими трудностями мы столкнулись
Итак, первое интервью есть – это 44 минуты слов, произносимых с высокой скоростью и приправленных айти-терминами, английскими словами и множественными словами-паразитами.
Я уверена, что любой человек, если он не профессиональный ведущий, говорит примерно так же, как и наш клиент. Конечно, есть люди, которые часто дают интервью, и они уже привыкли говорить четко и с расстановкой. Остальные – обычно говорящие граждане…
Как аудио- или видеозапись превратить в текст
Полученную аудиозапись предстояло превратить в текст. И сделать это надо было чем быстрее, тем лучше. У нас не было времени на медленные танцы, и каждый день был нужен новый пост. Хорошо, что есть очень умный парень по имени Гугл. Считается, что он знает все. Задаем в поиск: «как взять интервью у клиента онлайн и расшифровать аудио». И вот что получаем:
Засада в том, что нужно открывать все сервисы по порядку и проверять.
Speechpad. Онлайн-сервис Speechpad позволяет бесплатно через браузер Google Chrome переводить речь в текст. Это просто: нужно нажать Shift+Ctrl+S. Появится микрофон. Дальше включаем запись, и появляется текст. Чего проще? Но текст у меня больше странички не записывался. Большие тексты транскрибировать невозможно, наверное их нужно было сжимать. Но времени на это не было.
Остальные почти все оказались платными. И на многих нужно было регистрироваться.
Так, на zapisano.org – нужно было платить от 19 до 15 рублей за одну минуту. Написано, что это «единственный в России» сервис транскрибирования с личными кабинетами.
realspeaker.net – более скромный, и расшифровка 1 минуты аудио стоит 16 рублей. Да не жалко 1600 рублей, например. Но это же не решение проблемы! Интервью у нас будет не одно, и не два.
Про Express Scribe написано что-то очень красивое – и бесплатный, и профессиональный, и с множеством функций, «включая управление скоростью воспроизведения, механизм интеграции речи в текст и управление педалями». Сервис нужно было скачивать.
Времени не было, но попробую обязательно. Потом.
Нейронка
В телеграме я нашла чат-бот SaluteSpeech, и это спасло меня на какое-то время. Запись была, напомню, на 44 минуты и весила она примерно 40 Мб. Все действия были «связанные одной целью и скованные одной цепью», как в старой песне Nautilus.
Это когда: чат-бот расшифрует аудио, если файл весит не больше 20 Мб. А если больше, его нужно поделить. Ищем сервис, который поможет в этом…
От больших аудио- чат-бот отказывается. Получается – взять и поделить (как у Шарикова в «Собачьем сердце»). Для этого нашелся прекрасный сервис: products.aspose.app. Интуитивно понятный.
Файлов получилось 13, на это ушло минут 40. Загружаю в бот, он выдает небольшие стенограммы, уходит еще час как минимум.
Тексты без точек и запятых. Их нужно перенести в гуглдок и редактировать ручками (и головой, конечно). Это очень сложно еще и потому, что сам наш герой говорит практически скороговоркой. Кое-как пишем первые посты, где находим хоть что-то понятное. И не факт, что это нравится клиенту.
Делаю вывод: да, с помощью вышеупомянутых сервисов превратить аудиофайл в текст можно. Если:
- файл не очень большой,
- спикер говорит внятно и членораздельно,
- вы понимаете в теме,
- у вас есть достаточно времени для редактирования.
- Но мы же обещали, мы можем все! Значит, разбираемся дальше.
Есть контакт
Когда было написано уже постов 10, клиент прислал еще один материал: Zoom-конференцию, и здесь все было намного проще. У Zoom много возможностей, но опять-таки – в них нужно разбираться. В саппорте у Zoom – десятки советов. И первый – нужно зарегистрироваться и войти в учетную запись. А функция расшифровки аудиосвязи поддерживает только английский язык. Так как я не полиглот и русскоязычный копирайтер, мне тоже это не подходило.
А в самом Zoom на самом деле очень много полезного. Но, как в и Фейсбуке, – очень сложно найти концы (читай, начало) своей проблемы.
И тут судьба (читай Гугл) меня забрасывает на еще один очень сервис, который за меня решил вопрос: https://speechlogger.appspot.com/ru/.
Я даже на всякий пожарный стала расшифровывать по кусочкам – как бы ничего не пропало. Но это было лишнее. Тут и правда все просто: включаешь микрофончик, а потом запись (на чем угодно, хоть на телефоне), делаешь хороший звук. И все – можно идти заниматься своими делами.
Текст будет сам по себе появляться, при этом можно включить «Автопунктуацию». И даже можно записывать английскую речь, которая будет автоматически переводиться в превращаться в текст на русском.
Как работать с клиентом
Итак, текст у меня был, но какой! Никакой)). Что говорил человек? Было принято решение обговорить с ним подробнее детали. О чем?
- Попросить подумать, чем именно он хочет поделиться в блоге
- Разделить все пришедшие мысли на этапы
- Подумать о темах для каждого этапа
- Ответить по пунктам на вопросы, которые мы составим для каждой темы.
- И для каждой же отдельно делать небольшие аудиофайлики.
После этого, я думаю, аудиозаписи можно будет записывать намного проще. Посмотрю, что получится. И поделюсь, конечно. Может, кому-то пригодится.