суббота, 1 июня 2024 г.

Чертог Дракона

А вот и ещё одна большая по меркам "Гинтамы" арка - сразу на 4 серии. И примечательна она ещё тем, что с ней мы начинаем набивать руку на полном дубляже.

Первая серия вышла по той же старой привычной схеме - с генерацией фраз одним голосом, только ещё следом добавили преобразование на разные роли. И со всеми вытекающими, конечно: куча неверных звуков на перегоне - масса заплаток прямо в теле звукового файла - рваная и ненатуральная речь на выходе.

Но ко второй серии попалась под руку ещё одна софтина. По возможностям и естественности речи сопоставима с сервисом от ElevenLabs, но запускается локально. Естественно, мимо такой шикарной вещи мы пройти никак не могли :)

Правда, и неприятный недостаток вышеупомянутого сервиса там тоже был: нельзя прямо указать, где в слове нужно делать ударения. Тут спасает способ, отработанный на первой серии: генерим правильную речь, преобразуем в примерно нужный голос и латаем...

Чем дальше, тем опыта больше, и к четвёртой серии получилось уже более-менее прилично. Хотя нас пока что всё равно не до конца устраивает - так что переделывать косяки из первых серий пока не будем, а выйдем сначала на приемлемый уровень.

Комментариев нет:

Отправить комментарий