Что это за голос речевого синтезатора?
Помогите пожалуйста найти, какой синтезатор речи это озвучивает:
Помогите пожалуйста найти, какой синтезатор речи это озвучивает:
Open AI опять решили подразнить обычных пользователей и предоставили ограниченный доступ к своей новой нейросети для преобразования текста в голос - Voice Engine. Она позволяет скопировать голос человека из 15-секундной аудиозаписи:
Технология как и ElevenLabs поможет компаниям, преподавателям и инфлюенсерам обращаться к аудитории на любом языке собственным голосом, причем сохранив родной акцент.
Доступ к ней получили пока только серьезные компании HeyGen, Age of Learning и Dimagi.
HeyGen вообще красавчики - используют технологии как ElevenLabs, так и OpenAI, чтобы предложить своим пользователям более широкие возможности при создании видео с искусственным интеллектом.
Так вот, тестирование Voice Engine показало как можно использовать технологию во благо в различных отраслях. Вот несколько ранних примеров: перевод контента, помощь в чтении и поддержка лиц, не способных говорить, восстановление голоса людям с нарушениями речи, улучшение обслуживания в отдаленных районах.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.
Open AI показали нейросеть, которая может клонировать голос — Voice Engine.
Именно Voice Engine дал «голос» ChatGPT, а теперь еще и умеет клонировать чужие голоса по 15 секундам аудио образца.
Open AI заявляет, что Voice Engine может помочь детям и взрослым, которые не умеют читать, воспринимать текстовый контент. По словам разработчиков, модель не только сотрёт языковые барьеры, но и позволит блоггерам и компаниям общаться с аудиторией на любом языке собственным голосом. Также этот инструмент будет полезен людям, которые по каким-либо причинам потеряли голос или столкнулись с нарушением речи.
Простым смертным модель всё ещё нельзя попробовать, пока ее тестируют it - компании. И не спроста пока ее не выпускают в широкие массы, Open AI серьезно подстраховываются.
Тем, кто беспокоится о мошенничестве, Open AI серьезно позаботилось о безопасности.
Во-первых, партнеры, тестирующие Voice Engine, согласились с их политикой использования, которая запрещает выдавать себя за другое физическое лицо или организацию без согласия или законного права.
Во-вторых, все должны получить согласие первоначального докладчика, и мы не разрешаем разработчикам создавать способы для отдельных пользователей создавать свои собственные голоса.
В-третьих, партнеры должны сообщать своей аудитории, что голоса, которые они слышат, генерируются искусственным интеллектом.
В-четвертых, Open AI внедрили ряд мер безопасности, включая водяные знаки для отслеживания происхождения любого звука, генерируемого Voice Engine.
В-пятых, в США уже запретили звонки с использованием сгенерированных голосов из-за случая спам-звонков от Байдена )) Остальные страны тоже подтянутся в стремлении ограничить неэтичное использование голосовых технологий ИИ.
Подписывайтесь на ИИшница 🍳 - тут все самое интересное из мира новых технологий и нейросетей 🤖
Одна вакансия, два кандидата. Сможете выбрать лучшего? И так пять раз.
Всем, доброй ночи.
Имеется два компьютера на базе windows 10 и 11.
Накаждом из этих компьютеров установленна программа NVDA, она используется незрячими и слабовидящими людьми для взаимодействия с компьютером при помощи клавиатуры, и синтеза речи.
То есть вся работа у незрячего происходит при помощи этой программы с клавиатурой и синтезатором речи, который озвучивает все действия пользователя.
Тут начала появляться проблема, что есть родственники, у них ноутбук, жесткий диск на терабайт, система windows 10.
По привычке они все скидывали на диск ц.
Сегодня залез при помощи удаленного управления компьютером при помощи программы ТNVDA, у этой программы имеется хорошее дополнение для управление другим компьютером, правда это дополнение ставится дополнительно, дополнение должно быть у каждого установлено, чтобы была возможность подключаться к другому компьютеру при помощи адреса сервера и ключа, который можно создать самому или сгенерировать дополнением автоматически.
Более быстрым способом решения задачи решил поступить так, что просто взял и переместил все файлы с рабочего стола на диск д.
Может быть я сделал совсем неправильно, как нужно было это сделать.
Просто не имею желание сидеть и выбирать каждый файлик, что оставлять, а что просто в другое место скидывать.
Я предупредил их об этом, посмотрю, что будет дальше!
Надеюсь, что будут разбираться, куда что кидать, так как диск ц на 118 гигабайт, а освободил в районе 37.3 гигабайта, а точнее в районе 43 гигабайта.
Просто все скачивали сразу на рабочий стол, чтоб потом быстрее искать и с этим работать.
А вот как оно оказывается, что на этом диске оставалось в районе 300 мегобайт свободного места всего лишь!
Ка говорит Леонид Семенович Каневский: "А это совсем уже другая история".
Не секрет, что у Baldur's Gate 3 не было оригинальной русской озвучки. Мы сделали так, что главные персонажи из игры могут говорить на русском языке. Некоторые говорят с небольшим акцентом … а некоторые с заметным акцентом.
Послушайте сами, убедитесь:
Попробовать можно тут - @silero_voice_bot - https://t.me/silero_voice_bot
К вопросу о том насколько это правомерно/законно/человечно использовать чужие голоса в обучении нейросетей (в контексте обновления киберпанка): Если всё берётся из общего доступа и не нацелено на оскорбление/дискредитацию/унижение человека, то не думаю, что кто-то может сказать что-то против, кроме CDPR. А самим CDPR во-первых: выгодно чтобы у игры была хоть и неофициальная, но всё же озвучка на русском; во-вторых: что они сделают рандомному пользователю из инета, клепающему мод на игру? Некоторые умудряются DENUVO взламывать и им ничего не делается, а пиратская озвучка намного менее серьёзный проступок, если проступок вообще.
Поэтому болею сейчас за всех, кто трудится над озвучкой обновления нейросетями!
Привет, любители технологий! Сегодня я рад представить вам S.T.A.R.K. (Speech and Text Algorithmic Recognition Kit). Если вы когда-либо мечтали создать голосового ассистента, который будет современным, продвинутым и невероятно интуитивным, S.T.A.R.K. - лучшее решение.
Автономность и конфиденциальность: S.T.A.R.K. работает полностью на устройстве, гарантируя сохранность ваших данных.
Распознавание контекста: С S.T.A.R.K. вы можете легко определять контекст и параметры для последующих запросов, а также одновременно выполнять несколько команд.
Асинхронные команды: Запустите задачу и продолжайте использовать ваш голосовой ассистент. S.T.A.R.K. уведомит вас о завершении.
Множественные ответы: Получайте обновления в реальном времени для текущих задач, будь то мониторинг процесса загрузки или отслеживание доставки.
Продвинутый синтаксический анализ: Специальная синтаксическая система упрощает извлечение любого параметра из строк.
Расширяемость с помощью ведущих языковых моделей: Улучшите когнитивные способности S.T.A.R.K., интегрируя его с ведущими языковыми моделями, такими как ChatGPT.
Поддержка нескольких языков: Взаимодействуйте со своим голосовым ассистентом на нескольких языках.
Полная настройка: Создавайте сложные команды, интегрируйте различные голосовые или текстовые интерфейсы и даже переопределяйте существующие классы.
Поддержка сообщества: Присоединяйтесь к репозиторию STARK-PLACE и пользуйтесь библиотекой расширений от сообщества.
Для более подробного изучения каждой функции и понимания всех возможностей S.T.A.R.K. посетите официальную документацию и репозиторий на GitHub. Если вам понравился фреймворк, не забудьте добавить звезду ⭐ репозиторию.
Справились? Тогда попробуйте пройти нашу новую игру на внимательность. Приз — награда в профиль на Пикабу: https://pikabu.ru/link/-oD8sjtmAi
У меня есть желание, финансовые ресурсы, мощности GPU фермы, а так же некоторые способности, что бы озвучить DLC Сyberpunk 2077 Phantom liberty полностью на русском языке синтезированными голосами которые вы с трудом отличите от реальных голосов актеров озвучки. Для этого мне потребуются семплы голосов из оригинальной игры, умельцы которые помогут их взлечь уже нашлись.
Суть моей затеи следующая:
1) Набираю по 20 минут голосов всех персонажей игры,
2) Обучаю нейросеть голосам и создаю все голоса персонажей игры ну или большую часть ключевых (просто неписей я думаю можно озвучить 1 голосом)
3) Выгружаю все субтитры из DLC
4) Пишу скрипт который будет по API загружать тексты в мою нейросеть для озвучивания
4) Создаю все звуковые файлы с голосами персонажей для текстовых файлов субтитров. (самое трудозатратное и по деньгам и по времени)
5) Пишу скрипт который все голоса упакует в игру обратно
6) Получаю игру с русской озвучкой
Я не уверен, что всю получится, на каждом этапе можно споткнуться (навыки программирования у меня достаточно слабые) а ведь ещё есть такое понятие как липсинк. Ну вообщем идея такая. Демонстрация возможностей синтеза голосов можете увить на видео ниже. В этом же видео будут приведены в пример куски оригинальных голосов с которых нейросеть обучалась. Очевидно, что чем больше будет голосовых данных с разными эмоциями тем точнее и интереснее можно будет делать озвучку. В идеале 20 минут голоса на каждого персонажа.
Обсуждение проекта русификации происходит на на этом дискорд сервере: