Синтез речи: истории из жизни, советы, новости, юмор и картинки — Горячее

user4932718

17 дней назад

Лига программистов

Что это за голос речевого синтезатора?⁠⁠

Помогите пожалуйста найти, какой синтезатор речи это озвучивает:

[моё] Синтез речи Голосовое управление Искусственный интеллект Видео Вертикальное видео

5

Neurosonya

2 месяца назад

Серия новости

Open AI опять дразнят! Новая нейросеть скопирует голос за 15 секунд⁠⁠

Open AI опять решили подразнить обычных пользователей и предоставили ограниченный доступ к своей новой нейросети для преобразования текста в голос - Voice Engine. Она позволяет скопировать голос человека из 15-секундной аудиозаписи:

Подробнее в блоге OpenAI

Технология как и ElevenLabs поможет компаниям, преподавателям и инфлюенсерам обращаться к аудитории на любом языке собственным голосом, причем сохранив родной акцент.

Доступ к ней получили пока только серьезные компании HeyGen, Age of Learning и Dimagi.

HeyGen вообще красавчики - используют технологии как ElevenLabs, так и OpenAI, чтобы предложить своим пользователям более широкие возможности при создании видео с искусственным интеллектом.

Так вот, тестирование Voice Engine показало как можно использовать технологию во благо в различных отраслях. Вот несколько ранних примеров: перевод контента, помощь в чтении и поддержка лиц, не способных говорить, восстановление голоса людям с нарушениями речи, улучшение обслуживания в отдаленных районах.

Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.

Показать полностью 1

[моё] Инновации Технологии Искусственный интеллект Будущее Полезное Нейронные сети Openai Голос Клонирование Синтез речи Копия Копирование Digital Видео Длиннопост

1

AIshnytza

2 месяца назад

Искусственный интеллект

Серия Новости

Нейросеть для копирования голоса от Open AI и меры безопасности от мошенничества⁠⁠

Open AI показали нейросеть, которая может клонировать голос — Voice Engine.

Именно Voice Engine дал «голос» ChatGPT, а теперь еще и умеет клонировать чужие голоса по 15 секундам аудио образца.

Open AI заявляет, что Voice Engine может помочь детям и взрослым, которые не умеют читать, воспринимать текстовый контент. По словам разработчиков, модель не только сотрёт языковые барьеры, но и позволит блоггерам и компаниям общаться с аудиторией на любом языке собственным голосом. Также этот инструмент будет полезен людям, которые по каким-либо причинам потеряли голос или столкнулись с нарушением речи.

Простым смертным модель всё ещё нельзя попробовать, пока ее тестируют it - компании. И не спроста пока ее не выпускают в широкие массы, Open AI серьезно подстраховываются.

Меры против мошенничества

Тем, кто беспокоится о мошенничестве, Open AI серьезно позаботилось о безопасности.

Во-первых, партнеры, тестирующие Voice Engine, согласились с их политикой использования, которая запрещает выдавать себя за другое физическое лицо или организацию без согласия или законного права.

Во-вторых, все должны получить согласие первоначального докладчика, и мы не разрешаем разработчикам создавать способы для отдельных пользователей создавать свои собственные голоса.

В-третьих, партнеры должны сообщать своей аудитории, что голоса, которые они слышат, генерируются искусственным интеллектом.

В-четвертых, Open AI внедрили ряд мер безопасности, включая водяные знаки для отслеживания происхождения любого звука, генерируемого Voice Engine.

В-пятых, в США уже запретили звонки с использованием сгенерированных голосов из-за случая спам-звонков от Байдена )) Остальные страны тоже подтянутся в стремлении ограничить неэтичное использование голосовых технологий ИИ.

Подписывайтесь на ИИшница 🍳 - тут все самое интересное из мира новых технологий и нейросетей 🤖

Показать полностью 1

[моё] Инновации Будущее Искусственный интеллект Нейронные сети Информационная безопасность Синтез речи Голос Киберпанк Openai Видео Длиннопост

5

Партнёрский материал

specials

Поиграем в бизнесменов?⁠⁠

Одна вакансия, два кандидата. Сможете выбрать лучшего? ~~И так пять раз.~~

СДЕЛАТЬ ВЫБОР

Бизнес Игры Предпринимательство Работа Текст

andrei.ushanin

2 месяца назад

Хороший способ разобраться с компьютером удаленно⁠⁠

Всем, доброй ночи.
Имеется два компьютера на базе windows 10 и 11.
Накаждом из этих компьютеров установленна программа NVDA, она используется незрячими и слабовидящими людьми для взаимодействия с компьютером при помощи клавиатуры, и синтеза речи.
То есть вся работа у незрячего происходит при помощи этой программы с клавиатурой и синтезатором речи, который озвучивает все действия пользователя.

Тут начала появляться проблема, что есть родственники, у них ноутбук, жесткий диск на терабайт, система windows 10.
По привычке они все скидывали на диск ц.

Сегодня залез при помощи удаленного управления компьютером при помощи программы ТNVDA, у этой программы имеется хорошее дополнение для управление другим компьютером, правда это дополнение ставится дополнительно, дополнение должно быть у каждого установлено, чтобы была возможность подключаться к другому компьютеру при помощи адреса сервера и ключа, который можно создать самому или сгенерировать дополнением автоматически.

Более быстрым способом решения задачи решил поступить так, что просто взял и переместил все файлы с рабочего стола на диск д.

Может быть я сделал совсем неправильно, как нужно было это сделать.

Просто не имею желание сидеть и выбирать каждый файлик, что оставлять, а что просто в другое место скидывать.

Я предупредил их об этом, посмотрю, что будет дальше!

Надеюсь, что будут разбираться, куда что кидать, так как диск ц на 118 гигабайт, а освободил в районе 37.3 гигабайта, а точнее в районе 43 гигабайта.

Просто все скачивали сразу на рабочий стол, чтоб потом быстрее искать и с этим работать.
А вот как оно оказывается, что на этом диске оставалось в районе 300 мегобайт свободного места всего лишь!

Ка говорит Леонид Семенович Каневский: "А это совсем уже другая история".

Показать полностью

Ноутбук Удаленный доступ Программа Жесткий диск Память Дополнение Родственники Рабочий стол Освобождение Синтез речи Текст

6

snakers4

6 месяцев назад

Лига Геймеров

Оригинальные голоса Baldur's Gate 3 теперь доступны на русском⁠⁠

Не секрет, что у Baldur's Gate 3 не было оригинальной русской озвучки. Мы сделали так, что главные персонажи из игры могут говорить на русском языке. Некоторые говорят с небольшим акцентом … а некоторые с заметным акцентом.

Послушайте сами, убедитесь:

Попробовать можно тут - @silero_voice_bot - https://t.me/silero_voice_bot

Показать полностью 1 1

[моё] Искусственный интеллект Синтез речи Машинное обучение Озвучка Русская озвучка Baldur’s Gate 3 Видео Игры Компьютерные игры

7

bikupep

8 месяцев назад

Искусственный интеллект

Серия Нейросети, моё мнение

Ответ на пост «Cyberpunk 2077 - Русская озвучка для DLC Phantom liberty синтезированными голосами (Ви, Адам Смешер, Джони Сильверхенд)»⁠⁠

К вопросу о том насколько это правомерно/законно/человечно использовать чужие голоса в обучении нейросетей (в контексте обновления киберпанка): Если всё берётся из общего доступа и не нацелено на оскорбление/дискредитацию/унижение человека, то не думаю, что кто-то может сказать что-то против, кроме CDPR. А самим CDPR во-первых: выгодно чтобы у игры была хоть и неофициальная, но всё же озвучка на русском; во-вторых: что они сделают рандомному пользователю из инета, клепающему мод на игру? Некоторые умудряются DENUVO взламывать и им ничего не делается, а пиратская озвучка намного менее серьёзный проступок, если проступок вообще.
Поэтому болею сейчас за всех, кто трудится над озвучкой обновления нейросетями!

[моё] Игры Cyberpunk 2077 Озвучка Нейронные сети Синтез речи Искусственный интеллект DLC Киберпанк Закон Пиратство Моды Denuvo CD Projekt Ответ на пост Текст

4

MarkParker.5

8 месяцев назад

Программирование на python

S.T.A.R.K. — первый фреймворк для создания голосового ассистента⁠⁠

Привет, любители технологий! Сегодня я рад представить вам S.T.A.R.K. (Speech and Text Algorithmic Recognition Kit). Если вы когда-либо мечтали создать голосового ассистента, который будет современным, продвинутым и невероятно интуитивным, S.T.A.R.K. - лучшее решение.

Почему именно S.T.A.R.K.?

Автономность и конфиденциальность: S.T.A.R.K. работает полностью на устройстве, гарантируя сохранность ваших данных.
Распознавание контекста: С S.T.A.R.K. вы можете легко определять контекст и параметры для последующих запросов, а также одновременно выполнять несколько команд.
Асинхронные команды: Запустите задачу и продолжайте использовать ваш голосовой ассистент. S.T.A.R.K. уведомит вас о завершении.
Множественные ответы: Получайте обновления в реальном времени для текущих задач, будь то мониторинг процесса загрузки или отслеживание доставки.
Продвинутый синтаксический анализ: Специальная синтаксическая система упрощает извлечение любого параметра из строк.
Расширяемость с помощью ведущих языковых моделей: Улучшите когнитивные способности S.T.A.R.K., интегрируя его с ведущими языковыми моделями, такими как ChatGPT.
Поддержка нескольких языков: Взаимодействуйте со своим голосовым ассистентом на нескольких языках.
Полная настройка: Создавайте сложные команды, интегрируйте различные голосовые или текстовые интерфейсы и даже переопределяйте существующие классы.
Поддержка сообщества: Присоединяйтесь к репозиторию STARK-PLACE и пользуйтесь библиотекой расширений от сообщества.

Присоединяйтесь к нам

Для более подробного изучения каждой функции и понимания всех возможностей S.T.A.R.K. посетите официальную документацию и репозиторий на GitHub. Если вам понравился фреймворк, не забудьте добавить звезду ⭐ репозиторию.

Показать полностью

[моё] Разработка Программирование IT Python Голосовой помощник Голосовое управление Открытый код Open Source Распознавание голоса Синтез речи Автоматизация Умный дом Текст

8

Партнёрский материал

specials

Сможете найти на картинке цифру среди букв?⁠⁠

Справились? Тогда попробуйте пройти нашу новую игру на внимательность. Приз — награда в профиль на Пикабу: https://pikabu.ru/link/-oD8sjtmAi

Игры Награда

RedpaX

9 месяцев назад

Искусственный интеллект

Cyberpunk 2077 - Русская озвучка для DLC Phantom liberty синтезированными голосами (Ви, Адам Смешер, Джони Сильверхенд)⁠⁠

У меня есть желание, финансовые ресурсы, мощности GPU фермы, а так же некоторые способности, что бы озвучить DLC Сyberpunk 2077 Phantom liberty полностью на русском языке синтезированными голосами которые вы с трудом отличите от реальных голосов актеров озвучки. Для этого мне потребуются семплы голосов из оригинальной игры, умельцы которые помогут их взлечь уже нашлись.

Суть моей затеи следующая:

1) Набираю по 20 минут голосов всех персонажей игры,

2) Обучаю нейросеть голосам и создаю все голоса персонажей игры ну или большую часть ключевых (просто неписей я думаю можно озвучить 1 голосом)

3) Выгружаю все субтитры из DLC

4) Пишу скрипт который будет по API загружать тексты в мою нейросеть для озвучивания

4) Создаю все звуковые файлы с голосами персонажей для текстовых файлов субтитров. (самое трудозатратное и по деньгам и по времени)

5) Пишу скрипт который все голоса упакует в игру обратно

6) Получаю игру с русской озвучкой

Я не уверен, что всю получится, на каждом этапе можно споткнуться (навыки программирования у меня достаточно слабые) а ведь ещё есть такое понятие как липсинк. Ну вообщем идея такая. Демонстрация возможностей синтеза голосов можете увить на видео ниже. В этом же видео будут приведены в пример куски оригинальных голосов с которых нейросеть обучалась. Очевидно, что чем больше будет голосовых данных с разными эмоциями тем точнее и интереснее можно будет делать озвучку. В идеале 20 минут голоса на каждого персонажа.

Нужна ли синтетическая озвучка голосами привычных нам персонажей в Сyberpunk 2077 Phantom liberty, на русском языке?

Обсуждение проекта русификации происходит на на этом дискорд сервере:

https://discord.com/channels/1145981722081636402/11572229720...

Показать полностью 1

[моё] Опрос Игры Cyberpunk 2077 Озвучка Нейронные сети Синтез речи Искусственный интеллект DLC Видео YouTube

76