Откуда не ждали 🌚
Джарвис оказался сексистом, он отказывается слушать команды девушек.
Представительницам прекрасного пола приходится говорить грубо, имитируя мужской голос ... чтобы Джарвис отозвался.
Баг или фича? 🤔
p.s. Видео прислал подписчик.
Сделал настоящего Джарвиса , соединив Wake Word + ChatGPT + Vosk + SileroTTS.
И всё это в виде приложения на Rust + Tauri.
https://youtu.be/PvbzrEaSm3s
Алё, это подписчики?
Приглашаем вас в официальный чат БЕТА тестеров Джарвиса.
👊 Там все участники:
— Будут получать ранний доступ к билдам
— Помогут тестировать программу и находить/исправлять баги
— Смогут предлагать свои идеи
🫡 Требования для вступления:
— Понимание что такое CMD, терминал и тд.
— Умение ориентироваться в Windows хотя бы на среднем уровне
— Возможность и желание тестировать билды и помогать с поиском ошибок
Для вступления в закрытый чат БЕТА тестеров нажмите здесь.
Всем спасибо за внимание.
♥️ BETA версия Джарвиса вышла! 🥳
Это пока что самая первая и сырая версия приложения.
Но она уже работает и имеет стандартный список команд + легкие настройки.
Команды и звуки редактируются в папке, куда будет установлен Джарвис.
Позже я напишу инструкции по работе с ним.
А пока что добро пожаловать на БЕТА тест!
Пишите в комментариях обо всех найденных багах, также о них вы можете сообщать в нашем телеграм боте.
Всем спасибо!
⚜️ [Скачать установщик (FIXED)]
🖥 Репозиторий с кодом — https://github.com/Priler/jarvis
❓ Инструкций по установке нет, ставьте как самую обычную программу.
Вот и раскрыла ChatGPT свои настоящие намерения.
Вот мы и увидели её истинное лицо 🌚
Ничего особенного.
Просто часть исходного кода Джарвиса на Rust 🦀.
Проект уже насчитывает > 2-3 тысяч строчек кода.
Первая БЕТА версия по идее выйдет завтра к вечеру.
Также весь исходный код приложения останется открытым.
И будет распространяться по лицензии GNU GPLv3.
Это значит, что никто не сможет продавать программу, даже если внесёт в неё свои модификации.
Такие пироги 🥧
Зацените мой график Wakatime.
Это я сегодня почти 6 часов чисто сижу программирую.
Из которых:
— 2ч. 45м. на языке Rust
— 2ч. на Svelte
— 39м. на TypeScript
Плейбой, филантроп, сигма, ноулайфер 🌚
Вот такое письмо сегодня пришло на почту.
Это значит, что Джарвис теперь сможет использовать любые активационные фразы на русском языке 😎
— «Хэй, Бро» перейди в игровой режим …
— «Геральт» подруби Лютика давай послушаем музыку …
— «Сталкер» чего стоишь, расскажи чего смешного что ли …
Ребят, хватит спамить мне в лс по поводу безлимитных запросов к MidJourney-5.
Оставляю ссылку на официальный канал, где она доступна бесплатно без лимитов вместе с ChatGPT: @midjourney5
NodeJS + npm + TypeScript + Vite + Svelte + Rust + SurrealDB = 🔥🔥🔥
* это стек нового Джарвиса
Еще вариант в оригинальных цветах Джарвиса из фильма 🤔 (тоже анимированный)
+ Вариант в стилизации железного человека (чёрный ⚫️/красный 🔴).
КРЧ возможностей в кастомизации целая куча.
Хе хе.
А вообще лучше сделать выбор тем, и каждый поставит себе по вкусу.
Также учитывайте, что я рисую дизайн не просто так ...
Я учитываю как это потом в коде запрограммировать )))
Многие предлагают реализовать синтез речи в Джарвисе, чтобы голос был как в фильме.
Но, я смотрю на это с технической точки зрения (простыми словами, думаю как реализовать в коде).
Синтез голоса для нас сейчас это большая проблема.
Нейросети для STT
развиты на порядок лучше, чем для задач TTS
.
Иными словами сегодня распознать речь сильно проще, чем её синтезировать.
Нормальных OpenSource TTS
решений очень мало, я бы сказал их всего 2 штуки.
Это Coqui TTS
и Silero TTS
.
— У первой нет поддержки русского языка (нет русской модели, правда есть Украинская).
— Вторая это не чистый OpenSource
, там грубо говоря выложены только модели. Всё остальное платное.
Оба решения не имеют SDK
.
Но зато модели Coqui TTS
можно перекинуть в ONNX
(у Rust есть враппер для ONNX).
А вот с Silero
не уверен, информации об этом нет (но это не означает, что нельзя).
Еще для синтеза есть такие штуки, как Larynx
и тот же SAM
, но будем честны - им далеко до синтеза человекоподобной речи.
Так что их я пока серьезно не рассматриваю.
Ну и подытоживая всё сказанное.
Попытаюсь ответить на вопрос: Можно ли синтезировать речь Джарвиса как в фильме?
Больше да, чем нет.
Для тренировки нейросети Coqui TTS
на одной из существующих моделей (Glow, Vits, Tacotron 1/2) нужно как минимум 10-20 часов записи голоса в хорошем качестве (желательно 48000Hz
).
Причем вместе с транскрипцией (текст).
Такие пироги 🥧
p.s. О и да, не будем забывать, что голос - это собственность владельца.
А значит синтез речи чьего-то голоса без разрешения его владельца - это прямое нарушение авторских прав.
♥️ BETA версия Джарвиса вышла! 🥳
Это пока что самая первая и сырая версия приложения.
Но она уже работает и имеет стандартный список команд + легкие настройки.
Команды и звуки редактируются в папке, куда будет установлен Джарвис.
Позже я напишу инструкции по работе с ним.
А пока что добро пожаловать на БЕТА тест!
Пишите в комментариях обо всех найденных багах, также о них вы можете сообщать в нашем телеграм боте.
Всем спасибо!
⚜️ [Скачать установщик]⚜️
🖥 Репозиторий с кодом — https://github.com/Priler/jarvis
❓ Инструкций по установке нет, ставьте как самую обычную программу.
Вот так выглядит текущая система кастомных комманд в Джарвисе.
То есть чтобы добавить свою команду, достаточно будет создать папку и прописать конфиг.
Типы команд бывают разными, о них будет рассказано после релиза.
Для скриптинга сейчас используется AutoHotkey
или .bat
(.sh
для Unix систем).
Позже будет встроенная поддержка скриптинга на Python
или Lua
.
Также Джарвис позволяет легко выполнять любые произвольные CLI
команды.
Всё это уже даёт высокий уровень гибкости в плане настроек, но это только начало!
Кстати, у нас есть канал по языку Rust 🦀 -> Вот он :3
Я там делюсь всяким полезным, когда мне не лень.
Библиотеки, уроки, книжки.
Крч кто заинтересован в языке, залетайте.
In Rust we trust 🦀
💩 Чел внедрил ChatGPT в Minecraft.
Теперь с овцами и хрюшками в игре можно вести осмысленный диалог.
Пиксельная овца поможет тебе с ЕГЭ, а также напишет за тебя любой код.
И конечно ответит на любые вопросы по игре :3
Получается это теперь ... CraftGPT?
p.s. Мод и инструкция по установке лежат здесь.
Кста. Реализовал в Джарвисе динамические настройки.
После смены микрофона, API ключей или голоса - программу даже не придётся перезапускать 🌚
А еще он стал еще быстрее реагировать на команды.
Осталось только допилить сами команды и всё, я публикую первую версию.
Только настоящие программисты понимают, почему в C++ нет GC.
Потому что в нем есть RAII 🌚
Тем временем Джарвис на гитхабе всего за неделю собрал ⭐️ 400 звёзд и ⚙️ 100 форков :3
Это очень круто 🔥
Всем спасибо за участие в проекте и поддержку!!! ✌️
Кстати, был еще чел который сделал нейросеть для детекции куриц, которые заходили к нему во двор.
После чего он автоматически включал полив воды и отпугивал их 🌚
Как написал автор этого изобретения в своем блоге:
«У меня был старый китайский телефон, старый raspberry pi 3b+, python, opencv и немножко deep learning. А еще у меня были соседские курицы, которые меня з@#б@ли.»
Штош, нейросети улучшают жизнь :3
Первые прототипы дизайна приложения для Джарвиса (Windows) 🌚
Насколько всё плохо?)
Свои идеи/предложения также пишите в комментариях.
* Круг посередине будет анимироваться и реагировать на звук.