Наука, технологии, изобретения и урбанистика — прямо сейчас говорим о том, что уже скоро повлияет на каждого. по всем вопросам - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы
🖥 «Синьхо» (Xinghuo) – это амбициозный китайский проект экспериментальной электростанции, которая совмещает термоядерный синтез и ядерное деление в одном реакторе. Идея гибридного реактора заключается в том, что нейтроны от реакции синтеза запускают реакцию деления, объединяя преимущества обоих процессов.
Такой подход позволяет:
Получить высокий выход энергии: за счёт дополнительной энергии деления реактор рассчитан на рекордный коэффициент усиления Q > 30, то есть вырабатывать энергии в 30 раз больше, чем затрачивается на нагрев плазмы
Сократить ядерные отходы: использование нейтронов синтеза позволяет более полно «сжигать» ядерное топливо. Ожидается, что это увеличит энергоотдачу и уменьшит количество долгоживущих радиоактивных отходов по сравнению с обычными АЭС.
Применить новые технологии: реактор проектируется на базе высокотемпературных сверхпроводящих магнитов для магнитного удержания плазмы
Это новейший подход в термоядерной энергетике, позволяющий создавать более сильное магнитное поле с меньшими энергопотерями.
Название «Синьхо» переводится с китайского как «Искра», отсылая к известной цитате Мао Цзэдуна: «от одной искры вспыхнет степь»
«Синьхо» расширит границы исследований в физике плазмы, материаловедении и реакторостроении. Сам факт запуска такого комплекса предоставит уникальные данные о поведении плазмы в длительном режиме, о взаимодействии нейтронов синтеза с топливом деления и материалами конструкции. Этот проект послужит испытательным полигоном для новых технологий (сверхпроводники, новые топливные циклы), знания с которого смогут использовать ученые и инженеры по всему миру. Успешная работа «Синьхо» подтвердит принципиальную реализуемость гибридного подхода, что повлияет на дизайн будущих крупномасштабных термоядерных проектов во всём мире
Это важный, но промежуточный этап в развитии термоядерной энергетики. Речь идёт не о совершившейся научной сенсации, а о начале строительства уникального реактора.
Сам по себе запуск проекта «Синьхо» – значимое событие: Китай официально приступил к реализации первой в мире гибридной термоядерной электростанции. Это свидетельствует о серьёзном прогрессе и намерениях, однако до настоящего прорыва ещё предстоит путь. Впереди годы инженерных работ и испытаний: только после 2030 года станет ясно, оправдаются ли высокие ожидания. Таким образом, новость скорее подчеркивает тенденцию и лидерство Китая в этой сфере, чем сообщает о готовом технологическом чуде.
Если «Синьхо» успешно заработает, это станет поворотным моментом для науки и энергетики. Но пока это смелый эксперимент – этап на пути к цели, за ходом которого будет внимательно следить весь мир.
🔗 Статья
@vistehno
Робот Unitree демонстрирует свои возможности на показе мод в Шанхае, знаменуя наступление будущего.
@vistehno
📹 Топ-15 технических YouTube-каналов для изучения ИИ с нуля:
1) Andrej Karpathy — сочетание общего и технического контента, плейлист "Zero to Hero" обязателен к просмотру
2) uproger">Uproger — доступные уроки по программированию и ИИ, идеально для начинающих и тех, кто хочет углубить свои знания.
3) UmarJamilAI">Umar Jamil — технический блог, где автор реализует методы ML и LLM с нуля
4) szymonozog7862">Simon Oz — технические видео по низкоуровневому машинному обучению
5) Tunadorable">Tunadorable — отличные обзоры научных статей, реализация
6) GPUMode">GPU Mode — технические интервью и разборы всего, что связано с GPU
7) AIJason">AI Jason — эксперименты с ИИ, дизайн ПО и новые модели, с понятным и полным разбором.
8) FerdinandMom">Ferdinand Mom — всё о распределённом обучении и выводах
9) WelchLabs">Welch Labs — уникальный глубокий взгляд на комплексность алгоритмов машинного обучения.
10) ArtemKirsanov">Artem Kirsanov — нейронаука и машинное обучение с необычного авторского взгляда + отличная визуализация контента.
11) DavidOndrej">David Ondrej — новые модели, создание приложений с ИИ, практично для разработчиков https://t.co/BEOr0MgHag @DavidOndrej1
12) 3Blue1Brown
Потрясающие визуализации, которые делают абстрактные математические концепции понятными и интуитивными.
13) Lex Fridman
Глубокие беседы с лидерами индустрии ИИ, позволяющие получить широкий взгляд на современные тенденции.
14) Machine Learning Street Talk
Технические погружения и обсуждения с ведущими исследователями в области ИИ и машинного обучения.
Ссылка:
15) StatQuest with Joshua Starmer PhD
Доступные и понятные объяснения основ машинного обучения и статистики для начинающих.
Этот список для технической аудитории. Очень сложно выбрать всего 15 каналов, ведь есть множество других, создающих отличный контент.
Если знаете ещё каналы, дайте пишите в комментариях!
@vistehno
🎮 DOOM запустили на советском трамвае — настоящий гений оживил классику на модели ЛМ-68М2 «Ретро»: теперь демоны из ада атакуют прямо в кабине водителя.
USB, конечно, не завезли, так что клавиатуру пришлось подключать через старый PS/2.
Дед точно оценит!
@vistehno
✔️ Ant Group использует китайские чипы для снижения стоимости обучения моделей на 20%
Ant Group успешно использовала хардверные решения от Alibaba и Huawei для обучения своих моделей, что позволило сократить затраты примерно на 20%. Результаты тестов показали, что китайские чипы сопоставимы по производительности с Nvidia H800. Хотя Ant Group пока полностью не отказывается от Nvidia для разработки ИИ, ее последние разработки в основном полагаются на альтернативные решения - AMD и чипы китайского производства.
Это свидетельствует о том, что китайские компании ускоряют локализацию технологий искусственного интеллекта, чтобы сократить затраты и уменьшить зависимость от американских чипов.
bloomberg.com
✔️ В Италии запущена первая в мире газета, созданная ChatGPT.
Итальянская газета Il Foglio начала месячный эксперимент, опубликовав первый в мире газетный выпуск, сгенерированный искусственным интеллектом. Цель эксперимента - изучить влияние ИИ на журналистику, используя ChatGPT для создания контента.
Редактор газеты Клаудио Сераса заявил, что ИИ использовался на всех этапах создания - от написания текстов и заголовков до цитат и резюме, при этом журналисты редакции участвуют в создании промптов для ИИ и проверке сгенерированных текстов.
asianfin.com
✔️ ARC Prize запускает бенчмарк ARC-AGI-2 с призовым фондом в 1 миллион долларов.
Команда ARC Prize запустила 2 этап бенчмарка ARC-AGI-2 для оценки «гибкости мышления» ИИ через задачи, которые человек решает за секунды, а алгоритмы — с трудом. Как и в прошлой версии, система проверяет способность к обобщению знаний, но теперь барьер выше: на нем базовые LLM набирают 0%, а продвинутые — меньше 4%. Призовой фонд бенчмарка -1 млн. долларов, главный приз получит разработка, которая сможет превысить 85% выполнения бенчмарка.
Решение задач ARC-AGI-2 требует интуиции и адаптивности — того, что в людях заложено природой. «Это не тест на эрудицию, а проверка умения мыслить вне данных», — поясняют разработчики.
arcprize.org
✔️ Поисковая система Atlantic позволит проверить, использовалась ли ваша работа для обучения моделей.
Компания The Atlantic разработала поисковый инструмент, позволяющий пользователям проверить, не фигурирует ли их работа в LibGen - архиве книг, научных работ и статей, который, как сообщается, использовался для обучения популярных языковых моделей.
Согласно судебным документам, набор данных LibGen использовался для обучения моделей Llama. OpenAI уже публично сообщила, что контент LibGen не включен в текущие версии ChatGPT или в API OpenAI. Другие компании, занимающиеся разработкой ИИ, пока не комментировали, использование LibGen в своем обучении.
theatlantic.com
✔️ OceanDS: 1,8 млрд. данных об океане стали основой первой океанографической LLM.
Китайская модель OceanDS, созданная для морских исследований, опирается на уникальную базу из 1,8 млрд токенов данных. В неё вошли оцифрованные научные работы, книги и отчёты — всё, что касается океана.
По тестам OceanDS обходит топовые LLM в точности ответов на профильные запросы — разрыв достигает 25%. Это первый в мире ИИ, заточенный под океанографию. Уже сейчас его тестируют в управлении природными ресурсами Китая, а в будущем — внедрят в другие отрасли.
news.cgtn.com
@ai_machinelearning_big_data
#AI #ML #Research #NLP
🧠 Neuralink с открытым исходным кодом с использованием активности мозга обезьяны для управления роботизированными руками 🙉
Проект Jenkins исследует интерфейсы мозг-компьютер путем декодирования нейронной активности в движения роботов и генерации синтетических мозговых данных.
Используя нейронные записи мозговой активности обезьяны по имени Дженкинс, исследователи разработали модели для преобразования мозговых сигналов в движения роботизированной руки.
В проекте используются роботизированные руки и интерактивная веб-консоль для генерации данных о работе мозга в режиме реального времени с помощью джойстика.
Исследование открывает путь к созданию адаптивных интерфейсов «мозг-компьютер» за счет гибкого моделирования активности мозга.
▪ Github
@vistehno
🌟 Интересная визуализация для быстрого запоминания азбуки Морзе!
@vistehno
📌Ученые обнаружили сходство между мозгом человека и нейросетями в принципах обработки языка.
Совместное исследование Google Research, Принстонского университета, NYU и Еврейского университета в Иерусалиме нашло параллели в обработке естественного языка человеческим мозгом и большими языковыми моделями.
Используя внутричерепные электроды, ученые зафиксировали нейронную активность во время спонтанных диалогов и сравнили ее с внутренними представлениями модели Whisper, разработанной для преобразования речи в текст. Оказалось, что речевые эмбеддинги Whisper коррелируют с активностью в слуховых зонах мозга, а языковые — с областями, ответственными за семантику.
Эксперименты подтвердили догадки: при восприятии речи сначала активируется верхняя височная извилина (STG), обрабатывающая акустические сигналы, а через несколько сотен миллисекунд включается зона Брока (IFG), связанная с декодированием смысла. При воспроизведении речи последовательность обратная: IFG активируется за 500 мс до артикуляции, затем моторная кора планирует движение, а после произнесения слова STG «проверяет» результат. Эти паттерны совпали с динамикой эмбедингов Whisper, хотя модель не обучалась на нейробиологических данных.
Другое интересное совпадение - мозг и LLM используют предсказание следующего слова как ключевую стратегию. Как показали опыты, слушатель бессознательно предугадывает следующие слова, а ошибка предсказания вызывает «нейронное удивление» — механизм, аналогичный обучению с подкреплением в ML. Но архитектурные механизмы у мозга и LLM разные: трансформеры обрабатывают сотни слов параллельно, тогда как мозг анализирует информацию последовательно.
Несмотря на общую «мягкую иерархию» обработки (например, смешение семантических и акустических признаков в IFG и STG), биологические структуры мозга принципиально отличаются от нейронных сетей.
Исследователи подчеркивают: языковые модели (типа ChatGPT) не понимают, как люди общаются в реальной жизни (например, не чувствуют эмоций или культурных особенностей), и не учатся так, как это делает мозг человека с детства. Однако их эмбединги оказались очень полезными для изучения того, как мозг обрабатывает речь.
Ученые надеются, что эти открытия помогут создать нейросети, которые смогут обучаться как люди — медленно, шаг за шагом. А пока Whisper, неожиданно стал «зеркалом» принципов нашего мышления. Кто знает, может, через пару лет ИИ начнёт шутить с нами за чашкой кофе — как друг или коллега по работе.
🟡Статья
🟡Исследование
@ai_machinelearning_big_data
#AI #ML #Research #NLP
😞 А ведь он просто хотел завести новых друзей...
@vistehno
📡 Запущен первый спутник FireSat, который поможет раньше обнаруживать небольшие лесные пожары.
FireSat, новый прототип спутника обнаружения лесных пожаров, запущен на Falcon 9 компании SpaceX! Высококачественные изображения, обновляемые каждые 20 минут, скоро помогут обнаруживать лесные пожары размером 5x5 м по всему миру.
📌 Читать
#news #ai #ml
🌟 KBLaM: новая архитектура интеграции знаний для языковых моделей от Microsoft Research.
Microsoft Research представила KBLaM - архитектуру, которая решает ключевую проблему LLM — добавление новых внешних знаний. В отличие от традиционных методов файнтюна и RAG, KBLaM кодирует новые для LLM структурированные данные в виде векторных пар «ключ-значение», встраивая их напрямую в слои внимания модели. Это позволяет избежать дорогостоящего дообучения и построение дополнительных модулей, сохраняя линейную масштабируемость даже для баз знаний в 10 000 триплетов.
В KBLaM триплет — это структурированный элемент знания, состоящий из трех компонентов: сущности, свойства и значения. Например, в утверждении «Москва — столица России» сущностью выступает «Москва», свойством — «столица», а значением — «Россия».
llama_model.py
в src/kblam/models
.🤖 Новые тренды среди последних LLM
🗓 24 марта в 18:00 МСК
🆓 Бесплатно. Урок в рамках старта курса «NLP / Natural Language Processing».
LLM и трансформерные модели такие как ChatGPT, GPT4, GigaChat стали не только стандартом в области языкового моделирования, но и незаменимыми помощниками для решения огромного числа задач: от написания кода, до генерации сказок.
На вебинаре мы расскажем про последние тренды в этой области: чего уже достигли современные LLM сегодня и что нас ждет в ближайшем будущем.
Данный открытый урок будет особенно интересен:
- IT-специалистам, которые хотят расширить свои знания в Data Science
- Дата-сайентистам, желающим углубить свои знания по автоматической обработке текстов
- Тем кто самостоятельно изучает Data Science
В результате вебинара вы:
- поймете основные технологии за современными LLM сегодня
- узнаете про основные тренды в области больших языковых моделей
- узнаете, что ждет область LLM в ближайшие годы
🔗 Ссылка на регистрацию: https://otus.pw/DSIV/
🤖 NVIDIA, Google DeepMind и Disney Research сотрудничают над созданием домашнего дроида в стиле R2D2.
@vistehno
⭐️ Gemini Image Editing NextJS Quickstart — это быстрый стартовый проект от Google Gemini, который демонстрирует, как интегрировать возможности редактирования изображений в веб-приложения на базе Next.js.
▪ Простота интеграции: Проект предоставляет готовый шаблон, позволяющий разработчикам мгновенно начать работу с Gemini Image Editing API без сложных настроек.
▪ Удобство использования: Чётко структурированный и хорошо документированный код помогает быстро разобраться в функционале и адаптировать решение под свои нужды.
▪ Мощные возможности: Использование передовых алгоритмов редактирования изображений от Google делает этот инструмент конкурентоспособным по сравнению с аналогичными решениями.
▪ Расширяемость: Лёгкая модификация и добавление новых функций позволяют создать уникальное и функциональное приложение для обработки изображений.
Если вы хотите быстро внедрить современный функционал редактирования изображений в своё Next.js приложение, Gemini Image Editing NextJS Quickstart — отличный выбор. Ознакомьтесь с проектом на
📌 GitHub
🎓Месяц погружения в генеративный AI
Представьте, что вы каждый день открываете новые возможности для роста и развития, применяя AI-технологии в бизнесе, работе и личной жизни. Автоматизируете рутинные процессы, становитесь продуктивнее, и начинаете мыслить в парадигме AI.
Становитесь тем, кто быстрее других ориентируется в стремительно меняющемся мире AI.
AI Mindset приглашает вас на свою онлайн-лабораторию – попробовать AI-инструменты на практике.
За 4 недели вы:
- Поймёте, как устроен генеративный AI и почему это уже изменило мир
- Научитесь создавать мощные промпты и эффективно общаться с AI
- Создадите личного AI-ассистента под свои задачи и привычки
- Запустите AI-агентов, которые автоматизируют рабочие процессы и освободят ваше время
- Узнаете, как создавать изображения, тексты и мультимедиа с помощью передовых AI-инструментов
- Сможете быстрее, продуктивнее и интереснее решать любые задачи
Формат лаборатории:
- Практические воркшопы, коворкинги и живое общение
- Экспертные сессии от лидеров отрасли
Что нас отличает от других обучалок по AI?
- Формат лабораторий: много практики, адаптивная под запросы участников и новинки рынка программа
- Треки по направлениям, как отдельные мини-лаборатории: Startup, Automation, Research, Ethics и др.
Старт: 24 марта
Регистрация
*почитать о других проектах ребят можно на их канале @ai_mind_set
✔️ R²D²: набор решений для робототехники от NVIDIA.
NVIDIA Research предлагает 4 решения: MobilityGen генерирует синтетические данные в Isaac Sim, экономя время на сбор реальных данных, COMPASS создаёт универсальные алгоритмы передвижения для роботов любого типа — от двуногих до колесных, обеспечивая мгновенное внедрение из симуляции в реальность.
Для гуманоидов важен контроль всего тела: HOVER объединяет управление балансом, движением и манипуляциями в единую нейросеть, а ReMEmbR добавляет «память» — робот анализирует окружение с помощью ИИ-моделей (LLM, VLM) и действует на основе контекста.
Уже сейчас эти решения тестируют компании Under Control Robotics и Advantech: роботы собирают данные, перемещают грузы и избегают препятствий в динамичных условиях. Для разработчиков доступны исходники на GitHub и набор учебных материалов.
developer.nvidia.com
✔️ Google анонсировала ИИ-инструменты для планирования путешествий.
Google тизернула набор функций с ИИ для организации летних поездок. В Поиске теперь доступны AI Overviews — сводки, которые генерируют маршруты по запросам вроде «создать план поездки в Коста-Рику с акцентом на природу». В Gemini появился инструмент, позволяющий настраивать «экспертов» под конкретные задачи — например, для подбора направлений или списка вещей в дорогу. Отдельное внимание уделили отслеживанию цен: теперь, кроме авиабилетов, система уведомит о снижении стоимости отелей через email.
Обновление коснулось и Google Maps: приложение научилось анализировать скриншоты с сохраненными локациями. Достаточно открыть доступ к фото — и ИИ автоматически распознает места, предложив добавить их в список.
Пока функция доступна в США на iOS, версия для Android ожидается в ближайшее время.
techcrunch.com
✔️ Garmin запустил платный сервис с ИИ-аналитикой.
Garmin открыла платную подписку Connect+ за $7 в месяц, предлагающую ИИ-функции для анализа тренировок - персонализированные рекомендации, дашборд эффективности и советы для бегунов и велосипедистов. Сервис использует историю активности, чтобы оптимизировать прогресс и уведомления LiveTrack для безопасности.
В отличие от Strava (от $12/месяц), Garmin сохраняет доступную цену, делая AI-инструменты привлекательнее для любителей и профи. Хотя часть пользователей критикует переход на монетизацию, 30-дневный тест-период позволяет оценить новинку.
gizmodo.com
✔️ Vamba: новая архитектура для анализ длинных видео.
Vamba — гибридная архитектура на основе Mamba и Transformer для обработки длинных видео. Она позволяет анализировать до 100 тыс. видеотокенов без сжатия, сохраняя ключевые сцены и действия. За счёт замены части операций на модули Mamba-2, сложность вычислений снижается с квадратичной до линейной, что ускоряет обучение в 2 раза и сокращает потребление памяти на 50%.
В тестах На LVBench Vamba обошла конкурентов по точности (плюс 4,3%) и по стабильности обработки: даже при 512 кадрах потребление памяти не превышала 12 ГБ. Дополнительные тесты на датасетах с шумом и динамичными сценами доказали, что архитектура сохраняет детализацию без «провалов» в сложных условиях. Модель уже доступна в открытом доступе — код, веса.
tiger-ai-lab.github.io
✔️ Apple обновила Final Cut: поддержка Apple Intelligence и новые инструменты.
Apple выпустила обновления для Final Cut Pro на Mac, iPad и приложения Final Cut Camera. Главным новшеством стала интеграция Apple Intelligence: теперь в Image Playground можно быстро генерировать стилизованные изображения на основе описаний или фото из библиотеки.
Для Mac добавлены коррекция цвета, аудиоэффект Quantec QRS и улучшенный Magnetic Mask. На iPad появилась портретная ориентация и хоткеи для монтажа. Final Cut Camera обзавелась переключением на 48-мм телеобъектив (для iPhone 14 Pro и новее), поддержкой Apple Log LUT и записью в Spatial Audio (требуется iPhone 16).
Технические требования: macOS 15.2 и новее для Mac на M1+, iOS 18.2 для устройств с A17 Pro/M1.
9to5mac.com
@ai_machinelearning_big_data
#news #ai #ml
🤖 ChatGPT VS DeepSeek
Приглашаем на открытый урок.
🗓 01 апреля в 18:00 МСК
🆓 Бесплатно. Урок в рамках старта курса «NLP. Advanced».
ChatGPT, DeepSeek, Gemini… Что у них внутри и какие технологии их создают?
На открытом уроке разберем архитектуру современных LLM, методы их обучения и принципы, которые двигают индустрию NLP вперед.
Спикер Мария Тихонова – PhD Computer Science, Senior Data Scientist в SberDevices и преподаватель ВШЭ.
Если вы хотите глубже понять работу LLM, разобраться в ключевых концепциях DeepSeek и узнать о будущих трендах, этот вебинар для вас.
Участвуйте и получите скидку для обучения на курсе «NLP. Advanced».
🔗 Ссылка на регистрацию: https://otus.pw/ATev/
⚡️ Ideogram 3.0 — это последняя версия генеративной модели от компании Ideogram AI.
Генератор обеспечивает высокий реализм изображений, креативность и поддерживает качество рендеринга текста.
Согласно внутренним оценкам, Ideogram 3.0 превосходит другие текст-изображение модели по широкому спектру задач.
Одной из ключевых фишек Ideogram 3.0 является "Style References", позволяющая пользователям загружать до трех референсных изображений для генерации контента в заданном стиле.
ЭТО упрощает создание изображений с трудноописуемой текстом эстетикой, ускоряя и делая более выразительным творческий процесс.
Для вдохновения доступна функция случайного выбора стиля из библиотеки из 4,3 миллиарда пресетов, а понравившиеся стили можно сохранить и повторно использовать с помощью их уникальных кодов.
Кроме того, Ideogram 3.0 предлагает расширенные возможности генерации текста и макетов для графического дизайна, рекламы и маркетинга. Модель способна создавать стилизованный и точный текст с высокой точностью, включая сложные и длинные композиции, с которыми другие модели испытывают трудности. Созданный текст отличается красотой и художественностью, превосходя возможности традиционных дизайнерских платформ.
Ideogram 3.0 доступна для всех пользователей на платформе ideogram.ai и в приложении для iOS. Доступно 2 генерации на бесплатном тарифе, $20/мес.
🎯 Блог
⚡️ Google представил свою самую мощную нейросеть — новая «думающая» Gemini 2.5 Pro опережает всех конкурентов.
🚀 Пишет код на уровне сеньора с 10-летним опытом, решает любые математические задачи и, что самое главное, бесплатна.
Пробуем можно в AI Studio.
«Ошибка на миллиард» в ИИ
«Ошибка на миллиард долларов» — это популяризованное ученым Чарльзом Э. Хоаром название для null pointer exception. В большинстве классических языков программирования переменная, якобы содержащая объект какого-то класса, на самом деле может ничего не содержать.
В мире генеративных нейросетей «ошибкой на миллиард» можно назвать галлюцинации LLM. «Творческая натура» больших языковых моделей играет со строгими задачами злую шутку: в любой непонятной ситуации модель принимается фантазировать на основе претрейна.
Старший инженер по разработке ПО искусственного интеллекта в YADRO описал метод, который использовал, чтобы значительно снизить галлюцинации в выдаче модели.
Читать статью →
Сотрудники Авито ведут свой telegram-канал ⭐️
И знаете, получается мега-лампово и увлекательно. Всего через несколько постов начинаешь уже чувствовать себя частью их уютного офиса: рядом — знакомые весёлые коллеги из постов, и вам точно есть что обсудить.
А вообще хвалим и одобряем. Во-первых, смело и интересно. Во-вторых, для тех, кто рассматривает работу в компании, это возможность изучить культуру и вайб команды ещё до трудоустройства.
🔥 Однозначно подписка — @avito_life
🔥🔥 Если думаешь о работе в Авито, то добавляй сразу — @avito_career
🌅 HunyuanVideo-I2V
HunyuanVideo-I2V – это модель с открытым исходным кодом, предназначенная для создания видео на основе изображений, разработанная с активным участием сообщества.
В репозитории доступны реализации на PyTorch, предобученные веса и код для инференса. Для стабильной работы модели требуется NVIDIA GPU с поддержкой CUDA и не менее 80 ГБ видеопамяти. Кроме того, модель оснащена широким спектром настроек, позволяющих повысить качество генерируемого видео.
📌 Github
@vistehno
Трамп очень высоко оценил IT-навыки своего сына Бэррона
«Я выключаю его компьютер, а через 5 минут он снова работает! Как он это делает? У него потрясающие отношения с технологиями!» - заявил Трамп.
Мальчику всего 19 годиков.
@vistehno
💬 OPEN AI добавили API 3 новых SOTA аудио-модели.
🗣️ Две модели преобразования речи в текст, которые, как заявляют разработчики, превосходят Whisper.
💬 1 Новая модель TTS - которой можно указать *как* ей говорить.
Поддерживает функцию задания интонации, тона, тембра голоса и еще множества других параметров с помощью промпта.
🤖 Еще OpenAi выпустили Agents SDK, который для создания голосовых агентов.
Через час состоится стрим, где покажут примера создания голосовых агентов с новыми аудиомоделями.
📌 Потестить можно здесь: https://www.openai.fm/
🔥 Стрим Open AI - Создание голосовых агентов с новыми аудиомоделями
https://openai.com/live/
Хотите получить много практики на реальных задачах, собрать портфолио и узнать как выглядит рабочий день аналитика?
CEO Simulative и эксперт с большим опытом в аналитике, Андрон Алексанян организовал бесплатный интенсив, где вы будете решать реальные задачи, с которыми аналитики сталкиваются на работе
На прямых эфирах вы сделаете:
🟠Анализ активности пользователей с помощью SQL
🟠Анализ маркетинговых активностей с помощью Python
🟠ABC анализ ассортиментной матрицы в Excel (уже прошел, но вам будет доступна запись)
Во время эфиров вы узнаете много лайфхаков, а также будете получать полезные материалы для развития в аналитике на протяжении всего интенсива
❗️Знать Python и SQL не обязательно — все будем разбирать с нуля
🕗 Встречаемся на новом эфире уже сегодня, 20 марта в 19:00 по мск
😶Участвовать в бесплатном интенсиве
🔥 Claude теперь интегрирован в Unity, Blender и Unreal Engine — MCP-плагины остаются в центре внимания! Теперь для создания игры достаточно лишь клавиатуры.
• Claude в Unity— генерирует геймплейные механики (физику, цели, таймеры), окружение, эффекты, интерфейсы, миникарты и многое другое.
• Claude в Blender — мгновенно создаёт 3D-модели и сцены, превращает фотографии в игровые локации и редактирует их по вашим командам.
• Claude в Unreal Engine — создаёт объекты, задаёт им форму и разрабатывает их логику всего за несколько минут.
Сохраняйте и пробуйте в деле! 🚀
🔥 Сравнение 4 генераторов изображений на основе ИИ 🎨
Было протестировано 4 модели ИИ с 5 различными промптами, по 4 попытки на каждую модель.
🔹 Google Imagen 3
🔹 Mystic 2.5
🔹 Photon
🔹Frames
Каждая модель интерпретировала промпты по-своему, выдавая уникальные результаты. Как вы думаете, какая из них сделала это лучше всего? Промпты ниже:
Cinematic shot, a futuristic astronaut gazing at an alien planet's horizon, wide shot, reflective visor catching a distant sun, detailed rocky alien landscape, soft glowing atmospheric haze, breathtaking and otherworldy, photorrealistic, sci-fi, highly-detailed
2. Macro shot of a honeybee collecting pollen from a sunflower, delicate pollen grains visible on its fuzzy body, golden sunlight enhancing the textures, 90mm macro lens, vibrant warm tones
3. A vintage 1970s car driving along a winding road surrounded by a dense autumn forest, golden and crimson leaves covering the ground, soft sunlight filtering through the trees, motion blur on the background, nostalgic and cinematic atmosphere, warm and earthy tones
4. Full body portrait, a striking woman with high cheekbones and deep brown eyes, dressed in a bold, She stands against a dramatic desert backdrop, the warm earth tones contrasting with her vibrant outfit, Shot with a Leica, editorial composition
✔️ Factorio стала новым бенчмарком для ИИ.
Factorio привлекла внимание ресерчеров в качестве инструмента для оценки возможностей ИИ. Игра измеряет способность языковых моделей планировать и создавать сложные системы, одновременно управляя ресурсами и производственных цепочек.
Для этих целей была разработана среда Factorio Learning Environment (FLE) c двумя режимами: "Lab-Play" (24 структурированные задачи) и "Open Play", где агенты исследуют процедурно сгенерированные карты с целью построить максимально большую фабрику. В процессе тестирования модели взаимодействуют с Factorio через Python API и получают обратную связь через игровой сервер. Оцениваются параметры "Производственный показатель" и достижение ключевых "Вех".
Создатели протестировали 6 LLM, включая Claude 3.5 Sonnet и GPT-4o. Результаты показали, что модели испытывают серьезные трудности с пространственным мышлением, долгосрочным планированием и исправлением ошибок. Лучшие результаты у Claude 3.5 Sonnet, которая успешно справилась с 15 из 24 задач в режиме "Lab Play".
jackhopkins.github.io
✔️ Американцы все чаще считают, что искусственный разум превосходит их интеллект.
Исследование, проведенное Университетом Элона, выявило, что почти половина пользователей (49%) полагает, что LLM превосходят их собственный интеллект. Из отчета следует, что женщины чаще мужчин считают LLM "значительно умнее" (30% против 20%), а половина взрослого населения США уже использует языковые модели, лидирует ChatGPT с долей в 72%. Также выяснилось, что большинство пользователей (51%) применяют LLM в личных целях для обучения и планирования, в то время как для работы их используют лишь 24%. 65% пользователей взаимодействуют с ИИ-системами посредством голосовых команд.
Несмотря на высокий показатель общей удовлетворенности (76%), значительная часть пользователей сталкивается с проблемами: 23% совершали серьезные ошибки из-за галлюцинаций моделей в ответах, а 21% чувствовали себя манипулируемыми.
imaginingthedigitalfuture.org
✔️ ReasonGraph: инструмент для анализа ризонинга LLM.
ReasonGraph - опенсорсная веб-платформа, разработанная Кембриджским университетом, для визуализации и анализа процессов рассуждений LLM. Она поддерживает как последовательные, так и древовидные методы рассуждений, легко интегрируясь с основными провайдерами LLM и более чем 50 языковыми моделями.
Платформа построена на модульном каркасе и имеет выбор метода мета-рассуждения и настраиваемые параметры визуализации.
ReasonGraph улучшает обнаружение ошибок в логических процессах и способствует более эффективной разработке приложений на основе LLM. Оценка платформы показала практически 100% точность rule-based XML-парсинга при извлечении и визуализации путей рассуждений.
Репозиторий проекта на Github. Демо на HuggingFace.
arxiv.org
✔️ MEGA mini: концепт архитектуры для универсальных NPU.
На конференции по твердотельным схемам (ISSCC) была представлена архитектура MEGA.mini, позиционируемая как универсальный процессор для генеративного ИИ.
MEGA.mini использует парадигму Arm big.LITTLE и предлагает использование двухъядерной концепции в NPU. Предполагается, что высокомощные ядра "Mega" будут задействоваться для выполнения ресурсоемких задач, а облегченные ядра "Mini" будут использоваться для рутинных операций. Архитектура разрабатывается как универсальный процессор, в отличие от CPU, чтобы разработчики могли применять его в разных сценариях - от NLP-задач до мультимодальных ИИ-систем.
techradar.com
✔️ Deepseek R1 671B запустили локально на новом Mac Ultra M3.
YouTube-блогер Дейв Ли провел эксперимент по локальному запуску 4-bit версии Deepseek R1 с 671B параметров. Она может работать локально, но требует 512 ГБ RAM, 404 ГБ хранилища и принудительного выделения 448 ГБ видеопамяти через терминал.
Несмотря на незначительное снижение точности, скорость инференса составила 17-18 токенов в секунду, при этом энергопотребление находилось в пределах 200 Вт. Для сравнения: ПК с аналогичной производительностью потребовал бы в 10 раз больше электричества.
macrumors.com
@ai_machinelearning_big_data
#news #ai #ml
🚀 Стартер-пак для разработчика LLM — собрали 120 бесплатных библиотек для обучения, файн-тюнинга, оценки и создания ваших ИИ-агентов в одной базе.
▪ Удобная классификация: все инструменты аккуратно распределены по категориям, каждая снабжена подробным описанием и ссылкой на GitHub с исчерпывающими гайдами.
▪ Легкость освоения: благодаря детальным инструкциям внутри ссылок разобраться в материалах будет проще простого.
📌 Сохраняйте эту подборку — настоящий клад для каждого разработчика: https://github.com/KalyanKS-NLP/llm-engineer-toolkit
@vistehno
⚡️ Осваиваем английский с нуля за три месяца — найден метод, позволяющий выучить любой язык, тратя всего 20 минут в день.
Что особенного:
— Вместо скучной зубрёжки слова запоминаются через ассоциации.
— Перевод автоматически закрепляется в подсознании.
— Уже через неделю можно включать видео фоном — мозг сам начнёт понимать суть.
— В каждом ролике — 900 ключевых слов.
— Достаточно всего 20 минут в день.
Готовые видео для английского, немецкого и испанского языков — учимся с легкостью!
@vistehno