Наука, технологии, изобретения и урбанистика — прямо сейчас говорим о том, что уже скоро повлияет на каждого. по всем вопросам - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы
🎲 OPPO X³ — первый в мире смартфон в форме кубика-кубика!
Вы готовы мыслить нестандартно?
Пользователь искал кемпинги на берегу озера в пределах 150 км от Вены и хотел проверить близость к полям для гольфа, где имелись скидочные купоны и забил запрос в manus
ИИ создал веб-сайт со списком вариантов, интерактивной картой и ссылками для бронирования!
@vistehno
⚡️ 10 open-source генераторов видео достойных вашего внимания (text-to-video и image-to-video)
1) HunyuanVideo (text-to-video)
Флагманская модель от Tencent (~13B параметров), обеспечивает высокое качество качество и реализм.
Категория: подходит для генерации реалистичных видео
▪Ресурсы: 45–80 ГБ VRAM, A100/H100, поддержка FP8
🟡Ссылка
2) Mochi (text-to-video)
Описание: модель от Genmo (~10B параметров), быстрая и мощная
▪Категория: реализм + плавность движения
▪Бенчмарки: качество почти на уровне Hunyuan, 30 FPS
▪Кейсы: реклама, креативы, short-видео
▪Ресурсы: Для работы модели требуется не менее 4 GPU H100., поддержка LoRA, FP8
🟡Ссылка
3) Wan2.1 (text/image-to-video)
▪Описание: универсальный генератор от Alibaba (до 14B параметров)
▪Категория: синтез движений, анимация изображения
▪Бенчмарки: высокая стабильность, особенно в SkyReels.
▪Кейсы: оживление изображений, видеопрототипы
▪Ресурсы: 12–24 ГБ VRAM (1.3B и 14B версии)
🟡Ссылка
4)LTX-Video-Trainer
Проект, предоставляющий инструменты и скрипты для обучения и дообучения модели LTX-Video от компании Lightricks.
▪Категория: с его помощью можно обучать адаптеры LoRA поверх LTX-Video, а также выполнять полное дообучение модели на ваших датасетах.
▪Ресурсы: не менее 12 ГБ GPU для эффективного обучения и дообучения модели. RaM: Минимум 16 ГБ;
🟡Ссылка
5) Pyramid Flow (text/image-to-video)
▪Описание: модель на базе Flux для генерации длинных видео (до 10 сек, 768p)
▪Категория: длительные сцены, плавные переходы
▪Бенчмарки: превосходство в motion stability
▪ Кейсы: нарративные ролики, контент для соцсетей
▪ Ресурсы: 12–48 ГБ VRAM
🟡Ссылка
6) CogVideo / CogVideoX (text-to-video)
▪Описание: трансформер на 9B/5B параметров от THU
▪Категория: стилизация, универсальность
▪ Бенчмарки: сильные CLIP/FVD, хорошая временная согласованность
▪ Кейсы: мультфильмы, обучающее видео, стилизованные ролики
▪Ресурсы: 20–24 ГБ VRAM, оптимизирован под FP8
🟡Ссылка
7) Step-Video-TI2V
Модель для генерации видео (до 102 кадров), производительностью SOTA.
Принимает на вход текстовые описания и изображения.
▪Бенчмарки: на VBench-I2V показывает лучшие результаты по сравнению с другими современными открытыми моделями для генерации видео из изображения и текста, а также лидирует в публичном рейтинге.
🟡Ссылка
8) AnimateDiff
Ветеран этого списка.
▪Категория: анимация, стилизация
▪Бенчмарки: высокая согласованность между кадрами
▪Кейсы: оживление арта, анимированные сцены
▪Ресурсы: от 8 ГБ VRAM, масштабируется до 24 ГБ для высокого качества
🟡Ссылка
9) Easy Animate (image-to-video)
▪Описание: генерация видео из одного кадра (Alibaba, EasyAnimate V5)
▪Категория: анимация изображения
▪Бенчмарки: стабильная идентичность объекта, плавность
▪Кейсы: оживление фото, персонажей, иллюстраций
▪Ресурсы: минимум 12–24 gb CPU
🟡Ссылка
10) Open-Sora Plan (и связанные проекты)
▪Описание: Это не одна конкретная модель, а скорее инициатива разработчиков (и несколько независимых проектов) по созданию и обучению open-source модели
▪Бенчмарки: Пока находятся в активной разработке. Сильная сторона - открытость и амбициозная цель. Результаты варьируются, но быстро улучшаются.
▪Ресурсы: Требования сильно зависят от конкретной реализации и этапа проекта.
📌 Подробное описание моделей
Добавляйте в комментариях ссылки генераторы, которыми вы пользуетесь 👇
#ai #video #videogenerator #ml
✔️ DeepSite на базе DeepSeek-V3-0324, позволяет генерировать, код, приложения или игры прямо в браузере и хостить их.
Сгенерировал парочку простеньких HTML-игр с интерфейсом, работает годно.
😶 По сути это Сursor в браузере.
🟡Попробовать: https://huggingface.co/spaces/enzostvs/deepsite
@ai_machinelearning_big_data
#deepseek #vibecoding #app
✔️ R²D²: набор решений для робототехники от NVIDIA.
NVIDIA Research предлагает 4 решения: MobilityGen генерирует синтетические данные в Isaac Sim, экономя время на сбор реальных данных, COMPASS создаёт универсальные алгоритмы передвижения для роботов любого типа — от двуногих до колесных, обеспечивая мгновенное внедрение из симуляции в реальность.
Для гуманоидов важен контроль всего тела: HOVER объединяет управление балансом, движением и манипуляциями в единую нейросеть, а ReMEmbR добавляет «память» — робот анализирует окружение с помощью ИИ-моделей (LLM, VLM) и действует на основе контекста.
Уже сейчас эти решения тестируют компании Under Control Robotics и Advantech: роботы собирают данные, перемещают грузы и избегают препятствий в динамичных условиях. Для разработчиков доступны исходники на GitHub и набор учебных материалов.
developer.nvidia.com
✔️ Google анонсировала ИИ-инструменты для планирования путешествий.
Google тизернула набор функций с ИИ для организации летних поездок. В Поиске теперь доступны AI Overviews — сводки, которые генерируют маршруты по запросам вроде «создать план поездки в Коста-Рику с акцентом на природу». В Gemini появился инструмент, позволяющий настраивать «экспертов» под конкретные задачи — например, для подбора направлений или списка вещей в дорогу. Отдельное внимание уделили отслеживанию цен: теперь, кроме авиабилетов, система уведомит о снижении стоимости отелей через email.
Обновление коснулось и Google Maps: приложение научилось анализировать скриншоты с сохраненными локациями. Достаточно открыть доступ к фото — и ИИ автоматически распознает места, предложив добавить их в список.
Пока функция доступна в США на iOS, версия для Android ожидается в ближайшее время.
techcrunch.com
✔️ Garmin запустил платный сервис с ИИ-аналитикой.
Garmin открыла платную подписку Connect+ за $7 в месяц, предлагающую ИИ-функции для анализа тренировок - персонализированные рекомендации, дашборд эффективности и советы для бегунов и велосипедистов. Сервис использует историю активности, чтобы оптимизировать прогресс и уведомления LiveTrack для безопасности.
В отличие от Strava (от $12/месяц), Garmin сохраняет доступную цену, делая AI-инструменты привлекательнее для любителей и профи. Хотя часть пользователей критикует переход на монетизацию, 30-дневный тест-период позволяет оценить новинку.
gizmodo.com
✔️ Vamba: новая архитектура для анализ длинных видео.
Vamba — гибридная архитектура на основе Mamba и Transformer для обработки длинных видео. Она позволяет анализировать до 100 тыс. видеотокенов без сжатия, сохраняя ключевые сцены и действия. За счёт замены части операций на модули Mamba-2, сложность вычислений снижается с квадратичной до линейной, что ускоряет обучение в 2 раза и сокращает потребление памяти на 50%.
В тестах На LVBench Vamba обошла конкурентов по точности (плюс 4,3%) и по стабильности обработки: даже при 512 кадрах потребление памяти не превышала 12 ГБ. Дополнительные тесты на датасетах с шумом и динамичными сценами доказали, что архитектура сохраняет детализацию без «провалов» в сложных условиях. Модель уже доступна в открытом доступе — код, веса.
tiger-ai-lab.github.io
✔️ Apple обновила Final Cut: поддержка Apple Intelligence и новые инструменты.
Apple выпустила обновления для Final Cut Pro на Mac, iPad и приложения Final Cut Camera. Главным новшеством стала интеграция Apple Intelligence: теперь в Image Playground можно быстро генерировать стилизованные изображения на основе описаний или фото из библиотеки.
Для Mac добавлены коррекция цвета, аудиоэффект Quantec QRS и улучшенный Magnetic Mask. На iPad появилась портретная ориентация и хоткеи для монтажа. Final Cut Camera обзавелась переключением на 48-мм телеобъектив (для iPhone 14 Pro и новее), поддержкой Apple Log LUT и записью в Spatial Audio (требуется iPhone 16).
Технические требования: macOS 15.2 и новее для Mac на M1+, iOS 18.2 для устройств с A17 Pro/M1.
9to5mac.com
@ai_machinelearning_big_data
#news #ai #ml
🤖 ChatGPT VS DeepSeek
Приглашаем на открытый урок.
🗓 01 апреля в 18:00 МСК
🆓 Бесплатно. Урок в рамках старта курса «NLP. Advanced».
ChatGPT, DeepSeek, Gemini… Что у них внутри и какие технологии их создают?
На открытом уроке разберем архитектуру современных LLM, методы их обучения и принципы, которые двигают индустрию NLP вперед.
Спикер Мария Тихонова – PhD Computer Science, Senior Data Scientist в SberDevices и преподаватель ВШЭ.
Если вы хотите глубже понять работу LLM, разобраться в ключевых концепциях DeepSeek и узнать о будущих трендах, этот вебинар для вас.
Участвуйте и получите скидку для обучения на курсе «NLP. Advanced».
🔗 Ссылка на регистрацию: https://otus.pw/ATev/
⚡️ Ideogram 3.0 — это последняя версия генеративной модели от компании Ideogram AI.
Генератор обеспечивает высокий реализм изображений, креативность и поддерживает качество рендеринга текста.
Согласно внутренним оценкам, Ideogram 3.0 превосходит другие текст-изображение модели по широкому спектру задач.
Одной из ключевых фишек Ideogram 3.0 является "Style References", позволяющая пользователям загружать до трех референсных изображений для генерации контента в заданном стиле.
ЭТО упрощает создание изображений с трудноописуемой текстом эстетикой, ускоряя и делая более выразительным творческий процесс.
Для вдохновения доступна функция случайного выбора стиля из библиотеки из 4,3 миллиарда пресетов, а понравившиеся стили можно сохранить и повторно использовать с помощью их уникальных кодов.
Кроме того, Ideogram 3.0 предлагает расширенные возможности генерации текста и макетов для графического дизайна, рекламы и маркетинга. Модель способна создавать стилизованный и точный текст с высокой точностью, включая сложные и длинные композиции, с которыми другие модели испытывают трудности. Созданный текст отличается красотой и художественностью, превосходя возможности традиционных дизайнерских платформ.
Ideogram 3.0 доступна для всех пользователей на платформе ideogram.ai и в приложении для iOS. Доступно 2 генерации на бесплатном тарифе, $20/мес.
🎯 Блог
⚡️ Google представил свою самую мощную нейросеть — новая «думающая» Gemini 2.5 Pro опережает всех конкурентов.
🚀 Пишет код на уровне сеньора с 10-летним опытом, решает любые математические задачи и, что самое главное, бесплатна.
Пробуем можно в AI Studio.
«Ошибка на миллиард» в ИИ
«Ошибка на миллиард долларов» — это популяризованное ученым Чарльзом Э. Хоаром название для null pointer exception. В большинстве классических языков программирования переменная, якобы содержащая объект какого-то класса, на самом деле может ничего не содержать.
В мире генеративных нейросетей «ошибкой на миллиард» можно назвать галлюцинации LLM. «Творческая натура» больших языковых моделей играет со строгими задачами злую шутку: в любой непонятной ситуации модель принимается фантазировать на основе претрейна.
Старший инженер по разработке ПО искусственного интеллекта в YADRO описал метод, который использовал, чтобы значительно снизить галлюцинации в выдаче модели.
Читать статью →
Сотрудники Авито ведут свой telegram-канал ⭐️
И знаете, получается мега-лампово и увлекательно. Всего через несколько постов начинаешь уже чувствовать себя частью их уютного офиса: рядом — знакомые весёлые коллеги из постов, и вам точно есть что обсудить.
А вообще хвалим и одобряем. Во-первых, смело и интересно. Во-вторых, для тех, кто рассматривает работу в компании, это возможность изучить культуру и вайб команды ещё до трудоустройства.
🔥 Однозначно подписка — @avito_life
🔥🔥 Если думаешь о работе в Авито, то добавляй сразу — @avito_career
🌅 HunyuanVideo-I2V
HunyuanVideo-I2V – это модель с открытым исходным кодом, предназначенная для создания видео на основе изображений, разработанная с активным участием сообщества.
В репозитории доступны реализации на PyTorch, предобученные веса и код для инференса. Для стабильной работы модели требуется NVIDIA GPU с поддержкой CUDA и не менее 80 ГБ видеопамяти. Кроме того, модель оснащена широким спектром настроек, позволяющих повысить качество генерируемого видео.
📌 Github
@vistehno
Трамп очень высоко оценил IT-навыки своего сына Бэррона
«Я выключаю его компьютер, а через 5 минут он снова работает! Как он это делает? У него потрясающие отношения с технологиями!» - заявил Трамп.
Мальчику всего 19 годиков.
@vistehno
💬 OPEN AI добавили API 3 новых SOTA аудио-модели.
🗣️ Две модели преобразования речи в текст, которые, как заявляют разработчики, превосходят Whisper.
💬 1 Новая модель TTS - которой можно указать *как* ей говорить.
Поддерживает функцию задания интонации, тона, тембра голоса и еще множества других параметров с помощью промпта.
🤖 Еще OpenAi выпустили Agents SDK, который для создания голосовых агентов.
Через час состоится стрим, где покажут примера создания голосовых агентов с новыми аудиомоделями.
📌 Потестить можно здесь: https://www.openai.fm/
🔥 Стрим Open AI - Создание голосовых агентов с новыми аудиомоделями
https://openai.com/live/
Хотите получить много практики на реальных задачах, собрать портфолио и узнать как выглядит рабочий день аналитика?
CEO Simulative и эксперт с большим опытом в аналитике, Андрон Алексанян организовал бесплатный интенсив, где вы будете решать реальные задачи, с которыми аналитики сталкиваются на работе
На прямых эфирах вы сделаете:
🟠Анализ активности пользователей с помощью SQL
🟠Анализ маркетинговых активностей с помощью Python
🟠ABC анализ ассортиментной матрицы в Excel (уже прошел, но вам будет доступна запись)
Во время эфиров вы узнаете много лайфхаков, а также будете получать полезные материалы для развития в аналитике на протяжении всего интенсива
❗️Знать Python и SQL не обязательно — все будем разбирать с нуля
🕗 Встречаемся на новом эфире уже сегодня, 20 марта в 19:00 по мск
😶Участвовать в бесплатном интенсиве
🔥 Claude теперь интегрирован в Unity, Blender и Unreal Engine — MCP-плагины остаются в центре внимания! Теперь для создания игры достаточно лишь клавиатуры.
• Claude в Unity— генерирует геймплейные механики (физику, цели, таймеры), окружение, эффекты, интерфейсы, миникарты и многое другое.
• Claude в Blender — мгновенно создаёт 3D-модели и сцены, превращает фотографии в игровые локации и редактирует их по вашим командам.
• Claude в Unreal Engine — создаёт объекты, задаёт им форму и разрабатывает их логику всего за несколько минут.
Сохраняйте и пробуйте в деле! 🚀
🤖 У робота Unitree появились очень ловкие руки.
Прогресс в робототехнике невероятно стремительный.
Топ-100 нейросетей для любых задач — откопали на Reddit таблицу с самыми свежими инструментами.
Пост
@vistehno
Мобильный робот, который может летать! 🐝
DoubleBee — новый робот, разработанный в Наньянском технологическом университете в Сингапуре, который может как летать, так и передвигаться по земле, используя два наклонных пропеллера и два колеса.
В воздухе он летает эффективно, как бикоптер, а на земле он балансирует, как двухколесный робот, экономя энергию. На земле пропеллеры помогают контролировать его равновесие, а колеса управляют движением, облегчая управление.
DoubleBee может перемещаться в сложных условиях, перелетать через препятствия, проползать под ограждениями и взбираться на крутые склоны.
@vistehno
🖥 «Синьхо» (Xinghuo) – это амбициозный китайский проект экспериментальной электростанции, которая совмещает термоядерный синтез и ядерное деление в одном реакторе. Идея гибридного реактора заключается в том, что нейтроны от реакции синтеза запускают реакцию деления, объединяя преимущества обоих процессов.
Такой подход позволяет:
Получить высокий выход энергии: за счёт дополнительной энергии деления реактор рассчитан на рекордный коэффициент усиления Q > 30, то есть вырабатывать энергии в 30 раз больше, чем затрачивается на нагрев плазмы
Сократить ядерные отходы: использование нейтронов синтеза позволяет более полно «сжигать» ядерное топливо. Ожидается, что это увеличит энергоотдачу и уменьшит количество долгоживущих радиоактивных отходов по сравнению с обычными АЭС.
Применить новые технологии: реактор проектируется на базе высокотемпературных сверхпроводящих магнитов для магнитного удержания плазмы
Это новейший подход в термоядерной энергетике, позволяющий создавать более сильное магнитное поле с меньшими энергопотерями.
Название «Синьхо» переводится с китайского как «Искра», отсылая к известной цитате Мао Цзэдуна: «от одной искры вспыхнет степь»
«Синьхо» расширит границы исследований в физике плазмы, материаловедении и реакторостроении. Сам факт запуска такого комплекса предоставит уникальные данные о поведении плазмы в длительном режиме, о взаимодействии нейтронов синтеза с топливом деления и материалами конструкции. Этот проект послужит испытательным полигоном для новых технологий (сверхпроводники, новые топливные циклы), знания с которого смогут использовать ученые и инженеры по всему миру. Успешная работа «Синьхо» подтвердит принципиальную реализуемость гибридного подхода, что повлияет на дизайн будущих крупномасштабных термоядерных проектов во всём мире
Это важный, но промежуточный этап в развитии термоядерной энергетики. Речь идёт не о совершившейся научной сенсации, а о начале строительства уникального реактора.
Сам по себе запуск проекта «Синьхо» – значимое событие: Китай официально приступил к реализации первой в мире гибридной термоядерной электростанции. Это свидетельствует о серьёзном прогрессе и намерениях, однако до настоящего прорыва ещё предстоит путь. Впереди годы инженерных работ и испытаний: только после 2030 года станет ясно, оправдаются ли высокие ожидания. Таким образом, новость скорее подчеркивает тенденцию и лидерство Китая в этой сфере, чем сообщает о готовом технологическом чуде.
Если «Синьхо» успешно заработает, это станет поворотным моментом для науки и энергетики. Но пока это смелый эксперимент – этап на пути к цели, за ходом которого будет внимательно следить весь мир.
🔗 Статья
@vistehno
Робот Unitree демонстрирует свои возможности на показе мод в Шанхае, знаменуя наступление будущего.
@vistehno
📹 Топ-15 технических YouTube-каналов для изучения ИИ с нуля:
1) Andrej Karpathy — сочетание общего и технического контента, плейлист "Zero to Hero" обязателен к просмотру
2) uproger">Uproger — доступные уроки по программированию и ИИ, идеально для начинающих и тех, кто хочет углубить свои знания.
3) UmarJamilAI">Umar Jamil — технический блог, где автор реализует методы ML и LLM с нуля
4) szymonozog7862">Simon Oz — технические видео по низкоуровневому машинному обучению
5) Tunadorable">Tunadorable — отличные обзоры научных статей, реализация
6) GPUMode">GPU Mode — технические интервью и разборы всего, что связано с GPU
7) AIJason">AI Jason — эксперименты с ИИ, дизайн ПО и новые модели, с понятным и полным разбором.
8) FerdinandMom">Ferdinand Mom — всё о распределённом обучении и выводах
9) WelchLabs">Welch Labs — уникальный глубокий взгляд на комплексность алгоритмов машинного обучения.
10) ArtemKirsanov">Artem Kirsanov — нейронаука и машинное обучение с необычного авторского взгляда + отличная визуализация контента.
11) DavidOndrej">David Ondrej — новые модели, создание приложений с ИИ, практично для разработчиков https://t.co/BEOr0MgHag @DavidOndrej1
12) 3Blue1Brown
Потрясающие визуализации, которые делают абстрактные математические концепции понятными и интуитивными.
13) Lex Fridman
Глубокие беседы с лидерами индустрии ИИ, позволяющие получить широкий взгляд на современные тенденции.
14) Machine Learning Street Talk
Технические погружения и обсуждения с ведущими исследователями в области ИИ и машинного обучения.
Ссылка:
15) StatQuest with Joshua Starmer PhD
Доступные и понятные объяснения основ машинного обучения и статистики для начинающих.
Этот список для технической аудитории. Очень сложно выбрать всего 15 каналов, ведь есть множество других, создающих отличный контент.
Если знаете ещё каналы, дайте пишите в комментариях!
@vistehno
🎮 DOOM запустили на советском трамвае — настоящий гений оживил классику на модели ЛМ-68М2 «Ретро»: теперь демоны из ада атакуют прямо в кабине водителя.
USB, конечно, не завезли, так что клавиатуру пришлось подключать через старый PS/2.
Дед точно оценит!
@vistehno
✔️ Ant Group использует китайские чипы для снижения стоимости обучения моделей на 20%
Ant Group успешно использовала хардверные решения от Alibaba и Huawei для обучения своих моделей, что позволило сократить затраты примерно на 20%. Результаты тестов показали, что китайские чипы сопоставимы по производительности с Nvidia H800. Хотя Ant Group пока полностью не отказывается от Nvidia для разработки ИИ, ее последние разработки в основном полагаются на альтернативные решения - AMD и чипы китайского производства.
Это свидетельствует о том, что китайские компании ускоряют локализацию технологий искусственного интеллекта, чтобы сократить затраты и уменьшить зависимость от американских чипов.
bloomberg.com
✔️ В Италии запущена первая в мире газета, созданная ChatGPT.
Итальянская газета Il Foglio начала месячный эксперимент, опубликовав первый в мире газетный выпуск, сгенерированный искусственным интеллектом. Цель эксперимента - изучить влияние ИИ на журналистику, используя ChatGPT для создания контента.
Редактор газеты Клаудио Сераса заявил, что ИИ использовался на всех этапах создания - от написания текстов и заголовков до цитат и резюме, при этом журналисты редакции участвуют в создании промптов для ИИ и проверке сгенерированных текстов.
asianfin.com
✔️ ARC Prize запускает бенчмарк ARC-AGI-2 с призовым фондом в 1 миллион долларов.
Команда ARC Prize запустила 2 этап бенчмарка ARC-AGI-2 для оценки «гибкости мышления» ИИ через задачи, которые человек решает за секунды, а алгоритмы — с трудом. Как и в прошлой версии, система проверяет способность к обобщению знаний, но теперь барьер выше: на нем базовые LLM набирают 0%, а продвинутые — меньше 4%. Призовой фонд бенчмарка -1 млн. долларов, главный приз получит разработка, которая сможет превысить 85% выполнения бенчмарка.
Решение задач ARC-AGI-2 требует интуиции и адаптивности — того, что в людях заложено природой. «Это не тест на эрудицию, а проверка умения мыслить вне данных», — поясняют разработчики.
arcprize.org
✔️ Поисковая система Atlantic позволит проверить, использовалась ли ваша работа для обучения моделей.
Компания The Atlantic разработала поисковый инструмент, позволяющий пользователям проверить, не фигурирует ли их работа в LibGen - архиве книг, научных работ и статей, который, как сообщается, использовался для обучения популярных языковых моделей.
Согласно судебным документам, набор данных LibGen использовался для обучения моделей Llama. OpenAI уже публично сообщила, что контент LibGen не включен в текущие версии ChatGPT или в API OpenAI. Другие компании, занимающиеся разработкой ИИ, пока не комментировали, использование LibGen в своем обучении.
theatlantic.com
✔️ OceanDS: 1,8 млрд. данных об океане стали основой первой океанографической LLM.
Китайская модель OceanDS, созданная для морских исследований, опирается на уникальную базу из 1,8 млрд токенов данных. В неё вошли оцифрованные научные работы, книги и отчёты — всё, что касается океана.
По тестам OceanDS обходит топовые LLM в точности ответов на профильные запросы — разрыв достигает 25%. Это первый в мире ИИ, заточенный под океанографию. Уже сейчас его тестируют в управлении природными ресурсами Китая, а в будущем — внедрят в другие отрасли.
news.cgtn.com
@ai_machinelearning_big_data
#AI #ML #Research #NLP
🧠 Neuralink с открытым исходным кодом с использованием активности мозга обезьяны для управления роботизированными руками 🙉
Проект Jenkins исследует интерфейсы мозг-компьютер путем декодирования нейронной активности в движения роботов и генерации синтетических мозговых данных.
Используя нейронные записи мозговой активности обезьяны по имени Дженкинс, исследователи разработали модели для преобразования мозговых сигналов в движения роботизированной руки.
В проекте используются роботизированные руки и интерактивная веб-консоль для генерации данных о работе мозга в режиме реального времени с помощью джойстика.
Исследование открывает путь к созданию адаптивных интерфейсов «мозг-компьютер» за счет гибкого моделирования активности мозга.
▪ Github
@vistehno
🌟 Интересная визуализация для быстрого запоминания азбуки Морзе!
@vistehno
📌Ученые обнаружили сходство между мозгом человека и нейросетями в принципах обработки языка.
Совместное исследование Google Research, Принстонского университета, NYU и Еврейского университета в Иерусалиме нашло параллели в обработке естественного языка человеческим мозгом и большими языковыми моделями.
Используя внутричерепные электроды, ученые зафиксировали нейронную активность во время спонтанных диалогов и сравнили ее с внутренними представлениями модели Whisper, разработанной для преобразования речи в текст. Оказалось, что речевые эмбеддинги Whisper коррелируют с активностью в слуховых зонах мозга, а языковые — с областями, ответственными за семантику.
Эксперименты подтвердили догадки: при восприятии речи сначала активируется верхняя височная извилина (STG), обрабатывающая акустические сигналы, а через несколько сотен миллисекунд включается зона Брока (IFG), связанная с декодированием смысла. При воспроизведении речи последовательность обратная: IFG активируется за 500 мс до артикуляции, затем моторная кора планирует движение, а после произнесения слова STG «проверяет» результат. Эти паттерны совпали с динамикой эмбедингов Whisper, хотя модель не обучалась на нейробиологических данных.
Другое интересное совпадение - мозг и LLM используют предсказание следующего слова как ключевую стратегию. Как показали опыты, слушатель бессознательно предугадывает следующие слова, а ошибка предсказания вызывает «нейронное удивление» — механизм, аналогичный обучению с подкреплением в ML. Но архитектурные механизмы у мозга и LLM разные: трансформеры обрабатывают сотни слов параллельно, тогда как мозг анализирует информацию последовательно.
Несмотря на общую «мягкую иерархию» обработки (например, смешение семантических и акустических признаков в IFG и STG), биологические структуры мозга принципиально отличаются от нейронных сетей.
Исследователи подчеркивают: языковые модели (типа ChatGPT) не понимают, как люди общаются в реальной жизни (например, не чувствуют эмоций или культурных особенностей), и не учатся так, как это делает мозг человека с детства. Однако их эмбединги оказались очень полезными для изучения того, как мозг обрабатывает речь.
Ученые надеются, что эти открытия помогут создать нейросети, которые смогут обучаться как люди — медленно, шаг за шагом. А пока Whisper, неожиданно стал «зеркалом» принципов нашего мышления. Кто знает, может, через пару лет ИИ начнёт шутить с нами за чашкой кофе — как друг или коллега по работе.
🟡Статья
🟡Исследование
@ai_machinelearning_big_data
#AI #ML #Research #NLP
😞 А ведь он просто хотел завести новых друзей...
@vistehno
📡 Запущен первый спутник FireSat, который поможет раньше обнаруживать небольшие лесные пожары.
FireSat, новый прототип спутника обнаружения лесных пожаров, запущен на Falcon 9 компании SpaceX! Высококачественные изображения, обновляемые каждые 20 минут, скоро помогут обнаруживать лесные пожары размером 5x5 м по всему миру.
📌 Читать
#news #ai #ml
🌟 KBLaM: новая архитектура интеграции знаний для языковых моделей от Microsoft Research.
Microsoft Research представила KBLaM - архитектуру, которая решает ключевую проблему LLM — добавление новых внешних знаний. В отличие от традиционных методов файнтюна и RAG, KBLaM кодирует новые для LLM структурированные данные в виде векторных пар «ключ-значение», встраивая их напрямую в слои внимания модели. Это позволяет избежать дорогостоящего дообучения и построение дополнительных модулей, сохраняя линейную масштабируемость даже для баз знаний в 10 000 триплетов.
В KBLaM триплет — это структурированный элемент знания, состоящий из трех компонентов: сущности, свойства и значения. Например, в утверждении «Москва — столица России» сущностью выступает «Москва», свойством — «столица», а значением — «Россия».
llama_model.py
в src/kblam/models
.🤖 Новые тренды среди последних LLM
🗓 24 марта в 18:00 МСК
🆓 Бесплатно. Урок в рамках старта курса «NLP / Natural Language Processing».
LLM и трансформерные модели такие как ChatGPT, GPT4, GigaChat стали не только стандартом в области языкового моделирования, но и незаменимыми помощниками для решения огромного числа задач: от написания кода, до генерации сказок.
На вебинаре мы расскажем про последние тренды в этой области: чего уже достигли современные LLM сегодня и что нас ждет в ближайшем будущем.
Данный открытый урок будет особенно интересен:
- IT-специалистам, которые хотят расширить свои знания в Data Science
- Дата-сайентистам, желающим углубить свои знания по автоматической обработке текстов
- Тем кто самостоятельно изучает Data Science
В результате вебинара вы:
- поймете основные технологии за современными LLM сегодня
- узнаете про основные тренды в области больших языковых моделей
- узнаете, что ждет область LLM в ближайшие годы
🔗 Ссылка на регистрацию: https://otus.pw/DSIV/