Наука, технологии, изобретения и урбанистика — прямо сейчас говорим о том, что уже скоро повлияет на каждого. по всем вопросам - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы
🤖 Используем BERT для решения NLP задач
🗓 07 апреля в 18:00 МСК
🆓 Бесплатно. Урок в рамках старта курса «NLP / Natural Language Processing».
Вебинар посвящен такой классической трансформерной модели BERT, которая в свое время совершила революцию в мире Natural Language Processing. На вебинаре вы узнаете, что представлет из себя модель BERT. И как с ее помощью можно легко и эффективно решать разнообразные NLP задачи.
Данный вебинар будет особенно интересен:
- Практикующим Data Scientist и ИТ-специалистам, которые хотят глубже погрузиться в область NLP
- Тем, кто хочет узнать, что делает ChatGPT такой умной
- Людям, освоившими основы машинного обучения, но желающими развиваться в области DS
В результате урока вы:
- Узнаете, устройство модели BERT
- Научитесь дообучать предобученные трансформерные модели
- Научитесь дообучать BERT и работать с ним на практике.
🔗 Ссылка на регистрацию: https://otus.pw/I62M/?erid=2W5zFGdASGG
#реклама
О рекламодателе
«Бегущий по лезвию 2049»: BYD и DJI запустили продажи системы для запуска дронов с крыши автомобилей. Дрон снимает пейзажи, делает эффектные пролёты рядом с машиной и помогает на бездорожье. Взлёт — прямо с крыши.
@vistehno
🤖 У робота Unitree появились очень ловкие руки.
Прогресс в робототехнике невероятно стремительный.
Топ-100 нейросетей для любых задач — откопали на Reddit таблицу с самыми свежими инструментами.
Пост
@vistehno
Мобильный робот, который может летать! 🐝
DoubleBee — новый робот, разработанный в Наньянском технологическом университете в Сингапуре, который может как летать, так и передвигаться по земле, используя два наклонных пропеллера и два колеса.
В воздухе он летает эффективно, как бикоптер, а на земле он балансирует, как двухколесный робот, экономя энергию. На земле пропеллеры помогают контролировать его равновесие, а колеса управляют движением, облегчая управление.
DoubleBee может перемещаться в сложных условиях, перелетать через препятствия, проползать под ограждениями и взбираться на крутые склоны.
@vistehno
🖥 «Синьхо» (Xinghuo) – это амбициозный китайский проект экспериментальной электростанции, которая совмещает термоядерный синтез и ядерное деление в одном реакторе. Идея гибридного реактора заключается в том, что нейтроны от реакции синтеза запускают реакцию деления, объединяя преимущества обоих процессов.
Такой подход позволяет:
Получить высокий выход энергии: за счёт дополнительной энергии деления реактор рассчитан на рекордный коэффициент усиления Q > 30, то есть вырабатывать энергии в 30 раз больше, чем затрачивается на нагрев плазмы
Сократить ядерные отходы: использование нейтронов синтеза позволяет более полно «сжигать» ядерное топливо. Ожидается, что это увеличит энергоотдачу и уменьшит количество долгоживущих радиоактивных отходов по сравнению с обычными АЭС.
Применить новые технологии: реактор проектируется на базе высокотемпературных сверхпроводящих магнитов для магнитного удержания плазмы
Это новейший подход в термоядерной энергетике, позволяющий создавать более сильное магнитное поле с меньшими энергопотерями.
Название «Синьхо» переводится с китайского как «Искра», отсылая к известной цитате Мао Цзэдуна: «от одной искры вспыхнет степь»
«Синьхо» расширит границы исследований в физике плазмы, материаловедении и реакторостроении. Сам факт запуска такого комплекса предоставит уникальные данные о поведении плазмы в длительном режиме, о взаимодействии нейтронов синтеза с топливом деления и материалами конструкции. Этот проект послужит испытательным полигоном для новых технологий (сверхпроводники, новые топливные циклы), знания с которого смогут использовать ученые и инженеры по всему миру. Успешная работа «Синьхо» подтвердит принципиальную реализуемость гибридного подхода, что повлияет на дизайн будущих крупномасштабных термоядерных проектов во всём мире
Это важный, но промежуточный этап в развитии термоядерной энергетики. Речь идёт не о совершившейся научной сенсации, а о начале строительства уникального реактора.
Сам по себе запуск проекта «Синьхо» – значимое событие: Китай официально приступил к реализации первой в мире гибридной термоядерной электростанции. Это свидетельствует о серьёзном прогрессе и намерениях, однако до настоящего прорыва ещё предстоит путь. Впереди годы инженерных работ и испытаний: только после 2030 года станет ясно, оправдаются ли высокие ожидания. Таким образом, новость скорее подчеркивает тенденцию и лидерство Китая в этой сфере, чем сообщает о готовом технологическом чуде.
Если «Синьхо» успешно заработает, это станет поворотным моментом для науки и энергетики. Но пока это смелый эксперимент – этап на пути к цели, за ходом которого будет внимательно следить весь мир.
🔗 Статья
@vistehno
Робот Unitree демонстрирует свои возможности на показе мод в Шанхае, знаменуя наступление будущего.
@vistehno
📹 Топ-15 технических YouTube-каналов для изучения ИИ с нуля:
1) Andrej Karpathy — сочетание общего и технического контента, плейлист "Zero to Hero" обязателен к просмотру
2) uproger">Uproger — доступные уроки по программированию и ИИ, идеально для начинающих и тех, кто хочет углубить свои знания.
3) UmarJamilAI">Umar Jamil — технический блог, где автор реализует методы ML и LLM с нуля
4) szymonozog7862">Simon Oz — технические видео по низкоуровневому машинному обучению
5) Tunadorable">Tunadorable — отличные обзоры научных статей, реализация
6) GPUMode">GPU Mode — технические интервью и разборы всего, что связано с GPU
7) AIJason">AI Jason — эксперименты с ИИ, дизайн ПО и новые модели, с понятным и полным разбором.
8) FerdinandMom">Ferdinand Mom — всё о распределённом обучении и выводах
9) WelchLabs">Welch Labs — уникальный глубокий взгляд на комплексность алгоритмов машинного обучения.
10) ArtemKirsanov">Artem Kirsanov — нейронаука и машинное обучение с необычного авторского взгляда + отличная визуализация контента.
11) DavidOndrej">David Ondrej — новые модели, создание приложений с ИИ, практично для разработчиков https://t.co/BEOr0MgHag @DavidOndrej1
12) 3Blue1Brown
Потрясающие визуализации, которые делают абстрактные математические концепции понятными и интуитивными.
13) Lex Fridman
Глубокие беседы с лидерами индустрии ИИ, позволяющие получить широкий взгляд на современные тенденции.
14) Machine Learning Street Talk
Технические погружения и обсуждения с ведущими исследователями в области ИИ и машинного обучения.
Ссылка:
15) StatQuest with Joshua Starmer PhD
Доступные и понятные объяснения основ машинного обучения и статистики для начинающих.
Этот список для технической аудитории. Очень сложно выбрать всего 15 каналов, ведь есть множество других, создающих отличный контент.
Если знаете ещё каналы, дайте пишите в комментариях!
@vistehno
🎮 DOOM запустили на советском трамвае — настоящий гений оживил классику на модели ЛМ-68М2 «Ретро»: теперь демоны из ада атакуют прямо в кабине водителя.
USB, конечно, не завезли, так что клавиатуру пришлось подключать через старый PS/2.
Дед точно оценит!
@vistehno
✔️ Ant Group использует китайские чипы для снижения стоимости обучения моделей на 20%
Ant Group успешно использовала хардверные решения от Alibaba и Huawei для обучения своих моделей, что позволило сократить затраты примерно на 20%. Результаты тестов показали, что китайские чипы сопоставимы по производительности с Nvidia H800. Хотя Ant Group пока полностью не отказывается от Nvidia для разработки ИИ, ее последние разработки в основном полагаются на альтернативные решения - AMD и чипы китайского производства.
Это свидетельствует о том, что китайские компании ускоряют локализацию технологий искусственного интеллекта, чтобы сократить затраты и уменьшить зависимость от американских чипов.
bloomberg.com
✔️ В Италии запущена первая в мире газета, созданная ChatGPT.
Итальянская газета Il Foglio начала месячный эксперимент, опубликовав первый в мире газетный выпуск, сгенерированный искусственным интеллектом. Цель эксперимента - изучить влияние ИИ на журналистику, используя ChatGPT для создания контента.
Редактор газеты Клаудио Сераса заявил, что ИИ использовался на всех этапах создания - от написания текстов и заголовков до цитат и резюме, при этом журналисты редакции участвуют в создании промптов для ИИ и проверке сгенерированных текстов.
asianfin.com
✔️ ARC Prize запускает бенчмарк ARC-AGI-2 с призовым фондом в 1 миллион долларов.
Команда ARC Prize запустила 2 этап бенчмарка ARC-AGI-2 для оценки «гибкости мышления» ИИ через задачи, которые человек решает за секунды, а алгоритмы — с трудом. Как и в прошлой версии, система проверяет способность к обобщению знаний, но теперь барьер выше: на нем базовые LLM набирают 0%, а продвинутые — меньше 4%. Призовой фонд бенчмарка -1 млн. долларов, главный приз получит разработка, которая сможет превысить 85% выполнения бенчмарка.
Решение задач ARC-AGI-2 требует интуиции и адаптивности — того, что в людях заложено природой. «Это не тест на эрудицию, а проверка умения мыслить вне данных», — поясняют разработчики.
arcprize.org
✔️ Поисковая система Atlantic позволит проверить, использовалась ли ваша работа для обучения моделей.
Компания The Atlantic разработала поисковый инструмент, позволяющий пользователям проверить, не фигурирует ли их работа в LibGen - архиве книг, научных работ и статей, который, как сообщается, использовался для обучения популярных языковых моделей.
Согласно судебным документам, набор данных LibGen использовался для обучения моделей Llama. OpenAI уже публично сообщила, что контент LibGen не включен в текущие версии ChatGPT или в API OpenAI. Другие компании, занимающиеся разработкой ИИ, пока не комментировали, использование LibGen в своем обучении.
theatlantic.com
✔️ OceanDS: 1,8 млрд. данных об океане стали основой первой океанографической LLM.
Китайская модель OceanDS, созданная для морских исследований, опирается на уникальную базу из 1,8 млрд токенов данных. В неё вошли оцифрованные научные работы, книги и отчёты — всё, что касается океана.
По тестам OceanDS обходит топовые LLM в точности ответов на профильные запросы — разрыв достигает 25%. Это первый в мире ИИ, заточенный под океанографию. Уже сейчас его тестируют в управлении природными ресурсами Китая, а в будущем — внедрят в другие отрасли.
news.cgtn.com
@ai_machinelearning_big_data
#AI #ML #Research #NLP
🧠 Neuralink с открытым исходным кодом с использованием активности мозга обезьяны для управления роботизированными руками 🙉
Проект Jenkins исследует интерфейсы мозг-компьютер путем декодирования нейронной активности в движения роботов и генерации синтетических мозговых данных.
Используя нейронные записи мозговой активности обезьяны по имени Дженкинс, исследователи разработали модели для преобразования мозговых сигналов в движения роботизированной руки.
В проекте используются роботизированные руки и интерактивная веб-консоль для генерации данных о работе мозга в режиме реального времени с помощью джойстика.
Исследование открывает путь к созданию адаптивных интерфейсов «мозг-компьютер» за счет гибкого моделирования активности мозга.
▪ Github
@vistehno
🌟 Интересная визуализация для быстрого запоминания азбуки Морзе!
@vistehno
📌Ученые обнаружили сходство между мозгом человека и нейросетями в принципах обработки языка.
Совместное исследование Google Research, Принстонского университета, NYU и Еврейского университета в Иерусалиме нашло параллели в обработке естественного языка человеческим мозгом и большими языковыми моделями.
Используя внутричерепные электроды, ученые зафиксировали нейронную активность во время спонтанных диалогов и сравнили ее с внутренними представлениями модели Whisper, разработанной для преобразования речи в текст. Оказалось, что речевые эмбеддинги Whisper коррелируют с активностью в слуховых зонах мозга, а языковые — с областями, ответственными за семантику.
Эксперименты подтвердили догадки: при восприятии речи сначала активируется верхняя височная извилина (STG), обрабатывающая акустические сигналы, а через несколько сотен миллисекунд включается зона Брока (IFG), связанная с декодированием смысла. При воспроизведении речи последовательность обратная: IFG активируется за 500 мс до артикуляции, затем моторная кора планирует движение, а после произнесения слова STG «проверяет» результат. Эти паттерны совпали с динамикой эмбедингов Whisper, хотя модель не обучалась на нейробиологических данных.
Другое интересное совпадение - мозг и LLM используют предсказание следующего слова как ключевую стратегию. Как показали опыты, слушатель бессознательно предугадывает следующие слова, а ошибка предсказания вызывает «нейронное удивление» — механизм, аналогичный обучению с подкреплением в ML. Но архитектурные механизмы у мозга и LLM разные: трансформеры обрабатывают сотни слов параллельно, тогда как мозг анализирует информацию последовательно.
Несмотря на общую «мягкую иерархию» обработки (например, смешение семантических и акустических признаков в IFG и STG), биологические структуры мозга принципиально отличаются от нейронных сетей.
Исследователи подчеркивают: языковые модели (типа ChatGPT) не понимают, как люди общаются в реальной жизни (например, не чувствуют эмоций или культурных особенностей), и не учатся так, как это делает мозг человека с детства. Однако их эмбединги оказались очень полезными для изучения того, как мозг обрабатывает речь.
Ученые надеются, что эти открытия помогут создать нейросети, которые смогут обучаться как люди — медленно, шаг за шагом. А пока Whisper, неожиданно стал «зеркалом» принципов нашего мышления. Кто знает, может, через пару лет ИИ начнёт шутить с нами за чашкой кофе — как друг или коллега по работе.
🟡Статья
🟡Исследование
@ai_machinelearning_big_data
#AI #ML #Research #NLP
😞 А ведь он просто хотел завести новых друзей...
@vistehno
📡 Запущен первый спутник FireSat, который поможет раньше обнаруживать небольшие лесные пожары.
FireSat, новый прототип спутника обнаружения лесных пожаров, запущен на Falcon 9 компании SpaceX! Высококачественные изображения, обновляемые каждые 20 минут, скоро помогут обнаруживать лесные пожары размером 5x5 м по всему миру.
📌 Читать
#news #ai #ml
✔️ Google обновляет ряды руководителей ИИ-проектов.
Google объявила о смене руководства в подразделении потребительских приложений искусственного интеллекта: Josh Woodward сменил Sissie Hsiao на посту главы этого подразделения.
Hsiao, который возглавлял потребительские приложения ИИ, в том числе проект Gemini, покидает свой пост с сегодняшнего дня. Согласно инсайду, Sissie возьмет небольшой перерыв, после чего перейдет на новую должность в компании. Woodward, который ранее возглавлял Google Labs и контролировал запуск NotebookLM, продолжит проекты в Google Labs, одновременно взяв на себя новые обязанности. Это изменение происходит по мере того, как в гонке ИИ основное внимание уделяется не базовым моделям, а продуктам, созданным на их основе.
semafor.com
✔️ Nomic выпустила мультимодальные эмбединги для визуального поиска.
Nomic представила Nomic Embed Multimodal — набор опенсорсных эмбединг-моделей для создания векторных представлений текста, изображений, PDF и графиков. Флагманская модель ColNomic Embed Multimodal 7B показала 62.7 NDCG@5 на бенчмарке Vidore-v2, опережая предыдущие решения на 2.8 пункта.
Модели Nomic обрабатывают текст и изображения совместно, избегая сложных пайплайнов с OCR. Это особенно полезно для научных статей, технической документации или мультиязычных документов, где важен контекст.
Модели доступны в двух вариантах: ColNomic (многокомпонентные векторы) для максимальной точности и Nomic (одновекторные) для экономии ресурсов. Модели доступны на Hugging Face, а разобраться помогут гайды и ноутбуки Google Colab.
nomic.ai
✔️ Китайские ИТ-гиганты заказали чипов Nvidia на 16 млрд. долларов в первом квартале 2025 года.
ByteDance, Alibaba Group и Tencent Holdings разместили заказы на общую сумму более 16 миллиардов долларов на серверные чипы H20 AI от Nvidia в первом квартале 2025 года. Такой резкий рост спроса происходит на фоне опасений, что администрация США может наложить запрет на продажу этих чипов в Китай, ссылаясь на вопросы национальной безопасности.
H20 - самый доступный чип Nvidia для продажи в рамках действующих экспортных ограничений, которые запрещают передачу более мощных моделей китайским компаниям. Значительные заказы из Китая ставят Nvidia в сложное положение, поскольку она лавирует между возможностями для бизнеса и потенциальными геополитическими рисками.
theinformation.com
✔️ Google DeepMind опубликовали 145-страничный документ об ответственном развитии ИИ.
Google DeepMind выпустила подробный документ "Ответственный путь к AGI", в котором излагается технический план безопасного развития искусственного интеллекта общего назначения.
В документе подчеркивается важность устранения потенциальных рисков неправильного использования и несоответствия, связанных с технологией AGI. Несмотря на детальный подход, некоторые аналитики полагают, что документ может не полностью убедить скептиков в надежности и безопасности разработки AGI.
deepmind.google
✔️ Epic Games купит стартап Loci чтобы автоматизировать разметку 3D-контента.
Epic Games объявила о приобретении стартапа Loci, чья ИИ-платформа упрощает работу с 3D-ассетами. Технология автоматически генерирует теги для моделей, экономя время создателей на ручную разметку. Это особенно актуально для проектов с тысячами объектов — например, в Fortnite, где игроки добавляют элементы из популярных франшиз, провоцируя споры об авторских правах.
ИИ Loci не только ускоряет поиск и организацию контента, но и помогает выявлять нарушения интеллектуальной собственности. Loci будет интегрирован в экосистему Epic, в том числе в Unreal Editor для Fortnite и маркетплейс Fab, где продаются цифровые активы. Таким образом, разработчики получат инструменты для предотвращения юридических конфликтов и упрощения рабочих процессов.
epicgames.com
@ai_machinelearning_big_data
#news #ai #ml
🎲 OPPO X³ — первый в мире смартфон в форме кубика-кубика!
Вы готовы мыслить нестандартно?
Пользователь искал кемпинги на берегу озера в пределах 150 км от Вены и хотел проверить близость к полям для гольфа, где имелись скидочные купоны и забил запрос в manus
ИИ создал веб-сайт со списком вариантов, интерактивной картой и ссылками для бронирования!
@vistehno
⚡️ 10 open-source генераторов видео достойных вашего внимания (text-to-video и image-to-video)
1) HunyuanVideo (text-to-video)
Флагманская модель от Tencent (~13B параметров), обеспечивает высокое качество качество и реализм.
Категория: подходит для генерации реалистичных видео
▪Ресурсы: 45–80 ГБ VRAM, A100/H100, поддержка FP8
🟡Ссылка
2) Mochi (text-to-video)
Описание: модель от Genmo (~10B параметров), быстрая и мощная
▪Категория: реализм + плавность движения
▪Бенчмарки: качество почти на уровне Hunyuan, 30 FPS
▪Кейсы: реклама, креативы, short-видео
▪Ресурсы: Для работы модели требуется не менее 4 GPU H100., поддержка LoRA, FP8
🟡Ссылка
3) Wan2.1 (text/image-to-video)
▪Описание: универсальный генератор от Alibaba (до 14B параметров)
▪Категория: синтез движений, анимация изображения
▪Бенчмарки: высокая стабильность, особенно в SkyReels.
▪Кейсы: оживление изображений, видеопрототипы
▪Ресурсы: 12–24 ГБ VRAM (1.3B и 14B версии)
🟡Ссылка
4)LTX-Video-Trainer
Проект, предоставляющий инструменты и скрипты для обучения и дообучения модели LTX-Video от компании Lightricks.
▪Категория: с его помощью можно обучать адаптеры LoRA поверх LTX-Video, а также выполнять полное дообучение модели на ваших датасетах.
▪Ресурсы: не менее 12 ГБ GPU для эффективного обучения и дообучения модели. RaM: Минимум 16 ГБ;
🟡Ссылка
5) Pyramid Flow (text/image-to-video)
▪Описание: модель на базе Flux для генерации длинных видео (до 10 сек, 768p)
▪Категория: длительные сцены, плавные переходы
▪Бенчмарки: превосходство в motion stability
▪ Кейсы: нарративные ролики, контент для соцсетей
▪ Ресурсы: 12–48 ГБ VRAM
🟡Ссылка
6) CogVideo / CogVideoX (text-to-video)
▪Описание: трансформер на 9B/5B параметров от THU
▪Категория: стилизация, универсальность
▪ Бенчмарки: сильные CLIP/FVD, хорошая временная согласованность
▪ Кейсы: мультфильмы, обучающее видео, стилизованные ролики
▪Ресурсы: 20–24 ГБ VRAM, оптимизирован под FP8
🟡Ссылка
7) Step-Video-TI2V
Модель для генерации видео (до 102 кадров), производительностью SOTA.
Принимает на вход текстовые описания и изображения.
▪Бенчмарки: на VBench-I2V показывает лучшие результаты по сравнению с другими современными открытыми моделями для генерации видео из изображения и текста, а также лидирует в публичном рейтинге.
🟡Ссылка
8) AnimateDiff
Ветеран этого списка.
▪Категория: анимация, стилизация
▪Бенчмарки: высокая согласованность между кадрами
▪Кейсы: оживление арта, анимированные сцены
▪Ресурсы: от 8 ГБ VRAM, масштабируется до 24 ГБ для высокого качества
🟡Ссылка
9) Easy Animate (image-to-video)
▪Описание: генерация видео из одного кадра (Alibaba, EasyAnimate V5)
▪Категория: анимация изображения
▪Бенчмарки: стабильная идентичность объекта, плавность
▪Кейсы: оживление фото, персонажей, иллюстраций
▪Ресурсы: минимум 12–24 gb CPU
🟡Ссылка
10) Open-Sora Plan (и связанные проекты)
▪Описание: Это не одна конкретная модель, а скорее инициатива разработчиков (и несколько независимых проектов) по созданию и обучению open-source модели
▪Бенчмарки: Пока находятся в активной разработке. Сильная сторона - открытость и амбициозная цель. Результаты варьируются, но быстро улучшаются.
▪Ресурсы: Требования сильно зависят от конкретной реализации и этапа проекта.
📌 Подробное описание моделей
Добавляйте в комментариях ссылки генераторы, которыми вы пользуетесь 👇
#ai #video #videogenerator #ml
✔️ DeepSite на базе DeepSeek-V3-0324, позволяет генерировать, код, приложения или игры прямо в браузере и хостить их.
Сгенерировал парочку простеньких HTML-игр с интерфейсом, работает годно.
😶 По сути это Сursor в браузере.
🟡Попробовать: https://huggingface.co/spaces/enzostvs/deepsite
@ai_machinelearning_big_data
#deepseek #vibecoding #app
✔️ R²D²: набор решений для робототехники от NVIDIA.
NVIDIA Research предлагает 4 решения: MobilityGen генерирует синтетические данные в Isaac Sim, экономя время на сбор реальных данных, COMPASS создаёт универсальные алгоритмы передвижения для роботов любого типа — от двуногих до колесных, обеспечивая мгновенное внедрение из симуляции в реальность.
Для гуманоидов важен контроль всего тела: HOVER объединяет управление балансом, движением и манипуляциями в единую нейросеть, а ReMEmbR добавляет «память» — робот анализирует окружение с помощью ИИ-моделей (LLM, VLM) и действует на основе контекста.
Уже сейчас эти решения тестируют компании Under Control Robotics и Advantech: роботы собирают данные, перемещают грузы и избегают препятствий в динамичных условиях. Для разработчиков доступны исходники на GitHub и набор учебных материалов.
developer.nvidia.com
✔️ Google анонсировала ИИ-инструменты для планирования путешествий.
Google тизернула набор функций с ИИ для организации летних поездок. В Поиске теперь доступны AI Overviews — сводки, которые генерируют маршруты по запросам вроде «создать план поездки в Коста-Рику с акцентом на природу». В Gemini появился инструмент, позволяющий настраивать «экспертов» под конкретные задачи — например, для подбора направлений или списка вещей в дорогу. Отдельное внимание уделили отслеживанию цен: теперь, кроме авиабилетов, система уведомит о снижении стоимости отелей через email.
Обновление коснулось и Google Maps: приложение научилось анализировать скриншоты с сохраненными локациями. Достаточно открыть доступ к фото — и ИИ автоматически распознает места, предложив добавить их в список.
Пока функция доступна в США на iOS, версия для Android ожидается в ближайшее время.
techcrunch.com
✔️ Garmin запустил платный сервис с ИИ-аналитикой.
Garmin открыла платную подписку Connect+ за $7 в месяц, предлагающую ИИ-функции для анализа тренировок - персонализированные рекомендации, дашборд эффективности и советы для бегунов и велосипедистов. Сервис использует историю активности, чтобы оптимизировать прогресс и уведомления LiveTrack для безопасности.
В отличие от Strava (от $12/месяц), Garmin сохраняет доступную цену, делая AI-инструменты привлекательнее для любителей и профи. Хотя часть пользователей критикует переход на монетизацию, 30-дневный тест-период позволяет оценить новинку.
gizmodo.com
✔️ Vamba: новая архитектура для анализ длинных видео.
Vamba — гибридная архитектура на основе Mamba и Transformer для обработки длинных видео. Она позволяет анализировать до 100 тыс. видеотокенов без сжатия, сохраняя ключевые сцены и действия. За счёт замены части операций на модули Mamba-2, сложность вычислений снижается с квадратичной до линейной, что ускоряет обучение в 2 раза и сокращает потребление памяти на 50%.
В тестах На LVBench Vamba обошла конкурентов по точности (плюс 4,3%) и по стабильности обработки: даже при 512 кадрах потребление памяти не превышала 12 ГБ. Дополнительные тесты на датасетах с шумом и динамичными сценами доказали, что архитектура сохраняет детализацию без «провалов» в сложных условиях. Модель уже доступна в открытом доступе — код, веса.
tiger-ai-lab.github.io
✔️ Apple обновила Final Cut: поддержка Apple Intelligence и новые инструменты.
Apple выпустила обновления для Final Cut Pro на Mac, iPad и приложения Final Cut Camera. Главным новшеством стала интеграция Apple Intelligence: теперь в Image Playground можно быстро генерировать стилизованные изображения на основе описаний или фото из библиотеки.
Для Mac добавлены коррекция цвета, аудиоэффект Quantec QRS и улучшенный Magnetic Mask. На iPad появилась портретная ориентация и хоткеи для монтажа. Final Cut Camera обзавелась переключением на 48-мм телеобъектив (для iPhone 14 Pro и новее), поддержкой Apple Log LUT и записью в Spatial Audio (требуется iPhone 16).
Технические требования: macOS 15.2 и новее для Mac на M1+, iOS 18.2 для устройств с A17 Pro/M1.
9to5mac.com
@ai_machinelearning_big_data
#news #ai #ml
🤖 ChatGPT VS DeepSeek
Приглашаем на открытый урок.
🗓 01 апреля в 18:00 МСК
🆓 Бесплатно. Урок в рамках старта курса «NLP. Advanced».
ChatGPT, DeepSeek, Gemini… Что у них внутри и какие технологии их создают?
На открытом уроке разберем архитектуру современных LLM, методы их обучения и принципы, которые двигают индустрию NLP вперед.
Спикер Мария Тихонова – PhD Computer Science, Senior Data Scientist в SberDevices и преподаватель ВШЭ.
Если вы хотите глубже понять работу LLM, разобраться в ключевых концепциях DeepSeek и узнать о будущих трендах, этот вебинар для вас.
Участвуйте и получите скидку для обучения на курсе «NLP. Advanced».
🔗 Ссылка на регистрацию: https://otus.pw/ATev/
⚡️ Ideogram 3.0 — это последняя версия генеративной модели от компании Ideogram AI.
Генератор обеспечивает высокий реализм изображений, креативность и поддерживает качество рендеринга текста.
Согласно внутренним оценкам, Ideogram 3.0 превосходит другие текст-изображение модели по широкому спектру задач.
Одной из ключевых фишек Ideogram 3.0 является "Style References", позволяющая пользователям загружать до трех референсных изображений для генерации контента в заданном стиле.
ЭТО упрощает создание изображений с трудноописуемой текстом эстетикой, ускоряя и делая более выразительным творческий процесс.
Для вдохновения доступна функция случайного выбора стиля из библиотеки из 4,3 миллиарда пресетов, а понравившиеся стили можно сохранить и повторно использовать с помощью их уникальных кодов.
Кроме того, Ideogram 3.0 предлагает расширенные возможности генерации текста и макетов для графического дизайна, рекламы и маркетинга. Модель способна создавать стилизованный и точный текст с высокой точностью, включая сложные и длинные композиции, с которыми другие модели испытывают трудности. Созданный текст отличается красотой и художественностью, превосходя возможности традиционных дизайнерских платформ.
Ideogram 3.0 доступна для всех пользователей на платформе ideogram.ai и в приложении для iOS. Доступно 2 генерации на бесплатном тарифе, $20/мес.
🎯 Блог
⚡️ Google представил свою самую мощную нейросеть — новая «думающая» Gemini 2.5 Pro опережает всех конкурентов.
🚀 Пишет код на уровне сеньора с 10-летним опытом, решает любые математические задачи и, что самое главное, бесплатна.
Пробуем можно в AI Studio.
«Ошибка на миллиард» в ИИ
«Ошибка на миллиард долларов» — это популяризованное ученым Чарльзом Э. Хоаром название для null pointer exception. В большинстве классических языков программирования переменная, якобы содержащая объект какого-то класса, на самом деле может ничего не содержать.
В мире генеративных нейросетей «ошибкой на миллиард» можно назвать галлюцинации LLM. «Творческая натура» больших языковых моделей играет со строгими задачами злую шутку: в любой непонятной ситуации модель принимается фантазировать на основе претрейна.
Старший инженер по разработке ПО искусственного интеллекта в YADRO описал метод, который использовал, чтобы значительно снизить галлюцинации в выдаче модели.
Читать статью →
Сотрудники Авито ведут свой telegram-канал ⭐️
И знаете, получается мега-лампово и увлекательно. Всего через несколько постов начинаешь уже чувствовать себя частью их уютного офиса: рядом — знакомые весёлые коллеги из постов, и вам точно есть что обсудить.
А вообще хвалим и одобряем. Во-первых, смело и интересно. Во-вторых, для тех, кто рассматривает работу в компании, это возможность изучить культуру и вайб команды ещё до трудоустройства.
🔥 Однозначно подписка — @avito_life
🔥🔥 Если думаешь о работе в Авито, то добавляй сразу — @avito_career
🌅 HunyuanVideo-I2V
HunyuanVideo-I2V – это модель с открытым исходным кодом, предназначенная для создания видео на основе изображений, разработанная с активным участием сообщества.
В репозитории доступны реализации на PyTorch, предобученные веса и код для инференса. Для стабильной работы модели требуется NVIDIA GPU с поддержкой CUDA и не менее 80 ГБ видеопамяти. Кроме того, модель оснащена широким спектром настроек, позволяющих повысить качество генерируемого видео.
📌 Github
@vistehno
Трамп очень высоко оценил IT-навыки своего сына Бэррона
«Я выключаю его компьютер, а через 5 минут он снова работает! Как он это делает? У него потрясающие отношения с технологиями!» - заявил Трамп.
Мальчику всего 19 годиков.
@vistehno
💬 OPEN AI добавили API 3 новых SOTA аудио-модели.
🗣️ Две модели преобразования речи в текст, которые, как заявляют разработчики, превосходят Whisper.
💬 1 Новая модель TTS - которой можно указать *как* ей говорить.
Поддерживает функцию задания интонации, тона, тембра голоса и еще множества других параметров с помощью промпта.
🤖 Еще OpenAi выпустили Agents SDK, который для создания голосовых агентов.
Через час состоится стрим, где покажут примера создания голосовых агентов с новыми аудиомоделями.
📌 Потестить можно здесь: https://www.openai.fm/
🔥 Стрим Open AI - Создание голосовых агентов с новыми аудиомоделями
https://openai.com/live/
Хотите получить много практики на реальных задачах, собрать портфолио и узнать как выглядит рабочий день аналитика?
CEO Simulative и эксперт с большим опытом в аналитике, Андрон Алексанян организовал бесплатный интенсив, где вы будете решать реальные задачи, с которыми аналитики сталкиваются на работе
На прямых эфирах вы сделаете:
🟠Анализ активности пользователей с помощью SQL
🟠Анализ маркетинговых активностей с помощью Python
🟠ABC анализ ассортиментной матрицы в Excel (уже прошел, но вам будет доступна запись)
Во время эфиров вы узнаете много лайфхаков, а также будете получать полезные материалы для развития в аналитике на протяжении всего интенсива
❗️Знать Python и SQL не обязательно — все будем разбирать с нуля
🕗 Встречаемся на новом эфире уже сегодня, 20 марта в 19:00 по мск
😶Участвовать в бесплатном интенсиве