Всё, что может быть интересно медиа про Яндекс: новости, анонсы, заявления, комментарии, инсайды и другие горячие и не очень события ⚡️ PR-команда: pr@yandex-team.ru
🤖🧠 Все технологические достижения человечества в одной инфографике (очень-очень большой)
Делимся находкой, которую можно рассматривать бесконечно: генеалогическое древо (а точнее, целый лес) технологий, изобретённых людьми за последние 500 лет — от печатного станка до генерации изображений. Проект Calculating Empires предлагает посмотреть на технологические достижения в историческом контексте, чтобы лучше понять причины современных проблем (например, социального неравенства и глобальных изменений климата) и найти пути их решения.
Подписывайтесь 👉 @techno_yandex
🔒 Наступит ли будущее без паролей? Спросили об этом руководителя команды безопасности FinOps & ID Илью Глебова и разработчика из группы разработки API Яндекс ID Егора Князева.
Чем плохи пароли?
Люди используют их небезопасно. Если у человека один пароль для разных сервисов, то взлом одного сервиса даст злоумышленникам и пароль от остальных. Также случаются утечки, пароль можно подобрать, а ещё его можно забыть.
А беспарольный вход?
Вероятность фишинга снижается до нуля: закрытые ключи привязаны к определённым доменам. Но если существует резервный способ входа — по паролю, — злоумышленник может создать видимость, что сейчас доступен только он, и предложит ввести пароль.
Что заменит пароли?
Возможно, Passkeys — универсальная технология входа по лицу или отпечатку, поддерживаемая во всех популярных ОС и браузерах. Её основной компонент — асимметричная криптография: механизм, используемый, например, для электронных подписей. Сервис, в котором вы регистрируетесь, сохраняет публичную часть ключа, а закрытая часть хранится на вашем устройстве. При этом все ваши устройства в рамках одной экосистемы синхронизированы между собой — то есть достаточно одного ключа.
Когда пароли исчезнут?
Скорее всего, никогда. Модель беспарольных входов предполагает, что есть провайдер, который обеспечивает хранение и синхронизацию ключей (например, разработчики ОС — Microsoft, Google, Apple). Для первоначального входа в аккаунт провайдера нужно использовать пароль, хотя есть физические FIDO2-ключи. Можно настроить его для входа в аккаунт ОС, и для вас наступит беспарольное будущее.
Безопасно не иметь пароля?
Отсутствие пароля ≠ отсутствие аутентификации. Раньше сервис хранил информацию о пароле, сейчас хранит публичную часть ключа (утечки этой части не критичны). Поэтому, пока не взломали сами алгоритмы асимметричной криптографии, лежащей в основе Passkeys, не иметь пароль безопасно. Хотя если такое случится, пострадает сетевая инфраструктура в целом.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
👨💻 Технодайджест недели
Представлен Friend — носимый гаджет с эмпатичным ботом. Это подвеска с микрофоном, который может постоянно слушать разговоры вокруг, и кнопкой, позволяющей обратиться к гаджету напрямую. При этом в нём нет динамика и экрана, поэтому бот присылает сообщения на смартфон: комментарии к событиям в жизни пользователя, советы и тому подобное.
Ходячих роботов научили помогать в магазине. Это два отдельных проекта от компаний Mentee Robotics и DeepRobotics. Первая научила своего человекоподобного робота помогать человеку в инвалидной коляске, следуя за ним с тележкой, чтобы он мог класть в неё продукты. А DeepRobotics показала, как можно использовать в качестве тележки для покупок её четвероногого робота: в ролике робопёс следует за хозяином на поводке, перенося при этом большую бутылку с водой и другие грузы массой около 20 килограмм.
Arc’teryx и Skip представили штаны с электромоторами. Моторы в области колена работают синхронно с движениями человека, облегчая ходьбу. Штаны весят около трёх килограмм, но разработчики утверждают, что благодаря помощи от электромоторов человек в них будет ощущать себя легче примерно на 13,5 килограмма.
В Москве и Санкт-Петербурге протестируют беспилотные трамваи. В этих регионах ввели экспериментальный правовой режим, регулирующий работу автономного транспорта в городской среде. На первом этапе трамваи проедут не менее 3000 километров с водителями-испытателями, а затем смогут ездить полностью автономно.
В Instagram* и WhatsApp* появились боты-двойники. Функция, пока запущенная только для пользователей в США, позволяет создать персонализированного бота, который сможет самостоятельно общаться с другими пользователями от лица владельца аккаунта: переписываться в личных сообщениях и отвечать на комментарии.
* Сервисы компании Meta, которая признана экстремистской организацией и запрещена в РФ
Perplexity начнёт делиться доходами с владельцами контента. Компания будет выплачивать часть дохода от рекламы авторам контента, который её нейросеть использует при составлении ответа на поисковый запрос. Пока программа работает для ограниченного списка сайтов, в том числе Time, Fortune и WordPress.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
🤖🔍 В июле в ТЕХНО вышло много интересных материалов — вот некоторые из них:
🔸 Как отличить контент, сгенерированный нейросетями, и какие приложения в этом помогут
🔸 Как люди устанавливали рекорды сборки кубика Рубика и в какой момент их обогнали роботы
🔸 Как компания Atari похоронила миллионы картриджей с видеоиграми, а потом их нашли энтузиасты
🔸 Как появились мифы о зарядке смартфонов и почему фирменный кабель для неё не обязателен
🔸 Как Рэй Долби придумал шумопонижение звукозаписи и при чём тут индийский фольклор
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
🤖 Разработчик Яндекса создал робота, который побил мировой рекорд по скорости сборки кубика Рубика. До этого самым быстрым был робот Mitsubishi — он собрал кубик за 0,305 секунды. Новый рекорд — 0,203 секунды.
Коротко рассказали в карточках, как это удалось, а всеми подробностями создатель робота Александр Кротов поделился на Хабре.
Подписывайтесь 👉 @techno_yandex
🎁 Подводим итоги конкурса песен, зашифрованных с помощью Шедеврума
Первой все девять песен расшифровала Дарья @loveray13, поздравляем!
В ближайшее время мы свяжемся с вами и договоримся о доставке призов: бокса с нейросетевым мерчем и умной ленты Яндекса. Остерегайтесь мошенников, мы не запрашиваем платёжные данные. Доставка призов бесплатная.
В будущем вас ждут новые конкурсы и розыгрыши, а пока мы продолжим рассказывать о самом интересном в мире технологий.
Подписывайтесь 👉 @techno_yandex
👩💻Технодайджест недели
OpenAI представила SearchGPT — прототип своего поискового движка. Сервис, основанный на семействе моделей ChatGPT-4, откроют в тестовом режиме на 10 тысяч пользователей. Он по-разному компонует информацию в зависимости от заданного вопроса — может составить подборку ближайших концертов с короткими описаниями или по пунктам разобрать сложное явление на основе данных из Сети. Кроме того, пользователь может задавать наводящие вопросы. Движок разрабатывался при поддержке The Wall Street Journal, The Associated Press и Vox Media. В планах компании интегрировать его в ChatGPT, а не запускать в качестве отдельного продукта.
Meta* выпустила в опенсорс Llama 3.1 — флагманскую языковую модель на 405 миллиардов параметров с контекстным окном в 128 тысяч токенов, которая превосходит в части тестов лучшие модели от OpenAI и Anthropic. Марк Цукерберг надеется, что к концу года Llama станет самым популярным в мире чат-ботом на базе ИИ, а заодно окажется поворотной точкой для превращения опенсорса в ключевую модель распространения софта в индустрии. Больше подробностей — в нашем посте.
Reddit начал блокировать самые популярные поисковые движки и чат-боты — кроме Google. Сайт, аккумулирующий пользовательский контент и ответы на многие популярные в Сети вопросы, модифицировал файл robots.txt, запретив доступ к своим новым постам популярным поисковикам вроде Bing. Это произошло после заключения контентной сделки с Google на 60 миллионов долларов. Представители Reddit заявили, что вели аналогичные переговоры и с другими компаниями, но не со всеми удалось достигнуть соглашения.
NASA провела успешное тестирование лазерной передачи данных на МКС. Инженеры отправили 4K-видео с находящегося в воздухе самолёта на МКС и обратно. Раньше для этих целей преимущественно использовали радиоволны, но технология на основе инфракрасных лазеров в 10–100 раз быстрее. Благодаря ей с Земли можно будет теоретически наблюдать посадку на Луну в прямом эфире или связываться с удалёнными космическими колониями.
* Объявлена в РФ экстремистской организацией.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
🎵🤖🖼 Угадайте песни, которые мы зашифровали с помощью Шедеврума, и выиграйте* бокс с нейросетевым мерчем и умную ленту Яндекса.
Мы взяли строки из 9 популярных треков и попросили Шедеврум сгенерировать по ним картинки. Чтобы выиграть приз, надо назвать все зашифрованные треки и их исполнителей. Комментарии нельзя редактировать, но можно оставлять новые, а также использовать для расшифровки любые технологии и сервисы.
Подсказка: среди треков есть как современные, так и ретро, а записаны они на русском и английском языках.
Кстати, в Шедевруме появилась возможность добавлять музыку к своим генерациям — можно попробовать визуализировать любимые треки, как это сделали мы, и заодно озвучить их.
* отправка приза осуществляется внутри РФ, победитель один — первый, кто даст корректный ответ
Подписывайтесь 👉@techno_yandex
Не пропускайте новости Яндекса тут @yandex
👨🏻💻🤖 Учёные из Yandex Research создают новые технологии, помогают внедрять их в сервисы Яндекса и двигают вперёд мировую компьютерную науку.
Недавно они разработали и опубликовали в свободном доступе новый метод сжатия больших языковых моделей, который может уменьшить модель до 8 раз почти без потери качества ответов. Это позволяет запускать их на личных устройствах вроде домашнего компьютера или смартфона.
Статья Yandex Research про этот метод сжатия была включена в программу одной из самых престижных в мире конференций по машинному обучению — ICML 2024. Её подготовили вместе с исследователями из Института науки и технологий Австрии (ISTA) и экспертами ИИ-стартапа Neural Magic.
Денис Кузнеделев — один из исследователей Yandex Research, который участвовал в этом проекте. Поговорили с ним и узнали, как он пришёл в науку и чем увлекается.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
Super Retina HD — это OLED? А Apple Intelligence — это ИИ? Узнайте из этого ролика.
Больше таких видео — на наших страницах в techno_yandex">YouTube Shorts и VK Клипах.
Подписывайтесь 👉 @techno_yandex
👩💻Технодайджест недели
В сети появилось видео с рабочим прототипом так и не вышедшего узкого смартфона Essential. Устройство, похожее на шоколадный батончик, было впервые представлено в 2019 году, но так и не поступило в продажу из-за закрытия производителя в 2020-м. Смартфон под названием PH-2 купил на eBay разработчик Роб Уэйнрайт. В коротком ролике он показал, как на устройстве выглядят популярные приложения вроде Uber и Spotify.
Open AI представила GPT-4o Mini. Облегчённая версия GPT-4o полностью заменит GPT 3.5 Turbo для рядовых пользователей, но бизнесу версия 3.5 ещё какое-то время будет доступна через API. GPT-4o Mini уже поддерживает мультимодальность с ответами на основе текста и видео, а позже в неё добавят поддержку аудио и видео. Новая модель набрала 82% в бенчмарке MMLU. Для сравнения: у GPT 3.5 — 70%, а у GPT-4o — 88,7%.
Google досрочно показал Pixel 9 Pro и Pixel 9 Pro Fold. Таким образом компания приостановила уже традиционный парад утечек перед презентацией, запланированной на 13 августа. Тизеры двух смартфонов появились на официальном YouTube-канале компании, где был представлен их внешний вид и названия, но пока без подробностей.
NVIDIA раскрыла технические подробности гигантского экрана-сферы в Лас-Вегасе. Его работа обеспечивается 150 графическими адаптерами Nvidia RTX A6000 с 48 Гб видеопамяти GDDR6 у каждого, а также сложной сетевой инфраструктурой, создающей иллюзию того, что 1,2 миллиона LED-панелей работают как один экран. Контент для сферы производит и тестирует специально созданная Sphere Studios, которая научилась адаптировать для гигантского экрана видео в разрешении 18К — без необходимости склеивать их из нескольких потоков.
В компьютерах на базе Windows произошёл глобальный сбой. Причиной стало неудачное обновление корпоративного антивируса CrowdStrikе: он остановил работу магазинов, аэропортов, телестудий и целых компаний, а очевидцы по всему миру увидели знаменитые «синие экраны смерти» в самых неожиданных местах. Подробнее читайте в нашем разборе.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
🟦💀 Прямо сейчас во всём мире происходит сбой Windows. Он затронул работу банков, аэропортов, супермаркетов, больниц, СМИ и компаний.
Что случилось
Сегодня утром компьютерные системы на базе Windows перестали работать во всём мире. Многие авиакомпании были вынуждены отменить рейсы, а аэропорты в США, Европе и Австралии приостановили работу. Британский телеканал Sky News прервал прямой эфир, на Аляске нельзя дозвониться в службу спасения, в МИД ОАЭ вышли из строя компьютерные системы, в Австралии не работают банки, а в Японии люди не могут сделать заказы в McDonald's. На Reddit сбой обсуждают тысячи людей (и расстраиваются, что он произошёл перед выходными).
В чём причина
Проблема — в неудачном обновлении корпоративного антивируса CrowdStrike, который используют компании по всему миру для компьютеров и серверов на базе Windows. Антивирус имеет доступ к ядру системы, поэтому устройства отключаются от сети, не могут загрузиться и переходят в режим аварийного восстановления.
Когда всё починят
Компания CrowdStrike заявила, что остановит обновление, а корпорация Microsoft — что предпринимает «действия по устранению неполадок». Единого мнения о сроках возобновления полноценной работы пока нет. В разговоре с РБК эксперт в области информационной безопасности Алексей Лукацкий сказал, что решить глобальную проблему можно лишь в ручном режиме — перевести устройства в безопасный режим и удалить часть компонентов ПО. Глава компании CrowdStrike Джордж Куртц позднее сообщил, что проблема уже выявлена и найден способ исправления. Он исключил, что инцидент связан с кибератакой.
А что в России
По данным ТАСС, сбой практически не затронул Россию и страны СНГ, так как в них почти не используют облачные сервисы Windows и программы CrowdStrike. Задержки направлявшихся в Европу авиарейсов зафиксировали только в Молдове и Армении. Московские аэропорты работают в штатном режиме.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
🟪 Какие самые необычные картинки вы генерировали с помощью генеративных нейросетей? Мы провели исследование и выяснили, что люди часто создают, например, мемы, эскизы татуировок и даже иллюстрации для карт таро.
↗️ Всего нейросетями для создания текстов пользуются 33% россиян, а для генерации картинок — 28%. Исследование о том, кто и как пользуется генеративными нейросетями, читайте на сайте Нейростата.
Подписывайтесь ✨ @yandex
💪🏻🏆🦾 Спидкубингом — сборкой кубика Рубика на скорость — занимаются миллионы людей и десятки роботов. Вспоминаем, как устанавливали рекорды и в какой момент роботы обогнали людей.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
👩💻 Технодайджест недели
Samsung представил новые складные смартфоны и умное кольцо. Компания обновила процессоры и дизайн «раскладушек» Galaxy Z Fold и Z Flip, а также встроила в них новые нейросетевые функции, например, возможность дорисовать объект на фотографии с помощью диффузионной нейросети. Кроме смартфонов, Samsung представила умное кольцо, отслеживающее активность, и обновила линейки часов и наушников.
Учёные изучили влияние генеративных нейросетей на креативность. В исследовании приняли участие почти 300 человек, которых просили писать текстовые истории. Часть придумывала идеи самостоятельно, а часть — с помощью GPT-4. Исследователи пришли к выводу, что доступ к генеративной нейросети усиливает индивидуальную креативность, позволяя писать более качественные и интересные тексты, но снижает разнообразие контента: истории, написанные с помощью нейросети, были более похожими друг на друга, чем те, которые люди писали полностью самостоятельно.
Nothing выпустила «модульный» смартфон CMF Phone 1. На его задней крышке есть винтовые крепления для аксессуаров: сама компания выпустила картхолдер, ремешок и подставку для горизонтального положения, но пользователи уже начали печатать на 3D-принтерах и другие «модули». Кроме того, у смартфона легко заменяется задняя крышка.
Google оснастила робота мультимодальной нейросетью. Инженеры компании подключили исследовательского робота к нейросети Gemini 1.5 Pro, которая умеет анализировать видео. Они сняли ролик с обзором помещений, а затем давали роботу задания. Например, спрашивали, где можно зарядить гаджет, а робот «вспоминал» с помощью нейросети расположение розетки и показывал человеку путь к ней.
Logitech выпустила беспроводную мышь с беспроводным питанием. Она работает либо от одной батарейки типа AA, либо без неё, питаясь от специального коврика, передающего энергию на мышь.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
🔍 Как раньше искали информацию с помощью компьютеров. Каталог всех имеющихся в мире ссылок и другие способы из недалекого прошлого
Больше таких роликов — на наших страницах в techno_yandex">YouTube Shorts и VK Клипах.
Подписывайтесь 👉 @techno_yandex
🤖 Большие языковые модели требуют всё больших ресурсов. Чтобы снизить требования алгоритмов к железу и сжать нейросеть так, чтобы запускать её на более доступных GPU, учёные разрабатывают методы квантизации. В их числе и исследователи из Яндекса. Они разработали ряд методов, включая SpQR и представленные недавно AQLM и PV tuning, которые позволяют сжать модель в несколько раз, сохранив 95% и более качества ответов по метрике перплексии. Мы спросили Руслана Свирщевского, одного из учёных Yandex Research, занимающихся развитием методов квантизации, о том, что это и зачем нужно.
Что такое квантизация?
Это метод сжатия весов модели, который — для экономии памяти — позволяет хранить веса моделей не как массивы 32- или 16-битных чисел, а как наборы 3–4- битных (иногда даже менее) кодов.
Зачем нужны квантизованные модели?
Это нужно, если полноразмерная модель не помещается в память GPU. Качественно квантизованная из 16 в 4 бита модель, может дать практически такой же результат, как неквантизованная модель того же семейства. А ещё квантизованные модели потенциально могут работать быстрее, так как требуют копировать меньшие объёмы данных в память GPU, что возможно при дополнительной оптимизации и написании низкоуровневого кода для CUDA.
Есть ли предел в квантизации моделей?
Когда работаешь над статьёй, кажется что выжимаешь все возможности из алгоритма. Но проходит время, и появляются ещё более оптимальные методы. Так год назад пределом казались 4 бита, а сейчас вышли статьи о квантизации моделей в 2–3 бита, среди которых наша AQLM остаётся самой сильной. Появляются работы и про сжатие в 1 бит, правда, с потерей качества. При этом сами модели становятся лучше и эффективнее используют свои веса. Так, модели семейства LLaMA-3 заметно умнее моделей LLaMA-2 тех же размеров, но сжимаются они несколько хуже.
Есть ли смысл использовать модели без квантизации?
Да, если есть достаточно железа и/или важно не рисковать даже малейшими потерями в качестве. А ещё для них есть ускоренные реализации типа vLLM или CTranslate2, которые очень ограниченно поддерживают квантизацию.
Почему нельзя сразу обучать модель в 3–4 бита на параметр?
При обучении важно передавать через слои модели градиенты (вектора изменений весов). Квантизация бы округляла их слишком сильно, что затрудняет качественное обучение. Есть методы, совмещающие обычные и квантизованные веса при обучении, например Qlora, но они предназначены для дообучения моделей пользователями с ограниченными ресурсами. Исходные модели же, как правило, обучают организации, имеющие доступ к значительным вычислительным ресурсам.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
🎧🤖 Можно ли использовать музыку для обучения нейросетей?
24 июля Ассоциация звукозаписывающих компаний Америки (RIAA) подала иски против компаний Suno и Udio, которые разрабатывают нейросети, генерирующие музыку. Представители музыкальной индустрии считают, что компании используют защищённые авторским правом музыкальные произведения для создания моделей, генерирующих музыку. Эта музыка достоверно имитирует привычные записи, сделанные людьми, и всё это, по их мнению, нарушает законодательство.
Когда будет вынесено судебное решение — неизвестно. Вчера в блоге Suno появилась посвященная разбирательству запись, где есть такие слова:
Подобно подростку, который создаёт собственные рок-композиции после прослушивания образцов жанра, или подобно учителю и журналисту, изучающим созданные кем-то материалы, чтобы почерпнуть новые идеи, обучение не расценивается как нарушение. Оно никогда не было нарушением и не стало им сейчас.
📖 Минутка языкознания в ТЕХНО! Хотим рассказать про синдром СИА, который часто встречается в мире технологий.
Так называют повторное использование слова, которое уже включено в аббревиатуру. Например, CD-диск — это «компактный диск диск», а IT-технологии — это «информационные технологии технологии».
Само словосочетание «синдром СИА» — тоже пример синдрома СИА, поскольку расшифровывается как «синдром синдром избыточного акронима». Этот термин был в шутку предложен одним из авторов журнала New Scientist в 2001 году, однако с тех пор вошел в научный обиход и используется в работах лингвистов.
Кстати, многие лингвисты не считают синдром СИА серьезной речевой ошибкой, поскольку повторение слов для усиления ясности свойственно многим языкам. В этом смысле русское «чуть-чуть» или «да-да» близки по своей сути к «CD-диск». Также синдром СИА иногда позволяет уточнить, о чем идет речь, поскольку похожие аббревиатуры могут обозначать разные вещи. Например, CD — это компакт-диск, а Cd — это общепринятое сокращение для кадмия.
🤔 Пишите в комментариях, если сталкивались с другими примерами синдрома СИА.
Подписывайтесь 👉 @techno_yandex
👀 В этом видео робот Figure 01, созданный с использованием мультимодальной нейросети от OpenAI, угощает человека яблоком, хотя тот не просил об этом напрямую. Он может делать это благодаря пространственной осведомлённости.
Пространственная осведомлённость (spatial awareness) — это способность анализировать окружающее пространство, отслеживать находящиеся в нём объекты, учитывать их форму и положение, а также реагировать на них. Термин применяют по отношению к людям, а также системам искусственного интеллекта.
Для чего это нужно?
Пространственная осведомлённость позволяет машинам выполнять задачи, требующие от них физического контакта с окружением или понимания поведения объектов в нём. Она нужна роботам, беспилотному транспорту, роверам-доставщикам, а также системам дополненной реальности.
Работы в этом направлении активно велись ещё во время бума беспилотных автомобилей, а с появлением мощных мультимодальных нейросетей оно получило новый импульс. Например, недавно Фей-Фей Ли, известная учёная и создательница проекта ImageNet, основала стартап World Labs. Он занимается разработкой системы, способной понимать физический мир так же, как человек. Всего за несколько месяцев стартап привлёк около $100 млн инвестиций.
Как этого добиться?
При создании систем, которые понимают окружающую среду, используют сразу несколько технологий:
🛜 Датчики (лидары, камеры, радары, GPS) — чтобы собирать информацию об окружающей среде
👀 Компьютерное зрение — чтобы обрабатывать информацию с датчиков и распознавать объекты
🗺 Карты и пространственные трёхмерные модели — чтобы анализировать движение окружающих объектов
🛞 Системы управления — чтобы принимать решения и и планировать собственные перемещения
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
🎧 Прочитайте историю американского инженера Рэя Долби, благодаря которому мы слушаем качественно записанную музыку.
🤝 В 1949 году 16-летний Рэй Долби познакомился с русским учёным Александром Понятовым. Этот офицер белой армии уехал из России после Гражданской войны в США и основал компанию Ampex, которая производила профессиональные аудио- и видеомагнитофоны.
📋 Работая в Ampex, Долби заинтересовался проблемой шумопонижения — устранением шумов из звукового сигнала. Но качественного шумопонижения для звукозаписи тогда не было — это считалось невозможным.
🇮🇳 В 1963-м Долби уехал в Индию советником при ЮНЕСКО, взяв магнитофон, чтобы записывать фольклорные выступления. Качество записи его не устроило, и он понял, что хочет посвятить жизнь решению этой проблемы.
🎙️ В 1965-м Долби основал Dolby Laboratories, где помимо него работали три сотрудника. Через полгода он представил профессиональную систему шумопонижения Dolby-A. Она делила диапазон звуковых частот на четыре поддиапазона, и в каждом уровень шума уменьшался на 10 дБ. Это была сенсация.
🎶 В 1966-м английский лейбл Decca Records сделал первую запись с Dolby-A. «Первой чистой записью в истории» стал фортепианный концерт Моцарта в исполнении советского пианиста Владимира Ашкенази. Через год уже два десятка крупных компаний использовали Dolby-A, сделав её стандартом.
🔊 В 1960-х магнитофоны стали появляться у миллионов людей по всему миру. Шумопонижение для них было критически важно, и Долби разработал систему Dolby-B, также на много лет ставшую стандартом.
📽️ В начале 1970-х Долби занялся звуком в кино. Первым фильмом, озвученным с помощью системы Dolby, стал «Заводной апельсин» Стенли Кубрика. А в середине 1970-х появилась технология Dolby Stereo для записи звука на киноплёнку, определившая то, как звук мы слышим в кинотеатрах сейчас (первым фильмом с Dolby Stereo стали «Звёздные войны»). Позднее Dolby Laboratories разработала технологии Dolby Digital 5.1 и Dolby Atmos, которые до сих пор позволяют компании оставаться лидером в области технологий звука в кино.
⭐ Долби был непубличным человеком, но получил десятки наград. В 1989-м — Оскар за научно-технические достижения и Эмми в той же категории, а в 1995-м — Грэмми за выдающиеся достижения в мире звукозаписи. Уже после его смерти, в 2013 году, на Аллее славы в Голливуде появилась его звезда.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
🌐👾 Наш сериал о технологиях фантастических вселенных продолжает Cyberpunk 2077.
А если пропустили предыдущие серии, вот они: «Дюна», Fallout, «Звёздный путь», «Кин-Дза-Дза» и «Звёздные войны».
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉@techno_yandex и @igrapoisk
🤖🔍 Рассказываем, как и какими инструментами можно отличить сгенерированный контент от созданного человеком.
📝 Текст
Помогут сервисы Copyleaks, AI Content Detector, Gptzero, Writer, Contentatscale и Originality. Часть из них — платные и лучше работают с английским. Сгенерированные тексты не содержат грамматических ошибок, в них нет резких эмоциональных высказываний, но могут быть противоречия, так как нейросеть забывает, о чём писала раньше.
🖼 Изображения
Тут помогут сервисы AI or Not, Illuminarty.ai или Maybe's AI Art Detector.
Также обращайте внимание на такие параметры, как:
— Искажения и артефакты в деталях и текстурах. Неестественные элементы можно увидеть в областях рук, глаз, на фоне.
— Недостаток деталей указывает на сгенерированное изображение.
— Лица на сгенерированных изображениях слишком симметричны либо неестественно асимметричны.
— Нейросети рисуют несуществующие модели смартфонов и другой техники.
— В метаданных файла иногда можно найти информацию о создавшем картинку сервисе. Шедеврум, например, ставит в приложениях визуальные метки на всех сгенерированных картинках.
📹 Видео
Чтобы распознать дипфейки с использованием реального материала, присмотритесь к лицу. Его движения могут не совпадать с движениями тела, и лицо может иметь неестественные тени.
В целиком сгенерированном ролике обратите внимание на следующее:
— Объекты-призраки, способные появляться в кадре и исчезать.
— Детали-оборотни, которые могут меняться по ходу ролика.
— Объекты на заднем плане могут двигаться неестественно, сливаться или дублировать друг друга.
🔊 Музыка
Здесь специальных инструментов или рекомендаций совсем немного. В целом сгенерированная музыка звучит менее органично из-за ограничений в обработке звука и выборе инструментов. Однако обмануть человека с музыкой проще всего. Используйте интуицию — часто только она и может помочь.
👌 И если вы пришли из наших сторис: настоящее фото снизу.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉@techno_yandex
🤖🤖 Meta* выложила в опенсорс Llama 3.1 — флагманскую языковую модель на 405 миллиардов параметров (для сравнения у GPT-4o — 175 миллиардов) с контекстным окном в 128 тысяч токенов и улучшенной поддержкой 8 языков.
Модель в течение нескольких месяцев обучали на 15 триллионах токенов и более 16 тысяч видеокарт NVIDIA H100.
По оценке самой компании, LLama 3.1 сопоставима по качеству ответов с флагманскими закрытыми моделями конкурентов. Например, в человеческой оценке она проигрывает GPT-4o в 29,2% случаев, в 51,7% достигает паритета, а в 19,1% даёт лучший ответ.
Компания также обновила свои модели на 8 и 70 миллиардов параметров — также с размером контекста 128K, заметно повысив качество их работы, и впервые открыла возможность для стороних компаний тренировать свои языковые модели на базе ответов LLama.
*признана в России экстремистской организацией
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
🤖🤝🔍 В конце 2022 года, когда вышел ChatGPT, многим казалось, что он сможет заменить привычный поиск. Полтора года спустя стало ясно, что всё не так просто.
Нейросети vs поиск
В отличие от классической поисковой выдачи, состоящей из ссылок и быстрых ответов, чат-бот в ответ на запрос генерирует подробный и структурированный текстовый ответ. Многим такой сценарий использования понравился, и компания Google почти сразу начала рассматривать ChatGPT как угрозу для своей бизнес-модели. Но вскоре стало ясно, что у языковых моделей есть недостатки: их знания о мире ограничены датой обучения, а ещё они склонны к галлюцинациям — правдоподобной имитации фактов, которую не всегда можно заметить.
Нейросети + поиск
После этого компании начали интегрировать большие языковые модели в классический поиск, чтобы пользователи могли получать готовые ответы, основанные на актуальной информации. Первым стал Bing от компании Microsoft, у которой был эксклюзивный доступ к GPT-4. Яндекс запустил тестирование быстрых ответов на базе модели YandexGPT в сентябре прошлого года, а весной 2024-го представил Нейро — сервис, объединивший в себе поисковый движок и нейросети. Он анализирует запрос, изучает поисковую выдачу, выбирает несколько подходящих источников и с помощью YandexGPT 3 объединяет информацию в один связный ответ. Такой подход позволил взять лучшее от обеих технологий: Нейро отвечает на сложные вопросы и позволяет уточнять детали в диалоге (как чат-бот), но не придумывает факты, а ищет информацию в интернете и всегда ссылается на источники.
Что будет дальше?
Поисковики объединяют не только с языковыми моделями, но и с мультимодальными нейросетями, которые, помимо текста, умеют обрабатывать изображения, видео, аудио и другие форматы. Например, Нейро может ответить по картинке на вопрос «Кто и в каком году построил это здание». А прототипы мультимодальных ассистентов от Google и OpenAI умеют анализировать видео с камеры в реальном времени, правда, пока недоступны для пользователей.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
👮♂️🤖 Новые технологии способны облегчить труд человека практически во всех отраслях. Одно из немногих исключений — архив Штази, одной из самых репрессивных спецслужб в истории. Рассказываем историю 55 миллионов порванных в клочки документов, восстановить которые машинам оказалось пока не под силу.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
🤟🏻👩🎤🎸 Система персональных рекомендаций Моя волна в Яндекс Музыке научилась различать сотни нишевых музыкальных жанров — от буги-вуги до краст-панка. Рассказываем, как это сделали и зачем это нужно.
Как обучали волны по жанрам
Обучать алгоритм помогали приглашённые эксперты в области музыки. Среди них музыкальные журналисты Ляля Кандаурова и Антон Вагин, пианист и композитор Николай Мищенко и многие другие. Они выбрали из каталога Яндекс Музыки примеры треков, соответствующих 400+ музыкальным жанрам, которые заранее выделила редакция сервиса.
На основе этой выборки разработчики создали ML-разметку и обучили нейросеть. Она пытается следовать логике экспертов и определяет принадлежность трека к конкретному музыкальному направлению.
Какие факторы учитываются в первую очередь
👯♀️ Коллаборативность. Модель учитывает, какие треки слушают пользователи, предпочитающие музыку конкретного жанра.
🎛️ Аудиовекторы. Это описание звучания трека в виде небольшого набора чисел. Чем больше треки совпадают по тембру голоса вокалиста, набору инструментов, манере исполнения, музыкальному размеру, тем более похожими будут их аудиовекторы.
При этом в жанровых волнах также работает персонализация. Музыка будет подбираться с учётом вкуса конкретного пользователя.
Зачем всё это нужно
Это ещё один сценарий поиска новой музыки. У жанров в Яндекс Музыке есть список похожих направлений и знаковых альбомов, и на них можно переключиться. Многие пользователи впервые узнают, как называются даже те жанры, которые они слушают уже давно.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
🧠 Кажется, что искусственный интеллект, нейросеть и модель машинного обучения — синонимы, но это не совсем так. Объясняем, в чём отличие.
Больше таких роликов — на наших страницах в techno_yandex?erid=3apb1Qrwwr2uBg1SxqhhemuswyyWcebtLPKdBBZznviXp">YouTube Shorts и VK Клипах.
Подписывайтесь 👉 @techno_yandex
🪦🧟 Время кладбищенских историй! Рассказываем о первом крахе игровой индустрии, в центре которого внезапно оказался «Инопланетянин» Стивена Спилберга.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex
🚕 Каждую минуту в службу поддержки Яндекс Такси приходят сотни обращений от пользователей и водителей. С таким объемом не справиться без технологий — ML-сортировки, роботов-автоответчиков и предсказательных моделей.
В новой серии «Антологии технологий» рассказываем про службу поддержки, искусственный интеллект, человеческую эмпатию и технологии, которые скрыты по ту сторону чата с оператором. Смотрите на YouTube и Кинопоиске.
Подписывайтесь ✨ @yandex