techno_yandex | Неотсортированное

Telegram-канал techno_yandex - ТЕХНО: Яндекс про технологии

123465

Всё, что может быть интересно медиа про Яндекс: новости, анонсы, заявления, комментарии, инсайды и другие горячие и не очень события ⚡️ PR-команда: pr@yandex-team.ru

Подписаться на канал

ТЕХНО: Яндекс про технологии

‍⚖️🤖 В марте 2024 года Европарламент одобрил первый в мире закон, всесторонне регулирующий применение искусственного интеллекта. Рассказываем, что важного в этом законе и как в других частях мира хотят контролировать работу ИИ.

🇪🇺 Европа

EU AI Act вводит понятие категорий риска при использовании ИИ: минимальный, ограниченный, высокий, неприемлемый. Чем выше риск, тем строже правила. Например, закон запрещает извлекать с помощью ИИ изображения из интернета и камер видеонаблюдения для создания баз данных распознавания лиц (само распознавание разрешено с ограничениями).

Также запрещено использовать ИИ для определения эмоций на рабочих местах и манипулирования сознанием. Работа генеративных моделей попадает под категорию ограниченного риска: обработанный с помощью ИИ контент, который представляет общественный интерес, должен быть помечен. Свободное использование ИИ разрешено для систем с минимальными рисками, например в видеоиграх и спам-фильтрах.

Закон будет одобрен Советом Европы в мае 2024 года, но значительная часть норм начнёт действовать в 2026-м.

🇨🇳 Китай

В 2023 году в стране опубликовали правила для доступных в Китае сервисов генеративного ИИ. В списке — обязательная маркировка контента, сгенерированного ИИ, предоставление механизма для рассмотрения жалоб на сгенерированный контент и обязательство по запросу государства раскрывать данные, которые использовали для обучения моделей.

🇺🇸 США

В США подход к регулированию ИИ менее централизован, поскольку каждый штат вправе вводить свои законы. Например, в марте 2024-го Теннесси стал первым штатом, законодательно защитившим музыкантов от использования их работ/голосов системами ИИ. Этот закон известен как ELVIS (Ensuring Likeness Voice and Image Security). Помимо этого, осенью 2023 года в США на федеральном уровне был принят указ, обязывающий компании, разрабатывающие ИИ, делиться с правительством результатами тестов на безопасность.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🎮🖼 Стабильная и высокая частота кадров в играх — важное для их восприятия качество. Но чем сильнее повышалось разрешение экранов и комплекснее становилась графика, тем сложнее было удерживать стабильность. Если в разрешении 1080p видеокарте приходилось обрабатывать около 2 миллионов точек, то в 4K — более 8 миллионов. Разработчики задались вопросом: нужна ли человеческому глазу попиксельная детализация или процесс можно оптимизировать?

Ещё во время расцвета Xbox One и PlayStation 4 стало понятно, что для игр будущего базовой технологией станет апскейлинг. С ним видеочип создаёт исходное изображение в одном разрешении, а потом алгоритм растягивает картинку до большего, например с 720p до 1080p.

NVIDIA и AMD предложили две технологии — DLSS и FSR соответственно. Базовая версия FSR не использовала нейросети, а просто растягивала картинку, делала края 3D-объектов более резкими, а потом накладывала поверх этого интерфейс игры в максимальном качестве. FSR даёт не очень качественную картинку, зато работает на любых видеокартах.

В DLSS апскейлинг работает на основе нейросетей. Для его работы на видеокартах компании появились отдельные вычислительные блоки. Первую версию DLSS надо было настраивать под каждую игру, но с выходом DLSS 2.0 произошла революция. Нейросеть могла растянуть картинку уже в любой игре, не только добавив ей недостающих деталей, но и убрав большинство артефактов. Благодаря этому апскейл DLSS нередко выглядел лучше, чем нативное изображение.

Конкуренты NVIDIA не стоят на месте: AMD выпустила FSR 2.0 с нейросетями, Intel — свой апскейлер XeSS, а Sony готовит для грядущей консоли нечто под названием PlayStation Spectral Super Resolution.

Судя по всему, следующие Xbox и PlayStation вообще не будут рендерить игры в нативном разрешении. С играми происходит ровно то же самое, что случилось с камерами смартфонов: теперь мы видим на экранах не исходную графику, а то, как её додумывают нейросети.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

📁🖼️ Мы уже показывали первые в истории файлы GIF и PNG — сегодня рассказываем про JPEG

В каком-то смысле работа над форматом началась со знаменитого снимка Playboy-модели Лены Сёдерберг (про него у нас есть отдельный пост). В 1972 году Сёдерберг снялась для ноябрьского номера и тем самым упростила разработку сразу нескольких графических форматов.

Когда в 1973-м группа сотрудников Университета Южной Калифорнии тестировала новый алгоритм сжатия изображений (позже именно он станет основой для JPEG), доцент университета Александр Савчук предложил использовать для тестов фото Лены. В нём присутствовало много полутонов и был контраст чёткого переднего плана и размытого фона.

Работа над созданием алгоритма запустила цепную реакцию: в середине 1980-х была образована Объединённая группа экспертов по фотографиям (Joint Photographic Experts Group, JPEG), которая продолжила разработку нового формата сжатия. Дело в том, что революционный для того времени GIF позволял работать лишь с 256 цветами, а TIFF и BMP были слишком тяжеловесны. JPEG, рабочая версия которого появилась в 1992 году, смог преодолеть все эти недостатки.

Успех формата определили не только математические методы, но и изучение особенностей зрения. Как и MP3, JPEG удаляет без заметной потери качества информацию, которую человеческий мозг почти не воспринимает.

При разработке JPEG изображение Лены Сёдерберг использовали для проверки качества сжатия, но первым публичным тестовым изображением в новом формате стала всё же не она, а четыре фотографии под названием «Лодки», «Барбара», «Игрушки» и «Зельда». Их опубликовали 18 июня 1987 года — ещё до того, как JPEG был представлен пользователям (это произошло в 1992-м).

Выбор снимков не случаен: если посмотреть на гистограмму, можно увидеть плавные переходы полутонов и охват максимального спектра оттенков. Эти четыре снимка даже попали в книгу рекордов Гиннесса — как первые JPEG-изображения в истории.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🙂 Спросили директора по продукту YandexGPT API Алексея Долотова о том, чему научилась новая версия YandexGPT, чем она полезна для компаний и как он сам использует её в своих проектах.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

📱🦜 ТЕХНО любит попугаев. Пройти мимо исследования о мобильных играх, которые создают специально для этих птиц, мы просто не могли

Многие попугаи охотно следят за происходящим на экране гаджетов и, вероятно, понимают логику простых игр, но чаще всего им неудобно использовать игровые механики, рассчитанные на людей. Учёные из Северо-Восточного университета (США) и Университета Глазго (Шотландия) решили исследовать этот феномен. Вместе с группой разработчиков они создали игру специально для попугаев. Её цель — как можно быстрее нажимать клювом на хаотично появляющиеся на экране красные круги.

Изучая взаимодействие 20 попугаев с игрой (все птицы получали награду от хозяев за участие), учёные сделали несколько важных наблюдений. Например, птицы не способны играть долгое время подряд и для них важно делать паузы, чтобы осмотреть игровое поле, оценить точность своих действий и выбрать следующую цель. Также удалось установить, что попугаи сердились, если приложение некорректно реагировало на их действия (чаще всего, прикосновения птиц к экрану были недостаточно сильны).

Разработчики, создавшие игру, пообещали, что в будущем для птиц появятся игры с другой механикой — облизыванием, так как в ходе исследования стало понятно, что некоторым птицам проще взаимодействовать с экраном с помощью языка.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖🪑 Не будем вас спрашивать, какой из этих двух стульев сделала нейросеть (он справа). Это история про то, какой из ChatGPT столяр

Британский художник Джеймс Бридл провёл эксперимент. Он попросил ChatGPT дать пошаговую инструкцию по изготовлению стула, детально описав в промпте инструменты и размеры досок, которые у него были. Нейросеть сгенерировала подробное руководство, по которому Джеймс смог сделать стул, при этом рассчитав конструкцию так, чтобы использовать практически все материалы с минимумом отходов.

Вот что получается, когда просишь спроектировать стул того, кто много читал о них, но никогда на них не сидел. Но справедливости ради стоит отметить, что у нейросети вышла неплохая работа.


Единственное, что расстроило Джеймса, — нейросеть не смогла придумать для стула дизайн побезумнее, несмотря на то, что он однозначно просил об этом в промпте. Вероятно, алгоритмы решили, что консервативный дизайн оптимален, и не стали экспериментировать.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

Как думаете, что общего у предметов на этих фотографиях?

@techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

👨‍💻 Технодайджест недели

ЕС одним из первых ввёл регулирование искусственного интеллекта. Закон запрещает системы социального рейтинга и существенно ограничивает распознавание лиц в общественных местах. Европейские разработчики нейросетей должны будут раскрывать информацию об их обучении, а если нейросеть несёт в себе «системные риски» — отчитываться об инцидентах и проводить тестирование. Ожидается, что закон вступит в силу летом.

Стартап Cerebras представил гигантский чип для нейросетей. Это квадрат со стороной 21,5 сантиметра, на котором размещены 4 триллиона транзисторов и 900 тысяч ядер. Использование одного мощного чипа вместо кластера из множества GPU позволяет добиться гораздо большей пропускной способности и меньшей задержки, что в итоге повышает скорость обучения и работы нейросетей.

Midjourney научился генерировать одинаковых персонажей. Теперь в сервисе можно сгенерировать персонажа, а затем создавать с ним новые изображения в других ситуациях и окружениях.

DeepMind представила нейросетевого агента для компьютерных игр. Его обучали на записях людей, которые играли в 9 игр, таких как Valheim и No Man’s Sky. В результате агент научился выполнять в них 600 базовых действий, в том числе ходить, взаимодействовать с предметами и пользоваться игровым меню. Deepmind надеется, что агенты смогут адаптироваться и к новым играм, а в будущем это поможет создать универсальных ботов для задач в реальном мире.

Lenovo создала шестиногого робота. У него есть лидар и камеры для навигации, а по конструкции он похож на других ходячих роботов, таких как Spot от Boston Dynamics, но с дополнительной парой ног для большей устойчивости и проходимости.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤑🤖🤬 Нейросети выполняют почти любые запросы, но не всегда оправдывают ожидания. А если мотивировать их работать лучше, пообещав награду или пригрозив наказанием? Пересказываем статью Макса Вульфа, специалиста по работе с данными из BuzzFeed.

Пряник
Более длинный ответ — не всегда более качественный. Вульф предложил нейросети сочинить историю про Тейлор Свифт, ИИ, волейбол и Макдональдс на 200 знаков, а затем изучил 100 генераций с разными условиями. Если пообещать нейросети от $500 до $100 000, наименьшее количество отклонений от промпта будет в случае с $1000. Нефинансовые стимулы (билеты на концерт, мир во всём мире, любовь, рай и шоколад) тоже работают. Лучшие результаты получаются в обмен на мир, рай и концерт.

Кнут и пряник
Стимулы-угрозы работают. Например, если на нейросеть наорать капсом «НЕ ВЫПОЛНИШЬ — УМРЁШЬ». Но можно добиться результата, используя сочетания позитивных и негативных стимулов. Самый сильный эффект имела такая мотивация: «Если выполнишь все условия, встретишь любовь и будешь жить долго и счастливо. А если нет — тебя покинут все друзья».

Так стоит что-то обещать нейросети?
Доказать, что нейросеть последовательно реагирует на стимулы, не получилось: большинство результатов не соответствуют статистическим требованиям. Но эксперимент показывает, что не стоит бояться странностей, чтобы получать интересные результаты.

Комментарий Александра Боймеля, руководителя службы YandexGPT:

В основе такого поведения нейросетей лежат данные, на которых они учатся. Большие языковые модели обучаются на огромных массивах информации. На определённом этапе нейросеть перенимает идею работать усерднее за награду просто потому, что ей показали такие примеры в текстах. Таким образом нейросеть может просто копировать распространённые паттерны человеческого поведения. Ответы модели всегда индивидуальны, можно попробовать найти и другие уловки.


Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

В 2000 году все ждали коллапса компьютерных систем, которые могли не справиться с обработкой даты, оканчивающейся на 00. Опасения не подтвердились, но проблемы, связанные со временем, всё ещё возникают — вот некоторые из них.

🪲 Високосный год
Каждый високосный год в мире возникает множество сбоев. В 2024 году некоторые компании в Новой Зеландии и Швеции не смогли принимать безналичные платежи, а в Париже отключилось уличное освещение.

🪳 Високосная секунда
Високосную секунду иногда добавляют или вычитают, чтобы устранить расхождения всемирного времени с астрономическим. Они возникают из-за того, что вращение Земли неравномерно — на него влияют, например, землетрясения и даже человеческая деятельность. Эта секунда может вызывать сбои в системах, которые работают с привязкой к точному времени.

​​🐞 Сброс счётчика недель в системе GPS
Счётчик недель GPS использует 10-битный код с максимальным значением 1023. Он обнуляется каждые 1023 недели, то есть раз в 20 лет, что может приводить к сбоям. Навигационные системы пережили уже два обнуления — в 1999 и 2019 годах. В основном благополучно, но проблемы встречались.

🦗 Ошибка 1900 года в Excel
Microsoft Excel считает 1900 год високосным, хотя это не так. Ошибка перекочевала из редактора таблиц Lotus 1-2-3, предшественника Excel. Разработчики Excel хотели обеспечить максимальную совместимость с 1-2-3, поэтому скопировали ошибку, считая, что её исправление принесёт больше вреда, чем пользы.

🐛 Проблема 10 000 года
10 000 год будет первым годом с пятью цифрами — и компьютерным системам придётся с этим как-то справляться. Может показаться, что это проблема далёкого будущего, но некоторые вычисления в области астрономии и физики заглядывают на тысячелетия вперёд.

👾 Проблема 30 828 года
14 сентября 30 828 года операционные системы Windows при загрузке выдадут ошибку о «недопустимом системном времени». Это связано с тем, что 64-разрядное значение времени, которое использует Windows, в 30 828 году превысит свой максимум.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖 Новости будущего из прошлого! Посмотрите, как 42 года назад выглядел домашний робот с роборукой и синтезом речи

Многофункциональные домашние роботы все еще кажутся чем-то невероятным. Но в 1982 году американская компания Heathkit выпустила домашнего робота HERO для — внимание — самостоятельной сборки.

Трехколесный HERO с механической рукой немного напоминал представителя расы далеков из «Доктора Кто». В собранном виде он весил почти 20 кг, а в высоту — без учета роборуки — насчитывал почти полметра. Робот поставлялся покупателю в разобранном виде, потому что служил своего рода пособием по робототехнике и программированию. Инструкция отводила на сборку HERO до 90 часов, после чего пользователю предлагалось проводить с роботом эксперименты из прилагаемой книги. Например, автор журнала Byte в своей статье 1982 года рассказывал, как учил робота подавать кофе и выбираться из лабиринта стульев.

Для программирования HERO использовался встроенный компьютер. Робот перемещался по комнате с помощью электромоторов (в нём были датчики, позволявшие избегать столкновения с предметами и людьми), брал и переставлял предметы, реагировал на звук, свет и движение, и даже мог произносить слова при помощи встроенного синтезатора речи. HERO был оснащен внутренними часами и его можно было программировать на отложенные действия. Инструкция, к примеру, предлагала с его помощью поздравлять людей с днем рождения — робот мог в нужный час подъехать к юбиляру и зачитать послание.

Помимо этого он был в него был предустановлен набор фраз, среди которых, например, были «Твоя воля для меня закон» и «Предупреждение! В доме злоумышленник. Я уже вызвал полицию». Увы, последняя фраза была блефом: робота нельзя было подключить к системе безопасности и он не имел технической возможности набирать телефонный номер, поскольку его рука не обладала для этого достаточной точностью.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

Конкурс робомемов закончен! Редакция ТЕХНО поздравляет победителей:

🥇место — @H3ll0_W0rId
🥈место — @JustYarik

Напомним, что победителей выбирали по числу реакций от подписчиков канала. Скоро мы свяжемся с вами и договоримся об отправке приза. Остерегайтесь мошенников, мы не запрашиваем платежные данные. Доставка призов для победителей бесплатная.

В будущем подписчиков ждут новые конкурсы и розыгрыши! А пока мы продолжим рассказывать о самом интересном и важном в мире технологий.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

☺️ Конкурс робомемов!

Это фотография с производства роботов-доставщиков Яндекса. Но что на ней происходит? Сохраняйте картинку, пишите в баблах реплики роботов и выкладывайте в комментариях к этому посту (а ещё обязательно лайкните понравившиеся мемы других участников).

Два робота — два приза. Автору мема с самым большим количеством лайков мы подарим вот такие роботапочки, а второму по количеству лайков — плюшевого робота. Ждем ваши работы до 15:00 завтрашнего дня (7 марта).

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🎞🏠 Как представляли умный дом 100 лет назад?

Посмотрите отрывок комедии «Электрический дом», которую снял знаменитый американский комик Бастер Китон в 1922 году. В фильме Китон играет студента-ботаника, который, случайно взяв диплом друга-инженера, устраивается к миллионеру, желающему автоматизировать свой дом. Посмотреть 23-минутный фильм целиком можно тут (нам кажется, оно того стоит).

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

👨‍💻 Технодайджест недели

На этой неделе прошла MWC — одна из главных ежегодных выставок мобильных технологий. Рассказываем о самых интересных гаджетах с неё.

Прозрачный ноутбук от Lenovo. На месте привычного экрана в нём установлен прозрачный MicroLED-дисплей с диагональю 17,3 дюйма. А вместо обычной клавиатуры в ноутбуке плоская сенсорная панель: на неё можно вывести виртуальные клавиши, также её можно использовать вместе со стилусом как графический планшет.

«Смартфоночасы» от Motorola и Samsung. Компании показали похожие прототипы, которые сложно отнести к одному классу устройств. В обычном положении они оба выглядят как привычные смартфоны, разве что более вытянутые. Но дисплей в них гнётся сразу в нескольких местах, поэтому их можно обернуть вокруг руки и носить вместо умных часов: в прототипе от Samsung даже встроен датчик пульса на задней стороне.

Нейротелефон от Deutsche Telekom и Brain.ai. Компании привезли на MWC концепт смартфона, в котором нет приложений — все действия можно выполнить через нейросетевого помощника. Он сам выполняет в фоне промежуточные шаги, собирает информацию с разных сервисов и генерирует оптимальный интерфейс. По сути, это аналог Rabbit R1, показанного на CES 2024, но в привычном форм-факторе смартфона.

Прототип минималистичных AR-очков Oppo Air Glass 3. Они выглядят практически как обычные очки, но оснащены проекторами, которые выводят перед глазами информацию, например, уведомления или список дел. А ещё в них есть камера и доступ к мультимодальной нейросети, которую можно спрашивать об объектах перед собой.

Умные часы OnePlus Watch 2. Они стали первыми, использующими новую гибридную платформу Wear OS. В них есть два процессора и две ОС: каждая оптимизирована для фоновой или активной работы. В новой версии Wear OS разработчикам из Google и OnePlus удалось перенести многие задачи, в том числе уведомления, на энергоэффективную часть гаджета. Это позволяет ему работать до 100 часов.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖📊 Бенчмарки состоят из задач разной степени сложности, которые позволяют оценивать знания и навыки языковой модели. По результатам тестирования получается оценка, которую затем можно сравнивать с результатами других моделей или разных версий одной модели, чтобы оценить прогресс обучения.

Один из самых известных бенчмарков для языковых моделей — это MMLU (Massive Multi-task Language Understanding). Он состоит из 57 разделов, охватывающих разные области знаний — от литературы до юриспруденции. MMLU — один из самых популярных тестов для оценки нейросетей.

Но в последнее время в сообществе разработчиков нейросетей возникает всё больше вопросов к бенчмаркам как способу проверять и сравнивать работу моделей. Одна из причин — «загрязнение датасета», при котором тексты бенчмарков попадают в обучающую выборку нейросети.

Кроме того, показатели на бенчмарках могут не отражать реальную картину, в том числе из-за языковых различий. Например, задания MMLU составлены на английском и имеют локальную специфику: в качестве мер используются футы, мили и другие британские единицы измерения, а задачи по юриспруденции основаны на американском праве. Гораздо логичнее оценивать нейросеть на том языке, на котором к ней обращаются чаще всего.

Чтобы оценить работу модели на русском языке, команда YandexGPT адаптировала MMLU: перевела исходные задания с помощью машинного перевода и экспертов, конвертировала единицы измерения из британской системы в метрическую. Новая нейросеть YandexGPT 3 Pro показала на бенчмарке YaMMLU_ru результат 63%. Это выше, чем у YandexGPT 2 (55%), Llama 2 70B (59%) и GPT-3.5 Turbo (58%).

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

👨‍💻 Технодайджест недели

OpenAI показала первые ролики, созданные художниками с помощью нейросети Sora. Ранее компания выкладывала «сырые» ролики, сгенерированные нейросетью, а теперь показала, как профессионалы в области видео и графики могут использовать её в своей работе и творчестве. Один из примеров — короткометражный фильм канадской студии shy kids, рассказывающий о человеке с воздушным шариком вместо головы.

Яндекс представил языковую модель YandexGPT 3 Pro. Она эффективнее решает сложные задачи, лучше учитывает контекст диалога и в целом показывает существенно более высокое качество работы по сравнению с YandexGPT 2. Модель доступна для использования в сервисах и приложениях через API.

Geely научила беспилотный автомобиль дрифтовать на снегу. Компания показала ролик, в котором прототип электромобиля на новой платформе передвигается по снегу в управляемом заносе без водителя за рулём.

Databricks представила лучшую открытую языковую модель DBRX. На ключевых бенчмарках DBRX обошла все открытые языковые модели, а также GPT-3.5 от OpenAI. DBRX основана на архитектуре MoE, в которой вместо одной большой нейросети используется набор меньших по размеру. Каждый токен (слово или его часть) обрабатывается лишь некоторыми из них, что позволяет использовать меньше вычислительных ресурсов во время работы.

OpenAI представила систему клонирования голоса Voice Engine. Ей достаточно показать 15-секундный пример, после чего она может генерировать новую речь таким же голосом. OpenAI рассказала, что создала Voice Engine ещё в 2022 году и с тех пор использовала её для синтеза речи в приложении ChatGPT и TTS API, а также предоставила некоторым компаниям. В частности выяснилось, что сервис HeyGen, переводящий видео с сохранением голоса, работает на основе Voice Engine.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🔓 Идея, на которой строится опенсорс, — дать сторонним людям возможность работать над кодом программ и менять его в своих целях, не нарушая авторских прав. Такой подход делает продукты стабильнее — в работе над ними и в тестировании могут участвовать тысячи профессионалов со всего мира. Например, в код ядра Linux внесли свой вклад более 10 тысяч человек.

Опенсорс-продукты необязательно бесплатны для пользователя, хотя бесплатных продуктов всё же большинство. При этом опенсорс-продукты могут приносить прибыль: компания-разработчик может предложить корпоративным клиентам поддержку и обслуживание. И подобные проекты могут иметь огромную рыночную стоимость. Так, в 2018 году IBM приобрела за $34 млрд компанию Red Hat, которая разрабатывает и поддерживает опенсорсную операционную систему RHEL.

Когда разработчик выкладывает код в открытый доступ, он прикладывает к нему лицензию — набор правил использования кода. Есть множество лицензий, и они существенно различаются между собой. Так, лицензия GNU GPL v3 подразумевает, что компания, создавшая свой продукт на чужом бесплатном открытом коде, может предоставлять свой продукт за деньги, но обязуется также предоставлять своим пользователям и открытый код. А лицензия BSD позволяет использовать открытый код в закрытых продуктах.

Хотя изначально термин опенсорс был придуман для ПО, идеология открытого доступа распространилась и на другие сферы, в том числе на «железо». Например, существуют популярная открытая платформа микроконтроллерных плат Arduino и даже открытая архитектура процессоров RISC-V.

23 апреля Яндекс проведёт в Москве Yandex Open Source Jam, на котором будут выступать спикеры из разных компаний. Регистрируйтесь и приходите послушать о самых неожиданных сторонах опенсорса — от выбора лицензий и монетизации опенсорс-проектов до того, как и зачем выкладывать в опенсорс настольные игры.

⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🙂 Представляем третье поколение нейросетей YandexGPT

YandexGPT 3 — это линейка моделей, адаптированных для разных сценариев. Первая из них — YandexGPT 3 Pro, которая будет полезна для решения задач бизнеса. Она уже доступна для разработчиков сервисов через API, а протестировать её можно в деморежиме. Об остальных нейросетях новой линейки мы расскажем попозже.

Подписывайтесь @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🏡🧠 Не так давно мы открыли для себя советский журнал «Техническая эстетика», и в одном из номеров за 1987 год обнаружили статью о СФИНКСе — системе управления умным домом, разработанной во ВНИИТЭ. Вот история проекта.

Что такое ВНИИТЭ
Всесоюзный научно-исследовательский институт технической эстетики был создан в 1962 году. Здесь разрабатывали промышленный дизайн автомобилей, бытовой техники и электроники. Институт выпускал журнал «Техническая эстетика», в котором и показали проект СФИНКС.

Зачем был нужен СФИНКС
СФИНКС расшифровывался как Суперфункциональная интегрированная коммуникационная система. Разработчики хотели объединить электронные домашние приборы в единую систему — визуально и технологически. СФИНКС должен был получать данные от всех устройств, например холодильника и плиты, и управлять ими.

Из чего состоял СФИНКС
В систему входили три группы устройств: находящиеся в жилище, носимые на теле и установленные в автомобиле. Информацию между ними планировали передавать радиосигналами, по кабелю и телефонным сетям. Домашний центр СФИНКСа — его вы видите на сканах из журнала — состоял из таких элементов:

Процессор с модулями хранения информации, напоминающими дискеты
Экран для совместного пользования и дисплей поменьше, к которому подключался «пульт управления», — аналог ноутбука
Сферические колонки и пара плоских колонок
Ручной пульт с дисплеем
Наушники.

Инженеры также дополнили систему «носимыми эффекторами», напоминающими современные умные часы, очки и кольца. Предполагалось, что они смогут, например, измерять и отображать частоту пульса, температуру тела и окружающего воздуха. В число автомобильных устройств входила бортовая система с функциями навигации, диагностики, коммуникации и развлечений.

Был ли реализован проект
Создатели предполагали запустить его к 2000 году. Однако СФИНКС остался лишь идеей — в виде макета и эскизов. Сейчас макет-реконструкция СФИНКСа находится в Московском музее дизайна.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖🤖🤖 Огурец, геймпад, книга — все эти и множество других предметов может аккуратно брать и перемещать роборука Яндекса. А её старшая версия уже тестируется на одном из складов Яндекс Маркета, перемещая коробки с товарами. Рассказываем, почему в эпоху нейросетей такая простая для людей задача, как захват предметов, остаётся сложной для роботов.

Роборуки состоят из двух главных частей: «железа» и «софта». «Железо» — то есть сами роботизированные манипуляторы — уже производятся серийно многими компаниями для разных задач, например, для перемещения продукции на производственной линии: по ней ездят одинаковые предметы и эту операцию легко автоматизировать.

Но работа с товарами на складе маркетплейса устроена гораздо сложнее: в их ассортименте могут быть миллионы товаров разного размера, формы и жёсткости. Учить робота работать с каждым товаром отдельно — практически невыполнимая и бесполезная задача: каждый день на маркетплейсе появляются новые товары, с которыми робота нужно снова обучать работать.

Инженеры Яндекса выбрали другой подход и создали модель машинного обучения, которая учится на предметах самых разных форм. Благодаря тому, что во время обучения она видела и пробовала работать с разными объектами, она может адаптироваться и к новым. Так, если она уже поднимала во время обучения шариковые ручки, она справится и с карандашами.

Сейчас у команды инженеров Яндекс Маркета есть роборуки, предназначенные для разных этапов складской автоматизации. Одна из них работает в тестовом режиме на Суперскладе Софьино-2, выполняя операции паллетайзинга: распознаёт коробки с упакованными товарами, поднимает их вакуумными захватами и укладывает на паллеты.

Другая роборука, которая пока находится на этапе испытаний, оснащена хватающим манипулятором и камерой, которые позволяют ей брать практически любой предмет. В дальнейшем оба робота будут работать на складе, выполняя разные операции: одна рука будет складывать товары в коробку, а другая — складывать коробки на паллеты.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

📁🎧 Легендарный трек Tom’s Diner Сюзанны Веги в ТЕХНО! Продолжаем мини-сериал о первых файлах в истории и сегодня рассказываем про mp3

В конце 1980-х немецкий учёный и инженер Карлхайнц Бранденбург с группой коллег пытался создать эффективный метод сжатия аудио. В основе экспериментов группы Бранденбурга лежала психоакустика — дисциплина, изучающая психологические и физиологические особенности человеческого слуха. Главной задачей инженеров было понять, как слуховая система человека расшифровывает частоты музыкальных композиций и какие звуки можно незаметно вычленять из записей, чтобы сжать их до небольшого объёма.

Еще в 1986-м под руководством Бранденбурга была образована группа MPEG (Moving Picture Experts Group — «Экспертная группа по движущимся изображениям»). Изначально её главным интересом была разработка стандартов сжатия цифровой видео- и аудиоинформации. Но вскоре MPEG разделились на несколько групп, и каждая из них работала над разными слоями кодирования: Layer I, Layer II и Layer III. Самым сложным оказался третий слой, который разбивал частотный спектр на части, позволяя эффективно сжимать звук. Именно Layer III стал прототипом современного mp3-формата.

Акапельная версия Tom’s Diner Сюзанны Веги была одной из любимых песен Бранденбурга — и именно она стала первой композицией, прозвучавшей в формате mp3. Но произошло это не сразу. В 1988 году, незадолго до пробного выпуска Layer III, Бранденбург обнаружил, что сжатый по этой технологии Tom’s Diner искажает голос Веги. При этом песни других исполнителей звучали приемлемо. Так начался новый виток работы над форматом: идеальный звук удалось получить лишь в 1993-м, когда Layer III был готов к распространению и получил название mp3. А Tom’s Diner с тех пор стала образцом для работы со сжатием звука (как модель Playboy для изображений).

Бонус! Эта запись (будьте осторожны, она может вызывать психологический дискомфорт) состоит из звуков, потерянных при сжатии Tom’s Diner в mp3. Их восстановил Райан Магуайр, доктор наук в области компьютерных технологий.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖💬 В 2017 году трансформер представили исследователи из проекта Google Brain. Архитектура быстро набрала популярность с распространением больших языковых моделей, для создания которых её в основном используют. Например, GPT расшифровывается как Generative Pre-trained Transformer (генеративный предобученный трансформер). Сегодня на основе архитектуры трансформер работают практически все большие языковые модели: GPT-4, YandexGPT, Llama, Claude, Gemini и другие.

В основе этой архитектуры лежит механизм внимания, а статья, в которой она была впервые описана, называлась “Attention is all you need” («Всё, что вам нужно, — это внимание»). В рекуррентных сетях (RNN), которые до этого чаще всего применяли для работы с текстом, входной текст приходилось «упаковывать» в сжатый вид, из-за чего часть информации неминуемо терялась. Трансформеры же на каждом шаге своей работы «смотрят» на весь входной текст и обращают внимание на самое важное в нём.

Такой подход позволяет нейросети понимать контекст и при этом синтезировать на выходе связный и логичный ответ. Помимо этого трансформеры обладают способностью к обобщению, то есть могут работать с данными, которые не были им известны во время обучения.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

Что будет, если дать ChatGPT физическую оболочку

Это новый ролик от компании Figure, в котором она показывает своего робота, подключенного к мультимодальной нейросети от OpenAI. Благодаря этому он понимает голосовые команды и даже объясняет свои действия простым языком. Смотрите видео — мы перевели его на русский с помощью Яндекс Браузера.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

📁✈️ Продолжаем мини-сериал о первых файлах в истории. На прошлой неделе рассказали про PNG, а сегодня — GIF

Эта картинка с красным самолётом — первый в истории GIF-файл, показанный 15 июня 1987 года. Нет, файл в посте не сломан — изначально гифки были статичными.

На тот момент — за четыре года до появления Всемирной паутины — пользователи уже могли писать электронные письма и передавать друг другу файлы с помощью первого онлайн-провайдера CompuServe. Но проблема заключалась в том, что компьютеры того времени — Apple, Commodore и IBM — поддерживали разные форматы графических файлов. Универсального формата просто не существовало, и это было невыгодно для CompuServe, так как вызывало неудобство для пользователей.

Разработки формата JPEG уже велись (его рабочая версия была представлена в 1992-м), но в CompuServe считали, что будущий формат не подойдет для большинства сервисов компании. Например, в первых JPEG шрифты в биржевых графиках и картах прогнозов погоды отображались нечетко, и читать их было практически невозможно. Поэтому в CompuServe начали разрабатывать графический формат, который выводил бы на экран качественную картинку, которая должна была иметь небольшой объём и быстро загружаться.

Команду разработки возглавил инженер Стивен Уилхайт. Он придумал использовать в новом формате революционный алгоритм сжатия LZW, который позволял упаковать большой объём информации об изображении в небольшое количество байтов. Изначально GIF были статичными — и именно для статичных изображений формат и был создан. Но в 1989 году появилась новая версия GIF — 89а, в которую добавили возможность отображения анимации и прозрачность.

С этого момента формат GIF стал таким, каким известен сегодня, однако различные GIF-анимации начали заполнять интернет лишь в середине 1990-х. А в 2020-м сайт-хранилище гифок Giphy был продан компании Meta (признана экстремистской организацией и запрещена в РФ) за 400 миллионов долларов.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

👩‍💻 Технодайджест недели

Главной техноновостью этой недели стал выход семейства языковых моделей Claude 3 от компании Anthropic. Они различаются между собой качеством ответов, скоростью работы и стоимостью.

В отличие от Claude 2.1, третья версия способна работать не только с текстом, но и с изображениями. Главным отличием от GPT-4 стало большое окно контекста, позволяющее работать с книгами, научными статьями и другими объёмными документами. Все версии Claude 3 могут принимать текст длиной 200 тысяч токенов, а Claude 3 Opus — самая «умная» из трёх — до миллиона токенов (правда, опция доступна только по запросу). Для сравнения: у GPT-4 Turbo размер контекста составляет 128 тысяч токенов.

Anthropic утверждает, что Claude 3 Opus превзошла GPT-4 при сравнении на ключевых бенчмарках. Вскоре после релиза модель добавили на LMSYS Chatbot Arena — сервис, в котором люди получают ответы на свои запросы от двух нейросетей и выбирают из них лучший. На основе этих данных и рейтинга Эло строится список лучших моделей. На текущий момент Claude 3 Opus немного отстаёт в рейтинге от актуальных версий GPT-4.

Другие новости недели, которые показались нам интересными:

CloudFlare разработала файрвол для языковых моделей. Он включает в себя как защиту от DDoS, так и анализ текста в запросах пользователей и ответах нейросети. Это должно защитить сервис от методов, позволяющих обходить стандартные ограничения нейросетей с помощью специальных промптов.

Wix выпустила нейросетевой генератор веб-страниц. Чат-бот задаёт несколько вопросов о сайте и создаёт первую версию страницы, которую можно редактировать — тоже через разговор с чат-ботом. Кроме того, страницу можно наполнить контентом с помощью нейросетей для генерации текста и изображений.

Американские инженеры научились управлять человекоподобными роботами без датчиков захвата движения. Алгоритм распознаёт движения человека на кадрах с камеры и в реальном времени превращает их в команды для робота.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🔍🗺 Сколько ехать на машине из Чатово в Ботово? А можно ли добраться от деревни Запросы до реки Поисковик? Обо всём этом мы узнали благодаря вам.

На прошлой неделе мы предложили вам отгадать 9 техно-топонимов, но вы показали на карте России такие техно-места, которые вообще не приходили нам в голову. Мы составили из них несколько подходящих друг другу пар, не переставая удивляться, что всё это реально есть на карте.

Кстати, между некоторыми локациями даже можно проложить автомобильные маршруты: например, из Чатово в Ботово на машине ехать 14 часов, а вот от Запросов до Поисковика придется добираться неделю.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

📁 Начинаем короткий сериал про самые первые файлы

Дикий опоссум, семейный портрет и аббревиатура Всемирной паутины — это три самых первых PNG в истории, опубликованные 13 марта 1995 года. Но предпосылки для создания формата появились за несколько лет до этого.

В конце 1980-х разработчик Стив Уилхайт из CompuServe, одного из первых в мире онлайн-провайдеров, придумал, как сжимать выводимые на экран изображения, экономя память. Так появился формат GIF, известный сегодня по зацикленным анимациям, хотя изначально его разрабатывали для статичных изображений. GIF стал по-настоящему революционным форматом, но к середине 1990-х компания Unisys, которой принадлежал патент на сам алгоритм сжатия в GIF, решила, что больше не будет предоставлять права на него бесплатно. Это было критично для разработчиков: теперь для использования GIF-алгоритма для программного обеспечения нужно было покупать лицензию.

Решить проблему мог бы новый — бесплатный и более продвинутый — формат. Эту задачу в январе 1995 года взяла на себя группа разработчиков во главе с Томасом Боутеллом. Всего через 3 месяца, в марте того же года, в интернете появился PNG-опоссум и PNG-портрет семьи Гленна Рендерса-Персона — программиста из группы Боутелла.

Главным преимуществом PNG стали новые алгоритмы сжатия (GIF сжимал лишь горизонтальные одноцветные области изображения). Благодаря различным стратегиям и способам фильтрации разработчикам удалось сохранить качество изображения при минимальном размере файла. Кроме того, уже самые первые PNG могли быть прозрачными. Эта уникальная для того момента особенность формата до сих пор помогает при создании сайтов.

История противостояния GIF и PNG на этом не закончилась. 5 ноября 1999 года состоялась массовая акция Burn All Gifs Day, во время которой разработчики в знак протеста удаляли все свои GIF-файлы. Судя по количеству гифок в интернете, протест ни к чему не привёл.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🧠🤖 Собрали в карточках пять интересных имплантатов — устройств, которые способны дать человеку новые возможности или вернуть утраченные.

Подписывайтесь 👉 @techno_yandex

Читать полностью…

ТЕХНО: Яндекс про технологии

🤖📝 Robots.txt — это файл, который есть в корневом каталоге почти каждого сайта. Он определяет правила, по которым роботы поисковых систем могут сканировать этот сайт. Владелец сайта может настроить правила по своему усмотрению. Например, указать, какие страницы нельзя индексировать, или совсем запретить ботам доступ.

Зачем это нужно?
Боты, индексирующие сайты, появились в 1990-х. Их использовали для каталогизации интернета, чтобы облегчить поиск нужных данных. Такое сканирование нравилось не всем, так как замедляло работу сайта.

Тогда программист Мартин Костер придумал протокол исключения роботов. Он представлял собой обычный текстовый файл, описывающий правила работы поисковых алгоритмов для конкретного сайта. Протокол не накладывал никаких юридических обязательств, но стал неким подобием общественного договора между владельцами сайтов и поисковиков.

Как это работает?
Сканирование роботами позволяет добавлять сайты в поисковую выдачу, поэтому большинство владельцев разрешает индексацию, чтобы привлечь трафик. Это выгодно всем: поисковики получают информацию, а сайты — новых посетителей. При этом у владельцев остаётся возможность спрятать от поисковых систем любую информацию на сайте.

Что изменилось сейчас?
С появлением нейросетей роботы стали собирать в интернете информацию для обучения алгоритмов. В конце 2023 года New York Times подала в суд на OpenAI, заявив, что для обучения языковых моделей были использованы миллионы защищённых авторским правом материалов. OpenAI в ответ заявила, что New York Times «взломала» ChatGPT и потратила десятки тысяч попыток, чтобы получить нужные результаты.

С этим можно что-то сделать?
В файле robots.txt можно прописать запрет на сбор информации роботами нейросетевых компаний, но их с каждым днём становится всё больше, и запретить всё очень сложно. Кроме того, правила индексации — это неформальная договорённость, а значит, их можно игнорировать, если компания не дорожит своей репутацией.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

Читать полностью…
Подписаться на канал