YandexGPT 2: что изменилось
Обновили большую языковую модель YandexGPT. Мы покажем несколько примеров, на что она способна, но, конечно, интереснее пробовать самим — например, на ya.ru или в навыке Алисы «Давай придумаем».
🔸 Что нового:
Новая языковая модель решает больше различных задач, чем первая версия, а качество её ответов существенно улучшилось. Она способна анализировать тексты и отвечать на вопросы по ним, а также стилизовать текст ответа под разную аудиторию или персонажа.
🔸 Как мы это сделали:
Увеличили количество параметров и улучшили процесс обучения. Для этого тщательнее отбирали данные, добавили в датасет новые и синтетические — сгенерированные на основе реальной информации — примеры запросов.
🔸 И какие результаты:
Наши AI‑тренеры протестировали обе версии YandexGPT на 500 запросах по самым разным темам и сравнили результаты. Оказалось, что YandexGPT 2 в 67% случаев даёт более точный и подробный ответ.
Подписывайтесь 👉 @yandex
👾 Кто и как обучает нейросеть YandexGPT?
Прежде чем YandexGPT в Алисе научилась отвечать на ваши вопросы, большая команда асессоров, AI‑тренеров и DL‑инженеров готовили для неё данные и контролировали каждый шаг обучения.
DL или Deep Learning — это разновидность машинного обучения нейронных сетей на огромных объемах данных. Света Маргасова — DL‑инженер и член команды YandexGPT — в наших карточках рассказывает, как на самом деле учат большие языковые модели.
💫 Кстати, 7 сентября мы проведём Practical ML Conf, конференцию для экспертов о применении машинного обучения на практике, где Света прочитает доклад о том, что делать, если нейросеть начала галлюцинировать, то есть ошибаться и выдумывать факты.
Кроме того, докладчики из Yandex Cloud, Авито, Маркета, Sber AI, X5 Tech расскажут про Kandinsky, зрение роботов, GigaChat и многое другое. Регистрируйтесь по ссылке.
🚫 Виды спама, от которых защищает Яндекс 360.
В Почте Яндекса работают множество технологий защиты от спама. Одни анализируют адрес отправителя, вложения и ссылки, другие проверяют электронную подпись и подозрительную активность почтового ящика. Чтобы понять, отправить письмо в папку «Спам» или нет, они учитывают более 600 разных факторов.
Какой спам вообще бывает и чем он может быть опасен — рассказываем про это в коротком ликбезе.
Подписывайтесь 👉 @yandex
Небольшая история про одного из стажёров Яндекса.
Этим летом в наш московский офис пришёл Глеб, 19-летний студент Уральского федерального университета. Он должен был пройти стажировку в одной из команд Яндекс Еды. С самого начала Глеб спросил, можно ли ему снимать в офисе, чтобы поделиться впечатлениями с друзьями из Екатеринбурга.
Мы подумали, что это классная идея, и предложили поделиться не только с друзьями, но и вообще со всеми, кто подумывает прийти на стажировку в Яндекс. Глеб снимал свою стажёрскую жизнь, мы ему в этом помогали.
Получился влог про стажировку от первого лица — с экскурсией по офису, первыми факапами и тусовками. Чтобы вам было проще понять особенности стажировки, мы сняли для влога интервью с менторами и руководителями команд.
Подписывайтесь 👉@yandex
🧙 Знакомьтесь с генеративными блогерами!
Мы встретились с популярными авторами, которые создают изображения в Шедевруме, нашем приложении с генеративными постами и картинками, и попросили дать полезные рекомендации, чтобы вы могли вместе с нейросетью создать настоящий шедевр.
🛴 Запустили новый формат на ютьюбе — ПРОД. В нём познакомим с героями, которые создают технологии Яндекса, и покажем, из чего на самом деле состоит их работа.
В первом выпуске — самокаты Яндекса: посмотрите экскурсию по самокатной мастерской, познакомьтесь с профессией энерджайзера и узнайте, какие самокаты могут появиться в следующих сезонах.
Показываем нашего нового робота — Dilectus.
И рассказываем, что тут происходит.
⏩ Зачем он нужен:
Dilectus достаёт тяжёлые коробки с товарами — их называют тотами — и отвозит в зону сборки заказов. Именно поэтому робот такой большой и мощный: коробки, каждая из которых весит по 35 килограммов, он берёт с самых верхних полок стеллажей.
⏩ Что это даёт:
Робот поможет работникам. Им не нужно будет самим искать товары и перемещать их по складу. Вместо этого они сосредоточатся на сборке заказов и более интересных задачах. Это и ускорит работу, и уменьшит количество ошибок.
⏩ А какие ещё есть роботы:
Dilectus работает вместе с другими роботами Маркета: Spectro инвентаризирует склад, чтобы работники знали, где и какие товары лежат, а Motus перевозит по складу тяжёлые грузы.
Ещё одна подборка телеграм-каналов, которые ведут сервисы Яндекса. На этот раз про кино, умные устройства и скидки-скидки-скидки.
🍿 Кинопоиск и Кинопоиск Ждём
— что смотрим сегодня и что будем через год.
Если хотите знать про все главные трейлеры и самые важные анонсы, подписывайтесь на Кинопоиск Ждём. А если ищете более детальные разборы фильмов или просто что-то на вечер, то поможет основной канал Кинопоиска.
❤️ Яндекс для разработчиков
— о событиях, технологиях и людях, которые их создают.
Разработчики рассказывают о важных технологических новостях, глубоких хардовых кейсах и работе в Яндексе. А ещё в канале публикуют анонсы мероприятий, которые мы проводим для программистов, ML‑инженеров и других специалистов из ИТ.
💜 Алиса х Около Яндекс Станции
— для фанатов умных устройств.
Первыми узнавайте обо всех обновлениях умных устройств Яндекса, находите полезные сценарии и команды для виртуального помощника, а ещё обменивайтесь опытом настройки умного дома в большом комьюнити.
🚗 Журнал Авто.ру
— для автовладельцев.
Новости, статьи и полезные заметки обо всём, что связано с автомобилями и автомобилистами. Можно почитать про тест-драйв китайского электрокара, оперативно узнать о новых видах дорожной разметки или выбрать маршрут для отпуска.
📦 Скидки на Маркете
— промокоды и распродажи.
Узнавайте о выгодных предложениях на электронику, красивые вещи для дома, одежду, обувь, товары для детей и многое другое. В общем, полезно, если регулярно покупаете на маркетплейсе.
Кто и как тестирует автономные автомобили Яндекса?
Прежде чем новые технологии появятся на дороге, их нужно проверить и протестировать. Одни испытывают «железо» и, например, трясут лидары на вибростендах. Другие проверяют программное обеспечение. Любомир Матвеев руководит этим этапом тестирования автономных машин и объясняет, как оно устроено.
Как прочитать сотню отзывов на товары за несколько секунд?
YandexGPT научилась выделять главное из отзывов на товары и обобщать информацию из них в коротком списке преимуществ и недостатков. Всё это — прямо в Поиске Яндекса. Также эти обобщённые отзывы появились и на Яндекс Маркете.
Небольшой совет: если в Поиске нажать на один из пунктов, то увидите все отзывы, в которых покупатели говорят о какой-то конкретной особенности.
Что это такое спуфинг и как с его помощью обманывают.
🕸 Спуфинг принимает множество форм. Мошенники используют телефонные номера, электронную почту и даже IP‑адреса. Но суть всегда одна: через уязвимости системы выдать себя за уважаемую организацию или известную личность.
💸 У спуфинга могут быть разные цели. Но самая простая — получить данные или деньги. Мошенники отправляют спуфинговое письмо якобы от имени известного маркетплейса с новостью о скидках и приводят пользователя на поддельный сайт. На нём он может не заметить подмены и оставить или пароль от своего аккаунта, или оплатить что-то своей картой.
🔄 Спуфинговые письма создаются через скрипты. Они заменяют обычный адрес отправителя, например spoofmail@yandex.ru, на адрес, который нужен, чтобы ввести в заблуждение, например sale@newmarket.ru. Некоторые домены защищены протоколом DMARC — он не позволяет использовать их в спуфинге. Но такая защита есть не у всех.
✍️ Есть и способы отправить нежелательные письма в спам. Например, в Почте Яндекса алгоритмы проверяют DKIM‑домен и SPF‑авторизацию отправителя — что-то вроде скрытой электронной подписи, которая подтверждает подлинность письма. Если DKIM в письме оказался нехарактерным для почтового ящика отправителя, письмо помечается как мошенническое и просто не попадает во «Входящие».
Но есть и другие способы проверить подлинность письма и защитить почтовый ящик. О них мы расскажем позже.
Не удивляйтесь этой машине без водителя 👀
Мы продолжаем тестировать технологию автономного вождения в московском районе Ясенево. На новом этапе наши испытатели пересядут с водительского на пассажирское сидение. Не волнуйтесь, они всё так же контролируют поездку и могут остановить машину нажатием одной кнопки.
Попробуйте эти сценарии YandexGPT в учёбе.
Собрали полезные запросы, в ответ на которые YandexGPT объяснит простыми словами незнакомые термины, разложит по полочкам новые понятия и даже исправит ошибки в тексте.
Как и всегда — чтобы начать, откройте Алису и скажите: «Давай придумаем». Помните, YandexGPT может ошибаться, поэтому не забывайте проверять её подсказки.
Что уже умеет YandexGPT.
Пока мы работаем над обновлениями YandexGPT и думаем, в каком сервисе она ещё может появиться, расскажем про итоги первых месяцев с новой нейросетью: где она появилась и чему научилась.
Что делает поездки в такси безопасными?
Когда вы едете в такси домой, множество систем и технологий контролирует поездку, чтобы она развивалась безопасно и предсказуемо. В карточках коротко говорим о восьми таких технологиях.
А ещё больше о том, как поездки становятся безопасными, команда Яндекс Go рассказывает в этом видео.
🎙 Говорим о Яндексе сейчас и заглядываем в будущее. В новом yet another podcast — в Музыке и на YouTube — руководители Поиска объясняют, что будет с нашими автономными технологиями, почему мы готовим казахскую версию Алисы и какие обновления предстоят YandexGPT.
А пока парочка инсайтов про нашу большую нейросеть:
🟡 YandexGPT не убьёт классический поиск по интернету, а дополнит его. Например, сейчас тестируется версия Поиска, в которой нейросеть готовит быстрые ответы на разные вопросы и конспектирует информацию с сайтов.
🟡 Конечно, YandexGPT в продуктах Яндекса станет больше. В следующем году где-то половина пользователей наших сервисов будет сталкиваться или с самой YandexGPT, или с инструментами, которые мы создаём на её основе.
🟡 Завтра вы сможете узнать, как именно YandexGPT изменится в самое ближайшее время. На нашей Practical ML Conf расскажем об обновлениях большой нейросети. Регистрируйтесь и узнавайте первыми.
Собрали образовательные программы, полезные материалы и учебники, которые помогут научиться новому или подтянуть старые знания.
↘️ Яндекс Учебник по информатике
Интерактивный учебник для учеников 7–9 классов. Вводит в программирование на Python, даёт теорию и предлагает решить практические задания детям с разным уровнем подготовки. Перед началом работы на платформе должен зарегистрироваться учитель.
↘️ Хендбуки
Цифровые учебники с теорией и практикой. Одни подойдут для новичков, другие — чтобы подтянуть свои знания, например, перед собеседованием. Вышли пять учебников: по машинному обучению, анализу данных, основам Python, C++ и алгоритмов.
↘️ Курсы в Яндекс Лицее
Карьеру в ИТ помогут начать бесплатные курсы по Python и Go для школьников и студентов первых курсов колледжей. Чтобы поступить и выучиться на junior‑разработчика, хватит знаний из школьной программы. Заявки принимают до 11 сентября.
↘️ Специализации в Яндекс Лицее
Курсы длятся год, для более быстрого обучения есть интенсивы. Они идут три месяца и концентрируются на решении практических задач. До 12 сентября принимают на интенсивы по разработке игр, анализу данных, машинному обучению и веб-разработке.
↘️ База знаний Академии
Вообще все образовательные материалы от наших экспертов: и статьи на Хабре, и записи с конференций по фронтенду, мобильной разработке, дизайну, hardware и другим темам. Сохраните в закладках, чтобы поискать по базе ответы на свои вопросы.
↘️ Открытый лекторий Летних школ
Этим летом эксперты из Яндекса прочитали больше 150 лекций про YY_frontend/streams">фронтенд-, YY_backend/streams">бэкенд-, YY_mobile">мобильную разработку и YY_management/streams">управление продуктом, а именно продакт-менеджмент, маркетинг и аналитику. Если пропустили, мы выложили для вас записи всех лекций.
↘️ Курс Практикума для инженеров по тестированию
Одно из направлений, которое позволит попасть в ИТ-индустрию без навыков программирования и быстрее, чем это будет с другими профессиями. Курс длится четыре месяца, ближайшие начнутся 21 сентября и 12 октября.
📌 Небольшая подсказка: определитель номера Яндекса работает не только с обычными звонками, но и в мессенджерах WhatsApp и Viber. Когда звонят с незнакомого номера, он подскажет, полезный это звонок или, возможно, мошенники.
Откройте приложение Яндекс с Алисой и скажите голосовому помощнику: «Алиса, включи определитель номера». В iOS определитель для мессенджеров заработает сразу, в Android нужно в настройках приложения нажать на пункт «Определять звонки в мессенджерах».
Подписывайтесь 👉 @yandex
📹Нейросеть Яндекса научилась генерировать видео в Шедевруме
Новая функция работает в режиме тестирования и доступна активным авторам Шедеврума. Все остальные могут посмотреть на примеры работ в ленте приложения — обновите его до последней версии.
Как это работает?
За генерацию отвечают нейросети Яндекса. Чтобы сгенерировать видео в Шедевруме, нужно описать текстом то, что хочется увидеть. В ответ приложение предложит четыре варианта первого кадра и набор анимационных эффектов для создания движения. Сейчас их семь: зум (приближение), таймлапс (ускоренная перемотка), полёт, панорама, вращение, подъём и морфинг (постепенное изменение). За основу нейросеть берёт выбранное пользователем изображение, генерирует набор его изменённых версий и объединяет всё выбранным эффектом.
Приложение генерирует короткие ролики длиной четыре секунды с частотой 24 кадра/сек. Для создания кадров используется метод каскадной диффузии. Нейросеть сначала создаёт отдельные изображения в соответствии с запросом, а затем поэтапно увеличивает их разрешение, насыщая деталями. Звука в таких роликах пока нет.
Подписывайтесь 👉@techno_yandex
Не пропускайте новости Яндекса тут @yandex
💬 Чтобы составить ленту ресторанов в приложении, мы используем порядка ста разных факторов.
Например, учитываем предпочтения пользователя и сделанные им ранее заказы: любите бургеры — в первую очередь будем показывать, откуда заказать именно их.
Другие важные факторы — день недели и время суток: утром покажем рестораны с завтраками, а в пятницу вечером — места, чтобы заказать еду на вечеринку.
За всем этим стоит техника машинного обучения под названием градиентный бустинг, которая часто применяется для классификации, а также наша библиотека CatBoost.
Недавно говорили о приложении Еды и фудтехе в целом в yet another podcast. Слушайте, чтобы узнать больше об алгоритмах, которые помогают привезти вам еду.
Подписывайтесь 👉@yandex
Грабер: рассказываем об одной из главных особенностей нового робота Яндекса.
🏗 Это часть нового робота Dilectus. Он загружает себя товарами, а потом отвозит их в место, где работники собирают заказы. У робота внушительные размеры, поэтому за один раз он способен отвезти до девяти коробок с товарами.
📦 Грабер нужен, чтобы брать с полки тоты — те самые коробки, в которых на складе хранят товары. Сложная конструкция не ограничивает робота в его задачах и позволяет хватать не только ближайшие, но и те тоты, что стоят за ними.
👀 Чтобы снять тот с полки, его нужно сначала найти. Камеры Dilectus сканируют метки на стеллажах и помогают роботу ориентироваться на складе: в какой он стоит аллее и около какой ячейки. У грабера тоже есть своя камера — она ищет для него нужный тот.
Проводим экскурсию по умному дому за три минуты 🏘
Сходили в гости к разработчику Алисы Паше Капле. Он построил для себя и семьи по-настоящему умный дом, а мы посмотрели, как выглядит квартира, которой можно целиком управлять или с приложения в телефоне, или даже голосом.
🍥 Слушайте этот подкаст — на ютьюбе или в Музыке — только сытыми! В нём обсуждаем вкусную еду, доставку и алгоритмы, которые за всем этим стоят. И что же там такого интересного?
🔘 Инсайд от Яндекс Еды: готовим инновационные сумки для огромной пиццы (чтобы не переворачивалась!)
🔘 Десяток хитростей в Еде: как рестораны и пользователи пытаются перехитрить алгоритмы (но выходит далеко не всегда)?
🔘 Тренды в доставке еды: пицца, бургеры, роллы, хинкали — какие блюда популярны сейчас (и что будет в моде через год)?
Что если у телевизора не будет пульта? А вот что!
С новыми телевизорами Яндекса — ТВ Станция и ТВ Станция Про — вам не нужно искать пульт, чтобы включить фильм вечером. Достаточно просто попросить Алису — она услышит вас, даже если вы обратитесь к ней шёпотом.
А роботакси могут ездить в дождь? 🤔
Наши инженеры тоже задумались об этом и разработали технологии, которые помогают сенсорам машины ориентироваться в непогоду. В итоге роботакси ездит и в дождь, и в снег, и даже в сильный ливень. Георгий Никандоров руководит разработкой лидаров и сейчас всё про это расскажет.
👀 Представляем телевизоры, которым не нужен пульт.
Мы объединили нашу Станцию с Алисой и Smart TV — в ТВ Станцию и ТВ Станцию Про. Это новая категория 4K‑телевизоров с полноценным голосовым управлением, миллиардом цветовых оттенков и всеми возможностями Станции. Рассказываем, что делает их особенными.
Читайте блоги и журналы, которые ведут наши сервисы. Собрали пять изданий о технологиях, доме, путешествиях и бизнесе.
📚 Журнал Академии Яндекса
— медиа для начинающих айтишников
Советует книги по математике, рассказывает, как настроить Git и почему важно научиться делегировать. В интервью с яндексоидами разбирается, из чего состоят современные технологии и как достичь большего на своём карьерном пути.
🏠 Я так живу
— про квартиры и домашний уют
Рассматривает все этапы отношений с недвижимостью: обзоры на новостройки и районы — для тех, кто только ищет квартиру, списки лучших дизайнерских вещей для дома и советы по ремонту — для тех, кто уже обживается.
❤️ Яндекс на Хабре
— о том, как мы делаем Яндекс
Как создаются новые технологии — об этом рассказывают наши разработчики и профессионалы в самых разных сферах. Кто-то пишет о цифровой доступности и языковых моделях, кто-то — об умном доме и роботах.
📦 Журнал Чек
— как делать бизнес на Маркете
Эти материалы будут полезны тем, кто только задумывается выйти на маркетплейс или недавно запустил на Маркете свой магазин. В журнале продавцы делятся своим опытом и кейсами, а эксперты Маркета — аналитикой и лайфхаками, которые помогут увеличить продажи.
✈️ Журнал Путешествий
— для начинающих и опытных путешественников
Найдёте ответ на простой вопрос: «Куда же поехать в отпуск?». В Журнале собраны путеводители по городам и странам, полезные инструкции, например, как получить визу, сколько стоит путешествие и чем заняться в самолёте. Для заядлых туристов — маршруты по нетуристическим местам.
🚙 После этого yet another podcast — смотрите на YouTube, слушайте в Музыке — вы будете знать про каршеринг и Яндекс Драйв вообще всё, например:
🟡 Как сэкономить на каршеринге: откуда можно уехать бесплатно и почему больше нет 5 рублей за поездку?
🟡 Что происходит с парком Драйва: куда делись старые машины и откуда взялись «Мустанги» 1965 года?
🟡 Из чего состоит водительский рейтинг: что происходит на рейтинге 10 и хорошо ли пользователи Драйва ведут себя на дороге?
Не стесняйтесь округляться!
В наших сервисах — Яндекс Go, Лавка, Еда, Маркет, Самокаты и Заправки — вы можете округлять стоимость своих заказов, чтобы помогать сотням проверенных благотворительных фондов и их подопечным.
Округление может быть совсем небольшим, главное — регулярным. Такие постоянные пожертвования позволяют некоммерческим организациям эффективнее планировать расходы и помогать большему числу людей.
Всё очень просто — включите округление в приложении один раз и надолго сделайте благотворительность частью своей жизни. Даже малая помощь заметна, если сделать её регулярной.
Недавно мы открыли роболабораторию — место, где живут и разрабатываются роботы для складов Маркета. Обсуждаем, на что способны эти роботы, в yet another podcast на YouTube и в Яндекс Музыке:
🔘 Три закона складских роботов. Чем отличаются от законов Айзека Азимова?
🔘 Люди уже работают вместе с роботами. Но как они друг на друга реагируют?
🔘 В Яндексе делают собственных роботов. А почему бы не купить их в Китае или в другой стране?