Stability AI запускает первый набор языковых моделей StableLM
This repository contains Stability AI's ongoing development of the StableLM series of language models and will be continuously updated with new checkpoints. The following provides an overview of all currently available models. More coming soon.
StableLM предназначена для генерации текста и кода и будет использоваться в различных приложениях. Модель обучена и полностью готова к использованию всеми желающими абсолютно бесплатно. В данный момент готовы к использованию языковые модели с 3B и 7B (3 и 7 млрд.) параметрами.
🖥 Github: https://github.com/Stability-AI/StableLM
🤗 Hugging face: https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat
ai_machinelearning_big_data
💻 Навык работы с большими данными открывает путь в ведущие IT-корпорации. Обычно такие корпорации используют MLOps — способ повышения производительности и создания надежных моделей корпоративного уровня.
📊 Занимаетесь дата-инжинирингом и хотите выйти на новый уровень? Эксперты топовых компаний обучат вас необходимым навыкам на практическом онлайн-курсе «MLOps» от OTUS.
👉 Определите свой уровень подготовки с помощью теста — https://otus.pw/UB4x/
🔥 Пройдете тест, получите велкам-скидку и доступ к 2 предстоящим открытым урокам:
✔️ Построим свой конвейер обучения моделей на Airflow и k8s.
✔️ DataFrame API: от Dask к PySpark
Разработчики, архитекторы, Data Science и R&D-специалисты Нижнего Новгорода, вы здесь? Сбер приглашает вас на инженерный митап RecSys Community, который пройдет 25 апреля в Сo-working Garage 💻
О чем расскажут спикеры?
✔️ Рассмотрят подходы к применению трансформеров в рекомендательных системах и поделятся успешными кейсам.
✔️ Покажут, как используют AmazMe для обработки персонализированных и мультимодальных рекомендаций.
✔️ Раскроют все секреты, какие изменения помогли сделать рекомендательную систему поиска друзей такой точной.
Конечно же, на митапе будут Q&A-сессии, кофе-брейк, розыгрыш мерча и интересное общение. Встречаемся 25 апреля в Co-working Garage по адресу: ул. Октябрьская, д.35. Сбор гостей в 18:30.
Зарегистрироваться!⚡️
SiLK - Simple Learned Keypoints
SiLK is a self-supervised deep learning keypoint model.
🖥 Github: https://github.com/facebookresearch/silk
⏩ Paper: https://arxiv.org/abs/2304.06194v1
⭐️ Dataset: https://paperswithcode.com/dataset/hpatches
ai_machinelearning_big_data
AGIEval: A Human-Centric Benchmark for Evaluating Foundation Models
This repository contains information about AGIEval, data, code and output of baseline systems for the benchmark.
AGIEval, новый бенчмарк, специально разработанный для оценки моделей ориентированных, на вступительные экзамены, математические олимпиады и квалификационные экзамены для юристов.
🖥 Github: https://github.com/microsoft/agieval
⏩ Paper: https://arxiv.org/abs/2304.06364v1
⭐️ Dataset: https://paperswithcode.com/dataset/jec-qa
ai_machinelearning_big_data
🎨 Animated Drawings
A Method for Automatically Animating Children's Drawings of the Human Figure
Метод анимации детских рисунков от Meta.
🖥 Github: https://github.com/facebookresearch/AnimatedDrawings
⭐️Project: https://fairanimateddrawings.com/site/home
⏩ Paper: arxiv.org/pdf/2303.12741.pdf
ai_machinelearning_big_data
⭐️ Hard Patches Mining for Masked Image Modeling
We observe that the reconstruction loss can naturally be the metric of the difficulty of the pre-training task.
Мы предлагаем Hard Patches Mining (HPM), совершенно новую структуру для предварительного обучения MIM. Мы заметили, что потери на восстановление могут естественным образом служить метрикой сложности задачи предварительного обучения.
🖥 Github: https://github.com/haochen-wang409/hpm
⏩ Paper: https://arxiv.org/abs/2304.05919v1
⭐️ Dataset: https://paperswithcode.com/dataset/ade20k
ai_machinelearning_big_data
👀SEEM: Segment Everything Everywhere All at Once
Universal, interactive multi-modal interface for any types of segmentation with ONE SINGLE MODE.
SEEM позволяет пользователям легко сегментировать изображение, используя подсказки (промпты) различных типов, включая визуальные подсказки ( метки, рамки, каракули и сегменты изображения), языковые подсказки (текст и аудио) и т.д.
🖥 Github: https://github.com/ux-decoder/segment-everything-everywhere-all-at-once
⏩ Paper: https://arxiv.org/abs/2304.06718v1
⭐️ Dataset: https://paperswithcode.com/dataset/refcoco
ai_machinelearning_big_data
⛹️♂️ SportsMOT: A Large Multi-Object Tracking Dataset in Multiple Sports Scenes
A Large-Scale Multi-Object Tracking Dataset in Sports Scenes.
Новый крупный набор данных многообъектного отслеживания в различных видах спорта, собранных для трех видов спорта - баскетбола, волейбола и футбола.
🖥 Github: https://github.com/MCG-NJU/SportsMOT/tree/main/codes
⏩ Paper: https://arxiv.org/abs/2304.05170v1
⭐️ Dataset: https://paperswithcode.com/dataset/sportsmot
ai_machinelearning_big_data
⚜️ OpenAGI: When LLM Meets Domain Experts
Reinforcement Learning from Task Feedback (RLTF) mechanism, which uses the task-solving result as feedback to improve the LLM's task-solving ability
OpenAGI - исследовательская платформа AGI с открытым исходным кодом, специально разработанная для решения сложных, многоэтапных задач и сопровождаемая наборами данных по конкретным задачам, метриками оценки и разнообразным набором моделей.git clone https://github.com/agiresearch/OpenAGI.git
🖥 Github: https://github.com/agiresearch/openagi
⏩ Paper: https://arxiv.org/pdf/2304.04370.pdf
⭐️ Dataset: https://drive.google.com/drive/folders/1AjT6y7qLIMxcmHhUBG5IE1_5SnCPR57e?usp=share_link
ai_machinelearning_big_data
DiffMimic: Efficient Motion Mimicking with Differentiable Physics
Utilizing differentiable physics simulators (DPS), DiffMimic simplifies policy learning into a state matching problem, providing faster and more stable convergence than reinforcement learning-based techniques.
В данном фреймворке используются дифференцируемые физические симуляторы (DPS) и предлагается эффективный метод имитации движения, получивший название DiffMim.
🖥 Github: https://github.com/jiawei-ren/diffmimic
⏩ Paper: https://arxiv.org/abs/2304.03274v1
⏩ Project: https://diffmimic.github.io/
⭐️ Demo: https://diffmimic-demo-main-g7h0i8.streamlit.app/
⭐️ Video: https://youtu.be/B0unbsvGsLc
ai_machinelearning_big_data
Хотите быстро и эффективно погрузиться в мир искусственного интеллекта? Опыт программирования не важен!🤖
Всего за 3 вечера, под руководством наших экспертов в области ИИ, вы напишите 9 нейросетей и поймете как применить их на практике!👨💻
Какие нейронные сети вы создадите?
▫️Классификация людей на входящих и выходящих из автобуса
▫️Обнаружение возгораний
▫️Оценка стоимости квартир
▫️Оценка резюме соискателей
▫️Прогнозирование стоимости полиметаллов
▫️Сегментация изображений самолетов
▫️Распознавание команд умного дома
Наш интенсив идеально подходит для начинающих в области ИИ, а также для тех, кто хочет обновить свои знания и узнать о последних тенденциях.
Приходите на бесплатное обучение и напишите искусственный интеллект за 3 вечера💪
Регистрация по ссылке
🔥 Что такое согласованность данных и почему с ней все так сложно
Понятие согласованности данных сложное, неоднозначное и включает в себя широкий спектр определений, лишь частично совпадающих друг с другом. Команда VK Cloud перевела статью, в которой автор определяет термин «согласованность» в области распределенных БД и рассуждает на тему этой самой согласованности.
ai_machinelearning_big_data
Компьютерное зрение — технология, которая превращает настоящее в будущее. Уже сейчас ИИ с нами каждый день — направляет роботов-пылесосов и снимает блокировку телефона по FaceID. А в ближайшие 20 лет, по прогнозам экспертов, мы сможем легко купить себе беспилотный автомобиль, прокатиться на поезде без машиниста или получить диагноз от ИИ в районной больнице.
Если у вас есть опыт в Data Science — научитесь обучать CV-модели и работайте с передовыми технологиями. Для этого Яндекс Практикум запускает курс «Компьютерное зрение на базе нейронных сетей».
В программе — «три кита» компьютерного зрения: классификация, детекция и сегментация. За 3 месяца вы обучите модели, которые умеют:
— определять границы и сетку для пазла Судоку,
— узнавать настроение человека по фотографии;
— выявлять элементы дорожного движения для беспилотного автомобиля.
— сегментировать спутниковые снимки, чтобы определять местоположение объекта.
Вы освоите полный цикл работы с CV-моделями с нуля до релиза. А ещё — будете учиться у наставников — экспертов в области компьютерного зрения.
Записывайтесь в первый поток и работайте над технологиями, о которых писали фантасты.
WeakTr: Exploring Plain Vision Transformer for Weakly-supervised Semantic Segmentation
🖥 Github: https://github.com/hustvl/weaktr
⏩ Paper: https://arxiv.org/abs/2304.01184v1
💨 Dataset: https://paperswithcode.com/dataset/imagenet
ai_machinelearning_big_data
Inpaint Anything: Segment Anything Meets Image Inpainting
Inpaint Anything is able to remove the object smoothly.
"Inpaint Anything" - новый проект, который позваоляет удалить / заполнить / заменить что угодно на картинке (помощью промпта).
🖥 Github: https://github.com/geekyutao/Inpaint-Anything
⏩ Paper: https://arxiv.org/abs/2304.06790
⭐️ Dataset: https://segment-anything.com/dataset/index.html
ai_machinelearning_big_data
💻 Graph classification with Transformers
This notebook shows how to fine-tune the Graphormer model for Graph Classification on a dataset available on the hub.
В этой статье мы рассмотрим, как можно выполнять классификацию графов с помощью библиотеки Transformers.
🤗Hugging face blog: https://huggingface.co/blog/graphml-classification
⏩ Intro to Graphs: /channel/ai_machinelearning_big_data/3214
🖥 Github: https://github.com/huggingface/blog/blob/main/notebooks/graphml-classification.ipynb
⏩ Paper: https://arxiv.org/abs/2106.05234
⭐️Dataset: https://ogb.stanford.edu/
ai_machinelearning_big_data
📝 An open, billion-scale corpus of images interleaved with text.
MultimodalC4 is a multimodal extension of c4 that interleaves millions of images with text.
Открытый миллиардный корпус изображений, чередующихся с текстом.
🖥 Github: https://github.com/allenai/mmc4
⏩ Paper: https://arxiv.org/abs/2304.06939v1
⭐️ Dataset: https://paperswithcode.com/dataset/c4
ai_machinelearning_big_data
❓ Как стать высокооплачиваемым специалистов в ML?
Совершенствуй мастерство ML в сообществе единомышленников. 25 апреля — старт продвинутого онлайн-курса «Machine Learning Advanced» от OTUS.
Приглашаем на курс тех, кто хочет вырасти до позиции Middle или Senior уровня.
🧑💻 В программе:
- Продвинутые ML-алгоритмы и кейсы решения нестандартных задач
- Работа в production: настройка окружения, оптимизация кода, построение end-to-end пайплайнов и внедрение решений.
- Уникальный исследовательский проект по машинному обучению
⚠️ Вебинары в формате Live coding, где преподаватель с «чистого листа» показывает решение актуальных задач ML.
Ответьте на 10 вопросов и проверьте, насколько вы готовы к обучению на углубленном курсе - «Machine Learning. Advanced» от OTUS и его партнера — Сбера.
👉 ПРОЙТИ ТЕСТ:
https://otus.pw/pXFb/
Ищу ML специалиста для решения задачи компьютерного зрения
Мы компания metadreamteam.io - амбициозная команда XR разработчиков и 3Д артистов, работающая на американском рынке, которая делает проекты для всего мира! От Екомерс до real estate. От внедрения лучших решений на рынке до создания своих разработок с нуля.
Сейчас делаем свою разработку по примерке часов в режиме реального времени.
Работа удаленная. Фриланс. Оплата от $25 в час
(160 - 400 тыс руб за проект)
Если ты хочешь работать с лучшими в индустрии, делать амбициозные проекты и зарабатывать в валюте - тогда заполняй эту форму, чтобы присоединиться к нам! https://forms.gle/ovrkQDMasSBWsR538
Хотите узнать, как создавать нейронные сети и заработать от 150 тысяч рублей в месяц?
Изучение нейросетей может открыть множество возможностей для развития карьеры.💪
Почему нейросети это перспективно:
👉Тут много платят
👉Можно работать из любой точки Мира
👉Есть возможность продавать AI проекты на заказ с чеком 1 500 000 ₽
AI и нейросети доступны для изучения даже для людей далеких от мира IT, ведь опыт программирования НЕ нужен☝️
🔥Мы помогли уже тысячам людей получить профессию, которая будет востребована минимум ближайшие 30 лет!
Присоединяйтесь к нашему 3-дневному интенсиву по ИИ и получите полезные навыки и знания в короткий срок!
Почему именно ChatGPT стал прорывом в развитии нейросетей? Что происходит там под капотом на самом деле?
📢📢 Посмотрим на ChatGPT глазами ML-специалистов 17 апреля в 18:00 на открытом уроке «Towards ChatGPT».
Вебинар приурочен к старту онлайн-курса «Natural Language Processing (NLP)» в OTUS. На занятии мы разберем подход, позволивший ChatGPT добиться таких высот.
💻Что вас ждет на занятии?
— Поговорим про трансформерные и генеративные модели, лежащие в основе ChatGPT
— Разберем подход обучения с подкреплением на основе отзывов (RLHF), идею тюнинга инструкций и модель InstructGPT.
— Узнаем, благодаря чему трансформерным моделям удалось достичь таких высот.
Спикер — Мария Тихонова, руководитель курсов по ML в OTUS и Senior Research Data Scientist в команде AGI NLP в SberDevices. Не упустите возможность познакомиться с преподавателем курса и оценить формат обучения! Продолжить изучать NLP вы сможете уже на курсе, доступном в рассрочку.
При покупке курса вы бесплатно получите доступ к подготовительному курсу по Python, который познакомит с основными возможности языка.
👉Пройдите тест на уровень вашей подготовки и зарегистрируйтесь: https://otus.pw/i7yA/
Х5 Tech проведет Data science meetup #1
В программе:
🎯 Кто такие Data-спецназ X5 Tech, как пришли к автоматизации А/Б тестирования в оффлайне и что делать математику в ритейле
Расскажут Мария Шабалкова и Александр Сахнов, X5 Tech
🎯 Различия поведения пользователя на устройствах с экраном и без и как адаптировать ML-модели под изменение поведение пользователя на примере умной колонки
Выступит Прохор Гладких, SberDevices
🎯 Как правильно построить процесс разметки и освободить сотрудников от классификации обращений на 1000+ классов
Поделится Андрей Сон, Alfa-Bank
📅 26 апреля, начало в 18:00
🌐 Формат - онлайн
Зарегистрироваться
🚀 Смотрите международную конференцию Data Fusion 2023 в прямом эфире прямо сейчас! Конференция посвящена работе с данными и развитию технологий искусственного интеллекта.
Data Fusion 2023 – это точка сближения науки и бизнеса. Конференция будет полезна разработчикам и специалистам в области Data Science, CDO, бизнес-заказчикам DS-продуктов и сервисов, представителям государства и науки.
Присоединяйтесь к экспертам Банка ВТБ, Яндекса, Сколтеха, «Газпром нефти», ВШЭ и многим другим.
👉 Смотрите международную конференцию Data Fusion 2023 по ссылке: https://cnrlink.com/datafusion2023online
Стартовал набор в ШАД — двухгодичную программу Академии Яндекса для тех, кто хочет исследовать Machine Learning и работать в IT-индустрии. Обучение проходит по 4 направлениям:
— data science
— инфраструктура больших данных
— разработка машинного обучения
— анализ данных в прикладных науках
Для опытных разработчиков и ML-исследователей есть альтернативный образовательный трек.
Программа ШАДа полностью бесплатна. Учиться можно дистанционно или офлайн — в одном из 6 филиалов. Скорее переходите по ссылке и заполняйте анкету участника: https://clck.ru/344m9d
Чтобы узнать подробности об обучении в ШАДе и задать вопросы кураторам программы, приходите на День открытых дверей 13 апреля. Ссылка для регистрации: https://academy.yandex.ru/dataschool/enroll#openday
Instruction Tuning with GPT-4
First attempt to use GPT-4 to generate instruction-following data for LLM finetuning.
Это репозиторий для GPT-4-LLM, целью которого является обмен данными, сгенерированными GPT-4 для построения LLM, с помощью контролируемого обучения и обучения с подкреплением.
🖥 Github: https://github.com/Instruction-Tuning-with-GPT-4/GPT-4-LLM
⏩ Paper: https://arxiv.org/abs/2304.03277v1
⏩ Project: https://instruction-tuning-with-gpt-4.github.io/
ai_machinelearning_big_data
Painter → SegGPT: Vision Foundation Models from BAAI
SegGPT, a generalist model for segmenting everything in context.
Фреймворк, которые объединяет различные задачи сегментации в универсальную контекстную систему обучения, которая подходит для различных типов сегментации.
🖥 Github: https://github.com/baaivision/painter
⏩ Paper: https://arxiv.org/abs/2304.03284v1
⏩ Demo: https://huggingface.co/spaces/BAAI/SegGPT
💨 Dataset: https://paperswithcode.com/dataset/youtube-vos
ai_machinelearning_big_data
StackLLaMA: A hands-on guide to train LLaMA with RLHF
In this post, we went through the entire training cycle for RLHF, starting with preparing a dataset with human annotations.
В этой статье блога мы покажем все этапы обучения модели LlaMa для ответов на вопросы на Stack Exchange с RLHF.
🤗 Hugging face: https://huggingface.co/blog/stackllama
⏩ Demo: https://huggingface.co/spaces/philschmid/igel-playground
💨 Dataset: https://huggingface.co/datasets/HuggingFaceH4/stack-exchange-preferences
📌 Paper: https://arxiv.org/abs/2302.13971
ai_machinelearning_big_data
Segment Anything
The Segment Anything Model (SAM) produces high quality object masks from input prompts such as points or boxes, and it can be used to generate masks for all objects in an image.
Новая модель от Meta - Segment Anything, нейросеть, которая в один клик может вырезать любой объект из фото или видео.
🖥 Github: https://github.com/facebookresearch/segment-anything
⭐️ Project: https://segment-anything.com/
⏩ Paper: https://arxiv.org/abs/2304.02643v1
💨 Dataset: https://segment-anything.com/dataset/index.html
ai_machinelearning_big_data
Ищем учеников на бесплатное обучение по созданию искусственного интеллекта с нуля. Опыт программирования не важен!🤖
Всего за 3 вечера под руководством Дмитрия Романова - основателя Университета Искусственного Интеллекта, лидера обучения AI-разработке в РФ, вы с легкостью напишете свой первый искусственный интеллект👨💻
Какие нейронные сети вы создадите?
▫️Классификация людей на входящих и выходящих из автобуса
▫️Обнаружение возгораний
▫️Оценка стоимости квартир
▫️Оценка резюме соискателей
▫️Прогнозирование стоимости полиметаллов
▫️Сегментация изображений самолетов
▫️Распознавание команд умного дома⠀
Лучше освоить навыки создания нейронных сетей вам помогут домашние задания с проверкой от кураторов.⠀
Приходите на бесплатное обучение и напишите искусственный интеллект за 3 вечера💪
Регистрация по ссылке