ai_machinelearning_big_data | Технологии

Telegram-канал ai_machinelearning_big_data - Machinelearning

27349

Самая актуальная информация из мира ML, Нейронных сетей,DI По всем вопросам- @haarrp @itchannels_telegram - 🔥 best it channels @pythonl - 🐍 @machinee_learning -chat @ArtificialIntelligencedl - AI @datascienceiot - ml 📚 @machinelearning_ru ml

Подписаться на канал

Machinelearning

5 августа, в 11:00 по белградскому времени пройдёт вебинар о карьере разработчиков в сербском офисе Nebius. Подключайтесь!

Мы поговорим обо всём, что стоит знать кандидату. Вы сможете познакомиться с одним из тимлидов разработки Nebius и узнаете про:

— Процесс собеседования
— Критерии отбора
— Переезд
— Плюсы работы в нашем сербском офисе

Вебинар пройдёт на русском языке. Он будет полезен всем опытным разработчикам, которые рассматривают Сербию как страну для переезда или уже здесь находятся.

Регистрация обязательна

#реклама, https://nebius.com
Erid: LdtCKUBSC

Читать полностью…

Machinelearning

Этой осенью состоится международная конференция AI Journey 2023, в рамках которой с марта по август проходит отбор научных работ по искусственному интеллекту и машинному обучению.

Самые интересные работы будут опубликованы в научном журнале с международной аудиторией, а автор лучшей статьи получит приз - 1 миллион рублей.

Не упустите свой шанс принять участие в отборе и получить возможность опубликовать свою статью, а также выступить с докладом на конференции AI Journey! Поторопитесь — осталось совсем немного времени! Подать заявку и ознакомиться с Правилами отбора можно на сайте AI Journey

Читать полностью…

Machinelearning

Курс по соревновательному Data Science👨‍💻

🏆 Хочешь покорить Kaggle и научиться выигрывать соревнования по анализу данных? Тогда курс "Введение в соревновательный Data Science" - это именно то, что тебе нужно!

🎯 В отличие от большинства курсов по машинному обучению, этот курс сконцентрирован на практике, а не на теории. Поэтому на нем будет более 200 практических заданий, интервью с Kaggle Grand Masters и, конечно же, внутренние соревнования для отработки техник.

⚡️В программе курса тебя ждет:
* Продвинутая работа с pandas и numpy
* Генерация, визуализация и фильтрация признаков
* Модуль про SOTA градиентные бустинги и то как их тюнить
* Стекинг и блендинг моделей
* Ускорение вычислений и оптимизация памяти
* Парсинг данных из открытых источников
* Работа с Kaggle Api и различными облачными вычислительными сервисам
* Нейронки для табличных данных
* Интервью с Kaggle Grand Masters и многое другое

🚀 Еще ребята проводят еженедельные открытые вебинары, на которых разбирают решения победителей с чемпионатов, делают обзоры предстоящих соревнование и рассказывают про необычные техники, с которыми сталкиваются на практике.

🔗 Подписывайся на их телеграмм канал, чтобы подробнее узнать про курс и следить за открытыми вебинарами.

Читать полностью…

Machinelearning

Как создавать качественные ML-системы

Команда VK Cloud перевела две статьи о ML-проектах. В первой части подробнее о жизненном цикле, ценности для бизнеса, важности проектной документации и концепциях PoC или MVP.

Во второй части: Data-centric ИИ, данны для обучения, разметка и очистка, синтетические данные, Data Engineering и ETL.


💼 Habr: https://habr.com/ru/companies/vk/articles/749850/

Habr2: https://habr.com/ru/companies/vk/articles/749852/

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Для старта карьеры в машинном обучении не хватает опыта?

Решайте реальные рабочие задачи на Симуляторе ML. Под руководством ведущих Data Scientists — Валерия Бабушкина и Богдана Печёнкина — вы не просто  прокачаете отдельные навыки, а поймёте, как сводить бизнес-задачи к задачам машинного обучения. Поработав над проектами различного уровня сложности, вы научитесь: 

- Понимать, какие у бизнеса есть проблемы и какими метриками их можно измерить
- Проводить А/В-тесты, чтобы подтверждать прирост метрик
- Формулировать задачу для модели
- Выбирать подходящую модель и обучать её
- Организовывать процесс доставки данных для модели
- Оборачивать модель в сервис и деплоить его

После симулятора вы сможете успешно пройти собеседование на позицию в сфере Machine Learning, получить хорошую работу и приносить пользу бизнесу уже с первых дней. 

Симулятор работает в режиме подписки и постоянно пополняется новыми задачами.

Присоединяйтесь!

Читать полностью…

Machinelearning

NeRF-Det: Learning Geometry-Aware Volumetric Representation for Multi-View 3D Object Detection

NeRF-Det - это новый метод обнаружения трехмерных объектов на основе RGB-изображений. В методе NeRF используется для явной оценки 3D-геометрии объекта, что повышает эффективность распознавания.

🖥 Github: https://github.com/facebookresearch/nerf-det

📕 Paper: https://arxiv.org/abs/2307.14620v1

Project: https://chenfengxu714.github.io/nerfdet/

🔗 Dataset: https://paperswithcode.com/dataset/arkitscenes

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🐧 Tracking Anything in High Quality

Новый фреймворк для высокопроизводительного отслеживания и сегментации объектов.

🖥 Github: https://github.com/jiawen-zhu/hqtrack

📕 Paper: https://arxiv.org/abs/2307.13974v1

🔗 Dataset: https://paperswithcode.com/dataset/ovis

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🦙 LLM Attacks

Universal and Transferable Attacks on Aligned Language Models.

Метод атак, заставляющий llm модели генерировать нежелательное поведение.

🖥 Github: https://github.com/llm-attacks/llm-attacks

📕 Paper: https://arxiv.org/abs/2307.15043v1

🔗 Dataset: https://paperswithcode.com/dataset/ethics-1

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Edge Guided GANs with Multi-Scale Contrastive Learning for Semantic Image Synthesis

ECGAN новая система для решения сложной задачи семантического синтеза изображений.

🖥 Github: https://github.com/ha0tang/ecgan

📕 Paper: https://arxiv.org/abs/2307.12084v1

🔥 Dataset: https://paperswithcode.com/dataset/cityscapes

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🗣 DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection and Instruction-Aware Models for Conversational AI.

Studio: самая большая и разнообразная коллекция диалоговых датасетов, объединенных в единый формат.

🖥 Github: https://github.com/salesforce/DialogStudio

📕 Paper: https://arxiv.org/abs/2307.10172v2

🔥 Dataset: https://paperswithcode.com/dataset/dialogstudio

ai_machinelearning_big_data

Читать полностью…

Machinelearning

⭐️ CNOS: A Strong Baseline for CAD-based Novel Object Segmentation

Three-stage approach to segment unseen objects in RGB images using their CAD models.

CNOS - это простой, но эффективный трехэтапный подход к сегментации объектов.

🖥 Github: https://github.com/nv-nguyen/cnos

📕 Paper: http://arxiv.org/abs/2307.11067

🚀 Dataset: https://bop.felk.cvut.cz/datasets/

ai_machinelearning_big_data

Читать полностью…

Machinelearning

↗️ L-Eval: Instituting Standardized Evaluation for Long Context Language Models

Data and code for L-Eval, a comprehensive long context language models evaluation benchmark.

Данные и код для L-Eval, комплексноого эталона оценки языковых моделей с длинным контекстом.

L-Eval, содержащий 411 длинных документов и более 2000 пар "вопрос-ответ", аннотированных и проверенных авторами вручную, охватывает такие области, как право, финансы, школьные лекции, длинные разговоры, новости, длинные романы.

🖥 Github: https://github.com/bshall/urhythmic

🧑‍💻Model: https://huggingface.co/datasets/L4NLP/LEval

📕 Paper: https://arxiv.org/abs/2307.11088

🚀 Dataset: https://paperswithcode.com/dataset/quality

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🆓 Free Courses and Guides for Learning Generative AI

Бесплатные курсы и руководства по изучению генеративного ИИ

1. Building AI Products with OpenAIБесплатный курс от CoRise и OpenAI.

2. Подробное руководство по Prompt Engineering by DAIR.AI

3. LLM Bootcamp - Серия бесплатных лекций от The full Stack по созданию и развертыванию приложений LLM.

4. Что такое модели трансформеров и как они работают: Учебное пособие от Cohere AI.

5. Бесплатный курс от Activeloop на LangChain & Vector Databases in Production.

6. Pinecone learning centerМножество полезных гайдов.

7. Build AI Apps with ChatGPT, Dall-E and GPT-4бесплатный курс по Scrimba.

8. Gartner Experts Answer the Top Generative AI Questions for Your Enterpriseотчет компании Gartner.

9. GPT best practices: Руководство ****OpenAI, в котором рассказывается о стратегии и тактике получения лучших результатов от GPT.

10. OpenAI cookbook by OpenAIПримеры и руководства по использованию API OpenAI.

11. Prompt injection explained,

12. Generative AI short courses by DeepLearning.AIПять коротких курсов по генеративному ИИ, включая LangChain для разработки LLM-приложений, "Как работают диффузионные модели" и др.

13. Generative AI learning path by Google Cloud - серия из 10 курсов по продуктам и технологиям генеративного ИИ: от основ больших языковых моделей до создания и развертывания генеративного ИИ в Google Cloud.

ai_machinelearning_big_data

Читать полностью…

Machinelearning

📌 AlpaGasus: Training A Better Alpaca with Fewer Data

The first framework to conduct instruction optimization for black-box LLM like ChatGPT, where Black-box API LLM can only provide textual output.

Модель отбора, автоматически определяющая и удаляющая низкокачественные данные с помощью LLM.

🖥 Github: https://github.com/lichang-chen/instructzero

⭐️ Project: https://lichang-chen.github.io/InstructZero/

📕 Paper: https://arxiv.org/abs/2307.08701v1

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔥 Llama 2: Open Foundation and Fine-Tuned Chat Models

Llama 2 collection of pretrained and fine-tuned large language models (LLMs).

Новая Llama 2 в открытом доступе . Доступны предварительно обученные и настроенные модели с параметрами от 7B до 70B.

Llama 2 превосходит модели с открытым исходным кодом в большинстве протестированных бенчмарков и, судя по оценке полезности и безопасности, может стать достойной заменой моделям с закрытым исходным кодом.


🖥 Github: https://github.com/facebookresearch/llama

⭐️ Demo: https://huggingface.co/blog/llama2

🤗Hugging face: https://huggingface.co/meta-llama/Llama-2-70b

📕 Paper: https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔥 MetaGPT: Meta Programming for Multi-Agent Collaborative Framework

MetaGPT, an innovative framework that infuses effective human workflows as a meta programming approach into LLM-driven multi-agent collaboration.


MetaGPT - инновационный фреймворк, позволяющий назначать различные роли GPT для создания ит-продуктов и решения сложных задач. MetaGPT принимает на вход однострочное описание задачи и выдает пользовательские истории / конкурентный анализ / требования / структуры данных / API / документы и т.д.

🖥 Github: https://github.com/geekan/metagpt

📕 Paper: https://arxiv.org/abs/2308.00352v1

☑️ Roadmap: https://github.com/geekan/MetaGPT/blob/main/docs/ROADMAP.md

ai_machinelearning_big_data

Читать полностью…

Machinelearning

SEED-Bench: Benchmarking Multimodal LLMs with Generative Comprehension

A benchmark for evaluating Multimodal LLMs using multiple-choice questions.

Система генерации вопросов с несколькими вариантами ответов, ориентированных на конкретные параметры оценки, включающая процессы автоматической фильтрации и ручной проверки.

🖥 Github: https://github.com/ailab-cvc/seed-bench

📕 Paper: https://arxiv.org/abs/2307.16125v1

☑️ Dataset: https://paperswithcode.com/dataset/seed-bench

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🦙 ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs

🔨ToolLLM aims to construct open-source, large-scale, high-quality instruction tuning SFT data to facilitate the construction of powerful LLMs with general tool-use capability.

Открытая платформа для обучения, настройки и оценки больших языковых моделей.

git clone git@github.com:OpenBMB/ToolBench.git

🖥 Github: https://github.com/openbmb/toolbench

📕 Paper: https://arxiv.org/abs/2307.16789v1

⭐️Project: openbmb.github.io/ToolBench/

☑️ Demo: https://github.com/openbmb/toolbench#web-ui

ai_machinelearning_big_data

Читать полностью…

Machinelearning

📷 Powerful Multi-Task Transformers for Scene Understanding

TaskExpert, a novel multi-task mixture-of-experts model that enables learning multiple representative task-generic feature spaces and decoding task-specific features in a dynamic manner.

Мощные многозадачные модели трансформеров для анализа и понимания сцен.

🖥 Github: https://github.com/prismformore/multi-task-transformer

📕 Paper: https://arxiv.org/abs/2307.15324v1

🔗 State of art: https://paperswithcode.com/sota/monocular-depth-estimation-on-cityscapes-3d?p=joint-2d-3d-multi-task-learning-on-cityscapes

ai_machinelearning_big_data

Читать полностью…

Machinelearning

👗 Fashion Matrix: Editing Photos by Just Talking

Hierarchical AI system called Fashion Matrix dedicated to editing photos by just talking.

Fashion Matrix объединяет различные визуальные и языковые модели и в комплексного ИИ-помощника в области моды.

Система состоит из трех модулей: Fashion Assistant, Fashion Designer и AutoMasker, которые используют LLM в качестве поддержки интеллектуальной обработки текста.

🖥 Github: https://github.com/Zheng-Chong/FashionMatrix

⭐️ Project:

📕 Paper: https://arxiv.org/abs/2307.13240

👁 Video: https://www.youtube.com/watch?v=1z-v0RSleMg&t=3s

Demo : https://3040fb6b6c32c3715e.gradio.live/

🔗 Dataset: https://paperswithcode.com/dataset/densepose

ai_machinelearning_big_data

Читать полностью…

Machinelearning

⚡️Маст-хэв список для программистов, каналы с последними книжными новинками, библиотеками, разбором кода и актуальной информацией, связанной с вашим языком программирования.
Лучший способ получать свежие обновлении и следить за трендами в разработке.

Python: t.me/pythonl
C#: t.me/csharp_ci
C/C++/ t.me/cpluspluc
Машинное обучение: t.me/machinelearning_interview
Data Science: t.me/data_analysis_ml
Devops: t.me/devOPSitsec
Go: t.me/Golang_google
Базы данных: t.me/sqlhub
Rust: t.me/rust_code
Javascript: t.me/javascriptv
React: t.me/react_tg
PHP: t.me/phpshka
Android: t.me/android_its
Мобильная разработка: t.me/mobdevelop
Linux: t.me/+A8jY79rcyKJlYWY6
Big Data: t.me/bigdatai
Хакинг: t.me/linuxkalii
Java: t.me/javatg

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy

🎞 YouTube канал: uproger" rel="nofollow">https://www.youtube.com/@uproger

😆ИТ-Мемы: t.me/memes_prog

🇬🇧Английский: t.me/english_forprogrammers

Читать полностью…

Machinelearning

Just wanted to share with you that CrunchDAO is organizing the ADIA Lab Market Prediction Competition with a 100 000 USD Prize pool!

Here is what we offer (on top of the 100 000$ Prize pool) for you to participate).

- 128$ (40$Crunch) if you score > 3.5

- 320$ (100$Crunch) if you score > 4

These rewards are paid in $Crunch (you can swap it against USDC whenever you want).

They are only intended for you and can only work if you register through this link : https://crunchdao.com/live/adialab

The challenge of the competition is to rank the investments from best to worst at each given date. The scoring function for the competition is based on Spearman's rank correlation, which measures how well the predicted ranking of the investments matches up with the actual ranking.

Читать полностью…

Machinelearning

ANNOUNCING SDXL 1.0

The Stability AI team is proud to release as an open model SDXL 1.0, the next iteration in the evolution of text-to-image generation models.

Stability AI объявили о выпуске Stable Diffusion 1.0 XL, новой версии популярной модели для генерации изображений. SDXL 1.0 представляет собой базовую модель с 3,5B параметров и пайплайн с ансамблем моделей из 6,6B параметров.

💫 Announcement: https://stability.ai/blog/stable-diffusion-sdxl-1-announcement

🖥 Github: https://github.com/Stability-AI/generative-models

⭐️ Clip: https://clipdrop.co/stable-diffusion

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Думаете о международной карьере, но боитесь, что не хватит английского? Практикуйте его в разговорных клубах для IT-специалистов.

За пять дней вы:

- узнаете, как готовиться к собеседованию на английском
- попробуете использовать фреймворк STAR на примере собеседования
- потренируетесь вести дискуссию и вежливо отстаивать свою точку зрения
- получите подарки от Яндекс Практикума

Формат: закрытый телеграм-канал и два воркшопа в Zoom. В канале вы получите чек-листы и будете решать упражнения. На воркшопах — сможете попрактиковаться с преподавателем и другими студентами.

Ведущая: Василиса Шеромова. Преподаватель на курсах английского для работы в IT. Опыт преподавания: больше 10 лет. Пять лет работала менеджером по маркетингу в IT-компаниях.

Читать полностью…

Machinelearning

❗️Как пройти техническое собеседование на ML-специалиста?

⚠️ Узнайте на примере mock-интервью с преподавателями курса «MLOps» в OTUS!

На открытом уроке вы сможете наблюдать один из этапов собеседования при найме ML-специалистов — ML System Design секцию.

👉 Для удачного прохождения этого этапа не достаточно только знания алгоритмов машинного обучения. Также проверяются навыки проектирования ML систем, которые могут успешно работать в промышленной среде.

Больше инструментов MLOps ждет вас на курсе. Обратите внимание: возможные способы оплаты обучения.

👉 РЕГИСТРАЦИЯ
https://otus.pw/oCXA/

Нативная интеграция. Информация о продукте www.otus.ru

Читать полностью…

Machinelearning

IT — одна из самых высокооплачиваемых сфер. А освоить ее можно уже в школе, не дожидаясь поступления в университет. Никаких скучных лекций — только практика на реальных IT-проектах!

Московская школа программистов (МШП) обучает детей IT уже с третьего класса, так что к поступлению в вузы многие из них соответствуют уровню Junior и имеют свое портфолио для будущей работы.

Обучение в школе основано на университетской модели: дети изучают набор обязательных основных курсов, а со второго семестра могут выбрать спецкурсы по разным IT-направлениям и найти свою профессию!

Учиться можно очно и онлайн из любой точки мира.

Переходите по ссылке, чтобы подготовить ребенка к IT-карьере!
В подарок после регистрации – Курс английского языка для 5-10 классов.

Реклама. Рекламодатель ЧУ ДО "МОСКОВСКАЯ ШКОЛА ПРОГРАММИСТОВ". ИНН 9715290128. Erid: LdtCKYT95

Читать полностью…

Machinelearning

🐋 FreeWilly, Large And Mighty Instruction Fine-Tuned Models
.
FreeWilly1 and FreeWilly2 set a new standard in the field of open access Large Language Models.

В freeWilly1 используется оригинальная базовая модель LLaMA 65B, которая была обучена на новом синтетически сгенерированном наборе данных с использованием технологии
Supervised Fine-Tune (SFT) в стандартном формате Alpaca.

FreeWilly2 использует базовую модель LLaMA 2 70B и достигает качества, сравнимого с GPT-3.5.

⭐️ Post: https://stability.ai/blog/freewilly-large-instruction-fine-tuned-models

📌 FreeWilly1: https://huggingface.co/stabilityai/FreeWilly1-Delta-SafeTensor

📌 FreeWilly2: https://huggingface.co/stabilityai/FreeWilly1-Delta-SafeTensor

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Получите профессию NLP-инженера на онлайн-магистратуре “Анализ естественного языка в лингвистике и IT”. На программе вы будете учиться обучать нейросети, учить машины распознавать и анализировать человеческую речь и генерировать ответы.

●Программа ориентирована на обучение с нуля, технический "бэкграунд" не обязателен;
●Обучение очное, но в онлайн-режиме, а обучающимся полагаются студенческие льготы и отсрочка от армии;
●У вас будет доступ к суперкомпьютерному центру CYBERIA от ТГУ, с помощью которого вы сможете обучать нейросети и решать задачи NLP в режиме онлайн;
●А после обучения вы получите очный диплом ТГУ и готовое портфолио для дальнейшего трудоустройства;
●А благодаря господдержке первый год обучения стоит всего 280 р/мес!
Успейте записаться на бесплатный подготовительный курс: https://go.skillfactory.ru/ndod3w


Реклама - ООО «Скиллфкэтори»
Kra248FC3

Читать полностью…

Machinelearning

Привет, Чемпион!

🏆 Хочешь покорить Kaggle и научиться выигрывать соревнования по анализу данных? Тогда курс "Введение в соревновательный Data Science" - это именно то, что тебе нужно!

🎯 Что ты получишь?
- Первый русскоязычный курс по соревновательному Data Science с максимальным количеством практики.
- Насыщенная программа, содержащая эффективные методы для выбивания максимального качества из твоих ML-моделей.
- Более 200 практических заданий, интервью с Kaggle Grand Masters.
- Большое русскоязычное коммьюнити 400+ студентов курса для совместного прохождения и участия в соревнованиях.
- Поддержка преподавателей и даже собственный мерч курса за успехи.

🚀 На канале курса проводим еженедельные открытые вебинары, на которых разбираем решения победителей чемпионатов и делаем обзоры предстоящих соревнований.

🔗 Подписывайся на TG канал, чтобы узнать подробности о курсе, а также следить за открытыми вебинарами и другими активностями.

🔥Скидка 10% по промокоду: TGLETO (Сработает только при переходе по ссылке)

Читать полностью…

Machinelearning

💬 Text2Cinemagraph: Synthesizing Artistic Cinemagraphs from Text

Полностью автоматизированный метод Text2Cinemagraph для создания синемаграфов из текстового описания с учетом различных художественных стилей.

🖥 Github: https://github.com/text2cinemagraph/text2cinemagraph

🖥 Colab: https://colab.research.google.com/github/camenduru/AnimateDiff-colab/blob/main/AnimateDiff_colab.ipynb

📕 Paper: https://arxiv.org/pdf/2307.03190.pdf

🚀 Project: https://text2cinemagraph.github.io/website/

ai_machinelearning_big_data

Читать полностью…
Подписаться на канал