ai_machinelearning_big_data | Технологии

Telegram-канал ai_machinelearning_big_data - Machinelearning

27348

Самая актуальная информация из мира ML, Нейронных сетей,DI По всем вопросам- @haarrp @itchannels_telegram - 🔥 best it channels @pythonl - 🐍 @machinee_learning -chat @ArtificialIntelligencedl - AI @datascienceiot - ml 📚 @machinelearning_ru ml

Подписаться на канал

Machinelearning

SAM-Med2D

SAM-Med2D, the most comprehensive studies on applying SAM to medical 2D images.

🏆 Самая большая на сегодняшний день база данных по сегментации медицинских изображений (4,6 млн. изображений и 19,7 млн. масок) для обучения моделей.
🏆 Модель файнтюнинга Segment Anything Model (SAM).
🏆 Бенчмарк SAM-Med2D на крупномасштабных наборах данных.

🖥 Github: https://github.com/uni-medical/sam-med2d

🖥 Colab: https://colab.research.google.com/github/uni-medical/SAM-Med2D/blob/main/predictor_example.ipynb

📕 Paper: https://arxiv.org/abs/2308.16184

⭐️ Dataset: https://paperswithcode.com/dataset/sa-1b

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Нейросети хороши в генерации контента и кода, а 3D-принтеры, как оказалось— в генерации зубов.
Делимся статьей о том, как хорошо 3D-печать обосновалась в, казалось бы, далекой от нее нише — стоматологии.
• На что способны 3D-технологии в современной стоматологической практике.
• Как с их помощью врачи тренируются перед операциями
• Как стоматологи проектируют коронки, новый прикус, стоматологические шаблоны и тп
Такие технологии используются не в каждой стоматологии, и уж тем более про такое на часто пишут, а тема интересная.
Статья на Хабре

Читать полностью…

Machinelearning

5 дней практики в Data Science на реальных данных магазина из Великобритании.
1-2 часа в день и самостоятельно создадите модели машинного обучения.

Старт - 4 сентября. Обучаешься под руководством эксперта в своем темпе, в любое удобное время.

5500+ человек из разных стран мира уже приняли участие в данном интенсиве.

15 лет практического опыта у автора интенсива, поэтому полученные знания можно сразу применять в рабочих проектах.

Обучаем с 2017 года.
Предоставляем готовое окружение - ничего устанавливать и настраивать не нужно.

Количество БЕСПЛАТНЫХ мест ограничено.
Успевайте записаться по ЭТОЙ ссылке.

Подписывайтесь на их телеграм канал, чтобы не пропустить самое интересное из мира Data Science и не только.

Читать полностью…

Machinelearning

☄️Открытый урок по языковым моделям от OTUS

4 сентября в 18:00 мск встречаемся на открытом уроке «Языковые модели: от статистических до ChatGPT» в рамках курса «Natural Language Processing (NLP)» от OTUS.

📣 Кому подходит этот урок:

- Практикующим Data Scientist и IT-специалистам, которые хотят глубже погрузиться в область NLP
- Тем, кто хочет узнать, что делает ChatGPT таким умным
- Людям, освоившим основы машинного обучения, но желающими развиваться в области DS

💪 Результаты урока:

Вы узнаете, что такое языковые модели и как их использовать для решения NLP-задач, а также изучите подходы к обучению больших языковых моделей, таких как ChatGPT.

Это отличная возможность совершенно бесплатно протестировать формат обучения и задать преподавателю любые вопросы в режиме реального времени 😎!

Пройдите тестирование курса, чтобы зарегистрироваться на урок - https://otus.pw/pnyE/

Нативная интеграция. Информация о продукте www.otus.ru

Читать полностью…

Machinelearning

ИТ + научпоп + музыка = большой ИТ-пикник в Москве 💛

2 сентября Тинькофф, CodeFest и Мельница собирают большой благотворительный ИТ-фестиваль. Встречаемся в Коломенском на максимально летнем вайбе.

В программе: ИТ- и научпоп-лектории, выступления топовых спикеров, воркшопы, интерактивные зоны и вишенка на торте — музыкальные перформансы от Антохи MC, Zoloto, Therr Maitz, The Hatters, «Сироткина», а также секретного хедлайнера. Как думаете, кто им может быть?

Для участия нужно выбрать благотворительный фонд из списка и сделать донат от 1000 рублей. Подробности и регистрация — тут.

Реклама. АО "Тинькофф Банк"

Читать полностью…

Machinelearning

VK проводит онлайн-семинар Adversarial Prompting and Jailbreaking of LLMs, чтобы рассказать о том, какие могут быть опасности при работе с LLM и как защитить решения, основанные на них.

Large Language Models в последнее время стали слишком популярны. И многие строят свои ML-решения поверх таких LLM, но не все знают, что злоумышленники могут делать инъекции через промты и нарушить работу модели или вообще сломать систему. Как этого избежать — узнайте на онлайн-семинаре.

Читать полностью…

Machinelearning

Вы ещё успеваете поступить в онлайн-магистратуру МФТИ «Финансовые технологии и аналитика» 👩‍🎓Ближайшие даты экзаменов — 4 и 19 сентября.

➕Диплом очной магистратуры гособразца по направлению 38.03.05 «Бизнес-информатика».
➕Онлайн-обучение из любой точки мира.
➕Углубленная специализация в сфере финтех-разработки или аналитики.
➕Гранты на запуск своего стартапа в области Data Science/AI/ML до 3 млн ₽.
➕Более 5 проектов в портфолио: реальные задачи от Сбера, ВТБ, Ozon Fintech, Альфа-Банка и других финтех-компаний уже с первого семестра.
➕Возможность совмещать с работой и развивать корпоративный проект в качестве дипломного.
➕Рассрочка под 3% от Сбера и Минобразования. Платёж во время учебы — до 900 ₽ в месяц.

Бесплатный подготовительный курс и запись прошедших консультаций по экзаменам доступны после регистрации. Оставьте заявку, чтобы зарегистрироваться на день открытых дверей и начать готовиться к поступлению: https://netolo.gy/b3oh

Реклама ООО “Нетология” LatgBhfB7

Читать полностью…

Machinelearning

💻 В Москве прошла конференция по кибербезопасности OFFZONE 2023

Как мы уже писали ранее, конференцию провела компания BI.ZONE, партнер Сбера. В мероприятии поучаствовали безопасники, разработчики, исследователи, преподаватели и студенты технических вузов. Всего на ней выступили 108 экспертов, а общее число участников превысило 2500 человек.

О чем говорили на двух треках:

🔸как изменилась отрасль кибербезопасности за последние 10 лет;
🔸основные тренды кибермошенничества в финансовой сфере;
🔸лайфхаки в области mobile DevSecOps;
🔸необычные атаки с применением широко распространенных программ для удаленного управления;
и другое.

Также на площадке работали тематические зоны от специалистов по безопасности финансовых систем и банковской инфраструктуры, экспертов по безопасной разработке и анализу защищенности приложений, CTF.Zone и т.д.

Кроме того, в рамках OFFZONE 2023 прошла презентация об итогах года работы платформы BI.ZONE Bug Bounty. Так, на платформе зарегистрировались 17 компаний и 51 программа по поиску уязвимостей.

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Освойте алгоритмы распознавания и генерации звука за 1,5 месяца

5 сентября стартует практический курс Нетологии — «Распознавание и генерация речи. Диалоговые системы» для тех, кто работает или хочет научиться работать с задачами по распознаванию и генерации звуков. Для обучения нужно знать классические методы машинного обучения, основы работы с нейросетями, NLP.

Курс поможет разобраться в работе со звуком, обработке звуковых сигналов, транскрибации речи в текст. В программе 5 воркшопов, на котором вы реализуете 5 кейсов, один из которых — проект на основе ваших собственных данных. По нему вы получите личную консультацию эксперта из Сбера или JustAI.

Курс ведут практикующие специалисты по ИИ и работе со звуком:
• Илья Шигабеев, основатель сервиса по переозвучке видео Langswap.app
• Артур Сапрыкин, NLP-разработчик, предприниматель, работал над созданием голосового робота, разрабатывал поиск аудио по фрагменту
• Сергей Меньшов, ведущий специалист Nexgn.com, разработчик проектов Whisper и VOSK по распознаванию речи собеседника

Изучить программу курса можно на сайте программы. Старт 5 сентября → https://netolo.gy/b3kh

Реклама. ООО «Нетология» LatgBuQj3

Читать полностью…

Machinelearning

🦙Llama 2 learns to code

The models show state-of-the-art performance in Python, C++, Java, PHP, C#, TypeScript, and Bash.

Мощнейший ИИ-инструмент с открытым исходным кодом, для написания качественного кода Python и не только.

Примеры работы с codellama на скриншотах.

#!pip install git+https://github.com/huggingface/transformers.git@main acceleratefrom transformers

Hugging face
Github
Docs
Post

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Как подобрать правильные инструменты, чтобы использовать возможности больших данных на полную?

📅 31 августа | 16:00

7-й выпуск онлайн-дискуссии серии «Откровенно об ИТ-инфраструктуре» посвящен большим данным и инфраструктуре для их эффективного хранения и обработки.

Гости дискуссии: представитель Arenadata по облачным партнерствам Антон Близгарев и технический менеджер КРОК Сергей Синагейкин

Обсудим:
▪️ Ожидания от больших данных сегодня: тренды, кейсы
▪️ Какие типы данных анализируют компании 
▪️ Как правильно выбирать инфраструктуру больших данных
▪️ Big data из облака: возможно ли?
▪️ От бизнес-запроса до реализации: проекты больших данных 

Ведут дискуссию:
Сергей Зинкевич
Директор бизнес-юнита КРОК Облачные сервисы
Александр Фикс
Менеджер по развитию бизнеса КРОК Облачные сервисы

📍Подключайтесь! Регистрация тут>>

 Реклама. Информация о рекламодателе на сайте cloud.croc.ru

Читать полностью…

Machinelearning

Онлайн-конференция по большим данным от Х5 Tech

В программе:

🎯 Развитие команды аналитики в сервисе доставки из магазинов «Пятёрочка»: зарождение продукта, трудности, неудачные решения.

🎯 Как работает Data-спецназ X5 Tech, автоматизация А/Б тестирования в оффлайне и что делать математику в ритейле.

🎯 Необходимые инструменты мониторинга и управления, когда число IT-продуктов и ML-моделей исчисляется сотнями. Подходы к оптимизации распределения ресурсов и учет рисков.

🎯 Классический подход к проведению рекламы VS AdHoc-подход на основе эконометрической модели: ключевые факторы динамики трафика, влияние РК, оценка ROI и оптимизация затрат с помощью big data.

📅 31 августа, начало в 11:00
🌐 Формат - онлайн

Зарегистрироваться

Читать полностью…

Machinelearning

🏅MixSort

MixSort is the proposed baseline tracker in SportMOT.

Новая модель и датасет для трекинга спортивных сцен.


🖥 Github: https://github.com/MCG-NJU/MixSort

📕 Paper: https://arxiv.org/pdf/2304.05170.pdf

⭐️ SportsMOT: https://github.com/MCG-NJU/SportsMOT

ai_machinelearning_big_data

Читать полностью…

Machinelearning

prompt2model - Generate Deployable Models from Instructions

prompt2model - Generate Deployable Models from Natural Language Instructions


Prompt2Model - это система, которая на основе описания задачи на естественном языке (например, промптов, используемых в LLM, таких как ChatGPT) обучает небольшую специализированную модель, пригодную для быстрого развертывания.

pip install prompt2model

🖥 Github: https://github.com/neulab/prompt2model

📕 Paper: https://arxiv.org/abs/2308.12261v1

⭐️ Demo: https://github.com/facebookresearch/sonar#usage

☑️ Dataset: https://paperswithcode.com/dataset/mconala

ai_machinelearning_big_data

Читать полностью…

Machinelearning

💡 Sentence-Level Multimodal and Language-Agnostic Representations

SONAR, a new multilingual and multimodal fixed-size sentence embedding space.

Новый Текстовый кодер-декодер от Meta, охватывающий 200 языков, который существенно превосходит существующие модели.

🖥 Github: https://github.com/facebookresearch/sonar

📕 Paper: https://arxiv.org/pdf/2308.11466v1.pdf

⭐️ Demo: https://github.com/facebookresearch/sonar#usage

☑️ Dataset: https://paperswithcode.com/dataset/common-voice

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔥 CRATE (Coding RAte reduction TransformEr)

CRATE (is a white-box transformer architecture, where each layer performs a single step of an alternating minimization algorithm to optimize the sparse rate reduction objective

Алгоритм оптимизации сегментации с помощью архитектуры white-box трансформеров.

🖥 Github: https://github.com/ma-lab-berkeley/crate

🖥 Colab: https://colab.research.google.com/drive/1rYn_NlepyW7Fu5LDliyBDmFZylHco7ss

📕 Paper: https://arxiv.org/abs/2308.16271v1

⭐️ Dataset: https://paperswithcode.com/dataset/coco

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🎧 AudioLDM 2, but faster ⚡️

Read to the end to find out how to generate a 10 second audio sample in just 1 second!

В этом посте показано, как использовать AudioLDM 2 c Hugging Face 🧨 Diffusers, исследуя ряд оптимизаций для сокращения времени генераций более чем в 10 раз при минимальном снижении качества выходного аудио.

🤗 HH: https://huggingface.co/blog/audioldm2

🖥 Github: https://github.com/huggingface/blog/blob/main/audioldm2.md

🖥 Colab: https://mingukkang.github.io/GigaGAN/

🎧 Paper: https://arxiv.org/abs/2308.05734

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔥Scaling up GANs for Text-to-Image Synthesis

1B-parameter GigaGAN, achieving lower FID than Stable Diffusion v1.5, DALL·E 2, and Parti-750M.

GigaGAN - 1B модель генерации изображений из текста. Высокая скорость генерации изображений 0.13 сек в разрешении 512px, на порядки быстрее других моделей.

🖥 Github: https://github.com/mingukkang/GigaGAN/tree/main/evaluation

Project: https://mingukkang.github.io/GigaGAN/

🎞 Video: https://www.youtube.com/watch?v=UyoXmHS-KGc

📕 Paper: https://arxiv.org/abs/2303.05511

⭐️ Dataset:https://paperswithcode.com/dataset/svamp

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🖥 When Do Program-of-Thoughts Work for Reasoning?

An Easy-to-use Instruction Generation Framework for LLMs.

EasyInstruct - это пакет Python для обучения больших языковых моделей (LLM), таких как
GPT-3, Llama, ChatGLM, в ваших исследовательских экспериментах. Он прост в использовании и легко расширяемый.

pip install easyinstruct -i https://pypi.org/simple

🖥 Github: https://github.com/zjunlp/easyinstruct

📕 Paper: https://arxiv.org/abs/2308.15452v1

⭐️ Dataset:https://paperswithcode.com/dataset/svamp

ai_machinelearning_big_data

Читать полностью…

Machinelearning

📖 LongBench: A Bilingual, Multitask Benchmark for Long Context Understanding

LongBench includes 14 English tasks, 5 Chinese tasks, and 2 code tasks, with the average length of most tasks ranging from 5k to 15k, and a total of 4,750 test data.

LongBench - первый двуязычный, бенчмарк понимания длинных контекстов, позволяющий проводить тщательную оценку контекстов.
LongBench включает 21 датасет по 6 категориям задач на английском и китайском языках.


🖥 Github: https://github.com/thudm/longbench

📕 Paper: https://arxiv.org/abs/2308.14710v1

🤗 HF: https://huggingface.co/datasets/THUDM/LongBench

⭐️ Dataset: https://paperswithcode.com/dataset/youtube-vis-2021-validation

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🧑 FaceChain

Deep-learning toolchain for generating your Digital-Twin.

FaceChain — это набор инструментов машинного обучения для создания собственного цифрового двойника.


Всего из одной портретной фотографию, вы можете создать своего собственного цифрового двойника и начать генерировать персональные портреты с различными настройками.

🖥 Github: https://github.com/modelscope/facechain

📕 Paper: https://arxiv.org/abs/2308.14256v1

🖥 Colab: https://colab.research.google.com/drive/1cUhnVXseqD2EJiotZk3k7GsfQK9_yJu_?usp=sharing

⭐️ Dataset: https://paperswithcode.com/dataset/fairface

ai_machinelearning_big_data

Читать полностью…

Machinelearning

📌 SNARE (a multimodal alignment probing benchmark)

Scale multimodal alignment probing benchmark, to detect the vital linguistic components, e.g., lexical, semantic, and syntax knowledge,

Новый крупномасштабный мультимодальный бенчмарк, позволяющий обнаружить важные лингвистические компоненты в предварительно обученных моделях "vision-language ".

🖥 Github: https://github.com/wangfei-2019/snare

📕 Paper: https://arxiv.org/abs/2308.12898v2

⭐️ Dataset: https://paperswithcode.com/dataset/aro

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔦Relighting Neural Radiance Fields with Shadow and Highlight Hints

В данной работе представлен новый подход к изменении освещенности объекта на основе небольшого набора неструктурированных фотографий объекта, освещенного движущимся точечным источником света, отличным от позиции обзора.

git clone https://github.com/iamNCJ/NRHints.git
cd NRHints
pip install -r requirements.txt

🖥 Github: https://github.com/iamNCJ/NRHints

🚀 Project: https://nrhints.github.io/

📕 Paper: https://nrhints.github.io/pdfs/nrhints-sig23.pdf

⭐️ Dataset: https://github.com/iamNCJ/NRHints#data-and-models

ai_machinelearning_big_data

Читать полностью…

Machinelearning

👨‍🎓The Best Courses for AI from Universities with YouTube Playlists

Лучшие курсы по искусственному интеллекту от топовых университетов мира.

Stanford University Courses
CS221 - Artificial Intelligence: Principles and Techniques

CS224U: Natural Language Understanding

CS224n - Natural Language Processing with Deep Learning

CS224w - Machine Learning with Graphs

CS229 - Machine Learning

CS230 - Deep Learning

CS231n - Convolutional Neural Networks for Visual Recognition

CS234 - Reinforcement Learning

CS330 - Deep Multi-task and Meta-Learning

CS25 - Transformers United

Carnegie Mellon University Courses
CS 10-708: Probabilistic Graphical Models

CS/LTI 11-711: Advanced NLP

CS/LTI 11-737: Multilingual NLP

CS/LTI 11-747: Neural Networks for NLP

CS/LTI 11-777: Multimodal Machine Learning

CS/LTI 11-785: Introduction to Deep Learning

CS/LTI 11-785: Neural Networks

CS/LTI Low Resource NLP

Massachusetts Institute of Technology Courses

6.006 - Introduction to Algorithms

6.S191 - Introduction to Deep Learning

6.S094 - Deep Learning

6.S192 - Deep Learning for Art, Aesthetics, and Creativity

DeepMind x UCL

COMP M050 - Introduction to Reinforcement Learning

Deep Learning Series

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔥Dense Text-to-Image Generation with Attention Modulation

DenseDiffusion, a training-free method that adapts a pre-trained text-to-image model to handle dense captions while offering control over the scene layout.

DenseDiffusion - новый метод, адаптирующий предварительно обученную модель "текст-изображение",

С DenseDiffusion способен генерировать изображения, учитывая подробное описание, конкретной области изображения.


🖥 Github: https://github.com/naver-ai/densediffusion

📕 Paper: https://arxiv.org/abs/2308.12964v1

⭐️ Dataset: https://paperswithcode.com/dataset/coco

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🌄Scenimefy: Learning to Craft Anime Scene via Semi-Supervised Image-to-Image Translation

Novel semi-supervised image-to-image translation framework

Новый фреймворк для Автоматического высококачественного рендеринга аниме-сцен из сложных реальных изображений.


git clone https://github.com/Yuxinn-J/Scenimefy.git

🖥 Github: https://github.com/yuxinn-j/scenimefy

▶️ Project: https://yuxinn-j.github.io/projects/Scenimefy.html

📕 Paper: https://arxiv.org/abs/2308.12968v1

🚀 Demo: https://yuxinn-j.github.io/projects/Scenimefy.html

⭐️ Dataset: https://github.com/Yuxinn-J/Scenimefy#open_file_folder-anime-scene-dataset

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Онлайн-конференция по большим данным от Х5 Tech

В программе:

🎯 Развитие команды аналитики в сервисе доставки из магазинов «Пятёрочка»: зарождение продукта, трудности, неудачные решения.

🎯 Как работает Data-спецназ X5 Tech, автоматизация А/Б тестирования в оффлайне и что делать математику в ритейле.

🎯 Необходимые инструменты мониторинга и управления, когда число IT-продуктов и ML-моделей исчисляется сотнями. Подходы к оптимизации распределения ресурсов и учет рисков.

🎯 Классический подход к проведению рекламы VS AdHoc-подход на основе эконометрической модели: ключевые факторы динамики трафика, влияние РК, оценка ROI и оптимизация затрат с помощью big data.

📅 31 августа, начало в 11:00
🌐 Формат - онлайн

Зарегистрироваться

Читать полностью…

Machinelearning

👀 Как используют компьютерное зрение в промышленных роботах

Внедрение компьютерного на производстве важно, потому что оно помогает снизить риски для работников, автоматизируя опасные или монотонные задачи. Роботов учат распознавать объекты, оценивать параметры, проводить сложные анализы.

🤖 Яндекс тоже использует нейронные сети для своих складских роботов. А точнее систему сканирования на базе компьютерного зрения в серии роботов Яндекс Маркета: в роботе Spectro для проведения палетной инвентаризации на складах Маркета и в системе для определения положения коробок.

Руководитель группы разработки компьютерного зрения и бизнес-процессов на роботе Валерий Ильин расскажет об этом на хардовой конференции для экспертов по ML.

Это всего одна тема из всех докладов. Эксперты затронут генеративные модели, Research, NLP, Hardware, CV, RecSys, MLOps и Ecomm. Конференция Practical ML Conf пройдёт 7 сентября офлайн и онлайн. Регистрация — здесь.

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🤖Стартовала конференция по кибербезопасности OFFZONE 2023

Организатором мероприятия выступает партнер Сбера компания BI.ZONE. 24-25 августа более 110 спикеров расскажут о быстроменяющемся ландшафте кибербезопасности с экскурсом в историю за последние 10 лет, поделятся важными знаниями и лайфхаками для безопасников.

Также BI.ZONE представит итоги работы собственной платформы Bug Bounty. Помимо этого, будут работать прикладные воркшопы, где профессионалы с многолетним опытом расскажут о технологиях COM и подходах к исследованию Windows, применении ИИ для защиты информации и многом другом. Участникам конференции будет доступна секция о безопасности приложений, где покажут наглядно, как искать необычные уязвимости.

В AntiFraud.Zone обсудят вопросы банковской безопасности и борьбы с финансовыми преступлениями, как бороться с новыми видами атак и превентивно реагировать на угрозы, как устроен мошеннический кол‑центр и что нового появилось в антифрод‑системах за последние несколько лет.

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Как устроены ChatGPT, Siri, Алиса и Маруся — и какие навыки нужны, чтобы запускать такие продукты?

Узнайте у Владимира Васильева, руководителя направления из «Сбера», разрабатывающего русскую версию ChatGPT.

Регистрируйтесь на бесплатный онлайн-практикум от ТГУ и Skillfactory 29 августа в 17:00 мск.

За 1,5 часа вы:
— изучите ключевые задачи и навыки для работы с NLP;
— погрузитесь в мировые тренды развития анализа естественного языка;
— поймете с чего начать карьеру в NLP.

Регистрация по ссылке БЕСПЛАТНО: https://go.skillfactory.ru/&erid=LatgC5uSw

Реклама, ООО «Скилфэктори», ИНН: 9702009530

Читать полностью…
Подписаться на канал