data_analysis_ml | Неотсортированное

Telegram-канал data_analysis_ml - Анализ данных (Data analysis)

10807

Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚

Подписаться на канал

Анализ данных (Data analysis)

🚀 Llama-3_3-Nemotron-Super-49B-v1 — это крупная языковая модель (LLM) от NVIDIA, созданная на базе архитектуры Llama 3 и усовершенствованная с использованием технологий NVIDIA.

Модель на 49 миллиардов параметров, которая оптимизирована для работы на GPU и предназначена для выполнения сложных NLP задач.

Интеграция с экосистемой NVIDIA: Использует фреймворки вроде NeMo и TensorRT для ускорения вычислений на GPU.

Оптимизация под железо NVIDIA: Заточена для работы на серверах с GPU серий A100, H100 и др.

Совместимость с Llama 3: Сохраняет
🛠 Для кого полезен?

Корпоративные разработчики: Внедрение в продукты, требующие высокоточной генерации текста (чат-боты, аналитика).

🚀 Преимущества перед аналогами
Скорость и эффективность:

Благодаря оптимизации под CUDA и TensorRT, модель работает в 1.5–2x быстрее, чем базовые версии Llama 3 на аналогичном железе.

Поддержка квантования и динамического батчинга для снижения затрат на инференс.

Масштабируемость:
Готовность к интеграции в распределенные системы (NVIDIA DGX, Kubernetes).

Совместимость с NVIDIA Triton Inference Server для промышленного развертывания.

Кастомизация:
Возможность дообучения на доменных данных (медицина, юриспруденция, финансы) с использованием NeMo Framework.

https://huggingface.co/nvidia/Llama-3_3-Nemotron-Super-49B-v1

Читать полностью…

Анализ данных (Data analysis)

❓Работаете с данными? Масштабируйте Big Data с Apache Spark!

Освойте Spark на продвинутом уровне. За 4 месяца на онлайн-курсе от Otus вы:
- Освоите RDD, DataFrame, Dataset, Spark API
- Разберётесь в SparkML, потоковой обработке, работе с графами
- Научитесь запускать Spark в Kubernetes и Hadoop

В программе сложные, но интересные практические задачи и проект на реальных данных.

💪 Выпускники работают с биржами, маркетплейсами и банками.

➡️ Пройдите вступительное тестирование и получите скидку на курс: https://otus.pw/wFnu/?erid=2W5zFH7RZnp

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

Читать полностью…

Анализ данных (Data analysis)

✔️ "EXAONE Deep Released ━ Setting a New Standard for Reasoning AI" от LG AI Research

Мы уже писали про довольно интересное семейство моделей от LG, на этот раз они представили по-настоящему мощные ризонинг модели.

1) EXAONE Deep 2.4B превосходит другие модели сопоставимого размера,
2) EXAONE Deep 7.8B превосходит не только открытые модели сопоставимого размера, но и OpenAI o1-mini,
3) EXAONE Deep 32B демонстрирует конкурентоспособные характеристики по сравнению с ведущими открытым моделями.

Модель 32B, которая по размеру равна примерно 5% от размера DeepSeek r1, превосходит ее почти на всех бенчмарках.

Прорыв в цепочке рассуждений – релиз акцентирует внимание на улучшении "chain-of-thought" механизма, что делает модель способной генерировать обоснованные выводы и поддерживать длинные цепочки логических рассуждений.

🟡Релиз: https://www.lgresearch.ai/blog/view?seq=543
🟡Статья: https://arxiv.org/abs/2503.12524
🟡HF: https://huggingface.co/LGAI-EXAONE/EXAONE-Deep-32B
🟡Github: https://github.com/LG-AI-EXAONE/EXAONE-Deep

@ai_machinelearning_big_data


#AI #ML #LLM #EXAONE #LG #reasoning

Читать полностью…

Анализ данных (Data analysis)

Приглашаем аналитиков на дружескую встречу в Яндексе! 

22 марта в штаб-квартире Яндекса «Красная Роза» команда Рекламных технологий поделятся своим опытом и расскажут: 

— Как работает аналитика в Коммерческом департаменте и Рекламных технологиях 
— Как устроена аналитика антифрода рекламных систем

После основной части можно будет пройти диагностику навыков, поучаствовать в нетворкинге и задать все интересующие вопросы.

Ждут аналитиков с опытом на Python от 3 лет. Успейте зарегистрироваться — сбор заявок завершается 20 марта!

До встречи!

Читать полностью…

Анализ данных (Data analysis)

⚡️ Remade Effects — это интерактивный проект Spaces от Remade-AI, который демонстрирует возможности генеративного ИИ для создания креативных эффектов на изображениях.

▪ Инновационный подход: Проект позволяет применять различные художественные и стилистические эффекты к изображениям, используя современные генеративные модели.
▪ Простота использования: Удобный интерфейс дает возможность легко экспериментировать с эффектами без необходимости писать код, что делает его доступным как для разработчиков, так и для дизайнеров.
▪ Креативность и вдохновение: Инструмент может быть полезен художникам и креативщикам для создания уникальных визуальных работ, а также для исследований в области генеративного дизайна.

https://huggingface.co/spaces/Remade-AI/remade-effects

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

📹 ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

ReCamMaster: генеративный рендеринг с функциями управлением камерой 🔥

Еще один хит в области генерации видео из Китая

Позволяет создавать реалистичные новые сцены из одного видео, что позволяет «переснимать» видео с новыми движениями камеры.

Код обещают очень скоро,

🟡Github: https://github.com/KwaiVGI/ReCamMaster
🟡Paper: https://arxiv.org/abs/2503.11647
🟡Project: https://jianhongbai.github.io/ReCamMaster/

Читать полностью…

Анализ данных (Data analysis)

⚡️ Copy any UI

Клонирование любого сайта одним кликом стало возможным благодаря новому ИИ-агенту Same.dev! Этот инструмент способен создать практически точную копию веб-сайта всего лишь по ссылке.

Все, что вам нужно сделать, — это вставить URL интересующего ресурса и немного подождать. Same.dev автоматически проанализирует исходный код и предоставит готовую копию, которую сложно отличить от оригинала.

Причем это абсолютно бесплатно: https://same.dev/

Читать полностью…

Анализ данных (Data analysis)

⚡️ Computer Using Agent Sample App – это демонстрационное приложение для создания системы «Computer Using Agent» (CUA) с использованием OpenAI API.

Основные особенности
и интересные моменты проекта:

- Прототип CUA: Приложение показывает, как можно интегрировать ИИ-модель для управления интерфейсом компьютера. Модель анализирует скриншоты и предлагает действия (например, клики, ввод текста), которые необходимо выполнить в среде пользователя.
- Модульная архитектура: Проект разделён на две ключевые абстракции – «Computer» для выполнения действий (например, локальный браузер через Playwright, Docker-окружение, удалённые браузерные среды) и «Agent» для взаимодействия с моделью.
Многообразие сред: В репозитории реализованы различные среды (LocalPlaywright, Docker, Browserbase, Scrapybara), что позволяет протестировать приложение в разных условиях.

- Примеры использования: В проекте есть CLI для удобного старта, а также примеры (например, файл simple_cua_loop.py) для демонстрации базового цикла работы CUA.
Безопасность: Присутствуют базовые меры безопасности, в том числе проверки URL и запрос подтверждения действий, что важно при управлении реальными интерфейсами.

📌 Github

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

⚡️ GPUStack — это менеджер кластеров GPU с открытым исходным кодом для запуска и масштабирования AI моделей.

⚫ Универсальность: Поддерживает работу на разных платформах, включая macOS, Windows и Linux.
⚫ Масштабируемость: Позволяет легко добавлять дополнительные GPU или узлы для увеличения вычислительных мощностей.
⚫ Широкий спектр моделей: Поддерживает запуск больших языковых моделей (LLM), диффузионных моделей, аудио-, embedding и reranker моделей.
⚫ Несколько бекендов: Использует такие решения, как llama-box, vLLM и vox-box для инференса.
⚫ OpenAI-совместимые API: Предоставляет API, совместимые с OpenAI, что облегчает интеграцию с различными приложениями и сервисами.
⚫ Мониторинг и управление: Включает инструменты для отслеживания производительности GPU, использования токенов и управления пользователями и API-ключами.

https://github.com/gpustack/gpustack

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🔥 llm-scraper — библиотека на языке TypeScript, предназначенная для извлечения структурированных данных с веб-страниц с использованием LLM!

🌟 Библиотека поддерживает различные провайдеры LLM, включая локальные модели (Ollama, GGUF), OpenAI и Vercel AI SDK. Для определения схем данных используется библиотека Zod, обеспечивая полную типизацию в TypeScript. В основе работы llm-scraper лежит фреймворк Playwright, который управляет взаимодействием с веб-страницами.

🔐 Лицензия: MIT

🖥 Github

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

⚡️ Napkin AI — инновационный сервис, который превращает обычный текст в наглядные визуальные схемы, диаграммы и инфографику, облегчая процесс представления сложной информации.

• Автоматическая генерация визуализаций:
  • Просто вставьте текст, и Napkin AI предложит несколько вариантов визуального представления, которые можно адаптировать под ваши нужды.

• Интуитивно понятный интерфейс:
  • Легкая настройка цветов, иконок и шрифтов обеспечивает гибкость в дизайне.

• Экспорт в разные форматы:
  • Готовые визуализации можно сохранить в PNG, SVG или PDF для использования в презентациях, статьях или социальных сетях.

• Преимущества для разработчиков:
  • Ускорение создания документации: Диаграммы и схемы для технической документации создаются быстрее и проще.
  • Улучшение командной коммуникации: Визуальные схемы помогают лучше объяснять сложные концепции и процессы коллегам.
  • Повышение качества презентаций: Автоматически сгенерированные инфографики делают ваши выступления более наглядными и профессиональными.

Napkin AI находится в стадии бета-тестирования и доступен бесплатно. Это отличная возможность опробовать сервис и интегрировать его в свой рабочий процесс.

Попробовать

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🔥 TransPixar — новая нейросеть, способная генерировать видео с прозрачным фоном. Это идеально для создания спрайтов в видеоиграх!

🔗 Демо: *клик*
🖥 Github

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🖥 NocoDB — это база данных без кода (no-code database) с открытым исходным кодом, превращающая любую реляционную базу данных (MySQL, PostgreSQL, SQLite, MSSQL и др.) в гибкую таблицу, аналогичную Airtable!

🌟 Она позволяет пользователям управлять данными с помощью удобного веб-интерфейса, создавать REST API, настраивать представления (таблицы, календари, канбан-доски) и интегрироваться с внешними сервисами.

🔐 Лицензия: AGPL-3.0

🖥 Github

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🔍 Spark-TTS — свежий проект для синтеза речи, использующей большие языковые модели (LLM).

Проект обеспечивает высококачественную генерацию аудио с поддержкой zero-shot клонирования голоса, двуязычной (английский и китайский) синтезацией и управляемой генерацией речи, что делает его пригодным как для исследований, так и для коммерческого применения.

https://github.com/SparkAudio/Spark-TTS

Читать полностью…

Анализ данных (Data analysis)

Подборка полезных ИИ- каналов для обучения

🎓 1) Andrej Karpathy
Глубокие, но доступные лекции по глубокому обучению, языковым моделям и введению в нейронные сети.
Ссылка: https://www.youtube.com/c/AndrejKarpathy

📊 2) 3Blue1Brown
Потрясающие визуализации, которые делают абстрактные математические концепции понятными и интуитивными.
Ссылка: https://www.youtube.com/c/3blue1brown

🎙️ 3) Lex Fridman
Глубокие беседы с лидерами индустрии ИИ, позволяющие получить широкий взгляд на современные тенденции.
Ссылка: https://www.youtube.com/c/LexFridman

🤖 4) Machine Learning Street Talk
Технические погружения и обсуждения с ведущими исследователями в области ИИ и машинного обучения.
Ссылка: https://www.youtube.com/c/MachineLearningStreetTalk

💼 5) Uproger
Множество полных кусрсов, уроков с уклоном на практику
uproger" rel="nofollow">https://www.youtube.com/@uproger

🍉 6) Serrano Academy (Luis Serrano)
Ясный и доступный контент о машинном обучении, глубоких нейронных сетях и последних достижениях в ИИ.
Ссылка: https://www.youtube.com/c/LuisSerrano

💻 7) Jeremy Howard
Практические курсы по глубокому обучению и обучающие видео по созданию AI-приложений, основанные на опыте Fast.ai.
Ссылка: https://www.youtube.com/c/Fastai

🛠️ 8) Hamel Husain
Практические уроки по работе с языковыми моделями (LLMs), RAG, тонкой настройке моделей и оценке ИИ.
Ссылка: https://www.youtube.com/c/HamelHusain

🚀 9) Jason Liu
Экспертные лекции по RAG и советы по фрилансу в области ИИ для специалистов по машинному обучению.
Ссылка: https://www.youtube.com/c/JasonLiu

⚙️ 10) Dave Ebbelaar
Практические руководства по созданию ИИ-систем и применению технологий в реальных проектах.
Ссылка: https://www.youtube.com/c/DaveEbbelaar

📚 11) StatQuest with Joshua Starmer PhD
Доступные и понятные объяснения основ машинного обучения и статистики для начинающих.
Ссылка: https://www.youtube.com/c/statquest

Эти каналы предлагают разнообразный и качественный контент для всех, кто хочет углубиться в изучение искусственного интеллекта. Независимо от вашего уровня подготовки, здесь каждый найдёт что-то полезное для себя!

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

⭐️ Reasoning-v1-20m

Синтетический набор данных, содержащий более 22 млн цепочек рассуждений для прометав общего назначения в различных областях.

Большой датасет, содержащих следы рассуждений для различных тем: связанных с кодом/математикой, социальных сферах и естественных наук и тд.

https://huggingface.co/datasets/glaiveai/reasoning-v1-20m

#dataset #Reasoning

Читать полностью…

Анализ данных (Data analysis)

🚀 SmolDocling-256M-preview: Компактная NLP-модель от IBM для работы с документами

SmolDocling-256M-preview — это ""предобученная языковая модель"" с 256 миллионами параметров, оптимизированная для задач обработки структурированных и неструктурированных документов.

Она разработана для работы с текстами, включая технические документы, юридические соглашения и научные статьи.

▪Cохраняет контекст даже в документах на 10k+ токенов.
Специализация — обучена на корпусах документов (юридических, технических, медицинских).
▪ Легкость развертывания — компактный размер (256M параметров) против гигантов вроде GPT-3.


Работает на CPU и малом GPU (например, T4),

🔗 Модель: huggingface.co/ds4sd/SmolDocling-256M-preview

Читать полностью…

Анализ данных (Data analysis)

Multimodal-SAE 🚀

Multimodal-SAE — это фреймворк для работы с мультимодальными языковыми моделями (LMMs), который фокусируется на интерпретируемости и анализе их внутренних механизмов. Он использует разреженные автокодировщики (Sparse Autoencoders), чтобы «расшифровать», как модели обрабатывают текст, изображения и другие данные.

▪️ Для кого?
▪ Разработчики AI/ML, работающие с LMMs (например, GPT-4, LLaVA).
▪ Исследователи, изучающие интерпретируемость нейросетей.
▪ Инженеры, которым нужно оптимизировать мультимодальные модели.

▪️ Чем полезен?
▪ Диагностика моделей — выявляет, какие нейроны отвечают за обработку изображений, текста или их комбинаций.
▪ Уменьшение «галлюцинаций» — помогает находить и исправлять ошибки в логике модели.
▪ Сжатие моделей — идентифицирует избыточные компоненты для ускорения работы LMMs.
▪ Гибкость — работает с любыми предобученными моделями (Vision-Language, Audio-Text и др.).

▪️ Преимущества перед аналогами
▪Глубокая интерпретируемость — не просто визуализирует внимание, а декомпозирует механизмы принятия решений.
▪Эффективность — алгоритмы оптимизированы для работы с большими мультимодальными данными.
▪Универсальность — поддерживает CV, NLP, Speech в одном фреймворке.
Визуализация — встроенные инструменты для анализа активаций нейронов (графики, heatmaps).

P.S. Для старта изучите их документацию — там есть примеры для GPT-4, LLaMA и других популярных моделей!

📌 Github
📌 Paper

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

Mistral только что выпустили многоязычный, мультимодальный 24B LLM с производительностью SOTA с контекстом 128K и лицензией Apache 2.0 🔥

🟡HF: https://huggingface.co/mistralai/Mistral-Small-3.1-24B-Instruct-2503
🟡Post: https://mistral.ai/news/mistral-small-3-1/

@ai_machinelearning_big_data


#mistral #llm #mistralsmall

Читать полностью…

Анализ данных (Data analysis)

👁Настройка dev-окружения для команды компьютерного зрения.

Что будет на вебинаре?
- Аренда и базовая настройка сервера для работы команды.
- Установка и настройка инструментов для ML-экспериментов
- Развертывание сервиса для разметки изображений CVAT.

Узнаете, как арендовать и настроить сервер для командной работы, что позволит им быстро развертывать инфраструктуру для новых проектов.

Научитесь настраивать MLFlow для отслеживания экспериментов, JupiterLab для удобной разработки и MinIO для создания общего файлового хранилища, что упростит совместную работу с датасетами и другими файлами.

Сможете развернуть CVAT для разметки изображений, что пригодится в проектах, связанных с обработкой и анализом изображений, таких как распознавание объектов, сегментация и т.д.

👉 Регистрация и подробности вебинара
https://otus.pw/1tsR/

Вебинар проходит в рамках подписки OTUS, благодаря которой можно приобрести 3 курса по цене одного!

#реклама
О рекламодателе
erid: 2W5zFJPYH52

Читать полностью…

Анализ данных (Data analysis)

⚡️All-atom Diffusion Transformer (ADiT) — это новая разработка в области генеративного моделирования химических систем

. ADiT представляет собой унифицированную латентную диффузионную модель, способную генерировать как периодические материалы, так и непериодические молекулярные структуры
ARXIV.ORG

Ключевые особенности проекта:

Унифицированный подход: ADiT использует единое представление для молекул и материалов, что позволяет эффективно работать с различными химическими системами
ARXIV.ORG

Диффузионная модель: В основе генерации новых структур лежит диффузионная модель, обученная создавать новые латентные представления, которые затем декодируются в валидные молекулы или материалы
ARXIV.ORG

Автоэнкодер: Система включает автоэнкодер, который отображает атомарные представления молекул и материалов в общее латентное пространство, обеспечивая эффективное кодирование и декодирование
ARXIV.ORG

📌 Github

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

⚡️ Vondy: огромная базу ИИ-агентов для различных задач!

В Vondy можно подобрать нейроассистентов, которые возьмут на себя рутинную работу и сэкономят часы, чтобы вы могли уделить время отдыху, хобби или развлечениям.

▪ Агенты для любых задач: от кодинга, написания текста, дизайна и бизнеса до повышения продуктивности и генерации изображений, звуков и видео.
▪ Создайте своего агента: сервис предоставляет все необходимые инструменты, чтобы настроить помощника именно под ваши нужды.
Бесплатно.

https://www.vondy.com/

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

Агентство NEWHR опубликовало результаты исследования рынка аналитиков. 1293 респондента разных уровней рассказали, где работают, к чему стремятся и сколько получают. Коротко о главном:

⚫️ Лучшей компанией для работы является Авито (37,2%). Она же стала абсолютным лидером из наиболее известных российских компаний (42,1%).
⚫️ Большинство русскоязычных аналитиков работают в российских компаниях — 75,9%.
⚫️ За 2024 год у 44,9% опрошенных зарплаты выросли на 10-30%.
⚫️ 46% стали более лояльны к своему работодателю.

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

✔️ OpenAI презентовала новые инструменты для разработчиков.

OpenAI анонсировала 3 новых инструмента для разработчиков, поддерживаемых в API и доступных через новый SDK. Среди новинок – WebSearch Tool, основанный на дообученной модели GPT-4o/GPT-4o-mini, для поиска информации в интернете. FileSearch Tool - инструмент поиска по документам с возможностью фильтрации по тегам, аналогично функциональности в Ассистентах. Третий - Computer Use (Operator), использующий ту же GPT-4o, предоставляющий доступ к локальному компьютеру пользователя.

Опубликованы и тарифы:
⚫ Computer Use немного дороже обычной GPT-4o — 3 доллара за вход и 12 долларов за выход на миллион токенов; как формировать контекст, какие скриншоты и текст закидывать — остается на ваше усмотрение.
⚫ Поиск по файлам оценивается в $2.5 за 1000 запросов и $0.1 за каждый гигабайт загруженных файлов.
⚫ Стоимость поиска зависит от настройки «длина контекста» (вероятно, от того, сколько ссылок из поисковой выдачи попадут в контекст); для старшей модели цена составляет $30–$50 за тысячу вызовов.

📌 Github
📌 OpenAI на Youtube

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

Открытый вебинар «RL - учимся обыгрывать человека»

📚На вебинаре вы узнаете:
1. Основные концепции стохастических игр, включая многопользовательские стратегии и равновесие.
2. Популярные RL-алгоритмы, адаптированные для работы в стохастических средах (Q-learning, Policy Gradient, MARL). 
3. Рассмотрим применение стохастических игр в реальных кейсах: финансы, кибербезопасность, автономные системы.
4. Как обучать агентов, учитывая случайность и стратегии других участников. 

👨‍💻Кому будет полезно?
+ Data Scientists, которые хотят освоить продвинутые методы обучения с подкреплением для сложных сред. 
+ AI-разработчикам, работающим над автономными агентами и многоагентными системами.

⏰ 18 марта в 20:00 (мск).
🆓Бесплатно. Вебинар в рамках курса «Reinforcement Learning»

👉Записывайтесь: https://otus.pw/ioYS/?erid=2W5zFGri584

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

#реклама
О рекламодателе

Читать полностью…

Анализ данных (Data analysis)

🚨Данные растут, запросы тормозят, аналитика буксует. Знакомо?

Когда SQL-скрипты уже не справляются, а MapReduce заставляет вас страдать, пора переходить на Apache Spark.

На открытом вебинаре 19 марта в 20:00 мск разберём Spark API, научимся работать с DataFrame, RDD и Dataset, изучим практические примеры оптимизации.

➡️ Записывайтесь и получите скидку на большое обучение «Spark Developer»: https://otus.pw/A6Cb/?erid=2W5zFG3awWp

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

Читать полностью…

Анализ данных (Data analysis)

Приглашаем на открытый урок «Применение искусственного интеллекта в диагностике и визуализации медицинских изображений»

Познакомимся с современными методами использования ИИ для анализа медицинских изображений, включая рентгеновские снимки, МРТ и КТ на открытом уроке, посвященному курсу «Искусственный интеллект в медицине»

Рассмотрим примеры успешных внедрений и разберем алгоритмы, которые помогают врачам быстрее и точнее ставить диагнозы. 

👉 Регистрация и подробности: 
https://otus.pw/zskO/?erid=2W5zFGC6N1v

#реклама
О рекламодателе

Читать полностью…

Анализ данных (Data analysis)

💥 Повышайте точность ML-моделей!

Для достижения высокой точности в ML часто используют не одну, а несколько моделей, объединяя их в ансамбли.

Записывайтесь на бесплатный вебинар, где мы на практике разберём популярные методы ансамблирования:
- Бэггинг снижает дисперсию модели, делая её устойчивее
- Градиентный бустинг усиливает предсказания, обучая модели на ошибках

📅 Встречаемся онлайн 17 марта в 18:00 мск. Открытый урок пройдёт в преддверии старта курса «Специализация Machine Learning», а все участники получат скидку на обучение.

➡️ Ссылка для регистрации: https://otus.pw/znbk/?erid=2W5zFGn7i5v

#реклама

О рекламодателе

Читать полностью…

Анализ данных (Data analysis)

🖥 GPU Puzzles

Набор интерактивных упражнений («паззлов») для обучения программированию под GPU с использованием CUDA.

Это целая серия задач, где требуется написать небольшие CUDA-ядра (ядра GPU), реализующие операции вроде сложения с константой (map), поэлементного суммирования (zip), работы с блоками и потоками, свёртки, матричного умножения и других параллельных алгоритмов.

Основная цель репозитория – дать начинающим возможность непосредственно попрактиковаться в программировании под GPU, без необходимости погружаться в сложную документацию.

Для удобства рекомендуется запускать задания в Google Colab с включённым режимом GPU.

Репозиторий лицензирован по MIT, имеет высокую популярность (более 10 тыс звёзд) и является частью серии обучающих проектов (наряду с Tensor Puzzles, Autodiff Puzzles, Triton Puzzles и другими).

А здесь реализация задач на C++

Github
Colab

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🖥 OpenAi добавили новую страницу сравнения всех своих моделей в документацию— теперь вы можете легко увидеть разбивку возможностей каждой модели и сравнить все модели между собой.

https://platform.openai.com/docs/models


@data_analysis_ml

Читать полностью…
Подписаться на канал