Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚
🤖 Сооснователь Anthropic Бен Манн:
🧠 «Вероятность того, что суперинтеллект появится в ближайшие годы — около 50%.
И это не просто спекуляция — за этим стоят данные, законы масштабирования и чёткие научные тренды».
Он подчёркивает: даже если технический прорыв случится быстро,
его влияние на общество может проявиться с задержкой — через годы.
📌 Вопрос уже не в том, "если", а "как скоро" — и что мы с этим сделаем.
✔️ OpenAI анонсировала дату проведения DevDay.
OpenAI объявила, что ее следующая конференция для разработчиков, DevDay, состоится 6 октября 2025 года в Сан-Франциско. На мероприятии выступят Сэм Альтман и Грэг Брокман. DevDay традиционно становится площадкой для главных анонсов OpenAI, и в этом году разработчикам обещают ранний доступ к информации о будущих продуктах и технологиях.
Конференция планирует собрать более 1500 разработчиков. Регистрация на очное участие открыта в формате подачи заявок до 30 июля, а приглашения будут разосланы в середине августа. Стоимость участия составит 650 долларов. Для тех, кто не сможет присутствовать лично, будет организована прямая трансляция основной части мероприятия, а записи остальных сессий опубликуют позже.
openai.com
✔️ Proton представила Lumo: защищенный чат-бот с фокусом на приватность.
Швейцарская компания Proton, известная своим одноименным почтовым сервисом, выпустила автономного ИИ-ассистента Lumo. Чат-бот позиционируется как безопасная альтернатива продуктам от крупных технологических корпораций.
Lumo умеет обобщать документы, писать код, составлять черновики писем и отвечать на веб-запросы. Сервис работает исключительно на открытых языковых моделях, размещенных в собственных дата-центрах Proton в Европе. Вся переписка защищена сквозным шифрованием с "нулевым доступом", что не позволяет самой компании или третьим лицам читать и хранить сообщения.
Попробовать Lumo можно без регистрации через веб-клиент или мобильные приложения, но с ограничениями. Платная подписка Lumo Plus за $12.99 в месяц снимает лимиты на общение и позволяет загружать файлы большего размера.
proton.me
✔️ Google DeepMind Aeneas: открытая ИИ-система для восстановления латинских надписей.
Google DeepMind выпустила Aeneas, опенсорсный инструмент на базе ИИ, предназначенный для помощи историкам в работе с фрагментарными древними надписями. Система анализирует неполные транскрипции и изображения, после чего определяет вероятное место и дату происхождения текста, предлагает варианты недостающих слов и находит аналоги в корпусе известных надписей.
Модель, обученная на 200 000 каталогизированных текстов, является развитием более ранней системы Ithaca для греческого языка. В исследовании, опубликованном в Nature, Aeneas улучшил генерацию научных гипотез в 90% случаев, а его оценки происхождения и датировки совпали с консенсусом ученых.
Aeneas доступна бесплатно для ученых, преподавателей и сотрудников музеев.
theguardian.com
✔️ AWS закрывает свою ИИ-лабораторию в Шанхае.
Amazon Web Services объявила о закрытии своей исследовательской ИИ-лаборатории в Шанхае. В компании это решение назвали трудным, оно завершает семилетнюю историю работы центра, который занимался передовыми разработками в области машинного обучения. По словам одного из научных сотрудников, подразделение расформировывают из-за "стратегических корректировок на фоне напряженности между США и Китаем".
Лаборатория, открытая в 2018 году, была весьма продуктивной: на ее счету более 100 научных публикаций и создание популярной open-source библиотеки Deep Graph Library. В лучшие времена в ней работало более 1000 человек.
ft.com
✔️ Компания Марка Цукерберга разработала нейромоторный браслет, работающий без персональной калибровки.
Устройство, разработанное в Reality Labs представляет собой браслет, который считывает электрическую активность мышц предплечья (sEMG), напрямую декодируя двигательные намерения пользователя.
Главное достижение - разработка универсальной модели, обученной на данных тысяч людей. В отличие от аналогов, требующих длительной настройки под каждого человека, эта система работает из коробки, без предварительной калибровки под новых пользователей.
В тестах интерфейс продемонстрировал распознавание рукописного ввода со скоростью почти 21 слово в минуту, точное определение дискретных жестов (щипки, свайпы) и плавное управление курсором. При этом короткая персональная донастройка на данных конкретного пользователя может повысить точность еще на 16%.
nature.com
@ai_machinelearning_big_data
#news #ai #ml
🚀 Новинка: Code Sandbox MCP — простой интерпретатор кода для ИИ-агентов
Теперь ты можешь запускать код прямо из LLM (например, Gemini) в локальной изолированной среде, которую полностью контролируешь.
🛠 Как работает:
1. Запускается контейнер (Docker или Podman)
2. Код сохраняется во временный файл
3. Файл копируется внутрь контейнера
4. Выполняется (Python, JS и др.)
5. Вывод и ошибки считываются
6. Всё возвращается клиенту
7. Контейнер удаляется
🔗 Примеры и исходники — в блоге и на GitHub
@data_analysis_ml
🔍T-one — открытая русскоязычная модель распознавания речи, выпущенная Т-Технологиями специально для звонков и телефонии
🧠 Главное:
— Обрабатывает речь кусками по 300 мс и запоминает контекст, подходит для реального времени
— Основа — Conformer и CTC-декодер, дополнительно подключается языковая модель (5-грамм, KenLM), чтобы повысить точность
— Задержка небольшая: около 1–1.2 секунды вместе с постобработкой
— Хорошо справляется с шумом, паузами и разговорной речью по телефону (8 кГц)
— Обучена на 80 тысячах часов аудио, в том числе 6 тысяч часов — это реальные телефонные звонки
— Используется в продуктах Т-Банка
— Дает заметно лучшее качество, если подключить языковую модель
https://habr.com/ru/companies/tbank/articles/929850/
🚨 BREAKING: Руководитель DeepMind резко раскритиковал заявление OpenAI о "золоте" на Международной математической олимпиаде (IMO)
IMO — это International Mathematical Olympiad (Международная математическая олимпиада).
📌 Это крупнейшее и престижнейшее соревнование по математике для школьников со всего мира. Впервые проведено в 1959 году, сегодня в нём участвуют более 100 стран.
>Прессслужба OpenAI сообщили, что их модель впервые в истории выиграла на IMO золото
> “У IMO есть внутренний протокол оценки, который никто извне не видит.
> Без него нельзя утверждать, что у вас 1 место.
> С потерей баллов на задаче P6 — это серебро, а не золото.”
📌 Что произошло:
— OpenAI не уведомлял IMO, но объявила о "первом месте" своей модели
— Объявление сделали до окончания церемонии IMO, нарушив просьбу не затмевать победу реальных студентов
— DeepMind, наоборот, работала с IMO официально и соблюдала все условия
— Научное сообщество обвиняет OpenAI в непрозрачности и неуважении к сообществу
— Пост был сделан без публикации всей методики и без согласования с организаторами
💬 Цитата из сообщества:
“OpenAI повела себя неуважительно и эгоистично. Нельзя сравнивать так модели и людей.”
🧠 Вопрос к читателю:
Где грань между научным прогрессом и этикой в публичных заявлениях ИИ-компаний?
@data_analysis_ml
Присоединяйся к сообществу современной ИТ-компании. Проходи бесплатные стажировки, знакомься с экспертами, участвуй в активностях и найди работу мечты!
Лига — это:
— Более 6 000 сотрудников по всей России
— Удобный график: удаленка, гибрид или офис
— Полный соцпакет, ДМС, корпоративная связь
— Компенсация фитнеса
— И многое другое
Хочешь расти как профессионал, работать в дружной команде, отдыхать в компании единомышленников, участвовать в масштабных корпоративах? Тогда тебе к нам!
/channel/digitalleague?erid=2W5zFJaD2nU
Реклама. ООО "ЭЙТИ КОНСАЛТИНГ". ИНН 7715744096.
🚨 Подождите, NVIDIA выпустила новые open-source модели SOTA-уровня?!
🧠 OpenReasoning-Nemotron — линейка мощных LLM, специально обученных для математики, науки и программирования.
💾 Доступны 4 версии: 1.5B, 7B, 14B и 32B — можно запускать полностью локально, без облаков и подписок.
📊 Выдают топовые результаты на бенчмарках
⚙️ Идеальны для reasoning-задач и технических доменов
Как запустить на ноутбуке и всё, что нужно знать — ниже 👇
Как запустить OpenReasoning-Nemotron у себя на ноуте:
1️⃣ Скачай LM Studio для macOS, Windows или Linux
2️⃣ В поиске введи: openreasoning
3️⃣ Установи нужную модель
🧠 Совет: берите 7B-версию от Bartowski в квантовке Q4_0 — отличное качество при маленьком размере.
Идеально для ARM-процессоров (например, M1/M2).
🔥 Запускай топовую LLM локально — без облака, подписок и тормозов.
https://huggingface.co/collections/nvidia/openreasoning-nemotron-687730dae0170059860f1f01
MWS Cloud запустила платформу хранения больших данных для обучения ИИ.
⚡️MWS Data Lakehouse - это целая экосистема, способная переваривать любые типы данных — структурированные, неструктурированные и векторные. А это значит, что теперь вся ваша информация — от отчетов о продажах и заказах до логистики — могут находится в одном месте.
Безопасность - на высшем уровне. В платформу встроены инструменты централизации контроля доступа, аудита и шифрования, динамического маскирования чувствительных данных.
При этом она легко интегрируется с Greenplum и Postgres, что позволяет бизнесу сохранить свои исторические активы, сократить цикл реализации проекта по миграции, а также снизить затраты и риски, связанные с переходом на новое решение.
Результаты говорят сами за себя:
• данные обрабатываются в 23 раза быстрее;
• хранилище используется на 40% экономичнее;
• персонал работает эффективнее в 2,5 раза;
• время расчетов аналитически витрин сокращается в 2 раза.
Поверх платформы можно запустить инструменты для обучения и инференса ML и больших языковых моделей. Компания может развернуть как свои сервисы для работы с ИИ, так и использовать готовые MLOps-инструменты MWS.
Генеративный ИИ для предприятий сегмента Enterprise: как выбрать пилотный проект с максимальной отдачей?
Крупные компании уже запускают первые проекты на основе генеративного искусственного интеллекта. Но как определить, какие решения принесут реальную пользу при ограниченных бюджетах и сжатых сроках реализации?
31 июля в 11:00 мск приходите на первый совместный вебинар Yandex Cloud и «Инфосистемы Джет», чтобы:
– узнать как выбрать перспективные ИИ-проекты для вашего бизнеса,
– увидеть демонстрацию рабочих GPT-решений по интеллектуальному поиску, технической поддержке, кибербезопасности и анализу отзывов,
– поучаствовать в разработке GPT-решения.
Все посетители вебинара смогу сделать свои проекты частью JET & YandexGPT Lab — новой российской платформы по разработке и тестированию GPT-решений для бизнеса.
Спикеры:
🔸Наиль Енаев, руководитель направления GPT «Инфосистемы Джет»
🔸Антон Чикин, начальник отдела ML «Инфосистемы Джет»
🔸Тарас Юзефович, менеджер по работе с партнерами ML&AI Yandex Cloud
Для кого:
▫️Руководители по ИТ и ИБ в крупных компаниях
▫️Ответственные за внедрение генеративного ИИ и больших языковых моделей
▫️Директора по данным, цифровизации и цифровой трансформации
➡️ Успейте зарегистрироваться на вебинар!
🧪 Octelium — новая open-source платформа для запуска и оценки LLM-агентов в реалистичных сценариях.
🔍 Что делает:
• Запускает LLM-агентов в симулированных задачах: от браузинга до программирования
• Оценивает их поведение, принятие решений и эффективность
• Работает локально, без облака
• Поддерживает мультимодельность и кастомные задачи
• Подходит для RL, alignment, eval-пайплайнов
📦 Отличный инструмент для исследований, тестов и продвинутых экспериментов с LLM.
🔗 github.com/octelium/octelium
🚨 Похоже у нас тут… первая утечка GPT‑5?
В репозитории biology-benchmarks-inspect
появился подозрительный новый идентификатор:
`gpt‑5‑reasoning‑alpha` 👀
🧠 Главное:
> 20 часов назад коммит заменил модель o3
на новую — gpt‑5‑reasoning‑alpha
Если репозиторий действительно внутренний (а он на это похож), то GPT‑5 уже где-то рядом.
🤖 Это могут быть предварительные тесты, бенчмарки или подготовка к релизу.
@data_analysis_ml
⚡ VoltAgent — TypeScript-фреймворк для создания автономных AI-агентов. Этот open-source проект предлагает готовую инфраструктуру для разработки сложных агентов на базе LLM, избавляя от необходимости писать всё с нуля. С его помощью можно создавать как простых чат-ботов, так и многоагентные системы с координацией через Supervisor и сложной workflow-логикой.
Фреймворк поддерживает популярные языковые модели, интеграцию с внешними API через Model Context Protocol и даже голосовые интерфейсы через @voltagent/voice. Для отладки есть VoltOps — платформа с визуализацией работы агентов.
🤖 GitHub
@data_analysis_ml
🎨 Откуда у диффузионок креативность?
Команда AI VK Hub разбирает свежую статью с ICML 2025:
Достаточно двух свойств свёрточных сетей — локальности и инвариантности к сдвигам, чтобы генерировать осмысленные и разнообразные изображения, даже без нейросети.
Аналитический процесс с этими ограничениями почти не уступает ResNet и U-Net по качеству — и отлично объясняет поведение диффузионных моделей.
⚙️ Rig — современная Rust-библиотека для работы с LLM, предлагающая унифицированный интерфейс для разных провайдеров ИИ. Проект выделяется акцентом на модульность и эргономику, позволяя интегрировать языковые модели в приложения с минимальным бойлерплейтом.
Инструмент уже используют в продакшене такие проекты, как Dria Compute Node и Linera Protocol. Библиотека поддерживает не только чат-модели вроде GPT-4, но и векторные базы данных, включая MongoDB и LanceDB.
🤖 GitHub
@data_analysis_ml
🛠️ Вышел Public Roadmap для Gemini CLI — команды хотят создать мощного, open-source Coding Agent, ориентированного на сообщество.
Проект развивается сразу по 4 ключевым направлениям:
1. Extensible
CLI должен быть легко расширяемым под любые среды и сценарии: кастомные slash-команды, удалённые протоколы, запуск .gemini.md
файлов с пользовательскими тулзами.
2. Everywhere
Агент можно запускать как фоновый процесс в разных окружениях: локально, в контейнерах, GitHub Actions, облаке. Поддерживается делегирование задач субагентам.
3. Intelligent
Фокус на качестве моделей и инструментов. Цель — попасть в топ по метрикам вроде SWE Bench. Все критические баги (P0) будут закрыты до релиза версии 1.0.
4. Open Source
Проект строится в диалоге с сообществом: быстрое реагирование на ишью и PR’ы, минимальный бэклог и удобные процессы участия.
🔄 Workstreams уже распределены:
- Качество модели (улучшение рассуждений, устранение повторов)
- Производительность (кеширование, умная маршрутизация моделей)
- Расширяемость (агенты в фоне, деплой в облако)
- Автоматизация сообщества (улучшение dev-флоу)
📌 Если хочешь участвовать в разработке следующего поколения AI-инструментов для кодинга — сейчас самое время подключиться к Gemini CLI.
https://github.com/google-gemini/gemini-cli/discussions/4226
🎙 Lex Fridman выпустил новое интервью с Demis Hassabis — CEO Google DeepMind.
🔍 В подкасте — всё, что волнует мир ИИ:
— будущее AI & AGI
— моделирование биологии и физики
— видеоигры, программирование, генерация видео
— world models и Gemini 3
— scaling laws, вычисления, P vs NP
— сложность, энергия, солнце и термояд
и многое другое.
💡 Техническое, глубокое и очень увлекательное интервью. Настоящий разговор о том, куда идёт ИИ.
📺 Смотреть на youtube
📺 Смотреть в X
@data_analysis_ml
🚀 Новый релиз: MegaScience
Открыт крупнейший и самый качественный датасет для постобучения моделей научному мышлению — 1.25 миллиона QA-пар!
🔬 Покрывает 7+ дисциплин: от физики до биомедицины
📚 Вопросы и ответы уровня университетских учебников
📈 Обученные на нём модели обгоняют официальные Instruct-бейзлайны
📄 Статья: https://huggingface.co/papers/2507.16812
🤖 Датасет и модели: https://huggingface.co/MegaScience
💻 Код: https://github.com/GAIR-NLP/MegaScience
🎯 Система оценки: https://github.com/GAIR-NLP/lm-open-science-evaluation
@data_analysis_ml
🚀 Qwen3-Coder — новая мощная open-source модель от Alibaba для кодинга
Модель с архитектурой MoE:
- 480B параметров в общей сложности
- 35B активных параметров
- Контекст 256k, но легко масштабируется до 1M токенов
📈 Производительность:
- На уровне Claude 4 Sonnet
- Лучше или на уровне GPT-4.1 на многих задачах
- Обходит Kimi K2, DeepSeek V3 на ряде бенчмарков
🧩 Модель уже доступна:
- На HuggingFace — можно скачать и запускать
- В OpenRouter — $1/M токенов вход, $5/M выход
(в 3 раза дешевле Claude Sonnet: $3 и $15)
Попробовать бесплатно можно:
🟡Через чат: ttps://chat.qwen.ai/)
🟡GitHub link: https://github.com/QwenLM/qwen-code
🟡 Blog:https://qwenlm.github.io/blog/qwen3-coder/
🟡 Model: https://hf.co/Qwen/Qwen3-Coder-480B-A35B-Instruct
Qwen3-Coder — это просто одна из лучших моделей для программирования, которые мы когда-либо видели.
#qwen #ml #ai #llm #Alibaba
@data_analysis_ml
🧠 Нейроаналитик — AI-агент для анализа и визуализации данных от Yandex B2B Tech.
🔍 Что делает:
• Помогает искать инсайты в таблицах и графиках
• Строит и редактирует визуализации по запросу на естественном языке
• Ускоряет отчёты и проверку гипотез примерно на 30%
• Работает внутри BI-сервиса Yandex DataLens
• Доступен в облаке и on-premises
• Не требует знаний синтаксиса формул или кода
Построен на базе Yandex Cloud AI Studio, где также можно собирать своих ИИ-ассистентов. Первая версия фичи появится в сентябре этого года, а пока можно записаться в лист ожидания.
@data_analysis_ml
🧱 Pi³ (Pi-Cubed) — новая SOTA‑модель, которая строит 3D‑модель объекта по фотографиям 📸
💡 Главное:
— На вход подается несколько фото с разных ракурсов — и она восстанавливает объёмную 3D‑форму
— Не важно, в каком порядке поданы изображения
— Модель сама определяет, где стояла камера, как выглядел объект в объёме, и выдаёт готовое 3D
⚙️ Под капотом:
— Работает без supervision
— Не требует фиксированной позиции камеры
— Отлично подходит для 3D‑сканирования, реконструкции, AR/VR и генеративных задач
📄 Paper: https://yyfz.github.io/pi3/
👨💻 Code: https://github.com/yyfz/Pi3
🤗 Demo: https://huggingface.co/spaces/yyfz233/Pi3
#3d #ml #reconstruction
🚀 Новая модель рассуждений — Hierarchical Reasoning Model (HRM) 🧠🤖
HRM — это ИИ, вдохновлённый тем, как устроен человеческий мозг: информация обрабатывается иерархически, от простого к сложному. И результат — впечатляет.
💡 Модель решает сложные задачи, такие как:
- ARC-AGI (бенчмарк на гибкое мышление)
- Судоку экспертного уровня
И всё это:
✅ Без предобучения
✅ Без Chain-of-Thought
✅ Всего на 1,000 обучающих примерах!
🔬 Это не просто новая модель — это подход, построенный на принципах нейронауки, и он уже показывает мощные результаты.
📄 Исследование: https://arxiv.org/abs/2506.21734
💻 Код на GitHub: https://github.com/sapientinc/HRM
@data_analysis_ml
Бесплатный курс по PostgreSQL от практиков рынка
Присоединяйтесь к бесплатному курсу по основам PostgreSQL от Selectel и Эльбрус Буткемп. Он будет полезен Junior- и Middle-специалистам: администраторам баз данных, разработчикам, DevOps-инженерам и аналитикам.
Вы научитесь:
🔹создавать и связывать таблицы,
🔹выполнять базовые операции с данными,
🔹работать с РСУБД.
Бонусы: вы можете получить сертификат о прохождении курса, а также промокоды для практики на мощностях Selectel.
Начните обучение уже сегодня.
Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqwqVE9D
🔍 Lucy (1.7B) — легковесная агентная модель веб-поиска на базе Qwen3, обученная только через RL, без привычного SFT.
📱 Заточена под мобильные устройства и CPU-only:
• Агентный поиск через Serper (Google API) + Crawl4AI
• Специальные векторные задачи направляют рассуждение
• Обгоняет DeepSeek-v3 на SimpleQA (MCP-бенчмарк)
• Работает с vLLM, llama.cpp, Jan, LMStudio
• Есть в формате gguf — для локального запуска на CPU
• Режим генерации: temp 0.7 / top-p 0.9 / top-k 20
https://huggingface.co/collections/Menlo/lucy-6879d21ab9c82dd410b231ca
💸 Марк Цукерберг предложил *Марку Чену перейти к нему — и, по слухам, миллиардер предложил 1 миллиард долларов.
Когда речь заходит о гонке за ИИ‑талантами, ставки становятся буквально космическими 💸
Марк Чен (Mark Chen) — ведущий исследователь OpenAI, занимающий пост Chief Research Officer / Senior VP of Research.
ML-инженеры и Data Scientists + One Day Offer = попадание в команду HR-платформы Сбера! 💚
26 июля вы сможете пройти экспресс-отбор в команду банка, которая делает поиск кандидатов проще и быстрее. Вот для каких задач вы будете искать и разрабатывать AI-решения:
✔️ ранжирование резюме или вакансий
✔️ рекомендации образовательного контента
✔️ распознавание документов
✔️ автоматизация рутинных процессов
✔️ прогнозирование оттока и внутренних перемещений
Регистрация на One Day Offer по ссылке!
🎆 Harbor — локальный стек для работы с LLM в один клик. Этот инструмент упрощает запуск локальных языковых моделей и связанных сервисов — от веб-интерфейсов до RAG и голосового взаимодействия. Всё работает в Docker и настраивается парой команд.
Harbor автоматически интегрирует компонентов, например, SearXNG сразу подключается к Open WebUI для поиска по вебу, а ComfyUI — для генерации изображений. Подходит тем, кто хочет быстро развернуть локальную среду для экспериментов с ИИ.
🤖 GitHub
@data_analysis_ml
🚗 python-can — универсальная библиотека для работы с CAN-шиной из Python. Этот проект предоставляет удобные абстракции для взаимодействия с различными CAN-адаптерами и поддерживает как классический CAN, так и CAN FD.
Библиотека обладает кроссплатформенностью и поддерживает множество бэкендов, включая SocketCAN, Kvaser, PCAN и другие. Полезно для автомобильной диагностики, робототехники и промышленной автоматизации.
🤖 GitHub
📊 ManusAI теперь умеет визуализировать данные красиво и без боли
Загружаете сырые данные → описываете, что хотите увидеть → выбираете тип графика → Manus сам всё строит.
Мы вот так выяснили, что среди трёх видов пингвинов — Адели, Антарктических и Генту — самые пухлые и длинноластые оказались именно генту. 🐧
Подходит идеально для:
— дашбордов и презентаций
— отчётов для коллег и инвесторов
— исследовательского анализа без кода
🎨 Приятный интерфейс, поддержка CSV, markdown-выгрузка и PDF. И всё это — бесплатно.
Попробовать: https://manus.ai
@data_analysis_ml
#manus
Рискните зарегистрироваться на One Day Offer и получите работу в команду блока «Риски» ⚡️
25 июля Сбер приглашает дата-инженеров и аналитиков данных пройти ускоренный отбор и открыть доступ к реально интересным задачам в 120+ витринах и 25+ петабайтах данных.
Встречаемся онлайн 25 июля в 10:30 — ссылка на регистрацию здесь!
Как уменьшить расходы на КХД в 7 раз и не отстать от AI гонки?
Нужно использовать КХД на архитектуре Lakehouse. 74% западных корпораций уже мигрировали на архитектуру Lakehouse, которая объединяет сильные стороны DWH и Data Lake, а также служит фундаментом для быстрого внедрения AI-инициатив.
Протестируйте VK Data Lakehouse — КХД нового поколения для уменьшения стоимости хранения данных и ускорения аналитики до 10 раз.
→ Дешевое хранение данных в S3-хранилище. Стоимость хранения 1 ГБ с репликацией в облаке уменьшается в 10 раз — с 30 до 3 рублей по сравнению с DWH.
→ Транзакционность для данных в S3-хранилище. Табличный формат поверх S3 обеспечивает ACID и полноценную работу в сценариях DWH.
→ Ускорение аналитики. MPP SQL-движок для параллельной работы с данными из разных источников без тяжелого ETL.
→ Уменьшение расходов за счет разделения compute и storage. Платите только за то, что используете. Нет затрат на простаивающие ресурсы.
→ Линейный рост затрат вместо экспоненциального при масштабировании.
→ Не нужно содержать отдельные команды под DWH и Data Lake.
→ Универсальное решение для работы с любым объемом данных. От гигабайт до сотен петабайт. Без сложного масштабирования и миграций.
→ Работа с ML становится быстрее без рисков уронить DWH. DS команда может экспериментировать с ad hoc запросами без опаски уронить DWH и BI.
Чтобы получить до 150 000 бонусных рублей для тестирования VK Data Lakehouse в VK Cloud с поддержкой архитекторов:
👉Оставляйте заявку
Будем рядом на всех этапах пилота и поможем довести MVP до результата.