Наука, технологии, изобретения и урбанистика — прямо сейчас говорим о том, что уже скоро повлияет на каждого. по всем вопросам - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы
🔥 Это видео "стрима" было создано с помощью Sora!
🌟 Выглядит потрясающе.
@vistehno
🔍 Ничего необычного, просто роботы учатся играть в футбол.
@vistehno
📎 ML в медицине: дайджест за 16 - 22 декабря 2024 г.
▶️Модели, бенчмарки и датасеты
🔘MedMax: датасет для обучения мультимодальных медицинских моделей.
Большой набор медицинских изображений с текстовыми описаниями, на которой можно обучать и модели для работы с медицинскими данными.
🔘RadiologyLlama-70B: модель генерации отчетов в радиологии.
Модель, которая помогает врачам писать заключения, принимать решения и показывает лучшие результаты, чем обычные модели.
🔘Multi-OphthaLingua и CLARA: мультиязычный бенчмарк для оценки офтальмологических QA и RAG-система снижения предвзятости LLM.
Датасет на 1184 вопроса по офтальмологии, которые легли в основу RAG-системы CLARA.
🔘FactEHR: датасет для оценки способности LLM к декомпозиции фактов.
Набор из 2168 клинических записей 4 типов, который содержит 8665 декомпозиций фактов.
▶️Фреймворки и методологии
🔘ReflecTool: фреймворк для создания клинических агентов.
Фреймворк, который помогает лучше справляться с клиническими задачами за счет использования специальных инструментов.
🔘Process-Supervised Reward Model: улучшение качества генерации клинических заметок с помощью LLM.
Метод проверять качество медицинских заметок, созданных ИИ, оценивая их не целиком, а по шагам создания.
🔘LLM как эксперт: метод получения априорных знаний для прогностических моделей.
Методика использования LLM как "экспертов" для создания более точных начальных параметров в прогностических моделях с ограниченным количеством данных.
🔘ICS: сегментация медицинских изображений с контекстным обучением.
Улучшение сегментации последовательных медицинских изображений, используя предыдущие результаты для согласованности, без необходимости дополнительного обучения.
🔘HC-LLM: генерация радиологических отчетов с учетом исторической информации.
Система, которая использует историю рентгеновских снимков и отчетов для генерации более качественных радиологических отчетов с LLM.
▶️Медицинские LLM-приложения
🔘Система рекомендаций на основе MoE.
Система, объединяющая Mixture-of-Experts и языковые модели, для персонализированных рекомендаций здорового питания на основе текстовых и визуальных данных пользователя
🔘MCQG-SRefine: генерация медицинских тестов формата USMLE.
Система на базе GPT-4, которая автоматически генерирует сложные экзаменационные вопросы по медицинским темам.
🔘LookDeep Health: AI-платформа для непрерывного мониторинга пациентов.
Платформа, которая использует CV для непрерывного наблюдения за пациентами в больницах, отслеживая их перемещения и действия в реальном времени.
▶️Исследования и обзоры
*️⃣Влияние уровня объяснимости ИИ на доверие и точность диагностики рака молочной железы.
Исследование, которое показало, что чрезмерная детализация объяснений работы ИИ-систем поддержки врачебных решений может снижать доверие и точность диагностики среди врачей, и что более простые интерфейсы оказываются более эффективными.
*️⃣Исследование федеративного обучения с RAG для LLM в медицинской сфере
Сравнение нескольких подходов обучения для создания системы генерации медицинских текстов. Спойлер - LLM c RAG, лучше, чем без.
*️⃣Обзор методов агрегации эмбедингов для анализа гистопатологических изображений в клинической практике.
Сравнение, которое показало, что модели, обученные на медицинских данных, работают лучше, чем общие модели, и нет одного лучшего метода агрегации для всех задач.
🔜 Читать полный дайджест
🔜 Читать в Telegraph
@ai_machinelearning_big_data
⚡OpenAI официально представили o3 — обновленную и усовершенствованную версию o1. 🎉🔥
Результаты тестов просто поражают! Новая версия модели показывает уровень программирования, сравнимый с опытом сеньор-разработчика, оставляя далеко позади конкурентов и программистов. 😱
Однако есть и плохие новости: пока что доступ к этой версии для широкой публики предоставлен не будет. Сегодня ограниченная мини-версия модели передана командам, занимающимся вопросами безопасности, для тестирования.
Когда же состоится публичный релиз, у многих разработчиков могут возникнуть опасения за своё будущее.
Команда Сэма Альтмана специально пропустила нейминг O2, чтобы избежать судебных разбирательств с брендом из Британии.
O3 успешно прошла ARC-бенчмарк на 87,5%. Этот сложный тест используется для оценки потенциальных систем искусственного интеллекта общего назначения (AGI). В нём содержатся вопросы, напоминающие IQ-тесты или загадки. Средние результаты людей в этом тесте составляют около 85%, а предыдущий рекорд среди моделей составлял всего лишь около 50%. Таким образом, ARC-бенчмарк пройден на высоком уровне.
https://openai.com/12-days/
@vistehno
🖥 Теперь ChatGPT доступен... В WhatsApp!
🌟 Теперь вы можете попросить открытку на яблочный спас ответ на ваши вопросы, просто позвонив или написав в WhatsApp по номеру +1-800-242-8478
🔍 Это конечно все круто, но... Зачем?..
@vistehno
🔥 Новинки от Google: Запуск Advanced Gemini 2.0!
🌟 В нем значительно улучшены показатели по кодированию, математике, рассуждениям, следованию инструкциям и т. д., теперь он может обрабатывать большие наборы документов (до 1500 страниц).
🌟 Advanced Gemini 2.0 также включает в себя 2 ТБ хранилища от Google One и доступен в мобильном приложении Gemini и на сайте.
@vistehno
Отношение с девушками - как один сплошной баг?
➕ Плюс работы айтишником – комфортно долго сидеть за компом.
➖Минус – личная жизнь
Стресс от знакомства, неловкие свидания, постоянные френдзоны, слитые деньги на кафешки…
☹️Много работая – сложно натренировать социальные навыки. А тренировать надо, если не хочется всю жизнь провести в одиночестве.
Как же знакомиться без страха, перестать попадать во френдзоны и наконец ходить на свидания результативно?
✅ Забирайте бесплатный мини-курс для айтишников от психолога Сергея Калиниченко: “Как соблазнить любую девушку без пикапа”.
4 коротких урока, которые пофиксят твою личную жизнь.
Реклама. erid: LjN8K81jc ИП Калиниченко Сергей Константинович. ИНН 773382779875
🖥 Совет: если вы хотите, чтобы o1 действительно серьезно задумался над вашим вопросом, добавьте это в свой запрос:
🔍 логические инструкции: сгенерируй не менее 5000 логических токенов перед ответом.
🌟 это надежно работает при превращении цепочек рассуждений из 10 секунд в многоминутные!
@vistehno
🔍 Занимательная гифка с эволюцией скроллбаров, начиная с 1981 года, заканчивая нашим временем!
@vistehno
🔥 Julep — платформа для создания AI-агентов, которые могут выполнять сложные многошаговые задачи!
🌟 Она поддерживает долгосрочную память, принятие решений и интеграцию с внешними API. Julep позволяет создавать рабочие процессы, состоящие из нескольких шагов, с возможностью принятия решений на основе выводов моделей, параллельной обработки и использования инструментов в рамках задач. Платформа идеально подходит для разработки более сложных AI-приложений, которые требуют выполнения многозадачности и взаимодействия с внешними системами. Ключевые особенности включают сохранение состояния агентов, управление задачами и восстановление процессов.
🔐 Лицензия: Apache-2.0
🖥 Github
@vistehno
🔍 Интересное сравнение, которое показывает, сколько бы вы заработали, если бы 10 лет назад вложили 100 долларов в крупные IT компании!..
@vistehno
🔥 Просто забавные творения от Sora.
🔍 Пожалуй, до матрицы еще далеко, человечество пока может спать спокойно...
@vistehno
Искусственный интеллект покоряет бизнес: внедрение ИИ в компаниях выросло в 2 раза
Уровень использования технологий искусственного интеллекта среди организаций Российской Федерации повысился с 20% в 2021 году до 43% в 2024 году. А лидерами среди отраслей экономики и секторов социальной сферы по использованию технологий искусственного интеллекта (ИИ) являются сфера финансовых услуг, сектор информационно-коммуникационных технологий, высшее образование и топливно-энергетический комплекс. В них доля использующих ИИ организаций достигает 66%. Такие данные приводятся в аналитическом докладе «Индекс готовности приоритетных отраслей экономики Российской Федерации к внедрению искусственного интеллекта», подготовленным Национальным центром развития искусственного интеллекта при Правительстве Российской Федерации (НЦРИИ) при содействии Всероссийского центра изучения общественного мнения (ВЦИОМ). В отчете проанализированы 36 показателей по 11 направлениям, характеризующих развитие ИИ. Перечень таких показателей в том числе включает наличие отечественных решений на основе технологий ИИ на российском рынке, специалистов в области ИИ, инфраструктуры и др. В 2024 году в исследовании приняли участие более пяти тысяч организаций в 19 отраслях экономики и секторах социальной сферы.
Среди других выводов исследования отмечается значительный рост востребованности использования технологий обработки естественного языка, распознавания и синтеза речи. Наблюдается рост качества ИИ-систем и их эффективности: в этом году 97% организаций, использующих искусственный интеллект, получили положительный эффект от его применения. Кроме того, существенный и многократный экономический эффект от применения ИИ организации стали отмечать в 2,5 раза чаще за последние три года. При этом значимыми барьерами широкомасштабного внедрения ИИ остаются недостаток кадров и финансирования.
В рамках исследования представлена динамика развития искусственного интеллекта в 19 отраслях экономики; изучен опыт организаций, внедривших искусственный интеллект; определены потребности российских организаций в возможных мерах государственной поддержки для расширения практики использования искусственного интеллекта и увеличения эффективности его использования; выработаны рекомендации по нивелированию проблем, возникающих при внедрении искусственного интеллекта.
С полной версией отчета можно ознакомиться по ссылке: База знаний Национального портала РФ по искусственному интеллекту и нейросетям
Индекс рассчитывается с 2021 года при поддержке Правительства РФ в рамках федерального проекта «Искусственный интеллект» национальной программы «Цифровая экономика Российской Федерации». Результаты исследования используются в рамках исполнения поручения Президента Российской Федерации Пр-172, п.1 г) - 2 от 29.01.2023.
@vistehno
🌟 BioNeMo: фреймворк разработки ИИ-моделей для дизайна лекарств.
NVIDIA BioNeMo2 Framework - это набор инструментов, библиотек и моделей для вычислительного поиска и разработки лекарственный препаратов.
Он ускоряет самые трудоемкие и дорогостоящие этапы создания и адаптации моделей биомолекулярного ИИ, предоставляя оптимизированные модели и инструменты, которые легко интегрируются в вычислительные ресурсы на базе GPU.
Фреймворк позволяет создавать, обучать и настраивать модели, его возможности охватывают различные рабочие нагрузки и терапевтические механизмы: генерация молекул, предсказание структуры белка, белок-лиганд и обучение представлениям.
Помимо кода пайплайнов, скриптов и утилит, BioNeMo2 Framework содержит:
▶️Предобученные модели:
🟢ESM-2 - предварительно обученный двунаправленный энкодер (BERT-подобный) для аминокислотных последовательностей. BioNeMo2 включает в себя чекпоинты с параметрами 650M и 3B;
🟢Geneformer - модель табличного подсчета, которая генерирует плотное представление sc-RNA клетки путем изучения паттернов коэкспрессии в отдельных клетках.
▶️Датасеты:
🟠CELLxGENE - совокупность общедоступных single-cell наборов данных, собранных в CZI (Chan Zuckerberg Initiative) общим объемом в 24 млн. клеток;
🟠UniProt - база данных кластеризованных наборов белковых последовательностей из UniProtKB, созданная на основе транслированных геномных данных.
📌Лицензирование: Apache 2.0 License.
🟡Страница проекта
🟡Документация
🖥GitHub
@ai_machinelearning_big_data
#AI #ML #Framework #NVIDIA
🌟 DeepSeek-V2.5-1210: файнтюн базовой DeepSeek-V2.5.
Файнтюн модели DeepSeek-V2.5 с 236 млрд. параметров с улучшенными показателями в математических вычислениях, программировании, генерации текста и рассуждении. В модели также оптимизированы функции загрузки файлов и обобщения веб-страниц.
Точность решения задач с DeepSeek-V2.5-1210 на LiveCodebench выросла с 29,2% до 34,38% относительно родительской DeepSeek-V2.5, в математических тестах MATH-500 с 74.8% до 82.8%.
DeepSeek-V2.5-1210 поддерживает function calling и использует обновленный шаблон чата для расширения возможностей модели.
⚠️ Чтобы использовать модель в инференсе с BF16 требуется 8 GPU c 80 GB VRAM каждый.
▶️Пример инференса DeepSeek-V2.5-1210 на Transformers:
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, GenerationConfig
model_name = "deepseek-ai/DeepSeek-V2.5-1210"
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
# `max_memory` should be set based on your devices
max_memory = {i: "75GB" for i in range(8)}
# `device_map` cannot be set to `auto`
model = AutoModelForCausalLM.from_pretrained(model_name, trust_remote_code=True, device_map="sequential", torch_dtype=torch.bfloat16, max_memory=max_memory, attn_implementation="eager")
model.generation_config = GenerationConfig.from_pretrained(model_name)
model.generation_config.pad_token_id = model.generation_config.eos_token_id
messages = [
{"role": "user", "content": "Write a piece of quicksort code in C++"}
]
input_tensor = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt")
outputs = model.generate(input_tensor.to(model.device), max_new_tokens=100)
result = tokenizer.decode(outputs[0][input_tensor.shape[1]:], skip_special_tokens=True)
print(result)
Apple в конце 1994, 2004, 2014 и 2024
@vistehno
⚠️Внимание, тестировщики!
Узнали себя на ролике? Сколько раз вы, как и Борис, путались в десятках телефонах и вкладках эмуляторов? Сколько раз вручную запускали приложения на нескольких телефонах одновременно?
В видео от Selectel эта старая и очень неудобная QA-реальность показана так наглядно, что хочется забыть о ней раз и навсегда. И это возможно благодаря Мобильной ферме!
Это решение от Selectel для удаленного тестирования мобильных приложений на реальных устройствах, а не на эмуляторах. Здесь доступно более 100 моделей смартфонов, чтобы проверять удобство интерфейсов, проводить автотесты и параллельное тестирование на множестве устройств.
А как проводите тестирование вы? Пишите в комментариях
Реклама. АО “Селектел”, ИНН: 7810962785, ERID: 2VtzqvncsUv
🔥 BgSub — сервис, который позволяет легко менять фон на однотонный цвет, градиент или другое изображение!
🌟 Также поддерживаются функции настройки размера, положения и зеркального отображения. BgSub особенно полезен для фотографов, маркетологов, разработчиков приложений и пользователей социальных сетей, желающих быстро создавать качественные изображения без сложных инструментов.
🔗 Ссылка: *клик*
@vistehno
⚡️ Великая классика «Героев 3» прямо у вас в браузере!
Теперь вы можете играть в «Героев 3» прямо в браузере на любом устройстве! Российские разработчики создали бесплатную версию этой культовой стратегии, которая запускается мгновенно на любой платформе.
Основные особенности:
- Универсальность: работает на Windows, Linux, macOS, а также на устройствах под управлением Android и iOS.
- Сохранения: доступны как локальные сейвы, так и сохранение через кэш браузера.
- Официальные кампании: включены «Возрождение Эрафии», «Клинок Армагеддона» и «Дыхание Смерти».
- Кастомизация: более 160 пользовательских сценариев и встроенный генератор карт.
- Высокие разрешения: игра поддерживает современные экраны с высоким разрешением.
Как начать играть:
1. Перейдите по ссылке на игру.
2. Нажмите «Продолжить» — начнется загрузка необходимых ресурсов.
3. После завершения загрузки нажмите «Запустить игру».
Готово! Наслаждайтесь неделей «Героев».
@vistehno
🔥 Сравнение 8 ИИ-моделей для создания видео!
🔍 Промпт: POV Жуткая находка секретных подземных туннелей возле ядерного реактора в лесу, трясущаяся съемка с телефона, ненасыщенные синие, зеленые и серые тона, напряженное настроение, научно-фантастический хоррор
@vistehno
🔥 Все это сгенерировано с помощью Google Veo 2!
🌟 Выглядит впечатляюще!..
@vistehno
🖥 Сегодня девятый день стримов OpenAI из двенадцати, и они демонстрируют множество новых возможностей API o1:
— В API o1 теперь реализована работа с изображениями, возможность внутренних вызовов ассистентов (когда моделям необходимо выполнять вычисления), а также вывод данных в формате JSON.
— Улучшена настройка точности выполнения инструкций.
— Появилась функция Reasoning Efforts, позволяющая пользователям регулировать степень размышлений модели над задачей.
https://www.reddit.com/r/singularity/comments/1hgfttc/openai_day_9_for_developers/
@vistehno
Уже забыли, когда кодили что-то нестандартное?
Приглашаем тряхнуть стариной на бесплатном мини-курсе от Skillbox «Python для всех». Он состоит из практики чуть меньше чем полностью. За 4 дня мы создадим 4 проекта:
1️⃣ Бота для Telegram, который умеет переводить голос в текст
2️⃣ Бота для Telegram, который обрабатывает фотографии
3️⃣ Парсер, который извлекает данные с сайтов
4️⃣ Веб-сайт (с помощью фреймворка Flask)
В общем, прокачаете навыки, освежите память и наверняка узнаете что-то новое.
Регистрируйтесь: https://goo.su/kpfB?erid=2VtzqxQdkrm
🎁 А ещё подарки: персональная карьерная консультация, скидка 10 000 рублей на любой курс Skillbox и подборка полезных материалов.
Вас ждет новогодняя распродажа в Skillbox: дарим скидки до 60% и 3 курса в подарок!
Реклама. ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)», ИНН: 9704088880
📎 ML в медицине: дайджест за 8 - 15 декабря 2024 г.
▶️Модели, бенчмарки и датасеты
🔘Модель диагностики хронического заболевания почек.
Модель глубокого обучения, которая с высокой точностью диагностирует болезни почек по данным КТ-снимков.
🔘RNAgrail: графовая нейронная сеть и диффузионная модель для предсказания 3D-структуры РНК.
Опенсорсный инструмент моделирования и прогнозирования структуры РНК.
🔘LLaSA: Анализ активности пациента по инерционным датчикам с помощью MLLM.
Mодель, которая может анализировать данные с датчиков движения и отвечать на вопросы о действиях и активности человека.
▶️Фреймворки и методологии
🔘TOP-Training: целенаправленный метод обучения LLM для извлечения ответов на вопросы в медицинской области.
Метод обучения на синтетических данных, адаптированных под конкретную медицинскую задачу.
🔘Hybrid RAG: гибридная архитектура RAG для управления данными.
Концепт системы, которая использует MLLM и взаимодействие между клиниками для обмена медицинскими данными, улучшении диагностики и теорию контрактов, которые мотивируют клиники делиться актуальной информацией.
🔘MMedPO: метод повышения точности медицинских VLM.
Метод, который учитывает важность медицинской информации при обучении VLM и улучшает точность моделей в медицинских задачах.
🔘GMNA: анализ геномных данных с использованием сети ошибочной классификации.
Метод, который сравнивает геномы вирусов SARS-CoV-2 на основе ошибок в их классификации нейронными сетями. Чем чаще модель путает геномы из разных регионов, тем больше у них общего. Этот подход помог увязать генетические различия вирусов с географией и потоками авиаперелетов.
🔘Цифровые отпечатки для обучения ИИ в медицинской визуализации.
Способ хранить и передавать знания о том, как обучать ИИ анализировать медицинские изображения, не раскрывая данные.
🔘Прогнозирование посещений отделения неотложной помощи пациентами с диабетом 2 типа с помощью машинного обучения.
Применение разных ML-алгоритмов, чтобы спрогнозировать, когда пациенты будут ходить в отделение неотложной помощи. Лучше всего справлялись случайный лес, XGBoost и ансамблевая модель.
▶️Медицинские LLM-приложения
🔘BRAD: цифровой помощник для биоинформатики на основе LLM.
Цифровой помощник, который умеет искать и подтягивать информацию из разных источников - статей, баз данных, программных инструментов.
🔘BioResearcher: система автоматизации медицинских исследований.
Система с LLM, которая помогает ученым быстро находить нужные статьи, обрабатывать их, планировать эксперименты и даже писать отчеты.
▶️Исследования и обзоры
*️⃣T5-модели: преимущества и ограничения в обработке медицинских текстов.
Исследование, в котором сравнили разные модели Т5, обученные на медицинских данных, и выяснили, что специализированные клинические модели показывают лучшие результаты на некоторых задачах, но им не хватает гибкости. А модели общего назначения, адаптированные под медицинские задачи, оказываются эффективнее, особенно когда данных мало.
*️⃣Автоматизация классификации препаратов для клинических назначений с помощью LLMs.
Концепт системы, которая использует LLM для автоматической классификации лекарств по Анатомо-терапевтическо-химической системе. Это упрощает работу медиков и повышает точность распределения препаратов.
*️⃣Обзор медицинских наборов данных.
Обзор мед. датасетов - текстов, картинок, разговоров врачей и пациентов, которые используются для обучения ИИ-моделей решать медицинские задачи. Есть много интересных и полезных баз данных, но в основном на английском и китайском языках.
🔜 Читать полный дайджест
@ai_machinelearning_big_data
⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:
МАШИННОЕ ОБУЧЕНИЕ: t.me/ai_machinelearning_big_data
C++ t.me/cpluspluc
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Хакинг: t.me/linuxkalii
Devops: t.me/DevOPSitsec
АНАЛИЗ Данных: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/javatg
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Docker: t.me/DevopsDocker
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
Собеседования МЛ: t.me/machinelearning_interview
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: /channel/gamedev
Haskell: t.me/haskell_tg
💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: /channel/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: /channel/addlist/mzMMG3RPZhY2M2Iy
😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno
🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: /channel/addlist/BkskQciUW_FhNjEy
⚡️ DeepSeek-VL2: релиз набор VL-MoE моделей нового поколения.
DeepSeek-VL2 - усовершенствованная серия VLM c Mixture-of-Experts (MoE), которая значительно превосходит DeepSeek-VL.
Модели семейства ориентированы на задачи визуальных ответов на вопросы, оптического распознавания символов, понимания документов/таблиц/схем и визуального обоснования.
DeepSeek-VL2 включает три основных модуля:
🟠Визуальный энкодер SigLIP-SO400M-384, который использует динамическую стратегию разбиения изображения на фрагменты. Эта стратегия позволяет эффективно обрабатывать изображения высокого разрешения с различными соотношениями сторон.
🟠VL-адаптер, преобразующий визуальные элементы в формат, понятный языковой модели. Адаптер также добавляет специальные маркеры, чтобы обозначить границы строк, фрагментов и миниатюр.
🟠Языковая модель DeepSeek-MoE с механизмом MLA. MLA повышает эффективность обработки информации, сжимая kv-данные в компактный вектор. Это ускоряет обработку информации и увеличивает пропускную способность.
DeepSeek-VL2 обучается в три этапа: на первом этапе обучается MLP-соединитель, который связывает визуальный энкодер с языковой моделью, затем модель обучается на датасете из текста, изображений, аннотаций, QA и данных OCR и, в конце процесса, дообучается с учителем для улучшения ее способности понимать инструкции и вести диалог.
Модельная серия состоит из 3 вариантов c контекстом 4096:
🟢DeepSeek-VL2-Tiny (1B активных параметром и 3.4В общих);
🟢DeepSeek-VL2-Small (2.8B активных параметром и 16.1B общих);
🟢DeepSeek-VL2 (4.5B активных параметром и 27.5B общих).
DeepSeek-VL2 была протестирована на задачах DocVQA, ChartQA, InfoVQA, TextVQA, MMBench и показала лучшие результаты по сравнению с другими моделями MoE.
DeepSeek-VL2 эффективно использует архитектуру MoE и превосходит другие модели с аналогичным количеством активных параметров.
📌Лицензирование: DeepSeek License.
🟡Набор моделей
🟡Техотчет
🟡Сообщество в Discord
🖥GitHub
@ai_machinelearning_big_data
#AI #ML #VLM #DeepSeek
🔥 MagicPatterns — это онлайн-инструмент, способный генерировать классный дизайн по одному текстовому запросу!
🌟 Платформа помогает дизайнерам и разработчикам быстро создавать визуально привлекательные элементы для веб-сайтов, приложений и других цифровых проектов.
🔗 Ссылка: *клик*
@vistehno
🔥 Это видео, воссоздающее Tekken 8, полностью сгенерировано ИИ!
🔗 Оригинал: *клик*
@vistehno
🔥 MagicPatterns — это онлайн-инструмент, способный генерировать классный дизайн по одному текстовому запросу!
🌟 Платформа помогает дизайнерам и разработчикам быстро создавать визуально привлекательные элементы для веб-сайтов, приложений и других цифровых проектов.
🔗 Ссылка: *клик*
@vistehno
🔥 Julius.ai — полезный и бесплатный ИИ-сервис для визуализации данных!
🌟 Он отлично справляется даже с большими объемами информации. Так, на видео выше он без проблем составил интерактивную карту счастья населения по странам.
🔗 Ссылка: *клик*
@vistehno