Команда Qwen представила QwQ32B (Qwen with Questions) — экспериментальную ОТКРЫТУЮ модель, которая ставит под сомнение привычное понимание ИИ. QwQ стремится глубже понимать окружающий мир, исследуя каждую задачу через размышления и самопроверку.
Модель демонстрирует значительные успехи:
GPQA: 65,2% — сложные научные задачи;
AIME: 50% — решение задач по математике;
MATH-500: 90,6% — глубокие математические знания;
LiveCodeBench: 50% — решение реальных программных задач.
QwQ ещё на пути развития: она совершенствуется в языке, избегает циклов в рассуждениях и адаптируется к сложным задачам. Эта модель открывает новые горизонты для аналитики и решений, двигаясь в сторону ИИ будущего.
https://qwenlm.github.io/blog/qwq-32b-preview/
Короче эпик, открытая модель 32B уровня gpt o1, что ждёт нас дальше?
Sora от OpanAI слили свои же сотрудники в сеть, в интересные времена живём🤷♂️
https://x.com/legit_rumors/status/1861431113408794898?t=d8HFeYyJS25G65IKnFEBZw&s=19
https://huggingface.co/spaces/PR-Puppets/PR-Puppet-Sora - уже не открывается, но скачать то успели, будут распространять👌
вот уже видосики успели нагенерить (ну и под постом в твиттере их много)
https://streamable.com/pi1tq9
https://streamable.com/tx9orh
https://streamable.com/626t9r
Google как-то без шума представили LearnLM, семейство моделей ИИ, основанных на Gemini и разработанных для обучения. LearnLM применяет принципы обучения, такие как активное вовлечение, управление когнитивной нагрузкой и адаптация к ученику, в продукты Google, включая Поиск, YouTube и Gemini. В Поиске появится возможность упрощать сложные темы, а в YouTube – задавать вопросы во время просмотра образовательных видео. Gemini получит «коуча по обучению» для пошагового руководства🎓
Протестить можно в AI studio (с VPN) ну и не забываем про отдельный сервис Learn About, обучение никогда не будет прежним👌
Mistral, французский стартап, представил Pixtral Large — мощную мультимодальную модель с 124 миллиардами параметров. Она сочетает текстовый анализ и обработку изображений, превосходя конкурентов в таких задачах, как распознавание текста (OCR), анализ графиков и документов. Контекст 128к токенов.
Модель доступна бесплатно на Hugging Face для исследований (с ограничениями лицензии Mistral Research License). Для коммерческого использования необходима лицензия или доступ через API на платформе Mistral.
Попробовать можно в чат-боте Le Chat (ещё один бесплатный чат без впн уровня GPT4o🌚) Mistral активно укрепляет позиции на европейском рынке искусственного интеллекта👌
Просто, чтобы оценить скорость прогресса в LLM-сфере за последние 2 года: китайская моделька Yi-Lightning, которая занимает 6 место на арене, была обучена на 2000 графических процессоров и при бюджете в $3 млн🤯 тогда как OpenAI потратили на GPT-4 (которую Yi-Lightning обходит) от $80 до $100 млн.. Санкции, похоже только стимулируют Китай на инновации и оптимизацию вычислений, благодаря которым они и добились таких результатов (как и в недавней Qwen 2.5) В общем вопрос, кто достигнет AGI первым и каким способом, остаётся открытым🌚
Читать полностью…Если вы пропустили, то вчера вышла новая моделька Qwen 2.5 coder на 32b параметров, ну и она пишет код на уровне gpt4o🤯 для неё хватит и 16gb видео, а 14b и 7b, которые недалеко по бенчмарку ушли вообще на коленках можно запускать, this is big! 🔥
Опенсорс так скоро догонит и reasoning, как в o1 от OpenAI 🌚
https://huggingface.co/Qwen/Qwen2.5-Coder-32B-Instruct
Кажется, OpenAI достигли потолка scaling law.
The Information (от них последнее время приходит много интересной информации) поделились неутешительными новостями о следующей LLM от империи Альтамана.
С одной стороны, o1, пройдя всего 20% тренировки, уже достиг уровня GPT-4. С другой — источники в OpenAI говорят, что следующая модель хоть и обещает быть лучше предшественника в целом, но «не надежно лучше своего предшественника». Именно поэтому обсуждается смена парадигмы нейминга. Чтобы справиться с вызовами скейлинга, OpenAI создали специальную команду — foundation team. Похоже, мы можем не дождаться ChatGPT-5. o1, конечно, выглядит перспективно, но это всего лишь один из примеров смены направления развития.
Как видно из успеха o1, следующий шаг в развитии LLM-моделей лежит не в увеличении объема данных (их, кстати, уже не хватает — в датасете уже куча синтетики), а в поиске новых подходов к скейлингу. Один из таких подходов — это chain of thought, который по сути получает прирост в качестве за счет скейлинга количества компьюта во время инференса.
Еще одно важное направление — это агенты. Антропик уже продемонстрировали computer use, так что ответ от OpenAI не заставит себя ждать (как минимум еще во время презентации 4o gpt-ишка смотрела на экран юзера). Правда, точных дат нам не называют, и это, возможно, к лучшему — не хотелось бы снова ждать полгода, как это было с voice mode после первого анонса.
И да, Orion ожидается early next year, что на языке OpenAI это может означать период с января до середины июля :)
@ai_newz
Тут для современных моделек представили новый математический бенчмарк Frontier Math, который включает задачи, на решение которых у профессионалов уходит несколько дней. Современные модели справляются менее чем с 2% задач, несмотря на доступ к Python и большому количеству токенов. Для создания задач привлекли более 60 математиков, включая обладателей 14 золотых медалей IMO и одной Филдсовской премии.
Задачи оригинальны и требуют значительной работы, чтобы ответ не был угадан случайно. Подготовка к новым моделям идёт полным ходом, интересно будет пообщаться с ИИ (AGI) который рвёт этот бенчмарк в клочья (и почувствовать себя умственно отсталым🌚)
Я вообще тут подумал, что в какой-то момент выход каждой новой модели ИИ в массы будет больше пугать, чем восхищать, будем ещё топить за замедление темпа🫥
Я тут спросил Gpt 4о про апдейты выборов президента США, а мне предложили протестить новую модель о1🌚 Думаю, после выборов начнётся пора релизов различных AI чудес✨
Читать полностью…Пишут по этой линке уже доступна модель ChatGPT o1
https://chatgpt.com/?model=o1
Для платных подписок и по идее с десктопа надо
В общем точно скоро релиз раз такое дело и скорее всего после вторника, то есть выборов в США 🌚
UPD
Уже недоступна⛔️ но всех кто заюзал успела впечатлить
Видимо Google после успеха notebook LLM решил релизить необычные ИИ - сервисы, на этот раз — Learn About, который сделает погружение в любую тему интерактивным иии глубоким 🌚
Буду тестить позже, пока оставлю вам, выглядит интересно ✨
Не забывайте про VPN USA
OpenAI представили обновленную функцию поиска в ChatGPT✨ предлагающую быстрые и актуальные ответы с ссылками на релевантные веб-источники. Функция доступна пользователям ChatGPT Plus и Team.
Обновленный поиск интегрирован с новостными и информационными источниками, такими как AccuWeather, Reuters и Financial Times и др. Поиск также поддерживает голосовые и визуальные функции, помогая находить нужные ответы быстрее и удобнее.
Но пока далеко до угрозы гуглу, особенно что поиск там идёт в связке с браузером и всем к нему прилегающим🌚
https://openai.com/index/introducing-chatgpt-search/
Сундар Пичаи сообщил, что более 25% нового кода в Google теперь создается с помощью ИИ, что ускоряет разработку и оптимизирует внутренние процессы. Внутри компании они используют интернал модель Goose, которая обучена на базе данных собранной за 25 лет.
Интересно, насколько изменится этот показатель за год, как и количество сотрудников причастных к разработке 🌚
Google разрабатывает Jarvis - ИИ-агента на базе Gemini 2.0, который сможет автоматизировать веб-задачи в Chrome. Запуск ожидвается в декабре для ограниченного числа пользователей, потом уверен раскатят на всех👌 Ну и про подарки на др OpenAI не забываем, всё это разогрев перед 2025✨
Читать полностью…Ну вы поняли🌚 Похоже до крупных релизов Google и OpenAI решили выдавать каждые 2 дня небольшие улучшения текущих версий своих моделей🤷♂️
Ну что остаётся, пробуем👌
Горячая пора на релизы продолжается🔥 и снова Китайцы:
Китайская лаборатория DeepSeek представила модель R1-Lite — бесплатного конкурента o1, который вскоре будет доступен в опенсорсе. По тестам она приближается к o1-preview, а в некоторых задачах даже превосходит её. R1-Lite эффективно использует длинные размышления, что улучшает результаты. DeepSeek обещают опубликовать API, опенсорс-код и детальный технический отчёт о тренировке.
Важно: это лишь "облегчённая" версия, чтобы протестировать технологии перед созданием полноценной R1. Попробовать модель можно бесплатно на сайте DeepSeek, активировав режим «Deep Think».
И по слухам OpenAI на днях релизнет полноценную o1🌚
Оказывается Mistral может не тока в вебе искать, а ещё и canvas как в ChatGPT и Artifacts как в Claude запускать, надо на первую иконку с файлом нажать ✨
Читать полностью…Google выкатили пощупать новую экспериментальную модель Gemini exp 1114, которая сразу же стала лидером на чат-бот арене ✨
Пробуем тут с VPN USA https://aistudio.google.com/app/u/3/prompts/new_chat
Лимит контекста пока 32к токенов
Подходил к концу 2024 год и я решил пройти... Скайрим✨
Но к нему я прикрутил локальную LLM Mistral 7b и простенький синтезатор голоса, так что моих 8gb видео с лихвой хватает для полного погружения (я думаю хватит и 4, Мистрал совсем нетребовательная, хотя по бенчмарку Language Understanding на уровне gpt 3.5👌) и бесконечного общения с любым NPC🫶 Можно добавлять в беседу сразу несколько человек (начало диалога грузит чуть дольше), просить выполнить простейшие действия и узнавать детали квеста, как в моём разговоре меня попросили найти должника в таверне, что по итогу приведёт к настоящему квесту и это всё локально и бесплатно🤯 Я теперь буду отслеживать опенсорс модельки, но уже этой хватает чтобы взрывать мозг и по настоящему погружаться в игру🧙♀️
Так можно и новый формат прохождений начать на YouTube 🤔 попробую потом улучшить мод, чтобы больше функций было у нпс и русский прикручу🌚
P.S.
Попробую перезалить в лучшем качестве видео
Скульпторам ничего не грозит говорили они.. Понятно, что ручной труд и опыт ничто не заменит, но как бизнес модель где можно штамповать изваяния на продажу очень даже сработает 🤓
Читать полностью…Итак, выборы прошли и сразу посыпались новые модели ✨
Кто-то уже получил предварительный доступ к Gemini 2 и ходят слухи о скором релизе🔥
И на LLM арене сразу 3 новые модели Gemini test, big-engine, blueberry👌
эмм оказывается в Google AI Studio совершенно без помпы вчера добавили новую функцию Grounding (обоснование), которую ещё и настроить можно вручную, которая снижает галлюцинации модели используя поиск Google при необходимости (решает сама когда подкреплять ответы) и естессна с выдачей ссылок на источники👌
Например:
Низкая потребность в обосновании: Для запроса вроде «Напиши стих о пионах» модель не обращается к Google, так как её знаний достаточно.
Средняя потребность: Для рецепта, как «Азиатский гуакамоле», модель может обратиться к Google, если порог настроен низко.
Высокая потребность: Для актуального запроса, например, «Кто выиграл последний этап Формулы-1?», модель обязательно подключится к Google для проверки свежих данных.
В целом всё это есть в ChatGPT, но тут более тонкая настройка и как бы Google больше пока доверяю в вопросах поиска 🧐
Ничего необычного, просто читинг на интервью с помощью ChatGPT, ну и двойного скотча🌚
Читать полностью…Сейчас проходит OpenAI Dev Day в Лондоне, одно из мероприятий в рамках Dev Day 2024 (ещё одно планируется в Сингапуре 21 ноября) ну и вот свежачок🔥
Речь идёт о новых функциях o1 (не preview):
Function Calling – возможность вызывать определённые функции, улучшая взаимодействие с другими программами.
Developer Messages – сообщения, которые могут облегчить взаимодействие разработчиков с AI.
Streaming – выдача ответа частями, пока модель продолжает обдумывать следующую часть.
Structured Outputs – структурированные результаты, упрощающие интеграцию данных.
Image Understanding – расширенные возможности работы с изображениями.
Полный релиз o1 ожидается вскоре👌
Nvidia сделала презентацию своей системы для обучения роботов 🤖 Хуанг хочет и этот рынок захватить 🌚
https://youtu.be/uhLDHA9skFk?si=TnaKN33GcAaUaztG