всем привет) у кого есть домен и кто бы хотел лутанут 500 баксов)
Читать полностью…
даже при сильных галлюцинациях врет меньше чем Трамп😬😂
Читать полностью…
Берешь готовую ллмку, обучаешь через RL, файнтюн, получаешь что нужно
Читать полностью…
суверенная модель? 😁 это что-то новенькое.
В общем зачем это все было надо непонятно, достаточно было собрать датасет и отдать на откуп нашим крупным компаниям, чтобы они уже файнтюнили открытые модели под локальный инференс своих ботов. Но видимо надо было показать прототип. Дорого или дешево - не знаю. По мне так лучше бы закупили карты и дали доступ НИИ
А зачем с нуля? Мы хотим вступить в гонку между Китаем и США?
Читать полностью…
на этой да, но меня больше удивил GPQA тест
что касаяется дистиляций, так фронтиры же позакрывали цепочки глубоких рассуждений, так что догоняли и обгоняли опусы собственной синтетикой
Я бы сказал на этой арене больше чувство базового вебдизайна тестируется.
И кстати прям видно что глм дистилировали клодовские модели. Ооооочень похожий результат дает
А гпт, да, в вебдизайн ваще не умеет, крайне уродливо делает
Но вот только датасеты для обучения языку собрать автоматикой очень просто
Читать полностью…
Основная часть бюджета уходит на сбор качественного датасета
Читать полностью…
Взяли лламу, дообучили на текстах на казахском языке и бросили
Модель на уровне гпт 4о, судя по статам
Собирались обновлять каждые полгода, никаких обновлений нет)
Короче рассказываю) я работу в компаний где контракты и оплаты за работу проходить через deel.com короче там снизу увидел что если приглосить кого то по моей ссылке то я лутану 1000 баксов а тот кто пришел по. моей ссылке 500
Читать полностью…
Я пытаюсь найти видео с этого митапа и не могу. Я помню, что там была съемка. Кто этим занимался?
Читать полностью…
У Курсора моделька компоузер это обученный опенсорсный glm, проект вышел хороший, быстрый и недорогой
Читать полностью…
Зачем? Получился бы долгий дорогой проект с сомнительной ценностью, в сравнении с текущим
Читать полностью…
оказывается больше
https://www.yahoo.com/news/research-exposes-deepseek-ai-training-165025904.html?guccounter=1
А зачем становиться между Китаем и США? Говориться же о суверенитете, а лидерами пускай остаются лучшие
Читать полностью…
наверное от KazLLM все же ожидалось именно полной разработки с нуля по выделенному бюджету, а если для простого файнтюнинга то это слишком дофига
Читать полностью…
ну это очень даже дешево учитывая сколько OpenAI/Antropic потратили на свои наработки
Читать полностью…
его, на самом деле, делали (исполнители, не менеджмент) студенты, мастерс и другие сотрудники. подход был соотвествующий, кажется.
я не верил в качество самой модели