Telegram-канал ai_machinelearning_big_data - Machinelearning: Технологии

Machinelearning

06 марта 2024 09:02

🦸‍♂️ Supermaven uses a 300,000-token context window to provide the highest quality suggestions with the lowest latency.

Состоялся релиз Supermaven — нейросети для генерации кода с контекстным окном 300 тыс. токенов

Разработчики выпустили ИИ-генератор кода Supermaven с контекстным окном 300 тыс. токенов. Это в разы больше, чем возможности GitHub Copilot. Supermaven обучили с нуля, а не адаптировали уже готовое решение.

Представители Supermaven отмечают, что разработчики всё чаще начинают использовать ИИ-генераторы кода на ежедневной основе. Из-за популярности подобных инструментов большие компании пытаются сократить расходы на обслуживании нейросетей, ограничивая контекстное окно. При этом чем больше контекстное окно, тем больше кода за один раз может обработать языковая модель. Поэтому компаниям приходится искать баланс между экономией и удобством для пользователей.

Supermaven разработала и обучила нейросеть на новой архитектуре с контекстным окном в 300 тыс. токенов. При этом сохраняется высокая скорость, а такое масштабное увеличение контекста не сказывается отрицательно на стоимости обслуживания модели в облаке. Для сравнения, Microsoft недавно увеличила контекстное окно Copilot до 8192 токенов.

Возможности Supermaven позволяют языковой модели за 10-20 секунд проанализировать репозиторий, включающий в себя кодовую базу продукта, методы API, документацию и стайлгайды. С помощью этой информации нейросеть будет генерировать не просто работающий код, но и идеально вписывающийся в проект. В блоге Supermaven отмечают, что GitHub Copilot генерирует качественный код только с теми API и библиотеками, которые находились в датасете.

Сейчас Supermaven доступен в виде расширения для VS Code и поддерживает более 70 языков программирования. ИИ-помощник работает по подписке, которую можно оформить за 10 долларов в месяц или 99 в год. Можно активировать пробный период на 30 дней.

▶️ Официальная страничка

@ai_machinelearning_big_data