Telegram-канал hikonon - Кононюковщина: Неотсортированное - каталог телеграмм

hikonon | Неотсортированное

Подписаться на канал

Telegram-канал hikonon - Кононюковщина

431

Про AI, ML, IT и другие двухбуквенные сферы Для связи - @kononyuk

Подписаться на канал

Кононюковщина

12 сентября 2024 17:10

Тяжело строить IT-стартап в России...

Вчера, 11 сентября, sentry.io, сервис для отслеживания ошибок и измерения производительности приложений, заблокировал аккаунты российских пользователей.

Это стало личным ударом: качество моего проекта gamio.ru держалось, в том числе, благодаря мониторингу sentry. Иронично, что это была единственная зависимость от зарубежного SaaS. Ощущения такие, будто перекрыли доступ к кислороду.

Интересно и то, что в компании так заморочились, что их сайт невозможно открыть даже через VPN. Self-hosted для маленьких проектов тоже сделать невозможно - нужен несоизмеримо мощный сервер, а это дорого и вряд ли окупится.

Буду искать замену

#постнытья
@hikonon

Читать полностью…

Кононюковщина

08 августа 2024 16:31

CogVideoX: китайцы выпустили text2video модель с открытым доступом

- Генерирует 6-секундные видео с частотой 8 кадров/сек с разрешением 720x480 пикселей
- Модель потребляет 24 ГБ VRAM, на генерацию одного видео уходит ~90 секунд

🤗 HuggingFace
@hikonon

Читать полностью…

Кононюковщина

05 августа 2024 15:57

Пока я переживаю творческий кризис, расскажу о своих бесполезных, но забавных проектах.

Три года назад, когда ни о каком StableDiffusion и речи не было, я обучил GAN рисовать лапшу Роллтон в разных образах. В компании мои старания не оценили, поэтому оставлю это здесь.

Удивительно, как за столь малый промежуток времени развились технологии.

#useless

Больше фотографий
@hikonon

Читать полностью…

Кононюковщина

21 июля 2024 13:52

Отдыхаю от всего мира на Байкале

Читать полностью…

Кононюковщина

13 июня 2024 15:31

🔍 Aeonium v1.1 Base 4B

Модель обучена на литературе, стихах, Википедии и коде

@hikonon

Читать полностью…

Кононюковщина

31 мая 2024 15:40

🤗 Aeonium-v1-Base-4B

Новая модель из серии Aeonium. Все то же самое, что и в 1B, только обучена на большем количестве токенов.

По результатам бенчмарка ruMMLU, это лучшая открытая языковая модель, обученная на русском языке с нуля.

Конечно, до SOTA еще далеко, но первый шаг уже сделан. Instuct-версия будет чуть позже.

@hikonon

Читать полностью…

Кононюковщина

04 мая 2024 15:52

👩‍💻 Игра "Жизнь" на Rust

Относительно недавно я начал изучать язык Rust и сделал свой первый небольшой проект - реализовал клеточный автомат математика Джона Конвея. Основная роль игрока - размещать клетки на поле в замысловатом или не очень порядке и отслеживать, что с ними будет происходить в последующих поколениях. Более подробно про игру можно прочитать здесь.

Конечно, код далек от совершенства, но тот факт, что он хотя бы работает, не может не радовать. Чтобы потестировать, нужно сначала скомпилировать игру (инструкция есть на GH).

👩‍💻 0x7o/game_of_life

@hikonon

Читать полностью…

Кононюковщина

15 апреля 2024 16:26

👔 Спасибо добрым людям, которые оказали помощь в получении зарубежной карты.

Но поскольку Google - корпорация добра, они любезно осыпали меня букетом из ошибок OR-CBAT-15/23, про которые ходят местные легенды.

В итоге я не смог одолеть форму регистрации GCP и написал в службу поддержки, где мне сообщили:

Благодарим вас за оперативный ответ. Сообщаем, что мы связались с нашей внутренней командой для получения дальнейшей помощи. Это может занять до 24-48 часов, и мы будем держать вас в курсе, как только у
нас появится информация.

Никогда бы не подумал, что для того, чтобы пройти регистрацию, нужно писать в техподдержку. Как всегда, все для людей! Продолжение этой драмы выйдет после следующего письма от cloudsupport@google.com

@hikonon

Читать полностью…

Кононюковщина

09 апреля 2024 06:32

Наглядная инструкция о том, как повысить интерес к своему продукту в 2024 году:

1. Берём абсолютно любой продукт, что угодно;

2. Прикручиваем искусственный интеллект;

3. Наслаждаемся охватами и вниманием аудитории.

Читать полностью…

Кононюковщина

01 апреля 2024 10:25

📊 Общая оценка модели BulgakovLM 3B на бенчмарке MERA - 0.198

Прорыва не произошло, и LLM лишь немного опередила ruGPT3-large/small и FRED-T5. С учётом погрешности, можно сказать, что они на одном уровне

Читать полностью…

Кононюковщина

25 марта 2024 15:25

👏 25 марта - международный день прокрастинации! Поздравляю!

Читать полностью…

Кононюковщина

21 февраля 2024 13:44

⚡️ RussianVibe XL 2.0

Завершено обучение второй версии нейронной сети для генерации пейзажей России. На этот раз набор фотографий был почти в 6 раз больше, чем в версии 1.0!

Такое увеличение датасета существенно повлияло на качество модели:
- Улучшилась геометрия зданий. Теперь они больше похожи на привычный вид из окна)))
- Сцены стали более сложными.
- Цвета стали более разнообразными и насыщенными.

Но качество базового вывода сильно ухудшилось. Это связано с тем, что большинство фотографий из набора данных были сделаны на обычный телефон, из-за чего нейросеть генерирует слегка размытые изображения. Исправить это достаточно просто - добавьте тег low quality к negative_prompt.

Чуть позже я напишу статью на Хабре с более подробным техническим описанием того, как это работает и зачем это все вообще нужно :)

Онлайн демонстрация - https://hf.co/spaces/0x7o/RussianVibe
Файлы модели - https://hf.co/0x7o/RussianVibe-XL-v2.0
Датасет - https://hf.co/datasets/0x7o/RussianVibe-data
GitHub - https://github.com/0x7o/RussianVibe

@hikonon

Читать полностью…

Кононюковщина

17 августа 2024 07:00

📺 Runway выпустила Gen-3 Alpha Turbo для всех пользователей

- Это облегчённая версия модели Gen-3 Alpha для генерации видео из текста/изображений
- Максимальная длина видео — 10 секунд (как и у стандартной версии)
- Генерирует видео за 1-2 минуты — это очень быстро, если сравнивать с конкурентами
- Нет возможности увеличения разрешения или продления сгенерированных видео, как было с Gen-2
- Стоимость генерации: 5 кредитов за секунду генерации (в 2 раза меньше Gen-3 Alpha)

Попробовать модель можно без подписки на runwayml.com

#runway #gen3
@hikonon

Читать полностью…

Кононюковщина

07 августа 2024 16:07

Как корабль назовёшь, так он и поплывёт

Читать полностью…

Кононюковщина

30 июля 2024 08:16

Обычный день GPU poor персоны

Читать полностью…

Кононюковщина

05 июля 2024 15:50

🗯 Ae onium v1.1 Chat 4B

Дообученная на диалогах базовая языковая модель с нативной поддержкой русского языка.

Нейронная сеть сильно галлюцинирует, но иногда пишет хорошие стихи 😎

- HuggingFace
- Онлайн-демо

@hikonon

Читать полностью…

Кононюковщина

09 июня 2024 12:38

📌 Рисуем фракталы на Rust и CUDA

Написал небольшую программу, которая визуализирует множество Мандельброта на видеокартах. Поддерживает многопоточность, anti-aliasing и масштабирование

👨‍💻 0x7o/mandelbrot_set
📝 Статья на Хабре

@hikonon

Читать полностью…

Кононюковщина

06 мая 2024 11:02

👀 Aeonium-v1-BaseWeb-1B

Завершено обучение первой языковой модели для русского языка с 1.6 млрд. параметров.
- 32B токенов в датасете
- 4096 контекстное окно
- Llama в качестве основной архитектуры
- 128k vocab

HuggingFace
@hikonon

Читать полностью…

Кононюковщина

22 апреля 2024 14:02

🥸 Конец драмы

Google разрешил мне создать аккаунт GCP:

После всестороннего расследования мы выяснили, что ваш аккаунт сейчас активен и находится в хорошем состоянии.

Это означает, что в скором времени я начну обучение открытой языковой модели с 7 млрд. параметров на русском корпусе.

Некоторые подробности планируемой нейросети:
- Llama как основная архитектура
- Контекст в 4-8 тыс. токенов
- CulturaX в качестве основного источника данных
- Byte-Fallback BPE токенизатор

В настоящее время я обучаю токенизатор и готовлю наборы данных. Надеюсь, Google не решит внезапно заблокировать мой аккаунт за подозрительную активность! 🤡

@hikonon

Читать полностью…

Кононюковщина

12 апреля 2024 16:53

🔒 Google выделил мне TPU v4-256 для создания открытых LLM на русском языке

Два года назад я уже обучал модель русского языка, но тогда датасет был небольшой, и у меня не хватало мощностей, поэтому модель получилась посредственного качества.

Сейчас я собрал датасет на 1.5T токенов (русский, код и немного английского) и готов приступить к обучению 7B-модели, но есть небольшая дилемма: я не имею физ. карты в банке за пределами РФ.

Если вы живете за границей и у вас есть физическая банковская карта, вы можете внести свой вклад в развитие ответственного ЭйАй, оказав мне помощь в активации аккаунта Google Cloud Platform 😳
Пишите сюда -> @Ox7o_x

Читать полностью…

Кононюковщина

03 апреля 2024 06:30

📎 LIMA: Less Is More for Aligment

- 1000 отобранных примеров для LLM aligment дают результаты лучше, чем 50 000 синтезированных примеров.
- LLaMa 65B, обученная с помощью этого метода, показал лучшие результаты, чем Alpaca и davinci-003. А в 43 % случаев она показала такой же или лучший результат, чем GPT-4.
- Добавление 30 примеров multi-turn диалогов в стиле ИИ-ассистента позволяет LLM отлично поддерживать диалог.
- Это работает благодаря предположению, что хорошо обученные LLM уже обладают необходимыми знаниями, и aligment направлено только на указание требуемого формата ответа.

Поэтому не нужно создавать наборы данных на несколько миллионов синтезированных примеров. Берите качеством, а не количеством.

Читать полностью…

Кононюковщина

31 марта 2024 13:59

🤖 BulgakovLM 3B - большая языковая модель для русского языка

Копался в своих архивах и с удивлением обнаружил, что два года назад я обучил LLM для русского языка и никогда об этом не писал. Исправляюсь.

- Три миллиарда параметров на архитектуре GPT-J
- Токенизатор от rugpt3_based_on_gpt2
- Контекст 4096 токенов
- 100 ГБ датасет (>70% веб-страницы)
- Обучена в течение 2-х эпох

Хорошо подходит для дальнейшего обучения и быстрого прототипирования. HuggingFace

@hikonon

Читать полностью…

Кононюковщина

22 февраля 2024 15:52

📺 Россия, которой нет

Теперь смотреть работы RussianVibe 2.0 можно прямо в паблике VK!

Ежечасно в группе публикуются генеративные фотографии родных уголков России. Подсказки пишутся языковой моделью Llama 2 🤖

Присоединяйтесь!
https://vk.cc/cuRyta

Читать полностью…

Кононюковщина

18 февраля 2024 15:10

🧠 Сделал нейросеть для генерации пейзажей России. Первая версия обучена на 3500 изображениях из тематических пабликов ВК.
Это LoRA адаптер к SD-XL 1.0. Подписи к изображениям в датасете сгенерированы Kosmos-2.

Затем обучу вторую модель на 20 000+ изображениях и более подробно расскажу об создании нейросети и зачем вообще все это.

Файлы модели - https://hf.co/0x7o/RussianVibe-XL-v1.0
Демо - https://hf.co/spaces/0x7o/RussianVibe-1.0
Код - https://github.com/0x7o/RussianVibe

@hikonon

Читать полностью…

Подписаться на канал