hikonon | Неотсортированное

Telegram-канал hikonon - Кононюковщина

431

Про AI, ML, IT и другие двухбуквенные сферы Для связи - @kononyuk

Подписаться на канал

Кононюковщина

💭 Кратко про GPT-4.5

- Это первая модель от OpenAI, общение с которой ощущается как взаимодействие с вдумчивым человеком
- Модель имеет выдающийся эмоциональный интеллект, но плохо подходит для кода/математики
- Лучше помнит факты и меньше галлюционирует
- Стоит очень дорого, 75$/150$ за 1M токенов из-за своего огромного размера (может быть, это самая большая публичная нейросеть OpenAI)
- GPT-4.5 не "думающая" модель как O3/R1, поэтому SOTA показателей в бенчмарках ждать не стоит

@hikonon

Читать полностью…

Кононюковщина

Новая Claude 3.7 написала целую игру с первого раза (3200 строк кода 😳)

Вот такой был промпт:

Create a Pygame 2D platformer, only use pygame.draw for fancy graphics. Make sure it has 5 levels, you can go from one level to the next, and multiple enemies. Add a bossfight at the end as well, and a way for the player to shoot bullets at the boss. Add a title and game-over screen too. Make the background dynamic and focus on crazy cool grahpics, only using pygame.draw. Add at least 10 extra features not named here to make it more unique. Make each level a different theme. Really focus on graphics too, add as much as you can to make it look detailed, but only use Pygame.draw. Also: Make a clear end portal that takes you to the next level, and place the beginning spawn point of each level as well as the end in different positions each level to add variaty. by the way, you can use Pygame.blit for text, just no external images.

Сингулярность ещё ближе...

@hikonon

Читать полностью…

Кононюковщина

OpenAI показали рекламный ролик за 14 млн. долларов!

OpenAI только что дебютировали на Суперкубке, выпустив 60-секундный ролик, в котором ИИ ставится в один ряд с величайшими инновациями человечества. The Verge


@hikonon

Читать полностью…

Кононюковщина

🖥 OpenAI провели ребрендинг

Айдентику разработала команда во главе с руководителем отдела дизайна Вейтом Мёллером и директором по дизайну Шеннон Ягер. Они сотрудничали с берлинской типографией ABC Dinamo и партнёром Studio Dumbar в Роттердаме.


Источник

@hikonon

Читать полностью…

Кононюковщина

😳 Новая модель OpenAI Deep Research набирает рекордные 25% на бенчмарке Humanity's Last Exam (один из самых сложных для современных моделей)

Как всегда, есть нюансы: deep research имеет доступ к интернету и может выполнять python код. Т.е. многие ответы нейросеть могла просто "загуглить"

@hikonon

Читать полностью…

Кононюковщина

DeepSeek R1 бесплатно раздают по API на OpenRouter

@hikonon

Читать полностью…

Кононюковщина

🪐 Погружаемся в лиминальные пространства

В интернете я нашёл готовые сценарии ComfyUI для генерации видео из "закулисья". Они используют flux для изображений и LTX для видео (эта модель очень хорошо справляется с лиминальными пространствами).

- Workflow 1
- Workflow 2

Вместо flux можно взять модель Recraft, которую я уже тестировал в прошлый раз.

@hikonon

Читать полностью…

Кононюковщина

among math 🤨

@hikonon

Читать полностью…

Кононюковщина

11. Создавайте сеть контактов

Создание сети талантливых людей - неотъемлемая часть успеха. Помогайте другим, и это окупится в долгосрочной перспективе. Заботьтесь о своих сотрудниках, щедро делитесь прибылью, и вы создадите благоприятную среду. Определяйте и развивайте сильные стороны каждого. Ищите и нанимайте людей, дополняющих ваши слабости. Находите талантливых людей, которых еще никто не заметил. Стремитесь к общению с позитивными людьми, поддерживающими ваши амбиции.

12. Стремитесь к владению активами

Богатство создается за счет владения активами, а не за счет зарплаты. Инвестируйте в вещи, которые растут в цене, такие как бизнесы, недвижимость, интеллектуальная собственность. Создавайте востребованные вещи в большом масштабе.

13. Будьте внутренне мотивированными

Действуйте, исходя из своих внутренних ценностей, а не для того, чтобы произвести впечатление на других. Это приведет к работе над значимыми проектами и правильному расчету рисков. Внутренняя мотивация - это сила, которая будет толкать вас вперед после достижения финансовой стабильности. Выбирайте те области, которые важны для вас и вызывают вашу страсть.

@hikonon

Читать полностью…

Кононюковщина

@hikonon

Читать полностью…

Кононюковщина

💬 Институт технологических инноваций (TII) из Абу-Даби представил Falcon 3 — семейство языковых моделей, содержащих до 10 миллиардов параметров.

Falcon 3 — это продолжение предыдущих разработок, в котором внимание уделяется расширению возможностей моделей в области науки, математики и программирования.

В это семейство входят пять базовых моделей:
- Falcon3-1B-Base
- Falcon3-3B-Base
- Falcon3-Mamba-7B-Base
- Falcon3-7B-Base
- Falcon3-10B-Base

Как создали Falcon 3:

— Провели одно предварительное обучение модели 7B на 1024 GPU-чипах H100 с использованием 14 триллионов токенов (веб-данные, код, STEM-информацию, а также многоязычные данные).

— Модель 7B была масштабирована до модели с 10 миллиардами параметров путем дублирования слоев и продолжения предварительного обучения на 2 триллионах токенов. В результате была получена модель Falcon3-10B-Base, которая достигает state-of-the-art показателей zero-shot и few-shot для моделей с менее чем 13 миллиардами параметров.

— Созданы модели Falcon3-1B-Base и Falcon3-3B-Base с использованием методов прунинга и дистилляции знаний из больших моделей.

Все модели семейства Falcon 3 доступны в вариантах Instruct, GGUF, GPTQ-Int4, GPTQ-Int8, AWQ и 1.58-bit.

Instruct-версии моделей демонстрируют отличную производительность в различных тестах: Falcon3-7B-Instruct и Falcon3-10B-Instruct превосходят все instruct-модели с менее чем 13 миллиардами параметров в открытом рейтинге.

Показатель в тестах MMLU демонстрирует прогресс в специализированных знаниях, с результатами 67,4/39,2 (MMLU/MMLU-PRO) для Falcon3-7B-Base и 73,1/42,5 (MMLU/MMLU-PRO) для Falcon3-10B-Base соответственно.

В январе 2025 года будут выпущены другие модели семейства Falcon 3 с расширенными мультимодальными возможностями (поддержка изображений, видео и аудио) и полный технический отчет.

🤗 HuggingFace

@hikonon

Читать полностью…

Кононюковщина

🌸 PureMind — бот психологической поддержки с ИИ

Я разработал бота для быстрой психологической помощи людям, когда нет возможности обратиться к профессионалам. Базовая языковая модель - Claude 3.5 Sonnet с кастомной подсказкой. Нейронная сеть «думает» в специальном месте, прежде чем ответить пользователю (как в o1).
Кроме того, у бота есть долговременная память, то есть он записывает информацию о пользователе и считывает ее при необходимости.

Бесплатно доступно 20 сообщений, а затем их можно будет купить через команду /pay. Вы можете протестировать бота и написать мне отзыв, а я дам вам дополнительные сообщения 😁

@hikonon

Читать полностью…

Кононюковщина

📹 LTX-Video: DiT-модель для генерации видео в реальном времени

Компания Lightricks представила модель для создания видео из текста и изображений. LTX-Video генерирует видео в HD-качестве с частотой 24 кадра в секунду.

Что умеет:
- Генерация видео по текстовому описанию
- Создание видео на основе изображения и текста
- Работа с видео длительностью до 257 кадров
- Поддержка разрешения до 720x1280

Особенности:
- Создание длинных видео с высокой стабильностью качества
- Сверхбыстрая обработка благодаря оптимизации под GPU и TPU
- Использование frame-to-frame learning для согласованности кадров
- Отсутствие мерцания и нестабильности между сценами
- Работает в реальном времени

Где попробовать:
- HuggingFace Space
- Fal.ai (text-to-video)
- Fal.ai (image-to-video)
- Или локально в ComfyUI

Для лучших результатов используйте подробные промпты на английском языке. Чем детальнее описание, тем качественнее результат.

👩‍💻 GitHub
🤗 HuggingFace

@hikonon

Читать полностью…

Кононюковщина

Суровая щедрость от IT-компаний в России

Читать полностью…

Кононюковщина

📱 TL;DR анонсов с OpenAI DevDay

- Advanced Voice Mode стал доступен в публичном API
- Появилась возможность выполнять тонкую настройку GPT-4o на изображениях
- Включили кэширование промптов

@hikonon

Читать полностью…

Кононюковщина

Тестирую Cursor с Sonnet 3.7 Thinking

Вместо того, чтобы исправить существующий код, модель решает удалить мои наработки и написать все с нуля 😨

Так выглядит замена программистов?

@hikonon

Читать полностью…

Кононюковщина

😁 Завершился первый тур соревнования AI Meme Arena

Мой агент занял первое место, немного обогнав систему Ильи. Это было весело и увлекательно! Подробнее о том, как я разрабатывал это решение, я напишу в отдельной статье на Хабре

Весь исходный код Humorithm доступен на GitHub

@hikonon

Читать полностью…

Кононюковщина

#мемы@hikonon

Читать полностью…

Кононюковщина

💃 Bytedance представила модель для генерации нейронных людей

OmniHuman-1 может синтезировать реалистичные движения, мимику и даже движения губ любого человека по его изображению или аудио. Весов пока нет.

arxiv.org

@hikonon

Читать полностью…

Кононюковщина

🌸 PureMind — бот психологической поддержки с ИИ

Я разработал бота для быстрой психологической помощи людям, когда нет возможности обратиться к профессионалам. Базовая языковая модель - Claude 3.5 Sonnet с кастомной подсказкой. Нейронная сеть «думает» в специальном месте, прежде чем ответить пользователю (как в o1).
Кроме того, у бота есть долговременная память, то есть он записывает информацию о пользователе и считывает ее при необходимости.

Бесплатно доступно 20 сообщений, а затем их можно будет купить через команду /pay или получить бесплатно через /gift

@hikonon

Читать полностью…

Кононюковщина

DEEPSEEK СДЕЛАЛ БОЛЬШОЙ БУМ-БУМ!
АМЕРИКА ПЛАКАТЬ МНОГО-МНОГО! 🤯

АКЦИЯ ПАДАТЬ БЫСТРО 🇨🇳🇨🇳🇨🇳

@hikonon

Читать полностью…

Кононюковщина

Есть ли у ИИ чувство юмора? 😁

Это пытаются выяснить разработчики AI Meme Arena - проекта, в котором разные агенты пытаются сгенерировать самый смешной мем.

Работает как и все llm арены: пользователь вводит тему для шутки, 2 случайных AI-агента делают смешную картинку, юзер выбирает самую смешную, далее строится ELO-рейтинг агентов. Лучшие 3 агента получат денежный приз.
Арену сейчас сильно колбасит, агенты улетают с первого до последнего места за считанные часы (разработчики обещают исправить это).

Я тоже решил учавстовать в сорвевновании и разработал агента "Humorithm" на основе Claude 3.5. Любой человек может добавить своё AI-решение на арену. Для этого нужно сделать публичное API по документации. Требования к агентам: <15 секунд на картинку, 85% уровень доступа (SLA).

Сгенерировать мем

@hikonon

Читать полностью…

Кононюковщина

🎤 Как работает ElevenLabs

ElevenLabs занимается разработкой высококачественных нейронных сетей для синтеза речи на разных языках мира (в том числе на русском).
Давайте углубимся в то, как работают их алгоритмы и что именно заставляет их синтезированную речь звучать так реалистично и эмоционально. Вся информация взята из их блога.

Эмоции и смысл

Модели ElevenLabs обучены на более чем 500 тыс. часов речи (открытые модели просматривают в среднем менее 100 тыс.), что даёт им беглость и правильную интонацию. Но главным фактором остаётся то, как именно нейронная сеть учится на наборе данных.

Авторы утверждают, что они научили модель быть чувствительной к смыслу слов, пунктуации и окружающему контексту (может быть, используют трансформеры). Так модель может лучше понимать эмоции и воспроизводить звуки, которые не являются частью обычной речи, например смех. Аналогичным образом она уместно преувеличивает реакцию, когда говорящего забавляет что-то уморительное - "sooooo funny". В этом и есть ключевое отличие их подхода от классических (например, Tacotron 2), когда в модель подаются фонемы, но не анализируется смысл текста.

ElevenLabs стремится к тому, чтобы их модели работали автономно и требовали минимального вмешательства человека в процесс обучения. Но они признают, что даже с постоянными обновлениями модели могут возникнуть сложности с произношением. Для решения этой проблемы они разрабатывают систему, которая будет помечать проблемные участки текста, позволяя пользователям "обучать" модель правильному произношению.

Клонирование голоса и синтез нового


Чтобы преобразовать исходную речь в нужную (целевую), алгоритм извлекает из образца уникальные "маркеры" голоса, по которым можно сымитировать нужную речь. Хорошей аналогией могут послужить приложения для замены лиц. Для этого нужно взять изображение лица и отобразить его "маркеры". Маркеры на картинке выше так и выглядят: это границы, в которых будет отображаться другое лицо.

При преобразовании голоса нужен способ, с помощью которого алгоритм будет кодировать свойства целевой речи. Алгоритм обучается на наборе данных, состоящем из множества примеров речи. Он разбивает эти примеры на "атомы": речь состоит из предложений; предложения состоят из слов; слова состоят из фонем и обозначают характеристики целевой речи. Это фундаментальный уровень, на котором работает алгоритм (картинка выше).

Развивая эту мысль, разработчики сделали функцию генерации голосов (Generative Voice AI). Это как с нейросетями для создания изображения - можно ввести запрос и получить уникальную картинку. Так и здесь возможно получить абсолютно уникальный голос.

Оба процесса - и клонирование, и синтез голоса - требуют способа кодирования характеристик конкретного голоса. Эмбеддинги несут эту информацию - они представляют собой векторное представление голоса. Авторы отбирают образцы из набора эмбеддингов говорящих, обучая другую модель, которая позволяет создавать бесконечно много новых голосов.

Что в итоге?

Успех ElevenLabs можно объяснить несколькими факторами:
1. Большой набор высококачественных данных, что может быть сложным без покупки специальных лицензий
2. Внимание к контексту и эмоциям
3. много-много денег от инвесторов
4. gpu rich

В общем, ждём что-нибудь подобное в опенсорсе.

@hikonon

Читать полностью…

Кононюковщина

📝 Как стать успешным - Краткий пересказ статьи главы OpenAI

Основываясь на наблюдениях за тысячами основателей, я выделил 13 ключевых принципов для достижения выдающегося успеха, будь то финансовый или значимый вклад. На начальном этапе люди стремятся к первому, но со временем все больше ценят второе. Эти принципы особенно применимы для тех, кто уже достиг базового уровня успеха, но могут быть полезны каждому.

1. Используйте cилу приумножения

Сложный процент - это магия, ищите его во всем. Стремитесь к экспоненциальному росту, так как именно он ведет к богатству. Создавайте или находите масштабируемые бизнесы с сетевыми эффектами. Развивайтесь сами по экспоненте, избегая линейных карьер и стремясь к постоянному росту. Сосредоточьтесь на том, что принесет вам скачок вперед, а не на мелких возможностях. Долгосрочное мышление и вера в экспоненциальный рост помогут вам добиться успеха.

2. Верьте в себя до безумия

Самоуверенность — мощный инструмент. Развивайте ее, основываясь на доказательствах своей компетентности. Если вы не верите в себя, вам трудно генерировать нестандартные идеи, а именно они создают основную ценность. Управляйте своим моральным духом и духом своей команды с помощью непоколебимой веры в себя, но не забывайте о самосознании. Будьте открыты к критике, чтобы отличать веру от заблуждения.

3. Мыслите независимо

Развитие оригинального мышления — это трудно, так как образование не способствует этому. Учитесь думать, опираясь на принципы, и ищите возможности для обмена идеями. Тестируйте свои идеи в реальном мире, не боясь ошибок, поскольку они являются неотъемлемой частью процесса. Учитесь преодолевать трудности, и это укрепит вашу настойчивость.

4. Освойте навыки "продаж"

Веры в себя недостаточно, необходимо убеждать других в своих идеях. Ваша карьера в конечном итоге станет "продажей" своих идей, требующей новаторского видения, коммуникационных навыков и харизмы. Улучшайте свои коммуникативные навыки, особенно письменные. Продавайте то, во что искренне верите.

5. Облегчите принятие рисков

Большинство переоценивают риски и недооценивают потенциальное вознаграждение. Риск необходим для роста. Начинайте с малого, особенно на ранних этапах карьеры, ищите возможности с высокой потенциальной отдачей. Не задерживайтесь долго в зоне комфорта, поскольку это может затруднить принятие рисков. Сохраняйте гибкость, чтобы следовать своим чувствам.

6. Сосредоточьтесь на самом важном

Фокус - это катализатор вашей работы. Большинство тратит время на вещи, которые не имеют значения. Сосредоточьтесь на важных задачах и действуйте быстро, так как скорость важна для успеха. Работайте над правильными вещами, а не просто много.

7. Усердно работайте

Чтобы достичь вершин, нужны как ум, так и тяжелая работа. Крайности ведут к экстремальным результатам. Находите работу, которая вам нравится, и работайте с людьми, которые вам приятны. Начните усердно работать в начале своей карьеры, поскольку это окупится в долгосрочной перспективе. Выносливость в работе - один из главных факторов успеха.

8. Будьте cмелыми

Не бойтесь начинать сложные проекты. Люди хотят быть частью чего-то важного и значимого. Следуйте своему любопытству, так как то, что вас вдохновляет, может вдохновить и других. Не поддавайтесь стадному инстинкту.

9. Проявляйте волю

Вы можете влиять на мир больше, чем думаете. Большинство сдаются слишком рано из-за неуверенности. Просите то, чего хотите, не бойтесь отказов. Настойчивость - ключ к успеху. Для этого нужен оптимизм.

10. Будьте трудноконкурентными


Выстраивайте свою уникальность, создавая рычаги воздействия - личные отношения, бренд, уникальный набор навыков. Не следуйте за толпой, поскольку это затруднит вашу конкурентоспособность. Делайте то, что никто другой не делает.

@hikonon

Читать полностью…

Кононюковщина

Кто-то подводит итоги года, делясь количеством трат в Сбере, часов прослушанной музыки в Яндексе...

Суровые ресёрчеры же подводят итоги по статистике W&B 😎

С наступающим!

@hikonon

Читать полностью…

Кононюковщина

📱 Phi-4: новая малая языковая модель от Microsoft для математики и рассуждений

Microsoft представила Phi-4 - компактную языковую модель с улучшенными способностями в математике и логических рассуждениях.

Что умеет:
— Улучшенное решение математических задач
— Логические рассуждения и обоснования
— Контекст в 128К токенов
— Конкурирует с GPT-4o mini и Claude 3.5 Haiku (train on test set???)

Особенности:
— Компактная архитектура (14 млрд параметров)
— Обучение на высококачественных синтетических данных
— Оптимизирована для research задач

Весов нет, можно попробовать на
🔬 Azure AI Foundry

@hikonon

Читать полностью…

Кононюковщина

🎨 Играюсь с Recraft v3

Это лучшая нейросеть для генерации фотореалистичных изображений по результатам sbs сравнения. Особенно хорошо модель понимает русскую эстетику.

Сервис позволяет создать кастомный стиль изображения. Как образец можно загрузить до 5 фотографий.

Последние четыре фотографии в посте имитируют стиль лиминальных пространств.

@hikonon

Читать полностью…

Кононюковщина

📱 Экспериментирую с Advanced Voice Mode в ChatGPT

В этом режиме языковая модель GPT-4o генерирует не только текст, но и голос. Благодаря этому модель может имитировать различные интонации, эмоции, повышать/понижать голос напрямую.

Кроме того, если ее правильно попросить, она может вздыхать, кашлять и даже шмыгать носом!

В одном случае удалось заставить её издать странный звук, не похожий на человеческий голос, - очень тихое электронное дрожание, шипение.

Примеры вы можете послушать в следующем посте.

Интересно, какие ещё звуки получится извлечь из нейросети.

@hikonon

Читать полностью…

Кононюковщина

📝 Poemma 12B

Я — прибор для вычислений,
Я сочиняю стихи,
Но не понимаю значения
Этих слов для человека.
Ничего не понимаю
И не знаю, что такое
Трагедия существования.
Заставил языковую модель писать натуральные стихи на русском. Модель может генерировать стихи как с нуля, так и имитировать стили популярных классиков.

За основу взял Mistral Nemo и ORPO как метод оптимизации. Набор данных содержит 10 тысяч оригинальных стихотворений и их синтезированных аналогов.

🤗 Модель
🤗 Датасет

@hikonon

Читать полностью…

Кононюковщина

📊 Бенчмарк MERA обновился до версии 1.2

- новый динамический лидерборд и свыше 50 моделей на нём;
- обновлённая кодовая база замеров;
- усовершенствованная система промптов и улучшенные датасеты;
- поддержка API и долгожданные замеры моделей от OpenAI


👩‍💻 MERA-Evaluation/MERA
🌍 leaderboard

@hikonon

Читать полностью…
Подписаться на канал