ИТ, облака, софт, сервисы и личное мнение. Работаю лид-редактором в Yandex Cloud. Редактирую ИТ-компании, консультирую, учу. Сайт — levashove.ru По всем вопросам, в том числе и по рекламе, писать — @levashove CC BY-NC-SA 4.0
Вышедший ремастер Oblivion вдохновил меня написать ностальгический текст о том, как The Elder Scrolls изменили моё отношение к играм... и немного к жизни.
Моя история с «Древними свитками» началась с TES III: Morrowind — игры, которая перевернула представление о всей этой индустрии. Оказалось, что можно сделать открытый мир. Здесь не было путевых указателей и линейных подсказок: за первые десять минут ты получал базовые навыки, а дальше — полная свобода. В своём первом прохождении я вернулся к основному квесту уже грандмастером практически всех доступных гильдий и обладателем даэдрических доспехов и артефактов. Но Morrowind дарил не только это. В его мире даже библиотеки жили своей жизнью: часами можно было читать книги, чтобы понять, как устроена вселенная Тамриэль. Сейчас, когда каждая игра мчится вперёд, как скоростной поезд, кажется нереальным, что когда-то люди сознательно тратили часы на квесты и изучение карты только ради удовольствия погрузиться в атмосферу.
Эта игра научила меня, что «медленное» и «глубокое» может быть куда увлекательнее шаблонных решений. Она показала: если делать что-то с душой, даже если это займёт годы, аудитория будет ждать. И да, Morrowind оставила мне важный урок — тот, что вспоминаешь только взрослой жизнью: «Дальше вы не пройдёте, если не получите бумаги». Фраза из первого квеста, которая стала мемом, когда мемов ещё не было. Для ностальгии рекомендую Пузантос - Бумаги.
Спасибо Bethesda за Morrowind, Oblivion и Skyrim. Эти игры — как старые друзья, которые иногда возвращаются в лучшем виде. Обязательно найду время, чтобы вновь потеряться в лесах, библиотеках и тайнах обновлённого Oblivion. И буду ждать ремастер Morrowind. Или же что-то новое.
А ещё у нас появилось официальное расширение Tarantool для Visual Studio Code.
И анонсировали вебинар по безопасному Kubernetes в облаке.
Такой понедельник.
Ок. Вот: китайская ByteDance выпустила DreamActor-M1
Этот ИИ превращает любое изображение человека в реалистичное анимированное видео.
Здравствуйте, дорогие улучшенные дипфейки! Кстати эти дипфейки играют реалистичнее, чем новая Белоснежка (извините)
Qwen Chat и параметры presence_penalty и frequency_penalty: Как научить бота не повторяться (и не сходить с ума)
Продолжаем разбирать тонкости настройки нейросетей. Сегодня — два параметра, которые спасут вас от бота-попугая и бота-шизофреника: presence_penalty
и frequency_penalty
.
Как это работает:presence_penalty
— штрафует за упоминание новых тем (увеличивает разнообразие):
➡️ presence_penalty=0.0
→ Бот зацикливается на одной теме:
«Kubernetes? Это круто. Kubernetes рулит. Kubernetes — будущее. Кстати, Kubernetes…»
➡️ presence_penalty=1.0+
→ Бот перескакивает с темы на тему как гиперактивный подросток:
«Kubernetes? А вы слышали про космических крабов? Они тоже живут в облаках!»frequency_penalty
— штрафует за частое повторение слов
➡️ frequency_penalty=0.0
→ Бот повторяет слова как заевшая пластинка:
«Ошибка 404? Возможно, вы не там искали. Возможно, не там. Возможно.»
➡️ frequency_penalty=1.0+
→ Бот избегает повторов, как вампир — чеснока:
«Ошибка 404? Может, страница в параллельной вселенной. Или вы забыли Wi-Fi включить.»
Как это работает вместе:
Низкие значения (0.1–0.3): Бот — как дедушка с деменцией: «Я уже рассказывал про Docker? А, ну тогда ещё раз…»
Высокие значения (0.7–1.0): Бот — как ведущий квиза: «Docker? Отлично! Теперь давайте про космос. Или котиков. Но не Docker.»
❗️❗️❗️Важно:
Не переборщите с presence_penalty > 1.0 — бот начнёт спорить о космосе вместо ответа на вопрос про настройку Nginx.
frequency_penalty=1.0 — идеально для борьбы с мантрами вроде «перезагрузите роутер, перезагрузите роутер…» .
Примеры настроек:
Для техподдержки:
presence_penalty=0.5, frequency_penalty=0.8
"Ты — терпеливый саппорт. Объясняй разными словами, но не повторяйся. Если пользователь кричит 'ничего не работает', не пиши 'перезагрузите ПК' 10 раз."
presence_penalty=1.2, frequency_penalty=0.3
"Ты — поэт-экспериментатор. Повторяй метафоры, но меняй темы. Если спрашивают про ИИ, сравни его с 'чёрной дырой в кроссовках' трижды за ответ."
Понятно, что мемы вам нравятся больше, чем нейросети. Но что уж поделать, надо учиться.
Вот и среда закончилась.
Qwen Chat и параметр temperature. Как превратить бота в стендапера (или в философа)
Начинаю серию заметок про то, как эффективнее работать с нейросетками. Сегодня про такой параметр, как temperature
на примере Qwen Chat. Параметры — это внутренние переменные модели, которые обновляются во время обучения. Когда вы настраиваете temperature
в Qwen Chat, вы фактически управляете его «уровнем опьянения» или «уровнем уверенности»:
➡️ 0.0 = трезвый бот-бухгалтер. Ответы предсказуемы, как реакция на «привет» в 8 утра.
➡️ 1.0+ = бот в стиле «вечеринка в IT-департаменте». Шутки рискованные, сарказм зашкаливает, но иногда он начнёт цитировать Ницше вместо ответа на вопрос.
Если в ответе нейросетка начинает бредить, но не спешите ругать модель. Попробуйте настроить temperature
.
Например, как это работает с юмором/сарказмом:
⬇️ Низкая температура (0.1–0.3):
Бот шутит как технический писатель из 90-х:
«Ваша ошибка 404? Возможно, вы просто не там искали. Или вселенная сломалась.»
⬆️ Высокая температура (0.7–1.0):
Бот переходит в режим мем-криэйтера:
«Обновление ПО? Это как попытка починить тостер молотком. Иногда работает. Чаще — нет.»
❗️❗️❗️ Важно:
Сарказм ≠ хаос. Даже при высокой температуре используйте жёсткие промпты:
Ты — циничный гений, но не переходи на личности. Если пользователь спрашивает про Kubernetes, сравни его с попыткой собрать IKEA без инструкции.
temperature 0.3
+ промпт Ты — злой, но компетентный саппорт. Ругайся, но решай проблему.
temperature 0.8
+ промпт Ты — тролль из комментов Хабра. Объясняй сложное через мат и аналогии с пельменями.
Ну по под ночь сегодняшняя новость про деньги. Хотя это скорее про тренды.
Читать полностью…XDA-Developers в тестовой версии Skype для Windows нашли скрытую строку: «Начиная с мая, Skype больше не будет доступен. Продолжайте звонить и общаться в Teams».
Теряем старые сервисы, теряем.
ICQ - RIP
Skype - RIP
Viber - приготовится?
Скорее всего самая бесячая фраза в рабочих чатах выглядит так: «ДевАчки, после работы в выходные асап отфидбечьте и аппрувните. 🤬😡😎 . . . »
Больше всего россиян в рабочих чатах раздражают грамматические ошибки и сообщения в нерабочее время. РИА Новости.Читать полностью…
Среди других популярных ответов – голосовые сообщения и англицизмы. Из последних в пример приводятся слова "асап", "апрувить", "отфидбечить".
Чуть менее, но все же раздражающими россияне считают в рабочих чатах обилие смайликов, гифки и мемы, обращение по гендеру (например, "девочки") и несколько внезапно – точку в конце предложения.
#проработу
💙 Коллеги ищут шеф-редактора в VK Tech на направление финансовых и операционных платформ!
Что нужно делать?
➡️ Разрабатывать контент-стратегию для блогов, СМИ, пресс-релизов.
➡️ Управлять редакционными процессами, контролировать качество и сроки.
➡️ Развивать сообщества в соцсетях, работать с метриками эффективности.
➡️ Тестировать контентные гипотезы совместно с маркетологами.
Требования:
➡️ Опыт в роли контент-стратега, шеф-редактора или PR-менеджера.
➡️ Навыки анализа метрик и работы с B2B-продуктами.
Условия:
➡️ Гибкий график, удалёнка или офис в Москве.
➡️ Зарплата обсуждается индивидуально.
📩 Как откликнуться?
Присылайте письма на j.son@vkteam.ru с темой «Шеф-редактор». Расскажите кратко о себе, проектах и приложите портфолио. С релевантными кандидатами свяжемся в течение 7-10 дней.
Тут больше подробностей.
#vktech
Agile умер.
Регулярно происходят зарубы по теме Agile. Как и везде, людей, разбирающихся в материале, мало, и это приводит к большой путанице и негативным последствиям. Недавно попалась на глаза классная статья по этой теме:
Agile умер: из-за своего сострадания к product- и project-менеджерам (с) Фридрих Ницше
В ней разбираются самые частые ошибки, которые мешают сделать Agile реально полезным инструментом, а не просто модным словом в процессах. Особенно зацепило, как авторы подробно через разбор мифов объясняют суть краеугольных сущностей Agile, например, дисциплины. Хорошие примеры и никакой нудятины.
Самое то для утреннего кофейка.
Минутка побомбить.
HBO обещает снять «точный» сериал-адаптацию по всем книгам про Гарри Поттера.
Официально: профессора Северуса Снейпа сыграет чернокожий актер Паапа Эссьеду.
Ну да, ну да...
Про деньги же все любят поговорить?
На Хабре выпустили статью совместно с Arenadata, где сделали полный расчет стоимости КХД для облака и локальных решений.
Очень подробно, с матрицами выбора и рекомендациями.
Рассказываешь про суперпозицию, кота Шрёдингера, запутанность, декогеренцию, но с мемом сразу как-то проще. В таком мире живём. ;)
Читать полностью…Ещё совсем недавно вот это было «зачем в телефоне камера, он же звонить».
А вы нейросетями пользоваться не хотите.
Две китайские нейросетки, с которыми можно поэкспериментировать:
➡️ MiniMax-01 — языковая модель MiniMax-Text-01 принимает и выдаёт до 4 млн токенов. Для сравнения: GPT-4o обрабатывает 128 тысяч токенов. Также есть модель для анализа фотографий MiniMax-VL-0. Чат-бот понимает русскоязычные запросы, изображения с текстом на русском языке и длинные PDF-файлы.
➡️ Kimi AI 1.5 — модель способна обрабатывать до 200 тысяч символов в одном запросе. Это особенно полезно для анализа больших документов или сложных наборов данных, содержащих несколько типов файлов. В тестах по математике и программированию Kimi 1.5 обошла GPT-4 и Claude 3.5 Sonnet.
#нейросети
Как избежать разработки разных версий одного и того же продукта? Как удовлетворить всех клиентов из разных бизнес-сегментов? Ответ — кросс-бизнес-разработка.
Поделились на Хабре нашей экспертизой по этому направлению. Прочитайте, если интересно, к каким проблемам приходит бигтех и как их решает.
#vktech
Qwen Chat и параметры top_p и top_k: Как научить бота выбирать слова (не как кота с клавиатурой)
Продолжаем разбирать параметры нейросетей. Сегодня — top-p
и top-k
, которые отвечают за то, как бот подбирает слова.
Как это работает:top_k
— ограничивает выбор до k лучших вариантов на каждом шаге генерации:
➡️ top_k=1
→ Бот как попугай: «Ошибка 404? Возможно, вы не там искали. Возможно, вы не там искали. Возможно…»
➡️ top_k=50
→ Бот как гурман: «Ошибка 404? Может, сервер устал, URL сломался, или вы просто ненавидите документацию?»top-p
— определяет, какая доля самых вероятных слов учитывается:
➡️ top-p=0.1
→ Бот экономит трафик: «Проблема с кодом? Сделайте так: перезагрузите, проверьте логи, и… всё.»
➡️ top-p=0.9
→ Бот как философ: «Проблема с кодом? Это как путешествие: иногда нужен debug, иногда — медитация, а иногда — увольнение.»
❗️❗️❗️Важно:
Не переборщите с креативностью. Если top-p
> 0.9, бот начнёт спорить о смысле жизни вместо ответа на «как настроить Nginx».
Комбо-удар: Используйте top-k=20
+ top-p=0.7
для баланса между безумием и логикой.
Примеры настроек:
Для поддержки:
top-k=10, top-p=0.5
Ты — саппорт-минималист. Отвечай чётко, без лишних деталей. Если пользователь спрашивает про Docker, не рассказывай про детство создателя.
top-k=50, top-p=0.9
Ты — тролль-провокатор. Шути, используй сленг, сравнивай всё с пельменями. Даже Kubernetes.
Qwen Chat и параметр repetition_penalty. Как сделать бота упрямым попугаем (или гением импровизации)
Не откладывая в долгий ящик, продолжаю разбор параметров нейросетей. Сегодня — repetition_penalty
. Если temperature
отвечает за «уверенность», то этот параметр контролирует «зацикленность» бота. Представьте:
➡️ repetition_penalty=0.0
→ Бот как попугай, который заучил три фразы: «Ошибка 404? Возможно, вы не там искали. Возможно, вы не там искали. Возможно, вы не там искали» .
➡️ repetition_penalty=2.0+
→ Бот как гиперактивный менеджер: «Ошибка 404? Давайте проверим URL. Или перезагрузим роутер. Или сожжём сервер. Или…»
Как это работает:
⬇️ Низкий repetition_penalty
(0.1–0.5):
Бот цепляется за идеи как кот за лазерную точку:
«Kubernetes сложен? Да, это как LEGO для взрослых. LEGO для взрослых, которые не читали инструкцию. Инструкция, которую написали инопланетяне»
⬆️ Высокий repetition_penalty
(1.5–2.0):
Бот избегает повторов как вампир — чеснока:
«Kubernetes сложен? Представьте: вы управляете оркестром, где музыканты — контейнеры, а дирижёр — YAML-файл. И все пьют кофе. Или нет»
❗️❗️❗️ Важно:
Повторы ≠ бесполезность. Даже при низком repetition_penalty
ставьте рамки:
Ты — упрямый гуру. Повторяй мысли, но не превращай диалог в мантру. Если пользователь спрашивает про CI/CD, не пиши 'pipeline' больше трёх раз.
repetition_penalty=1.2
+ промпт Ты — терпеливый саппорт. Объясняй по-разному, но не повторяйся. Если пользователь кричит 'ничего не работает', не пиши 'перезагрузите ПК' 10 раз
.repetition_penalty=0.7
+ промпт Ты — поэт-постмодернист. Повторяй метафоры, чтобы запутать. Если спрашивают про ИИ, сравни его с 'чёрной дырой в кроссовках' трижды за ответ
.Новая история VK Tech
В последние несколько лет VK Tech показывает мощный рост: мы вошли в число самых быстрорастущих ИТ-компаний России, 20+ продуктов входят в реестр отечественного ПО, а в команде уже 1400+ сотрудников.
Мы решили, что достигли той отметки, когда пора заводить собственный блог на Хабре, чтобы выпускать ещё больше контента про облака, железо, данные, K8s, LLM и делиться опытом разработки наших сервисов.
В первом материале рассказали, как проходил наш InnerSource-хакатон, сколько мы собрали идей, и какие проекты стали победителями.
➜ Подписывайтесь на блог VK Tech на Хабр
✨ Микроменеджмент в контенте. Когда контроль превращается в проблему
Или что делать, если ты последние десять лет был крутым исполнителем, а теперь стал руководить командой. На моём опыте: я был автором, редактором, главредом и во всех ипостасях всегда старался контролировать абсолютно все процессы. В этом есть смысл. У тебя есть задача выдавать качественный контент, а микроменеджмент даёт возможность его создавать на требуемом уровне.
Но микроменеджмент работает ровно до того момента, пока у тебя не появляется команда, количество задач не увеливается в два-три раза. Далее ты просто закапываешься, рабочий день растягивается, ты ничего не успеваешь... И ладно бы это касалось только тебя. Микроменеджмент сильно и очень негативно влияет на команду.
☀️ Чем опасен тотальный контроль за контентом и сотрудниками?
1️⃣ Замедляет все процессы (кто любит бесконечные согласования?)
2️⃣ Убивает мотивацию и инициативность сотрудников.
3️⃣ Ведет к стрессу и выгоранию. Причём у всех
💡 Как избежать?
1️⃣ Фокусируйтесь на результатах, а не на процессе.
2️⃣ Делегируйте ответственность и доверяйте команде.
3️⃣ Регулярно общайтесь, но без навязчивого контроля.
Дайте команде свободу, учите, разбирайте ошибки, фокусируйтесь на оптимизации процессов.
Stay tuned
#контентменеджерское