chillhousetech | Неотсортированное

Telegram-канал chillhousetech - ChillHouse

4047

By Alexey Moiseenkov about startups, AI, ML and consumer product building. Opinions are my own. Only about tech.

Подписаться на канал

ChillHouse

Пока бегаю тут, удалось провести классический тест генерации изображений.

Читать полностью…

ChillHouse

Пост не реклама. Какие каналы в телеге я периодически читаю и почему.

1/ про модели, AI и все такое с разумной долей скептики и кучей мемов. Чтобы ненапряжно.

2/ Бориса знаю лично, уважаю. Тем более его прогресс в карьере значимый, уже staff ML в eBay. Тоже про ML.

3/ Иногда нужны всякие репорты, исследования и отчеты больших консультантов и прочие рыночные исследования. Ноль комментов, только файлы.

4/ Леня Черный, когда-то давным-давно начинали вместе в Яндексе. Леня лид наших усилий в Турции, мне 23 года, я проджект в картах. Просто пишет про менеджемент со стороны очень опытного руководителя. На досуге почитать полезно.

5/ Влада тоже знаю давно, он только начал канал. Снова тема AI, но больше пока интересных фактов и историй. Поэтому просто поддержите усилия :)

6/ Респектую Артему и его ai newz. Наверное самый понятный мне канал про новости из мира моделей AI, сухо, четко, вовремя.

7/ к сожалению в остальных, которые мне нравились посты не выходили уже аж месяц. Хотя ребята там ведут четкие. Возможно отмечу в комментах.

А что читаете вы? Накидывайте ссылки в комменты, думаю всем будет полезно. Лучших по-моему мнению добавлю в пост.

Читать полностью…

ChillHouse

Как и обещал, выкладываем бота в Open Source - форкайте на здоровье, ставьте в своем закрытом окружении, не бойтесь ссылки не утекут

https://github.com/matterai/DataKitsune

Небольшие улучшения:
- сделали по сути 1на1 режим, закинул ссылку и он тебе выдал саммари, например я закинул видосики с ютуба и он выдал мне что там к чему
- вообще говоря видео режим очень удобный для разных целей ибо выдает все по таймкодам (нужно быстро найти какойто момент, с помощью команды search вы сможете в закинутых видосах поискать огого тема)

Читать полностью…

ChillHouse

Блин, хочу такую фичу

Читать полностью…

ChillHouse

I've even heard professors warn that reading the wrong book can "cause brain damage" (с)

Я достаточно часто начинаю для себя отмечать, что мотивации AI research тим стали похожи больше не на науку, а на паблишинг новой фичи, которая вот еще один бенчмарк взяла. Это все продает "бодрый" СЕО, кричащий мы все скоро увидим AGI. Мне кажется с этим что-то не так, и все превратилось в моду. Во многих топ лабах по-моему ощущению стал пропадать дух науки. И тут я наткнулся на интересную заметку одного математика, который посетил конгресс (встречу) организованную именно для математиков; Но как мне кажется важен сам прецендент, AI действительно сильно влияет практически на все области знаний и науки. Занятное время!


Много вещей, которые мне ментально и модельно близки и отражают суть моей работы:
- Теренс Тао (один из самых сильных математиков современности, почитай про него обязательно), написал заметку в 2007 "Be Patient", отмечая тот факт что часто от первого дня работы над проблемой до ее решения могут пройти годы. Примерно так же я считаю в действительно сложных продуктах и решениях, к которым я приходил.
- В математике как и в физике, открытия часто называют именами тех, кто над ними работал. Это подчеркивает важность человеческого фактора, так же как и я считаю о важности команды людей в стартапе. Многие недооценивают это, но действительно крутых ребят найти крайне сложно и это большая часть успеха. И самое интересное что в работах по математике, команда считается равной, в заголовке работы фамилии идут в 75% случаев в алфавитном порядке, а в других областях (AI) в порядке занчимости вклада.
- Математики часто ищут суть вещей, когда как AI пытается лишь изобрести что-то новое или восхитить. Примерно так же я думаю про все, с детства увлекался физикой, потому что хотел понять как работают вещи, вселенная и прочее ведь это супер круто, как будто открывается новый мир: когда уравнение это не просто набор букв и равенств, это то что вокруг тебя.
- И хороший вопрос прозвучал в конце так, пусть даже новая AI система сможет доказать гипотезу Римана, но что если доказательство будет столь сложным, что человек его просто не сможет понять. Будет ли смысл в таком доказательстве? Что если фундаментальные открытия больше никто не будет понимать вообще? Ведь такого в истории человечества еще не было. И сможем ли мы по-настоящему использовать такие открытия?

Читать полностью…

ChillHouse

Кто, хотел сразу показать метрики инвесторам. Есть план:

- поднимаем pre-seed у банка/друзей
- тратим на перформанс рекламу 250к
- делаем 83к выручки в первый месяц, может даже день!
- и вот «самый быстрый 1M ARR»

Читать полностью…

ChillHouse

Пока пишу пост по мотивам изучения всяких топиков по AI alignment. А там столько интересного, а не только нас поработят и все. Все больше думаю вот так.

Читать полностью…

ChillHouse

Ну да, а чего не 200k в месяц? Мм?
У них похоже странная любовь к кратным 20 числам.

Читать полностью…

ChillHouse

Да хоть за триллион баксов тренировка

Читать полностью…

ChillHouse

Помните Skype? Ну все, пока пока. Уходит эпоха.

Новость

Читать полностью…

ChillHouse

8 центов за список файлов в моей папке, где я собирал всякие тестовые проекты по приколу с помощью Claude Code. Понял принял ls -la

Читать полностью…

ChillHouse

Одной строкой, новый релиз claude 3.7 - бегу тестить! Но так как это моя любимая модель была и до, а то есть в старой версии, надеюсь не подкачает! И нравится, что каждый релиз сопровождает понятная стратегия к чему ребята идут и даже сроки есть (в голове умножаем на 2-3). А верят они, что реальная автоматизация только через пару лет в сложных задачах (а как мы знаем все наши задачи сложные).

Читать полностью…

ChillHouse

Наш ждет замена джун разработчиков, нас ждет агент на агенте для всего и вся. Но как обычно в целом, пока все эти агенты мне кажутся практически бесполезными автономно и только хорошо помогают человеку с рутинными задачами. И подтверждении этого из OpenAI новая работа. Хотя конечно, результаты впечатляют. Надо будет попробовать так взять задач на аутсорсинг сайтов :) вдруг заработаем!

SWE-Lancer: Оценка возможностей современных LLM в реальной фриланс-разработке ПО. Такие вот дела! Взяли тучу задачек реальных с upwork (тут конечно же делаем скидку на качество и понимаем, что задачи внутри корпораций будут совсем другие по содержанию и сложности) и сделали бенч. Кто сколько заработает из текущих сеток.

TLDR:
1/ Claude рвет всех своих конкурентов и даже побеждает ризонинг сеточки о1 серии (ого, признали свое поражение, надеемся на лучшее)
2/ результаты прям очень далеки от идеальных и все сетки не справляются даже с половиной задач, хотя в менеджерской секции (прими/выбери правильное решение из готовых) все намного лучше, но все равно около половины только решено верно.
3/ фокус задач на полноценной фул стэк разработке кстати

Картиночки кто сколько из ляма баксов (успешное выполнение задач из бенча стоит на upwork условный миллион долларов) смог заработать.

Читать полностью…

ChillHouse

😘

Читать полностью…

ChillHouse

Вообще говоря давно считаю, что формат резюме сломан сам по себе. И он не говорит о человеке почти ничего. О чем это я?

Так вот о том, что центральным пунктом в резюме обычно стоит название компании, где человек работал и время проведенное там. Описание успехов мы надеюсь все понимаем, что ничего не стоит, так как никто никогда не проверит и даже как проверить не ясно (ну разве что там хардскиллы связанные с этим). И все мол цепляются за условный Google, Meta, Stanford etc. Вся логика основана на «ну раз он прошел их отбор, значит топ специалист». Хотя их отбор набор шаблонных заданий на таком то масштабе как сейчас.

Я бы смотрел на другое. А именно на людей, с кем работал данный человек. Кто был его лидером или руководил командой, что этот человек сделал и с кем еще работал. Мне кажется фундамент обучения и прогресса зависит от людей вокруг. Поэтому всем, кто ищет роста - ищите не логотипы новых стартапов с фандингом, а людей с кем бы вы хотели работать. Именно люди формируют у вас понимание что такое успех и как его достичь, именно люди могут дать свободу воли и решений или забрать. Но никак не название или прибыль компании.

Читать полностью…

ChillHouse

Друзья, следующие пару недель в долине. Писать вам так сказать лайв репортаж? Будет много встреч, переговоров и так далее. Как обычно много AI.

Читать полностью…

ChillHouse

Теория загруженного календаря или почему Илон Маск тааааак много успевает, даже в игры на приличном уровне тоже.

Есть такой классический тип восхищения работоспособностью людей. Мол как же так и там лекцию прочитать, и посты запостить и еще поработать и там сходить куда-то на встречи. У меня есть свои пять копеек «как же оно так вышло или что тут не так».

Разобью на рандомные пункты:
1/ Забитый календарь или миллион дел не дают возможности выдохнуть, ну или подумать, осознать происходящее. Лично у меня на два эффективных часа действительно важных решений или писем или плана уходит 8-10 часов на подумать, которое выражено чаще всего в смотрении стрима на Twitch, сидении в своем саду или прогулке или даже уборке. Поэтому играть в игры это часть процесса обдумывания или отдыха мозга, когда переключаешься полностью.

2/ Чем больше дел, тем менее они важны. Одним словом, когда у вас 100500 задач в дне, это все мелочи, которые не требуют внимания и полностью либо автоматизируются либо забиваются нафиг.

3/ Смело бегите от руководителя у которого все забито 24/7 (если ваш руководитель не топ менеджер или СЕО). Он не успевает осмотреться и принять правильные решения относительно команды точно. А если еще и хвастается этим то вообще беда. Забитый календарь это проблема. И часто расфокусировка и неумение выставлять приоритеты.

4/ Я банально верю в 3-4 часа эффективной работы в день если вам после 30.

5/ Все забито == неумение делегировать, а это важный навык ныне и всегда был.

6/ Все выше про интеллектуальный труд. Легкое его определение это когда не работаете физической силой и когда в вашей профессии есть люди, которые в десятки раз эффективнее других (так говорил в свое время Стив Джобс про разработчиков и почему так важно нанимать лучших потому именно в этой области есть пропасть в эффективности между разными профессионалами).

А у вас забит календарь?

Читать полностью…

ChillHouse

Мой любимый тест на посылку в LLM. Оставляйте ваши ответы в комментах. Надо выбрать фигуру, которая «отличается».

В первом комменте будут ответы сеток. А какой ваш?

Читать полностью…

ChillHouse

Дорогие друзья! У нас внутри команды есть небольшой бот, мы его сделали для внутренних целей. Ну и решили заодно выложить в паблик и бесплатно (надеюсь все наши кредиты не сожжем).

Зачем сделали. У нас в команде часто кидают разные ссылочки в чаты, много прям, знаете аж я не успею все эти статьи, пэйперы, YouTube видосы посмотреть. Вот решили сделать инструмент для того, чтобы не пропускать. Для начала делаем для телеги и ее чатиков.

В чем смысл:
- бот в чате умеет собирать все ссылки и отправлять вам в личку саммари в настроенное время
- боту не нужны админ права
- бот умеет суммаризировать видео (спасибо Gemini API) с YouTube
- надеюсь держит нагрузку :)
- сам бот /channel/datakitsune_bot

Красиво видео и лендинг прилагается

Буду очень рад если вы попробуете (все бесплатно), пошарите друзьям кому актуально.

Так же принимаю фидбек на доработку если действительно пользуетесь подобным.

Читать полностью…

ChillHouse

Ладно хватит ололо постов. К рубрике «прочитано, но не до конца понято». Сегодня будет много всякого разного.

1/ Очень годная статья под названием «Domain specific architectures for AI inference» для тех кто увлекается запуском и оптимизацией. Более того в статье много хороших ссылок.

2/ Настоящая хорошая гайд статья по тому какие есть пути добежать до 1M ARR (в отличие от моего совета выше) от Bessemer Ventures.

3/ Квантовые чипы от Микрософта пока отменяем. Слишком уж революционно. Есть обзорчик.

4/ Нашел достаточно интересное предсказание про self driving cars от чувака который работал в одной команде по AI alignment вместе с Ильей Суцкевером и например Дарио Амодей. А интересно тем, что ситуация по предсказанию похожа что мол вот через 10 лет все будет! Но мы то знаем про self driving cars что нет, нет ничего спустя десять лет :) кроме пару городов на чуть чуть.

5/ забавный бенч, где пытаются сравнить показатели моделей на задачах которые так же выполняет эксперт человек. Но самое интересное, что многие модели поймали за читерством в прямом смысле этого слова (например в похожем бенче на игре в шахматы модель перебирала грубо тысячи позиций чтобы посмотреть какая подойдет). Ну и там в целом есть классный тред про чуть другое, пост оригинал удалили кстати.

6/ это лучшая спека для вашего агента по кодингу

7/ если вы вдруг так же как и я иногда скучаете по теор физике есть хорошая напоминалка

Читать полностью…

ChillHouse

И так мой бартерный пост, друзья мои которые прошли YC, запускают на продакт ханте свой продукт. У них еще прям какая-то супер активная тема по линкедину - какие-то бешеные охваты (не знаю насчет эффективности).

https://www.producthunt.com/posts/fluently-ai-english-coach

В благодарность за поддержку, всем кто поставит апвоут cегодня (11 марта) - скинут свой гайд по фандрейзингу и заполнению заявки в топ акселератор США - Y Combinator. В гайде опыт прохождения в YC и привлечения денег на pre-seed / seed стадиях (подняли они около 2).

Как поставите апвоут - заполните анкетку, и вам пришлют гайд.

P.S. Взамен получу постик о моем мини запуске на днях. Stay tuned.

Читать полностью…

ChillHouse

Побывал на ужине фаундеров, которых поддерживает OpenAI. Ну все просто продают обертки :) хорошая стратегия для OpenAI чтобы твое API продавали стартапы, которые еще и рейзят сами

Читать полностью…

ChillHouse

Немного о будущем SAAS, персональных ассистентов в системе и AI для всей этой штуки.

Недавно вышел Claude Code агент и в прошлом году начал очень сильно хайпить Cursor. Это все такие максимально близкие к автоматизации системы (агенты можно назвать), которые помогают вам писать код или быть по сути программистом фичей. Я еще прошлым летом достаточно легко писал игры для телеги в качестве эксперимента не трогая руками ни одной строки кода. Тогда все не особо верили. Потом качество базовых моделей для программирования стало расти и стало возможно писать вполне сложные прототипы.

Что я хочу сказать, что сейчас вполне реально без знаний программирования сделать себе самому веб приложение или простую игру и радоваться. Да, будет чуть чуть потно по пути, но получится.

Так вот я считаю, что с текущим темпом прогресса в автоматизации процесса программирования вы сможете легко написать себе любой базовый интерфейс для чего-то. Например нужно завтра изучить Английский каким-то методом, который вы увидели в тиктоке, открываете ассистента (в скором времени даже системного) и говорите: а сделай мне приложение для изучения с карточками и вот чтобы еще можно было сразу искать отрывки кино где это слово. И ассистент вам соберет такое приложение. Тоже самое касается и всяких saas для небольших бизнесов. Вы сможете просто сказать: а сделай плиз а/б тесты на кнопки покупки и покажи результаты и может даже выбери что по данным там работает на моей аудитории.

В этом я вижу большую ставку на Anthropic и Cursor. Именно автоматизация инженерных усилий пока что кажется самой реальной.

Читать полностью…

ChillHouse

Вчера вышла GPT 4.5. Накину пять копеек своих мыслей или не своих (тут сложно быть оригинальным).

По сути текущий подход к AGI задизайнили и никогда не смогут к нему прийти. Что у нас получается то. Новая версия по факту на 10% лучше, но стоила похоже в тренировке пример ярд баксов (1B USD!) судя по ценам на API. Наблюдается логарифмическое масштабирование: каждые 10х затрат дают лишь ~10-15% улучшения. GPT-7, которая превзошла бы GPT-4 так же, как GPT-4 превзошла GPT-2, стоила бы $100 триллионов — весь мировой ВВП.

Есть конечно всякие идеи про test time compute, мол вот же как еще можно сделать умнее, но в таком кейсе на каждый новый токен пришлось бы думать днями. Что выглядит как минимум не применимо в реальной жизни для реальных задач (человека нанять попроще). Да и стоимость дичь.

А к чему я веду. А к тому что действительно мы нащупали стену в прогрессе «Ума» больших моделей и возможностях трансформера. Осталось понять какая архитектура лучше справляется с задачами предсказания и так далее чем “attention is all you need”.

А вы как думаете?

Читать полностью…

ChillHouse

Короче. Признаки контента на который надо смотреть критически и спросить себя три раза не булшит ли это:
- постоянные отсылки к авторитету (ссылки на известных людей типа CEO больших компаний, постоянные фамилии каких-то топ менеджеров)
- ноль фактуры, нет цифр, нет анализа, ничего, упоминаются идеи, сделки все что угодно, подробностей ноль, раскрытия смысла ноль (пример: «у меня была гениальная идея но ее сделали другие»), участников сделки нет, названия компаний нет, инвестора все упоминаются как «топ фонды»
- тебе постоянно пытаются «допродать» автора как супер специалиста, то есть автор доказывает что он крутой, знает, понимает, вместо того чтобы писать конкретные пункты или списки
- никто кроме самого автора не знает его, постоянно идет отсылки к комьюнити и прочему, но при малейшем вопросе «а познакомь» все превращается в продажу «поработай со мной»
- чувствуете что вам скоро начнут продавать платный консалтинг и да значит его начнут продавать
- выводы слишком «революционные», которые решат все ваши проблемы мигом, и вас постоянно спрашивают «а не хотите ли вы изменить свою жизнь/карьеру/зарплату?»

А у вас есть такие признаки? Что не нравится обычно?

Читать полностью…

ChillHouse

Замечу следующий важный момент. Anthropic своим релизом делает вполне четкую ставку на кодинг. Ничего больше. Все остальные бенчи похожи даже не парились улучшать, а вот по SWE подняли сильно (это как раз про кодинг).

Все это говорит лишь о том, что я бы задумался по поводу других агентских систем и их в целом целесообразности. Так как все равно все зависят от базовой модели.

Читать полностью…

ChillHouse

Так как я увлекаюсь квантовыми вычислениями и в целом квантовой механикой (не супер хардкорно к сожалению), то тут такая новость, что Microsoft сделали первый квантовый чип, который якобы позволит скейлится.

Для контекста:
- если это работает то это изобретение сравнимое по уровню с изобретением транзистора (мы все знаем к чему тразистор привел и вся наша комьютерная техника благодаря ему)
- это покруче чем ваш AI

Но надо смотреть конечно.

Читать полностью…

ChillHouse

А помните такой AI Pin от бывших Apple ребят, инноваторов и отцов iPhone, которые работали с самим Стивом Джобсом. А вот все HP покупает за 116M (не ведитесь на сумму это скорее всего долги и бабки инвесторов) и великие становятся просто лидами департаментов, чтобы железки для конференц румов делать и принтеров. Кто бы мог подумать? (Да вообще то я не понимаю как на такое дали денег).

Читать полностью…

ChillHouse

Что там по product manager зарплатам в US, из Lenny Newsletter картиночки подкатили.

TLDR помимо всяких зарплат:

Продакты в Британии поднимают всего 65% от того, что зарабатывают американские ПМы, а европейские вообще довольствуются меньше чем половиной американской зарплаты.
Если хочешь стабильно рубить бабло по максимуму (читай как жизненная стабильность и предсказуемость с долгой дорогой) - топай в публичную компанию в топовом американском городе.
А если хочешь максимальный шанс апсайда - стартапы с фандингом твой выбор.

Вообщем как обычно стабильность или попытка быстро взлететь. Классика.

Читать полностью…

ChillHouse

Короче говоря часто слышу следующие «гениальные посты от ведущих экспертов в области всего, что трендует». Мол ваши все ChatGPT это знаете ли ненадежно, он там никакие нормальные задачи не умеет выполнять. Помните даже два числа не мог сравнить. Или вот повторить за мной не может или там вычислить то, что может даже обычный калькулятор.

Ну вот как раз о калькуляторе речь и пойдет. Как примере технологии к которой мы привыкли и которую большая часть людей в принципе не понимает.

Так в чем же сложность. А сложность друзья мои в числах с плавающей запятой, те самые короче говоря не целые, что-то типа 0.1 или 0.2. Например вы знали, что операция сложения не ассоциативна в современных компьютерах. А именно, может получится, что:

0.1+(0.2+0.3) не равно (0.1+0.2)+0.3


Для реализации операций с такими вот числами ребята придумали стандарт IEEE 754, который на 60+ страницах описывает правила. И даже при его соблюдении одна и та же программа может давать разные результаты на разных системах!

Несколько подводных камней из теории:

1/ При вычитании близких чисел может произойти катастрофическая потеря точности
2/ Промежуточные результаты могут округляться по-разному в зависимости от реализации
3/ Числа могут быть представлены в разных форматах (одинарная/двойная точность)
4/ Нужно правильно обрабатывать особые значения (бесконечность, NaN)
5/ Операции должны давать корректно округленный результат


Когда-то в старые времена Google нанял одного инженера, чтобы написать калькулятор для Android который бы работал хорошо и без ошибок. Звали его Ханс Боэм. Так вот мужик настолько заморочился, что выпустил целую спецификацию и работу про API работы с числами.

Так, что знайте, что сегодня кажется крайне точным и вы ему доверяете на самом деле мало того, что может давать ошибки пусть и понятные, так и это огромный труд десятков лет.

P.S. по чистой случайности похожая статья вышла в HN https://news.ycombinator.com/item?id=43066953

Читать полностью…
Подписаться на канал