Наука, технологии, изобретения и урбанистика — прямо сейчас говорим о том, что уже скоро повлияет на каждого. по всем вопросам - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы
🎭 "Клуни" обманул на миллион: дипфейк актёра развёл фанатку из Аргентины
Аргентинская женщина стала жертвой мошенников, которые в течение шести недель выдавали себя за Джорджа Клуни. Используя дипфейк-ролики, они вели с ней переписку, убеждая, что это настоящий актёр.
💬 "Клуни" якобы собирался разводиться и обещал устроить её на работу — но сначала попросил денег. Обещания продолжались, а переводы не прекращались.
💸 Когда женщина поняла, что её обманывают, было уже поздно: она потеряла более 10 000 фунтов (около 1 млн рублей).
🧠 Напоминание: в эпоху нейросетей и дипфейков не всё, что выглядит реалистично — настоящее.
No money — no honey.
📌 Google AI-поиск: компания запустила экспериментальный AI-режим поиска — бесплатный аналог Perplexity, но с характерной гугловской подачей. Пока функционал доступен только для англоязычных запросов: при попытке спросить что-то на русском система вежливо откажется отвечать.
Пока что фича доступна только в США. Для тех кто хочет опробовать ее самым первым, вот что нужно делать:
1️⃣ Подключите качественный VPN с американским IP (европейские не подойдут)
2️⃣ Переключите язык аккаунта Google на английский я
3️⃣ Перейдите в Google Labs и нажмите на кнопку «AI Mode: TRY IT NOW», затем переведите переключатель «Try this experiment on or off» в положение ON и нажмите кнопку «Try AI Mode»
Возможно, уже скоро традиционные методы оптимизации могут уступить место подобным адаптациям под нейросетевой поиск.
@vistehno
🪲 Tumro — робот, вдохновлённый механикой движения насекомых.
Он ползает и прыгает на высоту, превышающую его собственную в 40 раз, а затем продолжает движение.
Отличный маленький робот для работы в сложных ландшафтах.
Как разобраться в нейросетях раз и навсегда?!
🚀 Хотите понять, как искусственный интеллект может упростить вашу жизнь или вывести ваш бизнес на новый уровень?
🤖 Авторский канал "ИИчко" — место, где ИИ становится доступным, понятным и невероятно полезным для всех, кто интересуется технологиями.
🔍 Что вас ждет:
• Образовательный контент;
• Простые объяснения сложных тем ИИ;
• Инсайты для профессионалов;
• Практические советы;
• Тренды и вдохновение;
Подписывайтесь на "ИИчко" и откройте для себя ИИ с новой стороны!
👉 /channel/+ZTRi8Q-tw4Y2Mjhi
Anthropic проводит испытания безопасности новой модели под названием «Клод-Нептун».
Не удивлюсь, если мы скоро увидим Claude 4.
Дарио Амодей в своём последнем интервью говорил, что Claude 4 будет готов через шесть месяцев. Похоже, это время уже подходит.
#Claude
@data_analysis_ml - подписаться
🎁 РАЗЫГРЫВАЕМ MacBook Air!
Майские праздники продалжаются! Разыграем новенький 13-дюймовый MacBook Air !
Условия участия максимально простые:
🔸Подписаться на телеграм-канал Machine Learning
🔸Подписаться на телеграм-канал Vistehno
🔸Нажать кнопку "Участвовать" ниже.
ВСЁ! Вы участник!
Итоги подведём 14 июня. Доставка приза осуществляется на территории РФ.
Всем удачи!
⚠️ Если бот подвис — не беспокойтесь, вас все равно зарегистрирует, просто выполните условия и нажмите «Участвовать».
Тра файл: мужик через GPT-4o составил текст извинения своей девушке, но слишком сильно доверился ИИ — забыл удалить одну строчку.
Комментарий очень красноречив 😂
🪰 Исследователи из Пекинского авиационного университета разработали микроробота длиной всего 2 сантиметра с ультрабыстрой скоростью передвижения.
Результаты работы опубликованы в исследовании под названием «Беспроводной робот-насекомое с ультрабыстрой автономной скоростью движения» в журнале Nature Communications.
#микроробот #локомоция #биомимикрия #робототехника #технологии #инженерия #инновации
🧩 LegoGPT: Генерация физически устойчивых и пригодных к сборке моделей LEGO по текстовому промету
https://huggingface.co/papers/2505.05469
🚀 Olmo 2 1B — компактная ИИ-модель, которая удивляет. Институт AI2 представил новую языковую модель с 1 млрд параметров, которая обходит решения от Google в тестах на арифметику и точность фактов.
Что делает Olmo 2 1B особенной?
— Полная прозрачность: исследователи выложили не только модель под открытой лицензией Apache 2.0, но и все обучающие данные с кодом обучения. Это редкий случай, когда можно буквально "заглянуть под капот" ИИ.
🔗 Ссылка - *клик*
@vistehno
Видео создано HunyuanCustom
Читать полностью…Киберпанк стал реальностью: в Японии вырастили мозг, управляющий роботом
Учёные создали цереброид — миниатюрный мозг, выращенный из стволовых клеток. Его подключили к специальному чипу, превратив в настоящего киборга.
Этот мозг уже учится, выполняет команды и управляет роботом — словно кадр из научной фантастики.
Он функционирует почти как настоящий, хотя пока и обладает ограниченными возможностями.
Хотите оказаться там, где бизнес и технологии пересекаются не на слайдах, а в реальности?
Конференция Data&ML2Business — это не просто витрина фич, а внутренняя кухня внедрения реальных технологий. 28 мая в Москве или онлайн расскажем, как компании реально применяют ML, BI и аналитические платформы.
В программе:
– выступления CTO и архитекторов Яндекса
– кейсы по генеративным моделям, речевой аналитике и аналитике видео
– гибридные data-решения в фарме и индустриальных компаниях
– что происходит с ML-процессами, когда они выходят за пределы одной команды
Событие подходит тем, кто строит системные решения и работает на стыке бизнеса и технологий.
Присоединяйтесь офлайн в Москве или онлайн — будет полезно.
🚀 ChatGPT всё ещё лидирует в AI-гонке, но Google Gemini стремительно набирает обороты!
Недавний опрос CivicScience показал, что 40% американских потребителей в прошлом месяце использовали генеративные AI-инструменты:
🤖 ChatGPT – 46%
🌟 Google Gemini – 37%
💼 Microsoft Copilot – 25%
🔍 При этом 52% пользователей ChatGPT и 40% пользователей Gemini предпочитают работать исключительно на своей платформе – показатель высокой лояльности и доверия.
Что это значит?
ChatGPT продолжает задавать тон благодаря широкой базе фанатов и зрелой экосистеме.
Google Gemini быстро сокращает отрыв, привлекая новых пользователей свежими возможностями и интеграциями.
Конкуренция стимулирует развитие: нам стоит ждать ещё более интересных функций и улучшений!
А вы какую платформу используете чаще всего? Поделитесь в комментариях!
#AI #ChatGPT #GoogleGemini #GenerativeAI #TechTrends #Innovation
МТС True Tech Day: ИТ-событие, которое нельзя пропустить. Участие бесплатное
6 июня разработчики из российских бигтехов на практических примерах покажут, как ИИ перестал быть экспериментом и стал частью разработки.
В программе:
— Больше 40 докладов от известных ученых и ИТ-компаний.
— Выступления зарубежных спикеров с индексом Хирша более 50.
— Концентрация практических кейсов: как создаются большие проекты с применением AI.
— Доклады по архитектуре, бэкенд-разработке и построению ИТ-платформ.
— AI-интерактивы и технологические квесты.
— Пространство для нетворкинга,
…а еще after-party со звездным лайн-апом.
Когда: 6 июня
Где: Москва, МТС Live Холл и онлайн
Регистрация по ссылке
🚀 Вышел Tencent Hunyuan Image 2.0
Новая модель генерации изображений с ИИ — теперь с по-настоящему кинематографическим качеством и мгновенной скоростью.
⚡️ Что умеет:
✅ Мгновенная генерация картинок по тексту:
Создаёт изображение за доли секунды — быстрее в 15 раз, чем другие ИИ. Пишешь или говоришь — и сразу видишь результат.
✅ Картинки как из фильма:
Никакой "пластиковой" графики. Новый подход к обучению делает текстуры и свет реалистичными — как в кино.
✅ Умная работа с холстами:
Можно работать сразу на двух холстах, синхронизируя композицию, свет и перспективу. Плюс поддержка многослойности — идеально для художников и дизайнеров.
Быстро, красиво и удобно.
👉 Попробовать: https://hunyuan.tencent.com
#TencentHunyuan #AI
Tехнологии, которые управляют будущим
Вы знали, что современные технологии позволяют управлять автомобилями, техникой и даже промышленными объектами на расстоянии?
На канале Galileosky | как заехать в телематику раскрывают секреты:
✅ Как следить за транспортом и оборудованием в режиме реального времени?
✅ Как снизить расходы на топливо и обслуживание?
✅ Какие технологии уже работают в логистике, строительстве и сельском хозяйстве?
Будущее за цифровыми решениями – разберитесь в них первыми!
@Galileosky_channel – подпишитесь и узнайте, как использовать технологии с выгодой!
#реклама
О рекламодателе
🚀 10 GitHub-репозиториев, чтобы изучить большие языковые модели (LLM)
Если вы хотите всерьёз разобраться в работе с LLM — от инженерии запросов до создания собственных агентов — KDnuggets собрали отличную подборку 10 репозиториев, которые помогут вам прокачаться.
📚 brexhq/prompt-engineering
Практическое руководство по инженерии запросов: стратегии, паттерны, ошибки и советы для работы с LLM (ChatGPT, Claude и др.)
https://github.com/brexhq/prompt-engineering
🎓 mlabonne/llm-course
Полноценный курс по большим языковым моделям: теория, код, проекты — всё, что нужно для старта
https://github.com/mlabonne/llm-course
🧠 Hannibal046/Awesome-LLM
Курируемый список лучших статей, туториалов, фреймворков и репозиториев по LLM
https://github.com/Hannibal046/Awesome-LLM
🤖 WooooDyy/LLM-Agent-Paper-List
Подборка научных работ и статей о LLM-агентах и архитектурах на их основе (AutoGPT, LangGraph и др.)
https://github.com/WooooDyy/LLM-Agent-Paper-List
📊 avvorstenbosch/Masterclass-LLMs-for-Data-Science
Электронная книга с упражнениями по применению LLM в анализе данных и автоматизации рабочих процессов
https://github.com/avvorstenbosch/Masterclass-LLMs-for-Data-Science
🛠️ Shubhamsaboo/awesome-llm-apps
Сборник реальных приложений на базе LLM, с кодом и открытыми API
https://github.com/Shubhamsaboo/awesome-llm-apps
🖼️ BradyFU/Awesome-Multimodal-Large-Language-Models
Ресурсы по мультимодальным LLM: модели, которые работают с текстом, изображением и звуком
https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models
📘 HandsOnLLM/Hands-On-Large-Language-Models
Официальный репозиторий к книге “Hands-On LLM” — с кодом, проектами и понятными объяснениями
https://github.com/HandsOnLLM/Hands-On-Large-Language-Models
🧠 Эти репозитории охватывают всё: от базового понимания до создания сложных LLM-систем.
🤖 ИИ в офисе: недавнее исследование проверило, как современные нейросети справляются с реальными рабочими задачами — от написания кода до управления проектами. В виртуальной компании с GitLab, чатами и CRM семь ИИ-агентов выполняли 175 заданий.
Лучший результат показал Claude-3.5, решивший 24% задач полностью, но даже он споткнулся на финансовых отчётах и админработе. Интересно, что модели чаще всего ошибались в элементарном: не распознавали документы, игнорировали советы коллег, путались в интерфейсах.
Пока ИИ эффективен только для рутинных операций с чёткими инструкциями. До полноценной замены сотрудников еще довольно далеко, но гибридный формат связки человека + ИИ уже выглядит неизбежным будущим офисной работы.
🔗 Ссылка - *клик*
@vistehno
🧠 ИИ предсказывает выживаемость при раке точнее, чем врачи — заявляют исследователи
Британские учёные разработали новую ИИ-систему, которая предсказывает выживаемость пациентов с раком точнее, чем врачи. Она обучена на реальных медицинских данных и демонстрирует лучшую точность в оценке долгосрочных прогнозов.
💡 Система помогает:
• Индивидуализировать лечение
• Определять риски на ранней стадии
• Поддерживать врачей в принятии критически важных решений
Этот прорыв — пример того, как ИИ усиливает человеческий интеллект, особенно в высокоответственных задачах. Вместо замены врачей — он становится надёжным партнёром.
🔬 Более точные прогнозы = более персонализированная и эффективная терапия.
📌 Яркий пример ИИ "во благо".
https://www.pymnts.com/news/artificial-intelligence/2025/ai-system-can-predict-cancer-survival-prognosis-better-than-doctors-researchers-say/
Создавай мобильные приложения — без единой строки кода!
Забудьте про сложные IDE и запутанные мануалы. Теперь за вас всё делает ИИ.
AppAlchemy — это сервис, который превращает текстовое описание в полноценный UI-дизайн для iOS и Android.
Просто опишите, что вы хотите — нейросеть соберёт экраны, предложит варианты редизайна и всё покажет вживую.
🛠 Возможности платформы:
💬 Генерация дизайна по описанию
✨ Автоматические идеи по улучшению интерфейса
🧩 Редактирование макета прямо в браузере
📱 Экспорт проектов под Android и iOS
🆓 Бесплатный базовый тариф
🔮 Попробуй магию —http://appalchemy.ai/
⚡️Создаём свою нейросеть в PyTorch
Хотите быстро разобраться в PyTorch и написать свою нейросеть? Мы подготовили для вас вебинар, где на практике разберём все этапы создания ML-модели.
Вебинар проведет Владислав Агафонов — ML-инженер, ранее работал в Yandex и Huawei.
Что будет на вебинаре?
🟠Установим PyTorch в Google Colab и настроим работу на бесплатном GPU;
🟠Поймём, что такое тензоры и почему они — фундамент всех нейросетей;
🟠Скачаем готовый датасет, разберём его структуру и подготовим для обучения;
🟠Научимся использовать DataLoader для эффективной загрузки данных;
🟠Пошагово соберём облегчённую версию классической свёрточной нейронной сети (CNN);
🟠Обучим и протестируем модель.
🕗 Встречаемся 14 мая в 18:30 по МСК, будет много практики, ответы на вопросы и полезные инсайты от эксперта.
😶Зарегистрироваться на бесплатный вебинар
🤖 Джеффри Хинтон: человек, который научил машины думать — и пожалел об этом
*В 1986 году он написал статью, которую никто не хотел читать.
В 2012 — создал модель, которая изменила всё.
А в 2023 — ушёл из Google, заявив:*
> "Я больше не могу участвовать в этом."
🧠 Глава 1 — Изгнанник
Джеффри Хинтон — потомственный логик. Его прадед, Джон Хинтон, был соратником Бертрана Рассела.
Но сам Джеффри выбрал путь нейросетей — странной идеи, что машины можно обучать, как мозг.
В 80-х это считалось ересью.
ИИ умер.
Финансирование ушло к экспертным системам.
Профессора смеялись. Он был "тот, кто возится с биомоделями".
Его идеи отвергали. Но он продолжал.
> _"Если никто не верит в твои идеи, это может значить, что они плохие.
> Или… что ты слишком рано."_
> — Джеффри Хинтон
🔁 Глава 2 — Возвращение
В 2006 году он публикует работу о глубоких нейросетях.
А в 2012 — вместе с двумя студентами, Алексом Крижевским и Ильёй Суцкевером — создаёт AlexNet.
Она уничтожает конкурентов в ImageNet.
Ошибка распознавания изображений падает почти вдвое.
Мир меняется.
Facebook, Google, Microsoft — все бросаются нанимать тех, кто "знает про нейросети".
Джеффри Хинтон становится иконой нового ИИ.
🌐 Глава 3 — Все используют, никто не понимает
На его идеях строится:
- Google Translate
- Siri
- AlphaGo
- ChatGPT
- Рекомендательные алгоритмы YouTube и TikTok
Но сам Хинтон начинает ощущать:
мы создаём не инструмент — мы создаём силу, которую не контролируем.
🛑 Глава 4 — Отход
В мае 2023 года Хинтон покидает Google.
Он больше не может молчать.
> _"Я хочу говорить открыто о рисках ИИ.
> О том, что мы можем потерять контроль над разумом, который сами породили."_
Он сравнивает ИИ с оружием, которое может быть использовано как во благо, так и во зло.
Говорит о:
- дезинформации
- автономном оружии
- потере доверия к реальности
🎯 Финал
Джеффри Хинтон — не Стив Джобс. Он не сделал миллиардов.
Он не устраивал презентации.
Но он изменил мир глубже, чем любой техно-стартап.
Он придумал, как научить машину видеть, слышать и "думать".
И первым из всех признал:
> _"Может быть, мы сделали нечто слишком сильное.
> И слишком рано."_
📌 Джеффри Хинтон — учёный, который задал самый главный вопрос:
> *А не зашли ли мы слишком далеко зашли?*
✔️ Тенденция регулирования ИИ меняется: техгиганты переходят от «стремления к регулированию» к «отказу от регулирования».
Сэм Альтман, генеральный директор OpenAI, на слушаниях в Сенате заявил, что государственное одобрение для запуска мощных ИИ-систем губительно для технологического лидерства США. Это резкий разворот позиции после его же призывов к созданию регуляторного агентства два года назад. Теперь акцент сместился: вместо предупреждений об «экзистенциальных рисках» ИИ топ-менеджеры и власти требуют ускорить разработки, чтобы обогнать Китай.
OpenAI не одинока в резком смене курса: Google DeepMind отказался от запрета на военные ИИ-проекты, а Microsoft и компания Марка Цукерберга сняли ограничения на сотрудничество с армией.
washingtonpost.com
✔️ Nvidia адаптирует чип H20 для Китая, чтобы обойти экспортный контроль США.
Nvidia планирует выпустить упрощенную версию чипа H20 для китайского рынка уже в июле. Модификация связана с ужесточением экспортных ограничений США, которые заблокировали поставки оригинального чипа без специальной лицензии. Новый вариант H20 получит значительно урезанную память и другие технические ограничения, но позволит Nvidia сохранить позиции на ключевом рынке, где за прошлый год компания заработала $17 млрд.
По данным инсайдеров, китайские клиенты Tencent, Alibaba и ByteDance уже активно интересовались чипом, нарастив заказы до $18 млрд только с начала года. Глава Nvidia Дженсен Хуанг недавно посетил Пекин, подчеркнув стратегическую важность региона для компании.
reuters.com
✔️ Google инвестирует в 3 площадки для развития ядерной энергетики в США.
Google расширяет свое участие в энергетическом секторе, выделив финансирование стартапу Elementl Power для подготовки 3 площадок под современные ядерные проекты в США. Каждый объект планируют оснастить реакторами мощностью от 600 МВт, что должно помочь корпорации обеспечить стабильное энергоснабжение для своих дата-центров. Сумма вложений не раскрывается, но цель партнерства — ускорить ввод новых мощностей до 2035 года.
Elementl Power, основанная в 2022 году, позиционирует себя как разработчика «под ключ», предлагающего решения для клиентов, которые хотят доступ к чистой энергии.
world-nuclear-news.org
✔️ LegoGPT генерирует конструкции LEGO по текстовым описаниям.
Исследователи из Университета Карнеги-Меллон представили LegoGPT — нейросеть, которая превращает текстовые запросы в рабочие схемы сборки LEGO. Модель обучалась на 47 тысячах структур, что позволяет ей создавать оригинальные дизайны с нуля.
Система поэтапно подбирает блоки, проверяя их совместимость и устойчивость. Если деталь пересекается с другими или «висит в воздухе», LegoGPT откатывается к стабильному шагу и продолжает сборку. Результат всегда можно собрать руками или роботом. Код проекта доступен на GitHub.
tomshardware.com
✔️ Google создала Gemini Nano для защиты от мошенничества в реальном времени.
Google усилила борьбу с онлайн-мошенничеством, интегрировав модель Gemini Nano в браузер Chrome. Технология работает прямо на устройстве, анализируя сайты в режиме реального времени и блокируя фишинговые страницы до того, как пользователь успеет ввести данные.
В Android-версии Chrome появились ИИ-уведомления: если система заподозрит спам в push-сообщениях, предложит отписаться или заблокировать. Аналогичные алгоритмы теперь сканируют звонки и SMS — Gemini Nano распознает подозрительные шаблоны, даже если схема новая.
blog.google
@ai_machinelearning_big_data
#news #ai #ml
⚡️ HunyuanCustom: консистентная видеогенерация c инпейнтом и липсинком.
Tencent выпустила HunyuanCustom, фреймворк, который не только генерирует видео по заданным условиям, но и умеет сохранять консистентность субъектов, будь то человек, животное или предмет. Модель справляется даже с мультисубъектными сценами: в демо-роликах люди естественно взаимодействуют с предметами, а текст на упаковках не плывет между кадрами.
В основе модели лежит улучшенный механизм слияния текста и изображений через LLaVA. Например, если вы загружаете фото женщины в платье и текст «танцует под дождем», система анализирует оба инпута, связывая описание с визуальными деталями.
Но главное - это модуль временной конкатенации: он «растягивает» особенности изображения вдоль временной оси видео, используя 3D-VAE. Это помогает избежать «прыгающих» лиц или внезапных изменений фона, проблемы, которая характерна даже для топовых моделей видеогенерации.
Tencent переработали и пайплайн аудио. Для синхронизации звука с движениями губ или действиями в кадре HunyuanCustom использует AudioNet, модуль, который выравнивает аудио- и видеофичи через пространственное кросс-внимание.
Фреймворк поддерживает возможность замены объекта в готовом ролике (скажем, подставить новую модель кроссовок в рекламу), модель сжимает исходное видео в латентное пространство, выравнивает его с шумными данными и встраивает изменения без артефактов на границах.
Экспериментальные тесты показали, что HunyuanCustom обходит конкурентов по ключевым метрикам. Например, Face-Sim (сохранение идентичности лица) у Tencent — 0.627 против 0.526 у Hailuo, а с Keling, Vidu, Pika и Skyreels разрыв еще больше.
⚠️ Для работы модель требует минимум 24 ГБ видеопамяти для роликов 720p, но чтобы раскрыть все возможности, разработчики рекомендуют 80 ГБ VRAM.
Код и чекпоинты уже доступны в открытом доступе, а в репозитории есть примеры запуска как на нескольких GPU, так и в экономном режиме для потребительских видеокарт.
📌Лицензирование кода : Tencent Hunyuan Community License.
🟡Страница проекта
🟡Модель
🟡Arxiv
🖥GitHub
@ai_machinelearning_big_data
#AI #ML #Video #HunyuanCustom #Tencent
🚀 ✔️ LTX Studio выпустила открытую видео-модель с рекордной скоростью и качеством.
LTX Studio представила новую модель для генерации видео, которая сочетает скорость, детализацию и контроль. Свыше 13 млрд. параметров и технология multiscale rendering позволяют добиться плавного движения, четкой картинки и минимума артефактов даже в динамичных сценах.
Суть multiscale rendering — анализ сцены на разных уровнях детализации, который сохраняет крупные объекты стабильными, не теряя мелких элементов. Результат: реалистичная анимация и согласованность между кадрами.
Модель работает до 30 раз быстрее аналогов при том же качестве и позволяет управлять ключевыми кадрами и камерой — можно буквально «режиссировать» каждый момент. Она доступна бесплатно на платформе LTX Studio или для локального инференса, веса опубликованы на HuggingFace.
LTX в сети Х (ex-Twitter)
▪Попробовать можно тут→ https://app.ltx.studio/ltx-video
▪Code → https://github.com/Lightricks/LTX-Video
▪Weights → https://huggingface.co/Lightricks/LTX-Video
🤖 История нейросетей: от мечты до революции
Когда-то идея создать «машину, похожую на мозг», звучала как фантастика. Сегодня нейросети распознают лица, переводят тексты, управляют роботами и пишут код. Как мы дошли до этого?
1) 🧠 Все началось… с нейрона на бумаге
✨ 1943 год.
Два учёных — Уоррен МакКаллок и Уолтер Питтс — публикуют статью, где описывают математическую модель нейрона. Они показали: нейроны можно представить как простые логические элементы, способные передавать сигналы.
Это была первая попытка описать работу мозга через математику.
👉 Но… компьютеры тогда только зарождались, а про обучение моделей никто не думал.
2) 🔍 Появляется перцептрон — первая нейросеть
✨ 1958 год.
Американский психолог Фрэнк Розенблатт создаёт перцептрон — устройство, которое могло «учиться» распознавать простые образы (например, различать круг и квадрат).
📝 Перцептрон обучали на карточках с рисунками: показывали примеры, корректировали ошибки. Машина сама подбирала веса связей между нейронами, чтобы давать правильный ответ.
Это был первый шаг к обучаемым моделям, но… были ограничения.
3) 💤 Застой: «нейросети не могут»
✨ 1969 год.
Книга Марвина Мински и Сеймура Паперта «Перцептроны» разбила мечты: учёные доказали, что односвязный перцептрон не способен решать задачи, требующие нелинейных разделителей (например, XOR).
👉 Многие поверили, что нейросети — тупиковая ветвь.
Финансирование упало. Интерес угас.
4) 🚀 Второе дыхание: обратное распространение ошибки
✨ 1986 год.
Джеффри Хинтон, Дэвид Румельхарт и Рональд Уильямс открывают метод backpropagation (обратного распространения ошибки).
Теперь нейросеть могла автоматически корректировать все свои слои, а не только первый. Это позволило строить глубокие нейросети и обучать их на сложных задачах.
💥 Революция? Почти. Компьютеров всё ещё не хватало, чтобы обучать большие сети.
5) 📷 Практическое применение: сверточные сети
✨ 1990-е.
Янн Лекун создаёт LeNet — сверточную нейросеть (CNN), которая распознавала рукописные цифры на чеках. Это была первая успешная коммерческая нейросеть.
👉 LeNet работала медленно, но точнее, чем любые предыдущие методы.
6) 💥 Большой взрыв: глубокое обучение
✨ 2012 год.
На конкурсе ImageNet сеть AlexNet (созданная студентами Хинтона — Крижевским и Суцкевером**) разгромила соперников, улучшив точность классификации изображений на **10% сразу.
Почему получилось?
• Были большие данные (ImageNet — 1,2 млн изображений)
• Были мощные GPU
• Были методы dropout, ReLU и хорошее понимание backpropagation
С этого момента deep learning стал мейнстримом.
Компании вроде Google, Facebook, Microsoft начали инвестировать миллиарды.
7) 🤯 Нейросети сегодня: GPT, Stable Diffusion, AlphaFold
Сейчас нейросети умеют:
• писать тексты (GPT)
• рисовать картины (Stable Diffusion, Midjourney)
• предсказывать белковые структуры (AlphaFold)
• водить машины (Tesla Autopilot)
Размер моделей растёт: от 10 нейронов в перцептроне — до 500 миллиардов параметров в GPT-4.
8) 🏁 Что дальше?
Мы прошли путь от искусственного нейрона — до машин, которые иногда ведут себя пугающе «человечно».
И это — только начало.
Кто знает, где мы окажемся через 10 лет?
👉 А нейросети продолжают учиться.
И, возможно, скоро они напишут продолжение этой истории сами.
🎉 Если понравился рассказ — поделись с друзьями, чтобы они тоже узнали, как всё начиналось!
🔍 Хочешь отдельную статью про GPT, CNN или AlphaFold? Пиши!
🔥 Калифорнийский стартап объявляет о прорыве в области робототехники для повседневных задач с помощью ИИ π0.5 — модели «зрение-язык-действие».
Все, что видит робот, он видит впервые.
🧪 В экспериментах Робот успешно справился с уборкой посуды, застиланием постели и мытьем пола в незнакомых домах, демонстрируя полное понимание задачи, её разбиение на шаги и адаптацию к новым условиям.
➡️ Робот воспринимает команды от абстрактных ("убери посуду") до пошаговых ("подними кружку", "поставь в раковину"), демонстрируя потенциал обобщения для сложных роботизированных навыков.
Модель анализирует семантику задачи, разбивает её на шаги и генерирует команды для моторных систем. π0.5 умеет реагировать и на голосовые команды разной детализации — от «убери посуду» до точечных указаний
✔️ Подробнее про π0.5
🖥 Prompt Library здесь собраны лучшие промты на все случаи жизни
Всего более 500 промтов на все случаи жизни в одном месте.
Разделены на 9 категорий — бизнес, карьера (идеально для составления резюме), креатив, образование, здоровье, маркетинг, технологии, личный помощник и общее.
Сохраняем и бустим производительность тут.
✔️ Учить японский теперь можно в формате игры: в интернете набирает обороты Wagotabi — полноценный самоучитель, замаскированный под JRPG.
Вы погружаетесь в язык через живые диалоги, квестовые цепочки и атмосферу настоящей Японии.
Подходит новичкам и тем, кто собирается в страну восходящего солнца.
Взорвала App Store: море восторженных отзывов.
На Steam уже доступна демо‑версия, можно попробовать до релиза.
Русская локализация присутствует.
https://store.steampowered.com/app/2701720/Wagotabi_A_Japanese_Journey/