sysblok | Unsorted

Telegram-канал sysblok - Системный Блокъ

10846

«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе. Финалист премии «Просветитель» sysblok.ru vk.com/sysblok fb.com/sysblok instagram.com/sysblok/ Присоединяйтесь к команде: sysblok.ru/join

Subscribe to a channel

Системный Блокъ

Языковые модели — это адронный коллайдер для языка: интервью с Татьяной Шавриной

Что делать с тем, что коммерческие продукты вроде ChatGPT созданы на основе украденной интеллектуальной собственности? Есть ли внутри современных нейросетевых моделей что-то вроде физической модели мира? (Спойлер: кажется, нет.) Куда развивается искусственный интеллект и какие новые умения он приобретет в ближайшем будущем? И что делать тем, кто хочет участвовать в развитии ИИ? Об этом «Системный Блокъ» поговорил с Татьяной Шавриной, руководительницей исследовательской команды в проекте LLAMA и создательницей канала Kali Novskaya @rybolos_channel, в котором выходят новости мира NLP, обзоры свежих статей, датасетов и моделей.

‼️ Перспективы

Мы впервые находимся в ситуации, когда благодаря большим языковым моделям (LLM) мы можем задокументировать человеческое общение в огромном объеме, причём в условиях, которые мы можем контролировать. Благодаря LLM мы можем построить универсальные правила грамматики заново, как бы снизу вверх, опираясь на большие данные, которые у нас теперь есть. Правда, придется преодолеть англоцентризм моделей и ещё некоторые ограничения.

❗ Риски

С использованием искусственного интеллекта связаны и большие риски. Например, манипуляция информацией и общественным мнением на разных уровнях, а еще – применение в военной сфере. Сейчас есть стартапы, которые занимаются компьютерным зрением для дронов, распознаванием лиц, слежкой за людьми.

❓ Вопросы

Интеллектуальная собственность и авторские права — большой вопрос в сфере ИИ. Все нейросети и продукты на них в широком смысле построены на нарушении копирайта. Что с этим делать пока неясно, поскольку популярные лицензии на интеллектуальную собственность составлялись без учета того, что кто-то будет их использовать для обучения ИИ-моделей. Они создавались под маркетинговые нужды. Сегодня крупные владельцы контента часто сами заинтересованы в том, чтобы ослабить ограничения копирайта, но пока мало что сделано.

⁉️ Сомнения

Фундаментально в области LLM мало что поменялось с 2020 года, когда вышла GPT-3. То есть ещё до ChatGPT. Просто сначала взаимодействие с ней было не так удобно, как сейчас, потому что оно было не в формате диалога. Скорее всего вскоре наши ожидания от LLM остановятся на определённом уровне, как ожидания от интернет-поиска. Станет проще писать эссе, писать код или оформлять отчёты по ГОСТу. И на этом всё.

Впрочем, модели, конечно, будут становиться масштабнее и качественнее. Будет поддержка большего числа языков. Будут больше использоваться научные данные. Логический вывод будет работать чуть-чуть лучше. Тренд идет на планирование, агентность — всё то, чего нам не хватает до наступления AGI (универсального искусственного интеллекта).

Если хотите узнать больше о настоящем и будущем ИИ — конкуренции Open-source моделей с коммерческими, данных для обучения и «модели мира» — переходите к полной версии интервью.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Музей криптографии глазами гуманитария 
Рассказываем про новый пост из блога Бориса Орехова

Что такое криптография?

Криптография — наука о конфиденциальности, аутентификации и шифровании данных. Системный Блокъ уже писал об исторической криптографии и шифропанках. Музей криптографии в Москве посвящен не только ей самой, но и смежным дисциплинам и технологиям коммуникации. 

Культура и технологии вперемешку

Сейчас область криптографии исключительно математическая и компьютерная, однако музей концентрируется еще и на гуманитарной составляющей. Например, целый этаж посвящен истории здания музея, а на литературной полке можно найти книги, в которых шифры играют заметную сюжетную роль. В то же время в музее много технических экспонатов: например, шифровальных аппаратур.

Атмосфера «Системного Блока» 

Музей может показаться представительством редакции «Системного Блока» в оффлайне: здесь внимание и к текстам, и к технологиям, и к их взаимодействию. Музей отличается легкой подачей и заботливым отношением к истории. Например, большое пространство отведено античности.

Каковы гуманитарные истоки криптографии? Как музею о ней удается разговаривать на человеческом языке? Почему часть экспозиции рассказывает про интернет? О всём этом и многом другом, читайте в посте блога. 

Время чтения: 7,5 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

От Ктулху до Человеколося: мифы в цифровой галактике

Как существа из древних легенд «выживают» в современной массовой культуре, перемещаясь из сказок и книг — в мультики, сериалы и компьютерные игры? Материал «Системного Блока» о цифровой жизни мифов. 

Кратко: о чём статья?

В цифровой среде интерактивность лежит в основе реальности. Интерактивность пользователя, взаимодействие с программным кодом или его написание порождает просьюмеризм (явление, при котором человек принимает активное участие в создании товаров и услуг, которые сам потребляет). Когда просьюмер сталкивается с собственным запросом, он познает проблему интермедиальности (перехода образа из одной среды в другую).

Примером перехода мифа в цифру может служить рассказ Говарда Лавкрафта «Зов Ктулху». Образ Ктулху стал появляться в произведениях других авторов, например, Анджея Сапковского, Стивена Кинга и Нила Геймана, потом с участием этого персонажа сняли фильмы. Индустрию игр Ктулху также не обошёл стороной.

Другой пример переосмысления образов — игра пермских инди-разработчиков «Человеколось». За основу взяты предания ханты, манси и саамов о лосе Ене и его семи сыновьях.

О том, чем может заниматься просьюмер, из чего состоит коллекция пермского звериного стиля и какие ещё примеры перехода мифа в цифру можно найти — в полном тексте статьи.

Время чтения: 6 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Птички, цветочки и запахи городов: подборка материалов для летнего чтения

Впереди почти месяц лета, а это значит, что можно успеть насладиться августом: съездить в путешествие, собрать гербарий, посмотреть выставки.  Но еще лучше, если сделать все это в духе digital humanities. Как соединить технологии и летние радости, читайте в нашей сезонной подборке. 

Чем пахнут города?
Лето — это прежде всего путешествия. Если не знаете, как выбрать направление, загляните в наш материал об интерактивной карте запахов городов, которую составила международная группа урбанистов. Узнаете, как исследователям помогли посты и фотографии из соцсетей и на какой улице Барселоны раздается больше всего ароматов еды.

Айтрекинг в восприятии архитектурной среды
Путешествовать можно и виртуально. Например, в Помпеи! Ведь ученые создали 3D-модель Дома греческих эпиграмм, сохранившегося после извержения Везувия. Мы изучили их исследование и выяснили, зачем археологам погружать людей в виртуальную реальность и что привлекает современных наблюдателей в античном интерьере.

Бердвотчинг: что это за птица такая?
Если городскому туризму вы предпочитаете прогулки по природным ландшафтам, то рекомендуем заняться бёрдвотчингом, или попросту наблюдением за птицами. У нас есть материал, в котором мы советуем мобильные приложения для всех, кто хочет отличать соловья от кукушки. Прочитайте его — и вы узнаете, как с помощью смартфона определить, кто поет в соседней роще и как любители могут внести вклад в большую науку. А ещё больше о возможности самостоятельно вложиться в науку рассказали здесь.

Испытание ботаника: тест по растениям России из цифрового гербария МГУ
Примените свои знания о флоре в нашем тесте, созданном на основе цифрового гербария МГУ. Это самая крупная в России цифровая база растений. В ней собраны более миллиона образцов со всего мира. Пройдите тест и вы навсегда запомните, как называется трава из детской игры “Петушок или курочка” и какое народное прозвище у клевера ползучего.

Гид по Voyant Tools
Если лето для вас — время, когда можно научиться чему-то новому, то рекомендуем наш гайд по инструменту для анализа текстов Voyant Tools (есть первая и вторая части). Визуализации, частотный анализ, определение трендов и коллокаций в корпусе — вот лишь некоторые возможности этого ресурса. 

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

От Гомера до Мольера: зарубежная литература в школьной программе

Должен ли современный школьник читать Шекспира и Сэлинджера? А Гомера? Когда больше изучали зарубежных авторов: в советское время или сейчас? Недавно мы рассказывали о нашем дата-исследовании школьного канона от Октябрьской революции до ЕГЭ, а теперь собрали главную информацию и инфографики на карточках.

Смотрите, как менялось изучение иностранной литературы в школах в последние 100 лет, и рассказывайте, кого в школе читали вы – Джоан Роулинг или Оноре де Бальзака.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Что такое Викиданные (Wikidata) и как там искать информацию?

Даже заядлому поклоннику ночного серфинга по страницам Википедии может быть непросто собирать и систематизировать большой объем информации из свободной энциклопедии. Для работы с такими данными были созданы Викиданные (Wikidata) — большая и удобная база данных на основе Википедии. Разберемся, как с ней работать и когда она может быть полезна.

Кратко: как это работает?

База Wikidata объединяет всё, что можно найти благодаря Wikibooks, MediaWiki, Wikisource, Wikiquote и другим проектам со словом Wiki. Она позволяет лучше структурировать и быстрее находить информацию с необходимых страниц, копировать результаты поиска в формате необходимого языка программирования, строить графы и диаграммы и многое другое.

Правда, чтобы взаимодействовать с Викиданными вам потребуется специальный поисковик и специальный язык для запросов – SPARQL. Чтобы разобраться с ним можно обратиться к шпаргалке от самих Wikidata или к ChatGPT: модель легко преобразует ваш текст в нужный формат запроса.

Посмотреть, как Wikidata помогли нам собрать информацию о программистках, рождённых после 1950 года, и проследить за всеми этапами работы с данными можно на нашем сайте.

Время чтения: 6 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Мастерская дата-журналистики «Системного Блока»: учим работать с данными и делать из них истории среди ёлок на берегу Волги ⛺🌲📊

В эти дни «Системный Блокъ» проводит мастерскую дата-журналистики на Летней школе. Сейчас участники мастерской изучают инструменты работы с данными и прокачивают навыки дата-журналистов (поиск инфоповодов и данных к ним, фактчекинг, верификация данных, стортеллинг), а на следующей неделе будут работать над своими проектами.

Читать лекции и вести мастер-классы мы позвали ведущих экспертов по данным и визуализации: Надю Андрианову и Алексея Смагина из Яндекс.Исследований, Анастасию Кокоурову и Витовта Копытока из «Если быть точным», Сергея Антонова из Т-Ж, Алексея Новичкова из Вышки, Ксению Орлову из Инфокультуры, Татьяну Мелентьеву и Ольгу Добровидову из ИТМО, Юлию Криган из «Точки», Андрея Дорожного из «Дата-студии Андрея Дорожного» и других прекрасных людей.

И все это под звездным небом среди сосен и елей на берегу Волги. Делимся с вами избранными фотографиями с мастерской💁

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

100 лучших книг XXI века: разгадка Элены Ферранте

Как многие догадались, Элена Ферранте – не вполне реальный человек. Личность итальянского автора (или авторов) до сих пор остается анонимной.

Однако благодаря стилометрии удалось выяснить, что романы Ферранте стилистически близки романам Доминико Старноне, другого итальянского писателя. Неясно только, есть ли у него соавторы. Например, Анита Райа, переводчица и… жена Старноне. Её стиль не так близок к Ферранте, но исследователи отмечают, что при коллективном авторстве обычно доминирует сигнал только одного из двух писателей, так что Старноне вполне может быть главным, но не единственным голосом, стоящим за текстами Ферранте.

Узнать об этом расследовании о личности Ферранте подробнее можно из нашей статьи.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

«В России история интернета не написана никем»: Леонид Юлдашев об изучении интернета, кибернетике, Starlink и Чебурнете

Как исследователи пишут историю интернета? Почему глобальная сеть вытеснила национальные проекты вроде французского Minitel? Почему достижения советской кибернетики не привели к созданию работающих сетей? Кто стоял у истоков Рунета и куда Рунет движется сегодня? Обо всём этом «Системному Блоку» рассказал Леонид Юлдашев, социолог, исследователь истории интернета, в прошлом координатор клуба любителей интернета и общества.

Кратко: о чем интервью?

В 1990-е годы считалось, что интернет меняет мир, что мы в Сети — не то же самое, что мы в офлайне. С интернетом связывались утопические надежды. Правда, всё оказалось гораздо сложнее, и сегодня есть целая область исследований, которая называется Internet Histories. Она ставит перед собой задачу создать описание истории интернетов во всех странах планеты.

В России история интернета не написана никем и существенно отличается в каждом городе. Например, в Арзамасе в 2005 году провайдеры использовали военный телефонный кабель, потому что их инвестор мог его достать, а в Томск в 1997-м приехали американские инвесторы и предложили строить интернет на телевизионном кабеле, потому что в Америке он тогда использовался очень широко.

И если пока интернет еще можно регулировать с помощью провайдерских центров админтрафика, то реализация идеи глобального интернета может всё изменить. Илон Маск, например, пытается создать космический интернет, соединяя спутники лазером. Его регулировать будет негде.

Впрочем, эта страница истории интернета ещё не написана. Если хотите узнать больше о прошлом и настоящем интернета в России и в мире, переходите к полной версии интервью.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Лазер из iPhone: как найти древнюю цивилизацию с помощью LiDAR

Современным археологам недостаточно лопаты, мастерка и кисточки для полевой работы. Чтобы обнаружить скрытые под слоем почвы города и дороги, ученые сканируют поверхность Земли с помощью лазера. Рассказываем, как работает LiDAR — технология, которая сегодня есть в обычном айфоне, и как LiDAR помогает делать археологические открытия в джунглях Амазонки, на Тихоокеанских островах и прямо посреди Европы.    

⚙️ Что такое Lidar?

Лидар или LiDAR (Light Detection and Ranging) — это технология лазерной локации, позволяющая определять расстояние до объектов и строить двухмерную или трехмерную модель окружающего пространства. Существуют как лидары ближнего действия, например, для работы в помещениях, так и дальние, “видящие” на расстоянии сотен километров. 

🤖 Где его используют? 

Лидары создают пространственные модели планеты, которые используют экологи, строители и топографы. Ещё они помогают беспилотным автомобилям не врезаться в другие машины и прохожих, а роботам на конвейере – обрабатывать только нужные детали. Для археологов лидар создает карту поверхности, на которой заметны фундаменты домов, остатки стен, контуры улиц и прочие сооружения.

🏛️ Затерянные города Упано в долине Амазонки

С помощью лидара ученые обнаружили остатки крупнейшего комплекса доколумбовых поселений – городов с сетями улиц и системами каналов для отвода воды. Раньше здесь уже проводили раскопки, но исследователи находили только мелкие предметы быта,  не подозревая, что под джунглями скрывается обширная система городов. 

🗿 Камни латте на острове Гуам в Тихом океане

Эти камни не имеют ничего общего с кофе, но чем-то схожи с каменными монолитами с острова Пасхи — такие же древние, загадочные и океанические. Чтобы найти их, ученые сканировали территорию с самолета лидарами, определяя местоположение артефактов и строений.

🏚️ Империя XII века в джунглях Камбоджи

Как показали результаты аэросъемки с использованием лидара, в XII веке Кхмерская империя была одной из крупнейших на Земле. Правда, многие здания кхмеры строили из дерева и других биоразлагаемых материалов, которые со временем просто исчезли. К счастью, лидар способен определять земляные насыпи, фундаменты, дороги и другие следы строительства, по которым можно воссоздать строение и облик древнего города.

О других интересных открытиях, сделанных с помощью лидара, а также о том как и где можно опробовать эту технологию самостоятельно, узнаете из полной версии статьи.

Время чтения: 12 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Новая модель для дизайна белков, скорый выход самой большой LLama и FlashAttention 3

Рассказываем, что произошло в мире ИИ за последние три недели.

Самая большая LLama на подходе

По данным сотрудника Meta, LLama 3 — языковая модель от Meta — с 405 млрд параметров выйдет уже 23 июля. Скорее всего, модель будет поддерживать работу не только с текстом, но и с другими типами данных, например, изображениями. Промежуточные результаты этой модели в стандартных тестах сопоставимы с результатами GPT-4.

Меньшие версии LLama 3 с восемью и 70 млрд параметров были выпущены в середине апреля. В отличие от большинства остальных языковых моделей, LLama выложена в открытый доступ и может быть использована в коммерческих целях.

ESM3 — одна из самых больших моделей для дизайна белков

Компания EvolutionaryScale, основанная бывшими сотрудниками Meta, представила модель ESM3 для генерации белков. Она была обучена на более чем 2,7 млрд последовательностей и структур белков и способна создавать белки с заданными свойствами.

Для демонстрации компания использовала ESM3 для дизайна флуоресцентного (светящегося) белка. Излучающий свет белок GFP (green fluorescent protein) был найден у медуз в 1960-х годах. Впоследствии учёные научились использовать его, чтобы помечать другие белки. Это, например, позволяет подсвечивать растущие раковые опухоли, показывать развитие болезни Альцгеймера в мозге или рост болезнетворных бактерий. За использование GFP в биологии в 2008 году несколько ученых получили Нобелевскую премию.

Исследователи вычислили наиболее способную к флуоресценции молекулу, не похожую на известные флуоресцентные белки, и использовали ESM3 для её усовершенствования. Хотя до лучших по яркости лабораторных образцов результаты всё еще не дотягивают, совпадение полученной молекулы с наиболее близкой из обучающих данных составило менее 60%.

Основатель компании отмечает, что итеративный процесс дизайна белков с помощью ESM3 схож с процессом естественной эволюции.

FlashAttenion3 — новые оптимизации механизма Attention

Исследователи выпустили третье поколение оптимизаций механизма Attention. Attention — главная составляющая самой популярной архитектуры нейросетей Transformer, которая в том числе используется во всех современных языковых моделях.

Главная проблема Attention — большое потребление вычислительных ресурсов, которое существенно растет с увеличением входных данных. FlashAttention — это серия работ по оптимизации ресурсозатратного блока.

Третья версия, по сравнению с предыдущей, более чем в два раза эффективнее использует вычислительные мощности во время работы Attention и поддерживает вычисления с числами пониженной точности (зачастую разработчики пренебрегают точностью в угоду скорости).

Благодаря более эффективной реализации Attention сократится стоимость обучения и использования большинства современных моделей, а языковые модели, в свою очередь, смогут работать с более длинными текстами.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Историки, культурологи и краеведы: папка телеграм-каналов

Исторические исследования дают большой простор для применения цифровых методов, поэтому мы часто пишем на исторические темы. Мы рассказывали о расшифровке писем Марии Стюарт, сети социальных связей европейских монархов накануне Первой мировой войны, тематическом анализе дневников 1917 года и изучении рисунков на стенах древнего храма. 

Если вы читаете посты и статьи «Системного Блока» прежде всего ради таких материалов, сегодня точно ваш день. Потому что мы делимся целой папкой телеграм-каналов, которые позволят лучше изучить разные времена и пространства истории. От Константинополя до Ростова, от античности до Второй мировой, от личных дневников до дата-исследований.

Папку можно легко добавить к себе целиком или выбрав самое интересное.

Как это работает:
— Кликаете на гиперссылку 
— Нажимаете ​​«Добавить папку»
— Выбираете интересующие каналы
— Делитесь с друзьями
— Наслаждаетесь подборкой!

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Классное чтение: школьная программа по литературе от Октябрьской революции до ЕГЭ

Когда в школьной программе появлялись Гарри Поттер и Бильбо Бэггинс? А когда изучали Гомера и Эсхила? Какие иностранные художественные произведения входят в школьный канон? Когда больше изучали зарубежных авторов: в советское время или сейчас? Первая часть нашего дата-исследования школьного канона посвящена зарубежной литературе.

Кратко: о чем статья?

Зарубежная литература всегда присутствовала в школьной программе, начиная с первых лет советской власти, но устойчивый состав авторов и произведений сложился только в 1970-е годы.

В программе 1919 года можно найти античную драматургию и Шекспира. В 1930-1940-е состав расширился: добавились западноевропейские писатели XVII-XIX веков (Гейне, Шиллер, Байрон…) и современные писатели, поддерживающие Советский Союз. Во время войны эта тенденция изменится и задержится на долгое время, так что зарубежной литературы будет всё меньше: между 1954 и 1962 годами вся иностранная словесность в школьной программе ограничивается «Фаустом» Гете и «Гамлетом» Шекспира.

Сегодня же доля зарубежных произведений в школьной программе выше, чем в советское время, однако в основном они входят в необязательную часть, которая изучается по выбору. В 2015 и в 2020 годах из 66 писателей необходимо было изучить творчество только 11-ти, остальное на выбор, а в ЕГЭ зарубежная литература вошла только с 2022 года: выпускник должен знать произведения не менее трех зарубежных поэтов или прозаиков за определенный период.

Сравнить популярность Шиллера и Байрона в школьной программе, выяснить, что происходило со списком литературы с 1960-х по 1990-е, и соотнести количество французских, британских и американских авторов в программе разных годов можно благодаря полной версии статьи.

Время чтения: 11 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Проверяем авторство: стилометрия для японских текстов

На примере работы японской исследовательницы Уэсака Аяка рассказываем о том, как с помощью стилометрии было поставлено под сомнение авторство повести, приписываемой знаменитому поэту и прозаику XVII века Ихара Сайкаку.

Кратко: о чем статья?

Стилометрия – это количественный метод в лингвистике, литературоведении и других гуманитарных науках, который определяет авторский стиль с помощью статистических метрик. Мы часто рассказываем о стилометрических исследованиях, например, творчества Набокова, древних греков и нейросетей. А ещё предлагали вам провести свой стилометрический эксперимент

Но если мы захотим применить стилометрию для восточных языков, то столкнемся с проблемой: как посчитать слова, если текст не разделен пробелами? На помощь приходят парсеры – программы, которые содержат правила для какого-то конкретного языка, по которым можно разделить предложения на слова, а слова на морфемы. 

Исследовательница Уэсака Аяка с помощью стилометрии поставила под сомнение теорию об авторстве «Повести о скоротечном пути Араси» Ихара Сайкаку (1642–1693). Повесть написана в 1688 году и считается первым художественным произведением о жизни актера традиционного японского театра кабуки по имени Араси.

Уэсака Аяка написала собственный парсер японского языка, оцифровала 120 работ Сайкаку, разделила их на слова и получила корпус из 710 355 токенов. Затем она собрала корпус размером 53 838 слов из трех романов другого писателя того же периода – Ходзё Дансуй (1663–1711). Благодаря этому она подтвердила авторство четырех работ Сайкаку, опубликованных после его смерти… но не исследуемой повести. В её случае дать однозначный ответ нельзя, поскольку у нее есть черты стиля как Сайкаку, так и Дансуй.

Подробнее об этом исследовании узнаете из полного текста статьи.

Время чтения: 7 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Идеальная формула депрессивной песни на примере Radiohead

Музыковед Анна Виленская назвала Radiohead одной из величайших групп в истории, песни которой вполне можно выделить в отдельный жанр. А мы изучили не их жанр, а их… депрессивность. Вспоминаем материал «Системного Блока» о том, как вычислить «индекс уныния» песни и применить эту формулу к Radiohead. 

Кратко: о чём статья?

Британская рок-группа Radiohead пишет печальные мелодии, а тексты на их музыку многие называют мрачными. Дата-сайентист Чарли Томпсон вычислил их самую депрессивную песню с помощью языка программирования R.

Для своего исследования Томпсон использовал API Spotify. Потом он обратился к корпусу эмоционально окрашенных слов Национального научно-исследовательского совета Канады и выбрал оттуда лексемы, считающиеся «грустными». Посчитав количество «грустных» лексических единиц в каждой песне, он выяснил, что самый печальный текст Radiohead – High And Dry

Если же взять во внимание не только слова, но также лирическую плотность и валентность (музыкальную позитивность) по версии Spotify, то абсолютным победителем по шкале грусти окажется True Love Waits.

Подробнее о трех компонентах «индекса уныния», идеальной формуле депрессивной песни и сайте Sentify, где можно визуализировать настроение песен любимого исполнителя, — в полном тексте статьи.

Время чтения: 5 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Вино и гашиш, Истанбул и Париж: про какие города и страны поют русскоязычные исполнители? 

Анализ 1129 песен, выпущенных с 1990-ых по 2019 год показал, какие локации популярнее всего у русской поп-эстрады. В лидерах Москва – 68 упоминаний (от 22 исполнителей). Причем чаще всего город встречается в песнях Децла. Второе по популярности направление – Париж. О нем пели 41 раз 13 исполнителей. Санкт-Петербург как главный мотив песен упомянули 30 раз 8 исполнителей.

Если хотите узнать не только о городах, но также о еде, напитках и чувствах в песнях разных жанров, читайте наше исследование о русскоязычной музыке.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

«Короче, Пушкин!»: как нейросети пересказали школьную программу

В апреле 2024 года — период активной подготовки к экзаменам — Яндекс Вордстат зафиксировал более 1,5 миллиона запросов по словосочетанию «краткий пересказ». Но кто-то ищет краткие пересказы произведений в поисковиках, а кто-то — просит помощи у нейросети. Насколько точен и адекватен анализ от ИИ? Чтобы узнать это, мы провели эксперимент и протестировали три самых популярных нейросети.

Кратко: что за эксперимент?

Для эксперимента мы использовали три нейросети: Chat GPT, Yandex GPT и Notion AI.
У каждой ИИ было две задачи: кратко изложить текст и рассказать, в чем основная суть произведения.

В качестве материала мы выбрали разные по структуре произведения из школьной классики: рассказ А. П. Чехова «Толстый и тонкий», басню Крылова «Ворона и лисица» и стихотворение М. Ю. Лермонтова «Бородино».

В случае рассказа Чехова Yandex GPT пересказал только сюжет: на вокзале встретились два приятеля, пообщались и разошлись. Никакой иронии он не заметил. Chat GPT справился лучше, хотя грамматика русского языка у него оказалась не на высоте и встречались фразы вроде: «У них были с собой жена и сын тонкого». Notion AI просуммировал события наиболее точно, но вот считать иронию текста у нейросети тоже не получилось. Зато, формулируя главную мысль текста, Notion AI обратил внимание на позицию автора критику общества, не ограничившись только сюжетом.

В случае с Лермонтовым и Крыловым Yandex GPT бессистемно выдавал лоскуты отдельных цитат, а Notion AI и Chat GPT выбрали другие стратегии.

Подробнее о них и о том, какие ошибки сделали нейросети (спойлер: Chat GPT, например, приписал «Бородино» Пушкину) узнаете из полной версии статьи.

Время чтения: 9 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Исход людей из OpenAI, новые модели для решения математических задач и SAM 2

Рассказываем, что произошло в мире ИИ за последние две недели.

Ключевые лица покидают OpenAI?

Сооснователь OpenAI, Джон Шульман, заявил о своём уходе. В сообщении Шульман рассказал, что переходит работать в компанию Anthropic (один из основных конкурентов OpenAI). Свою отставку он объяснил желанием  заниматься более технической работой и сфокусироваться на исследованиях безопасного ИИ.

Через несколько часов после заявления Шульмана технический директор компании Грег Брокман сообщил, что после девяти лет работы он берёт отпуск до конца этого года. В июне этого же года компанию покинули два топ-исследователя. Один из них также впоследствии ушёл в Anthropic.

Qwen2-Math – новый лидер среди математических моделей

Китайский холдинг Alibaba Group выпустил семейство больших языковых моделей Qwen2-Math, специализированных для решения математических моделей. Qwen2-Math  — дообученная версией семейства обычных языковых моделей Qwen2, доступная в трёх размерах: 1,5, 7 и 72 млрд параметров.

Флагманская модель опережает открытые и коммерческие модели (GPT-4o и Claude Sonnet 3.5) в математических тестах. Младшая версия же по качеству сравнима с моделями более чем в четыре раза больше, включая недавно выпущенную Mathstral.

SAM 2 – новая модель для сегментации изображений и видео

Meta* представила второе поколение модели SAM (Segment Anything Model). В отличие от предшественника, который умел выделять произвольные объекты только на изображениях, SAM 2 умеет работать и с видео.

SAM 2 способен консистентно выделять произвольные движущиеся объекты между кадрами. В работе с изображениями новая версия точнее и в шесть раз быстрее первой. Для обучения модели была собрана обучающая выборка, содержащая 51 тыс. разнообразных видео с 643 тыс. выделенных объектов.

Модель и выборка доступны для скачивания и коммерческого использования.

🤖 «Системный Блокъ» @sysblok

* Meta признана в РФ экстремистской организацией.

Читать полностью…

Системный Блокъ

Какие темы интересуют современных востоковедов и как им помогают в исследованиях цифровые технологии?

Какие инструменты помогают анализировать древние рукописные иероглифы и токенизировать азиатские тексты? Что узнали ученые, исследующие религиозность африканцев? И что творят с цифровыми технологиями японцы? Читайте в нашей востоковедческой подборке статей от «Системного блока».

Искусственный интеллект и старинные японские книги: как лингвисты распознают иероглифы

В старинных японских книгах иероглифы отличаются от современных — они более сложны в написании и отличаются по значению. Старинные рукописи еще своеобразнее — в них использовалась скоропись, из-за чего символы плавно перетекают из одного в другой. И в тех, и других текст необязательно последовательный — он может огибать иллюстрации или зависеть от толщины кисти. Такую старую систему записи называют кудзусидзи, и ее способен прочесть не каждый носитель японского языка. Что уж говорить об ИИ. О том, что все же помогло ученым ускорить обработку текстов, читайте в статье.

Искусственный интеллект и YouTube: что ещё изучают лингвисты

Лингвисты, работающие с современными источниками на японском языке (такими как комментарии на YouTube), осваивают совершенно другие технологии: чистят данные от стоп-слов, распознают иероглифы-эмоджи и создают облака слов для отражения частотностей. О них читайте в статье о Voyant Tools.

Религии Африки через данные: во что и как верит самый религиозный континент Земли

За жизнь одного поколения Африка перешла в христианство и ислам настолько быстро и эффективно, что африканских проповедников стали приглашать европейцы для изучения их опыта и оживления собственных служб. Иван Захаров рассказал о том, что помог узнать ученым датасет, охватывающий более чем столетие развития феномена. 

ChatGPT и литературная премия

Япония не перестает удивлять. Пока школьники становятся агрессивнее и наращивают темпы кибербуллинга, люди искусства осваивают ИИ.  Так, 17 января 2024 писательница Риэ Кудан получила престижную японскую премию Акутагавы. Жюри назвало роман «почти совершенным». А на следующий день разразился скандал: в одном из интервью писательница призналась, что примерно 5% текста были написаны с помощью ChatGPT. О том, зачем она это сделала и почему премию не отозвали, рассказывает Анна Слащева. 

Гайды по работе с библиотеками токенизации азиатских текстов

Завершим подборку востоковедческих текстов рассказом про text-mining (автоматизированный интеллектуальный анализ текстов) с инструкциями, как это использовать вам, если вы изучаете корейский, китайский или японский язык.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Подборка статей о цифровых музыкальных исследованиях

О чем пели в российской попсе за последние тридцать лет? Можно ли посчитать, насколько депрессивна моя любимая песня? Куда идти, если я хочу провести свое исследование большого пласта музыки? В подборке статей «Системного блока» — проекты цифровых музыковедов и интернет-ресурсы, которые могут помочь исследователю.

Музыкальная «энциклопедия русской жизни»

Анастасия Панасюк провела исследование текстов самых популярных российских исполнителей с 1990 года — мы узнали, что ели и пили музыканты за 30 лет, куда они хотели поехать, о чем мечтали и сколько зарабатывали (по крайней мере, в собственных глазах). Собрали здесь все самые интересные находки.

Кто поет Бодлера?

Рассказываем о проекте Baudelaire Song Project, где собраны все песни, написанные на стихи Шарля Бодлера, и музыка, вдохновленная его поэзией. В ресурсе удобно собраны композиции, относящиеся к творчеству поэта-декадента.

Считаем депрессию в песнях Radiohead и не только

Дата-сайентист и фанат группы Radiohead Чарли Томпсон провел исследование, чтобы измерить, насколько грустные песни написал его любимый коллектив. Для анализа использовались и тексты, и музыка — получилось даже вывести формулу идеального грустного трека.

Genius как помощник в исследованиях музыки

Рассказываем, как устроена музыкальная «база знаний» Genius — сайт, где можно ознакомиться с текстами большинства популярных исполнителей мира и стать филологом от мира современной музыки, прокомментировав любую загадочную строчку. 

Архив музыки — даже древней

Проект RISM (Международный каталог музыкальных источников) был создан, чтобы объединить музыкальные ресурсы всего мира в универсальное хранилище. С его помощью можно найти и изучить композиции: от современных до записанных на бумагу в XVI веке. Доступ к библиотеке бесплатный, поэтому ее может использовать любой желающий. Рассказываем, как она работает.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Новые модели от OpenAI, Mistral и Meta*: дайджест новостей ИИ

Рассказываем, что произошло в мире ИИ за последние две недели.

GPT-4o mini — быстрая и доступная GPT

Компания OpenAI выпустила языковую модель GPT-4o mini. Особенность модели — компактный размер, благодаря чему она быстрее и дешевле флагманской GPT-4o. Эти преимущества позволяют использовать модель в приложениях, где важна маленькая задержка между запросом и ответом, — например, в чат-ботах, которые отвечают на вопросы клиентов.

Несмотря на относительно маленький размер, модель превосходит GPT-3.5 Turbo и миниатюрные модели от других компаний в тестах понимания языка, математических и логических способностей, а также поддерживает все языки, которые есть в старшей версии.

Обновление LLama 3

Корпорация Meta* выпустила LLama 3.1 405B — одну из самых больших языковых моделей, которые есть в открытом доступе. Модель сопоставима с GPT-4o или лучше её практически во всех стандартных тестах.

Meta также обновила младшие версии LLama 3. Обновлённые модели имеют более высокие показатели во всех задачах, а также могут работать с существенно более длинными текстами.

Еще Meta рассказала об экспериментах по внедрению в модели поддержки работы с изображениями и видео. Все модели доступны для использования в исследовательских и коммерческих целях.

4 новых модели от Mistral

Французский стартап, основанный бывшими сотрудниками Meta*, выпустил две новые языковые модели, а также модели, специализированные для написания кода и решения математических задач.

Mistral Large 2 поддерживает сотни естественных языков и «знает» свыше 80 языков программирования. Также Large 2 была специально обучена использовать внешние инструменты (например, браузер и интерпретатор кода).

Mistral NeMo — модель среднего размера с упором на мультиязычность. Nemo использует эффективную предобработку текстов не на английском языке. Так, тексты на китайском, итальянском, французском, немецком, испанском и русском языках представляются на 30% компактнее по сравнению с LLama 3. Благодаря этому модель работает с «иностранными» текстами быстрее и ресурсоэффективнее.

Codestral — семейство моделей, обученных писать программный код. Модель доступна в двух размерах: 7 и 22 миллиардов параметров. Codestral опережает модели схожих размеров в задачах на программирование. Младшая версия основана на архитектуре Mamba 2, что отличает её от практически всех языковых моделей, которые в свою очередь используют архитектуру Transformer. Архитектура Mamba 2 позволяет модели обрабатывать очень длинные тексты, что особенно актуально для задач по написанию кода.

Mathstral — модель, предназначенная для решения математических задач. Mathstral показывает высокие результаты в тестах на понимание естественных наук, она смогла решить две из 30 задач из AIME (второй отборочный этап на международную олимпиаду по математике в США). Для сравнения — почти все модели конкурентов не смогли решить ни одну из предложенных задач.

*Meta признана в РФ экстремистской организацией.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Перцептроны в черном ящике: как работает нейросеть и что нам мешает её понять

Несмотря на быстрое развитие больших языковых (и не только языковых) моделей, исследователи до сих пор плохо понимают, как и почему нейросети выдают тот или иной ответ. Объясняем, почему нейросети работают как «черные ящики», что такое интерпретируемость в контексте машинного обучения и какие особенности устройства нейронных сетей мешают их понять.

Кратко: о чем статья?

Нейросети работают, как «черные ящики»: на вход подаются исходные данные, далее с ними происходят абстрактные математические преобразования, и в итоге выдается ответ. Изложить в понятных человеку категориях, как он был получен и что именно на него повлияло, такие модели обычно не могут. Другими словами, нейросети позволяют хорошо моделировать зависимость между входом и выходом, но не предоставляют объяснения того, как именно эта зависимость устроена.

Свойство модели, позволяющее наблюдателю объяснить внутреннее устройство и механизм ее работы модели, и то, как она решает задачу, называется интерпретируемостью. Плохая интерпретируемость нейросетей тормозит их применение в медицине, беспилотном транспорте или управлении промышленными технологическими системами, где существует высокий риск при ошибке.

Даже передовые языковые модели могут галлюцинировать, то есть генерировать ложную информацию. Более высокая интерпретируемость позволила бы лучше контролировать их поведение. Понимая устройство языковой модели, можно точечно удалить из неё нежелательную информацию вроде рецептов опасных веществ или убрать возможность генерировать вредоносный код.

О главной сложности в интерпретации нейросетей — полисемантичности перцептронов — читайте в полной версии статьи. Это первая часть нашего цикла о механизмах работы больших языковых моделей. Во второй части мы расскажем, как метод, разработанный в компании Anthropic, позволяет выявлять, какими концепциями оперируют большие языковые модели и как с его помощью можно контролировать их «поведение». Не переключайтесь!

Время чтения первой части: 11 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

100 лучших книг XXI века: загадка Элены Ферранте

Недавно газета The New York Times опубликовала свой топ «100 лучших книг XXI века», которые выбрали (преимущественно американские) писатели, литературные критики, переводчики и другие эксперты. На первом месте в их списке оказалась «Моя гениальная подруга» Элены Ферранте, но Ферранте – автор загадочный. В этом опросе предлагаем вам угадать, в чем особенности лидера списка книг, а вечером расскажем об Элене Ферранте подробнее.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Братских народов союз вековой: литература народов СССР и России в школьной программе

Вторая часть нашего спецпроекта о школьном литературном каноне посвящена региональной литературе. В первом материале мы изучили ситуацию с зарубежной литературой, а из этого поста вы узнаете о произведениях, написанных на родном языке писателей-представителей народов СССР или России, и их судьбе в школьной программе. Каким национальным писателям уделялось больше внимания в советское время? И кто сегодня единственный национальный автор, чьи произведения нужно читать, чтобы сдать ЕГЭ?

Кратко: о чем вторая часть?

В школьные программы по литературе с 1919 по 2022 годы были включены имена 62-х писателей и поэтов, создававших свои произведения на языках народов СССР и РФ. При этом в советское время доля региональной литературы была намного выше, чем сегодня. На протяжении 1919-1991 годов она составляла от 1 до 12% от всех изучаемых произведений, а в 1974-1988 гг. объем произведений народов СССР был почти вдвое больше иностранной словесности. Однако это связано не с ростом объема обязательной программы, а с увеличением числа необязательных текстов, рекомендованных для изучения. Отдельно интересен случай произведений Ицика Фефера и Исаака Харина, чьи тексты вошли в программу всего на один (1933-й) год. Позднее оба писателя стали жертвами репрессий.

В последние годы региональная литература занимает от 0,5 до 7% от числа всех произведений. При этом до 2004 года ее в списке чтения не было вообще. В программах 2004-2022 годов упоминается всего 12 региональных авторов и несколько эпосов народов России.

В ОГЭ региональная литература не входит совсем, а на ЕГЭ появилась только с 2022 года. Чтобы сдать экзамен, нужно знать творчество только одного автора, представляющего народы России — Расула Гамзатова.

О том, какие авторы и тексты попадали в школьную программу, что об этом думают эксперты и почему даже на уроках «Родной литературы» зачастую не изучаются тексты на языках коренных народов, узнаете из новой части дата-исследования.

Время чтения: 14 минут.


🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Филологи и программирование: подборка интервью «Системного Блока»

Филология и программирование. Нужны ли они друг другу? Все ли ученые делятся на физиков и лириков? «Системный Блокъ» считает, что их знания можно взболтать, но не смешивать. Делимся подборкой наших интервью о том, насколько важно современным гуманитариям знание Python и нейросетей.

Нейропоэзия, корпусная лингвистика и интеллектуальный фитнес

Борис Валерьевич Орехов, доцент Школы лингвистики факультета гуманитарных наук НИУ ВШЭ, в интервью рассказад о своем пути филолога в программирование. Стилометрия, лингвистические корпусы, башкирский стих, нейронные сети и Digital Humanities в целом — что о них думает программирующий филолог?

Рациональность, научный метод и эмпирика в гуманитарной области

Интервью о миссии открытых данных против мракобесия и копирайте в корпусах. Кирилл Александрович Маслинский — цифровой филолог, создатель Детского корпуса и Репозитория открытых данных по русской литературе и фольклору ИРЛИ РАН. Он рассказывает, как пришел к DH, что можно узнать в Детском корпусе о себе и мире и как делают датасеты для цифровых исследований.

Цифровые методы на службе у гуманитариев: библиотека LingPy для исторической лингвистики. И жонглирование!

Йоханн-Маттис Лист — специалист по исторической лингвистике. Он разработал LingPy — пакет на языке Python для автоматического сравнения языков и поиска родственных слов. Мы поговорили с ним о междисциплинарности, связи биологии и лингвистики, а также о том, как развивать неуязвимость к неудачам с помощью жонглирования.

«​​Python и R — это не китайская грамота»: о ЖЖ и точных методах в гуманитарных науках

Роман Лейбов, филолог и писатель, стоял у истоков российского сегмента интернета. В интервью он объяснил, какова роль интернета для литературоведов, что такое корпусная поэтика, какими соцсетями он пользуется и как студенты-гуманитарии относятся к точным методам.

Статистика для литературоведов и разница между количественными и цифровыми методами

Александр Пиперски — лингвист, популяризатор науки и герой самого первого интервью «Системного Блока». Мы поговорили о значении корпусной лингвистики и о том, зачем лингвистам изучать статистику (спойлер: лингвисты и филологи становятся объективнее, применяя статистические методы. А дальше зависит от вкуса исследователя: кому-то ближе количественные методы, а кому-то цифровые).

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Похороны, объятия и выпас скота: обыденные практики и ритуалах XX — начала XXI века

Как выглядели свадебные девичьи «куколки» Поморья? Как звучат похоронные причеты Вологодчины? Какие колыбельные пели в старину в Коми? Электронный архив «Российская повседневность» хранит данные об обыденных практиках и ритуалах XX — начала XXI века. Цифровую коллекцию материалов о русской повседневной культуре создал «Пропповский центр» совместно с компанией «Альт-Софт». Архив состоит из аудио- и видеозаписей интервью с городскими и деревенскими жителями, оцифрованных рукописных дневников, семейных альбомов с комментариями, любительских рисунков и фотографий.

Данные архива структурированы по формату (аудио, видео, фото, текстовые расшифровки) и разделены на классы. В разделе «Процессы» находятся материалы, которые соотносятся с действиями или «изменением положения дел»: гаданием, дракой, переправой, игрой на музыкальном инструменте или приготовлением пищи. А в «Тематических коллекциях» представлена подборка фотографий, иллюстрирующих цвета в одежде.

Материалы сопровождаются короткими пояснениями, например: «Информант демонстрирует заговор от медведя», «Трактор, везущий гроб на кладбище, тронулся с места. В кузове стоит Галина Васильевна Саукова, хотя она не родственница погибшему. Вслед за трактором идут местные жители» или «Шуточная попытка похищения пирожка».

Посетители медиаархива могут применить простой поиск или найти необходимую информацию, используя географический указатель, карту и список информантов.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Цифровой архив газет Российской империи: от морских чудищ до высочайших манифестов

Коллекция «Газеты Российской империи» находится в открытом доступе на портале East View и охватывает почти весь период русской дореволюционной журналистики ― с 1767 по 1918 годы. Делимся тремя интересными заметками, которые мы нашли, изучая онлайн-архив.

🦑 Большой морской зверь, именуемый Крак (16 сентября 1786)

«Джемс Андерсон и Мадс Дженсон… показали…, как они, так и все морские служители, бывшие с ними, видели в отдалении одной английской мили к югу зверя, которого в Норвегии называют морским червяком, чрезвычайной величины, высунувшегося из моря. Он казался им быть тремя низкими островами или отмелями серого цвету. Длина его простиралась на одну английскую милю. Ширина его казалась быть до 30 саженей. Они смотрели на него более 50 минут, после чего он опустился тихо на дно, не причинив воде ощутительного движения».

🎨 Награждение Айвазовского (26 сентября 1897)

«Нашему действительному тайному советнику, почетному члену Императорской Академии художеств, причисленному к Морскому ведомству со званием живописца, профессору живописи Ивану Айвазовскому. В награду шестидесятилетней художественной деятельности, обогатившей русское искусство образцовыми произведениями, всемилостивейше пожаловали Мы вас кавалером Императорского Ордена Нашего Святого Благоверного Великого князя Александра Невского». 

👑 Отречение Николая II от престола (5 марта 1917)

«В эти решительные дни в жизни России почли мы долгом совести облегчить народу нашему тесное единение и сплочение всех сил народных для скорейшего достижения победы и в согласии с Государственной думою признали мы за благо отречься от престола государства Российского и сложить с себя верховную власть. Не желая расстаться с любимым сыном нашим, мы передаем наследие наше брату нашему великому князю Михаилу Александровичу и благословляем его на вступление на престол государства Российского». 

Больше фрагментов статей найдете в полной версии статьи, а онлайн-архив – по ссылке.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Dark Academia: интернет-эстетика глазами Kandinsky

Dark Academia (в переводе с английского «‎Тёмная академия») — это интернет-эстетика, ставшая особенно популярной во время COVID-19. Её основными вдохновителями считаются книги «‎Тайная история» Донны Тартт и «‎Словно мы злодеи» М. Рио, а также фильм «‎Общество мёртвых поэтов». Все эти произведения объединяют темы элитных учебных заведений, увлечения гуманитарными науками, смерти и тайн.

Dark Academia начала набирать популярность в социальных сетях ещё до пандемии, но карантин нарушил социальные связи, усилил чувство одиночества и из-за повсеместного домашнего онлайн-обучения разрушил атмосферу принадлежности к образовательной организации. В этих условиях интернет-пользователи стали искать новые способы самовыражения, а также средства укрепления своей идентичности.

Подробнее о Dark Academia мы рассказали в статье, а сегодня попросили нейросеть Kandinsky сгенерировать несколько картинок в этом стиле. Три подробных англоязычных промта, основанных на главных элементах стилистики, мы сгенерировали с помощью ChatGPT, а в качестве четвертого указали просто «эстетика dark academia». Предлагаем вам угадать, какую картинку модель создала по этому короткому запросу.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Мы разные, но равные: как с помощью цифровых инструментов сделать образование более инклюзивным

Образование — право каждого, а инклюзивное образование — способ дотянуться до тех, кто этого права был лишен. Современные цифровые технологии помогают сделать знания доступными для всех, независимо от физических или ментальных особенностей. В статье разберем международные и российские примеры успешного применения инклюзивных технологий в школах и университетах.

Инклюзивное образование в мире

Страны выбирают разные подходы к инклюзивному образованию. В Скандинавии и Португалии, например, дети с особыми потребностями учатся в обычных школах, что помогает им лучше интегрироваться в общество. В Великобритании и Франции законы обеспечили доступ к образованию для всех детей, сократив количество специальных школ. В США закон IDEA (The Individuals with Disabilities Education Act) позволяет детям с особыми потребностями учиться в обычных школах, при этом получая дополнительную поддержку и индивидуальные учебные планы.

Инклюзивное образование в России

Сегодня в Москве и некоторых других регионах дети с особыми потребностями учатся вместе с обычными детьми. С помощью НКО и благотворительных фондов разрабатываются и внедряются модели инклюзивного обучения. Тем не менее, согласно исследованию ВЦИОМ, 59% опрошенных взрослых не знакомы с термином «инклюзивное образование».

Адаптивные технологии

Один из типов цифровых инструментов – адаптивные технологии. Они предлагают задания на основании решенных материалов или тестов, то есть подстраиваются к уровню знаний и способностей ученика. Например, платформа Khan Academy предлагает материалы по всей школьной программе, DreamBox помогает изучать математику, AI-ассистент Skyeng присылает индивидуальные задания для улучшения знаний английского.

Технологии ассистивной коммуникации


Есть также специализированные инструменты, приложения и программы, которые помогают людям с коммуникативными нарушениями понимать других и быть понятыми. Например, Zvukogram, Elevenlabs, Speechify и Voicemaker создают аудио по написанному тексту и могут помочь людям с нарушениями языка и речи. А приложения Proloquo2Go, TouchChat HD, LAMP Words for Life специально разработаны, чтобы детям с аутизмом было легче общаться, в том числе с помощью символов и текста.

Специализированные образовательные платформы

Наконец, платформы, на которых собирается образовательный контент, позволяют учиться в любое время и в любом месте. Coursera, edX, Udemy содержат программы и курсы университетов со всего мира, а Stepic — русскоязычная платформа с курсами для обучения по школьным и университетским программам. Эти платформы не разрабатывались для инклюзии, но благодаря возможности получать образование полностью онлайн они повышают его инклюзивность.

Узнать об инклюзивном обучении подробнее можно из полной версии статьи.

Время чтения: 16 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Kandinsky vs. Русский рок

Недавно мы рассказывали, чем наполнен мир русской популярной музыки, а сегодня попросили российскую нейросеть Kandinsky изобразить один из таких миров.

Kandinsky генерирует сначала векторное представление изображения, подобно Stable Diffusion, а затем декодирует изображение из полученного векторного представления.  Модель поддерживает текстовые описания на нескольких языках. Узнать подробнее о ней и о том, где её опробовать, можно из нашего каталога нейросетей.

P. S. Все картинки иллюстрируют один и тот же трек!

🤖 «Системный Блокъ» @sysblok

Читать полностью…
Subscribe to a channel