sysblok | Неотсортированное

Telegram-канал sysblok - Системный Блокъ

5669

«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе. Финалист премии «Просветитель» sysblok.ru vk.com/sysblok fb.com/sysblok instagram.com/sysblok/ Присоединяйтесь к команде: goo.gl/qbPJuK

Подписаться на канал

Системный Блокъ

С Международным женским днём!

Восьмого марта вспоминаем знаменитых женщин-программисток: Аду Лавлейс, Маргарет Гамильтон, Грейс Хоппер, Кэтлин Бут, Екатерину Ющенко. Благодаря которым у нас есть Ethernet и язык программирования COBOL, которые помогали запускать «Аполлон-11» на Луну и программировали первые советские компьютеры.

В карточках собрали самые интересные факты о женщинах, положивших начало развитию IT и вычислительной техники.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Не вандализм, а искусство: как устроена самая большая цифровая карта граффити

Уличное искусство мимолётно и изменчиво: со стен зданий арт-объект может пропасть, не успев просуществовать и нескольких лет (а порой — дней). От бесследного исчезновения стрит-арт спасает фото- и видеофиксация. Составлением цифровой коллекции или, точнее, карты граффити занимается независимый некоммерческий проект The Vagabundler Project.

Кратко: о чем статья?

В 2017 году проект начинался как блог журналиста Гюнтера Михельса, где тот собирал граффити по всему миру. Он прикладывал фото, видео и/или текст и обозначал локацию, чтобы получилась интерактивная карта.

Затем к The Vagabundler Project присоединились и другие энтузиасты. Сегодня на сайте можно найти более 150 тысяч фотографий стрит-арта. А ещё — статьи об уличном искусстве, обзоры фестивалей, интервью с художниками из разных стран, альтернативные маршруты путешествий для любителей стрит-арта и подкаст.

Правда, информация распределяется по странам и континентам неравномерно, так что использовать любительский проект для исследований было бы сложно. Ожидаемо, самым исследованным регионом мира на карте проекта оказалась Европа. Хуже всего дела обстоят с Африкой: представлены только 6 стран из 54. 

Узнать о других проблемах и особенностях проекта и посмотреть на примеры граффити из разных частей света предлагаем в полной версии материала.

Время чтения: 9 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Health humanities: как медикам помогают методы цифровых гуманитариев?

Health humanities — новая область исследований, объединяющая медицину и гуманитарные науки. Хотя идея такого подхода появилась давно, направление стало активно развиваться только в XXI веке. Цель health humanities — обогатить медицину пониманием субъективного опыта врачей и пациентов, а также поведения людей, связанного с решением проблем со здоровьем. Это дает медикам новые возможности: не только лечить физиологические причины уже возникших заболеваний, но и предотвращать проблемы, связанные с действиями их пациентов за пределами клиники, а также делать опыт лечения более простым как для больных, так и для врачей. Для достижения этих целей исследователи используют данные и методы гуманитарных и социальных наук (например, философии, литературоведения, социологии), а также искусство.

«Системный Блокъ» уже рассказывал об исследовании, относящемся к этому направлению. В статье «Книги про питание: проверка на обман» мы говорили о том, как учёные применили цифровые методы гуманитарных наук: дальнее чтение и анализ метаданных — для изучения бестселлеров о правильном питании. Есть ли у авторов подобных книг подходящее образование? Насколько состоятельны их рекомендации? Об этом вы сможете узнать, прочитав нашу статью на сайте.

А пока предлагаем вам небольшую викторину. Как вы думаете, какие из приведенных ниже советов действительно взяты из популярных книг о питании, а какие коварно придумала наша редакция? Отмечайте ваши варианты в опросе, а правильный ответ мы опубликуем вечером!

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

«Ты же не думаешь, что можно заниматься диалектологией как профессией?»: интервью с диалектологом Игорем Исаевым

Диалектологов в России очень мало, но они выполняют важную задачу: фиксацию и изучение русских диалектов. Казалось бы, зачем нужны диалекты, когда уже есть стандартный «литературный» язык? Лингвист-диалектолог Игорь Исаев утверждает, что диалекты позволяют людям чувствовать себя свободнее, когда есть выбор между разными вариантами языка.

«Системный Блокъ» спросил Игоря Исаева о том, как изучают диалекты, в чём разница между социальными и территориальными диалектами и как ученым помогает программа Praat.

Кратко: о чем
интервью?

Литературный язык — это лишь одна часть русского языка. Диалектологи изучают другие его части и стремятся показать, как они устроены.

Сами диалекты делятся на два типа: территориальные и социальные (например, бранная лексика и блатная музыка), но чаще всего подразумевают именно территориальные — говоры. Они могут отличаться от литературного языка и в грамматике, и в семантике, и в фонетике. Для того, чтобы их изучить, можно либо обращаться к историческим источникам вроде деловых книг, либо отправиться в экспедицию и узнать, как люди говорят сегодня (больше об экспедициях, кстати, узнаете из подкаста Игоря Исаева и Дмитрия Коломацкого). В идеале — сделать и то, и то, чтобы увидеть, как диалект эволюционировал.

Помочь в работе с фонетикой диалектов может программа Praat: ей удается уловить то, что на слух не очень понятно. Например, соотношение напряжённости и ненапряжённости согласных. Это особенно важно, если диалектолог не владеет языком, с которым работает.

Подробнее о работе с Praat, кумыкским и хамниганским языками, а также о том, как интернет может стать источником данных о регионализмах, узнаете из полной версии интервью.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Подборка научно-популярных каналов от издания «Системный Блокъ»

Научпоп — новый чёрный, им занимаются все, кому не лень. Но как найти хорошие каналы, на которые стоит подписаться? «Системный Блокъ» собрал для вас подборку, где каждый канал заслуживает подписки:

@dubininvaofficial — Дубынин о мозге
Нейробиолог Вячеслав Дубынин рассказывает популярно, но с научной точки зрения о самом наболевшем: о том, как дожить до конца зимы и сохранить бодрость, существуют ли гормоны ревности и верности, как работают нейромедиаторы радости и грусти, можно ли изучать наше бессознательное. И правда ли, что некоторые люди засыпают после кофе, а танцы способствуют профилактике болезни Альцгеймера?

@nezemnoy_telegram — Неземной телеграм | Астроном Сурдин
Канал астронома и просветителя, автора учебников и книг по астрономии Владимира Сурдина поможет быть впереди планеты всей во всём, что касается внепланетного пространства: с какой скоростью чёрная дыра J0529-4351 поглощает материю, на каком расстоянии от нас учёные обнаружили новый протопланетный диск, как развивается лунная миссия, к которой прикованы взгляды тысяч землян.

@kot_sh — Кот Шрёдингера
«Лучше быть Котом Шрёдингера, чем собакой Павлова», – девиз канала, чередующего новости Вселенной с картинками из жизни древесных кенгуру и морских овечек. Помимо Вселенной и животных «Кот Шрёдингера» любит открытия и путешествия – в прошлое, будущее, на соседние планеты, а, бывает, и в черные дыры. Канал посвящён всему интересному – но смотрит он на всё с точки зрения науки, поддерживая любовь к познанию у разумных существ любого возраста, вида и местообитания.

@scienceandlife — Наука и жизнь
Что общего у этилена и банана? Как искусственный интеллект различает бобров? Почему с возрастом изменяется восприятие цветов и где отдыхает браминский сыч? На эти и другие вопросы из разных областей знаний отвечает старый-добрый журнал «Наука и жизнь».

@SciTopus — Наука и научпоп
Хаб научпоп-видео на русском языке: здесь автоматически собираются только что вышедшие ролики и фильмы о космосе, физике, истории, палеонтологии, теории эволюции. Все, кто любит документальное кино из разных областей научного знания, найдут здесь контент по вкусу. Списки других научпоп каналов можно найти в закрепе.

@severnymayak — Северный маяк | Наука и природа
Издание рассказывает о космосе и планете Земля: находки астрономов и орнитологов, открытия биологов и математиков, научные эксперименты химиков и физиков. В канале вы узнаете о случаях альтруизма у морских слонов, торнадо в яйцеклетке плодовой мушки, каталоге ДНК в паутине, звёздах — красных гигантах, которые выпускают столбы пыли.

@kurilka_gutenberga — Курилка Гутенберга
Коллекция научно-популярных статей и лекций из разных источников. Здесь вы найдёте ответы на вопросы, которые давно стеснялись задать: почему сплетничать полезно? Как быть, если вы родились без уха? Почему нам стыдно смотреть видео с котятами?

@thebatrachospermummagazine — Батрахоспермум
Научно-развлекательный журнал-водоросль для людей с чувством юмора. Обладатели премии «Просветитель.Digital» рассказывают о том, как российский лепидоптеролог открыл аномальную елдозию, показывают, как самец кругопряда ездит на юной самке в ожидании её взросления, открывают новые факты о супервулканах, морских лилиях и рыбках с гениталиями на подбородке.

@sysblok — Системный Блокъ
Как искусственный интеллект меняет науку? Как большие данные помогают бороться против инфаркта и диабета? Откуда берётся музыкальный оргазм? Системный Блокъ пишет о том, как цифровые технологии помогают учёным в самых неожиданных задачах: нейросети расшифровывают древние языки, спутники выявляют социальное неравенство, а векторно-семантические модели помогают понять стиль Льва Толстого.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

На распутье цифровой гуманитаристики

Представители Digital Humanities проводят исследования и выигрывают гранты, хотя это направление все еще не имеет до конца сформированной методологии и научной базы. «Системный Блокъ» много пишет про исследования в области DH, но пора вспомнить, что это и кто такие цифровые гуманитарии.

Кратко: о чем статья?

Digital Humanities — междисциплинарное направление. Цифровые гуманитарии обладают навыками, которые ранее были доступны только программным инженерам. При этом они умеют работать с предметами изучения гуманитарных направлений — текстами, картинами, музыкой, культурой в целом.

В перспективе выделяют четыре основных сценария развития цифровой гуманитаристики: торжество Digital Humanities, радикальная традиционность, междисциплинарная цифровизация и так называемый наиболее реальный вариант. В условиях последней траектории DH-специалист — многопрофильный исследователь, который, кроме научной деятельности, занимается менеджментом и междисциплинарными проектами в IT-компаниях. Например, цифровой гуманитарий автоматизирует простые повторяющиеся задачи, такие как транскрибирование индексных карточек или создание системы тегов.

Более подробно о других вариантах развития Digital Humanities и о специалистах в этой области, читайте в полной версии статьи.

Время чтения: 11 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Столетний пряник и космическая матрешка: 10 необычных экспонатов Госкаталога

Где можно найти и матрёшку с мордой собаки Стрелки, и сборник суеверий из XVIII века? Рассказываем о необычных экспонатах Госкаталога музейного фонда России — цифрового архива экспонатов российских музеев и частных собраний. Его база данных уже содержит более 40 миллионов музейных предметов и регулярно пополняется.

🦌 Композиция из моржового клыка «В ожидании санрейса»


Скульптура изображает сцену жизни тундровых чукчей — ожидание санитарного рейса. Чтобы увидеть композицию вживую, нужно добраться до самого восточного населённого пункта России — села Уэлен Чукотского автономного округа.

🕊️ Платок с надписью «Молодёжь об’единяйся в борьбе за мир, против угрозы новой войны!»

Этот платок был создан в честь Третьего Всемирного фестиваля молодёжи и студентов, который проходил в 1951 году в Восточном Берлине. Слово «мир» на нём написано на двенадцати языках, а фраза из заголовка — на четырех: русском, немецком, английском и французском.

🎲 «Надежды исчезают по ходу игры»: настольная игра «Перестройка»


Сатирическая игра вышла в газете «Собеседник» в 1991 году. Вместо правил там такая информация: «В начале игры все получают надежды. Надежды (их роль могут выполнять разноцветные фантики) исчезают по ходу игры. В игре также участвует несколько конфет (карамелек, кусочков сахара, чёрных сухарей — в зависимости от того, что достанете)».

✍🏼 «До чорта уроков»: объяснительная записка школьника 1937 года

Школьник объясняет руководителю оркестра народных инструментов, почему не придёт на занятие: «так как у меня много (до чорта!) уроков». Но на этом не останавливается: приписывает в скобках «хорошая причина».

Посмотреть на столетний пряник в виде рыбы, композицию из моржового клыка «В ожидании санрейса» и «Абевегу русских суеверий» можно в полной версии статьи. Там же найдёте ещё несколько экспонатов и их краткую историю.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Память о репрессиях: Цифровая история Узбекистана в проекте Raqamli tarix

Узбекистан — солнечный, хлопковый, гостеприимный. Но в XX веке и тут проходили сталинские репрессии. Проект Raqamli tarix («Цифровая история») помогает сохранить память об этом периоде в истории страны. В одном месте собраны база данных о репрессированных, фотографии и видео, а также архивные материалы на трёх языках: узбекском, русском и английском.

Кратко: о чем
статья?

В Узбекистане проводится масштабная работа по увековечению памяти соотечественников, незаконно репрессированных в годы сталинских репрессий в 1920–1950-е гг. Кроме физических мест памяти (музеев, памятников и мемориалов) существуют и проекты по сохранению историй жертв репрессий. Например, Raqamli tarix — «Цифровая история».

На платформе можно найти несколько разделов: от новостей до видеотеки с лекциями и подкастами. А для каждого человека, пострадавшего от репрессий, есть своя карточка с биографией, которую можно скачать.

Помимо Raqamli tarix изучать и сохранять наследие репрессированных в Узбекистане можно с помощью мобильного приложения Книги памяти Ташкента и трехязычного мультимедийного комплекса. Подробнее об этих возможностях и о платформе Raqamli tarix узнаете из полной версии статьи.

Время чтения: 7 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Мир как набор стереотипов в глазах нейросети

Алгоритмы искусственного интеллекта не только генерируют изображения или тексты, но и воспроизводят общественные стереотипы. «Системный Блокъ» рассказывает, как и почему они это делают.

Кратко: о чем статья?

Причина предрассудков нейросетей — смещенные или искаженные данные, на которых они могут обучаться. Смещение происходит, когда в наборе данных одни элементы получают больший вес и/или лучше представлены, чем другие. Например, технология ИИ по оцениванию откликов на вакансии от Amazon присваивала меньшие баллы резюме со словом «женщина» и отсеивала кандидаток из учебных заведений для девушек. Этот случай называется смещением репрезентативности (Representation Bias): для обучения были представлены резюме преимущественно мужчин, в результате чего алгоритм решил, что мужчины предпочтительнее.

Предвзятость нейросетей грозит не только распространением искаженной информации и языка ненависти, но и появлением новых форм социальных стереотипов и дискриминации. Разработчики ИИ предлагают очевидное решение: тщательнее составлять базы данных для обучения. Тем не менее, мы не сможем полностью избавить нейросети от стереотипов, пока сами остаемся предвзятыми.

О других случаях предвзятости моделей и опасности, которой это грозит, читайте в полной версии статьи.

Время чтения: 11 минут

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

«Нас вообще все боятся»: Александра Архипова* о том, зачем фольклористы и социальные антропологи собирают слухи и считают репосты

От китайской медицины до американской конспирологии: «Системный Блокъ» поговорил с антропологом Александрой Архиповой и узнал, о чем могут рассказать лозунги митингующих и народные рецепты лечения Covid. А ещё — о сторонниках разных методов в исследованиях культуры, цифровых базах данных для фольклористов и причинах внесения в реестр иностранных агентов.

Кратко: о чем интервью?

Социальные антропологи, фольклористы и этнографы изучают, как люди воспринимают и как создают мир вокруг себя. Правда, пользуются разными методами: некоторые антропологи однозначно предпочитают количественные методы качественным, некоторые — наоборот. Александра Архипова старается их совмещать: например, как в исследовании анекдотов о Штирлице.

А ещё Александра уверена, что тот, кто умеет делать базу данных по сказкам и анекдотам, может и тексты плакатов на митингах анализировать, и слухи собирать. За первые полгода пандемии Covid-19 с помощью агрегатора текстов социальных сетей получилось собрать базу данных на два миллиона репостов и посмотреть, как распространялись слухи о болезни и лечении. Среди них есть очень старая история о том, что в вакцине содержатся тяжелые металлы, у которой было 500 тысяч репостов. Это — пример текста-реагента: ситуативного и отражающего плохо сформулированные страхи. Такие всегда возникают в ситуации социальной напряженности.

При этом слухи могут прийти к нам и из США, и из Китая, потому что сегодня они легко преодолевают национальные границы. Например, народная медицина у нас скорее китайская, а конспирологические теории — западные. Другое дело, что место таких теорий в российской жизни иное, чем в британской или в американской. В России их транслируют все социальные группы (в том числе политики). Плюс, конспирология всегда предлагает более удобное объяснение, чем какая-то наука, поэтому в некотором смысле конспирологи всегда выигрывают.

О том, как распространялся и распространяется нарратив о том, что на границах России обнаружили тайные лаборатории, и о том, как влияет на жизнь и работу статус иноагента, узнаете из полной версии интервью.

🤖 «Системный Блокъ» @sysblok

*признана в РФ иностранным агентом

Читать полностью…

Системный Блокъ

Цифровые коллекции японского искусства

Как технологии открывают миру богатство культурного наследия? Японские гравюры, живопись и каллиграфию можно увидеть и изучать не только вживую, но и через интернет. Исследуем платформу Google Arts & Culture, цифровой ресурс Cultural Japan, базу данных японских гравюр на дереве Ukiyo-e Search и Центр исследования искусства Университета Рицумэйкан, которые позволяют соприкоснуться с оцифрованными произведениями японской культуры из любой точки мира. 

🎌 Google Arts & Culture
Эта платформа объединяет более двух тысяч культурных учреждений из более чем восьмидесяти стран мира. При запросе «‎Japan» поисковая система Google Arts & Culture предлагает просмотреть 52 800 связанных с Японией экспонатов, 175 коллекций, 2 333 истории (онлайн-выставки) и 4 виртуальные галереи.

🏯 Cultural Japan
Cultural Japan включает в себя 133 базы данных и 1 718 202 элемента, доступных для поиска на английском и японском языках. Пользователи ресурса могут не только исследовать, но и создавать собственные виртуальные выставки: функция Self Museum позволяет выбирать произведения искусства и добавлять их в виртуальные галереи на сайте.

🎌 Japanese Woodblock Print Search
Эта база данных содержит изображения и метаданные по японским гравюрам из различных учреждений — всего более 213 000 гравюр из 24 коллекций по всему миру. Текстовый и графический поиск помогают исследователям находить новые копии гравюр, корректировать атрибуцию и идентифицировать гравюры.

🏯 The Art Research Center (ARC), Ritsumeikan University
В цифровых архивах Университета Рицумэйкан можно найти 80 баз данных, которые включают в себя изображения, тексты и метаданные, связанные с богатым культурным наследием Японии. Причем искать их можно не только по коллекции университета, но и по собраниям других учреждений и коллекционеров.

Узнать об истории этих проектов и посмотреть на интерфейс каждого можно на сайте.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Понять Льва Толстого: как векторно-семантические модели помогают литературоведам

Идиостиль — это авторский стиль писателя. И если на небольших стихах его изучать удобно, то вот на текстах Льва Толстого — очень непросто. Рассказываем, как филолог Борис Орехов использует векторно-семантические модели для анализа идиостиля Толстого.

Кратко: о чем статья?


Раньше полностью проанализировать корпус текстов Толстого — девяносто томов — было практически невозможно. Теперь такая перспектива появилась благодаря машинным методам. С помощью компьютерного моделирования контекстов в векторном пространстве можно понять, какие слова в корпусе текстов находятся ближе всего друг к другу. Говоря проще: определить, чем индивидуальный стиль писателя отличается от «обычного» русского языка.

В случае Толстого, например, обнаружилась разница между синонимичными «любовь» и «обожание». Оказалось, что глаголы «обожать» и «боготворить» в текстах писателя свидетельствуют о чувствах ложных и зыбких, а вот «любят» у классика по-настоящему.

Ещё одна интересная находка связана с полями: ближайшими соседями слова «поле» в текстах писателя оказались компоненты пейзажа («лес», «луг») и сельские термины, а батальная семантика поля боя встречалась реже.

Узнать больше об этом исследовании и подтвердить находки цитатами поможет полная версия статьи.

Время чтения: 6 минут.


🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Агрессивная сеть: кибербуллинг в цифрах

Кто чаще всего сталкивается с травлей в сети? Как часто жертвы кибербуллинга становятся агрессорами? В новом материале «Системного Блока» разбираемся с феноменом онлайн-агрессии среди детей, подростков и взрослых.

Кратко: о чем
статья?

Понятие «буллинг» было впервые введено Дэном Олвеусом в 1993 году, а термин «кибербуллинг» канадский политик Билл Белси ввел четыре года спустя. Он предлагал понимать его как агрессивные действия, направленные на интернет-пользователя со стороны других пользователей различных социальных сетей.

Сегодня с кибербуллингом сталкиваются люди всех возрастов, но 56% — согласно исследованию «Постнауки» — составляют подростки. Более того, в 40% случаев жертвы травли в интернете вскоре сами становятся онлайн-агрессорами. При этом 25% чувствуют вину, а 26% понимают, что поступают неправильно.

Другое исследование, которое проводила компания Microsoft, показало, что от интернет-агрессии в социальных сетях страдали или страдают 50% опрошенных российских подростков. При этом каждый второй предпочитает отвечать агрессией на агрессию, а к родителям обращается только каждый пятый.

Подробнее о ситуации с кибербуллингом, о том, что о ней думаю шестиклассники и девятиклассники и о том, как защититься от агрессии в интернете, узнаете из полного текста статьи.

Время чтения: 4,5 минуты.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Кто какую часть произведения написал? Выясняем с помощью Stylo

Представьте, что у вас есть текст, написанный несколькими людьми. Как узнать, какие его части точно принадлежат тому или иному автору, если об этом нет никаких данных? Для этого в Stylo, библиотеке языка программирования R, существует функция rolling.classify. В новом гайде рассказываем, как она работает и чем может быть полезна в стилометрических исследованиях.  

⚙️ Как это работает?

В основе работы rolling.classify лежит алгоритм, который обучается на корпусе текстов предполагаемых авторов. Затем он разбивает изначальный текст на части и определяет, кому какая принадлежит.

🔬 Эксперимент «Системного Блока»

Чтобы проверить функцию, мы составили единый текст из отрывков «Драмы на охоте» А. П. Чехова и «Жизни Арсеньева» И. А. Бунина и запустили rolling.classify (Важное замечание: у неё нет графического интерфейса, как у stylo, придется написать код вручную и скопировать пару команд из инструкции).

После запуска функции на выходе получается диаграмма, которая предлагает три варианта разбиения отрывков по авторам — от более вероятного к менее. В нашем случае она сразу показала достаточно точный результат, но, изменив несколько параметров, мы убедились, что иногда найти подходящие для текстов настройки с первого раза не так просто. Поэтому в реальности часто нужно совмещать количественный анализ с качественным. Например, обращаться к литературоведческим работам, в которых можно найти подтверждение найденным закономерностям.

Проследить за экспериментом от начала и до конца и узнать, как провести собственное стилометрическое исследование, можно благодаря туториалу на сайте.

Время чтения: 9 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Тест: Перестаньте читать книги и начните их анализировать

Благодаря новому тесту «Системного Блока» узнаете, кто чаще говорит в пьесах Чехова, как выглядят графы комедии и трагедии и как гарантировано умереть в «Гамлете». В общем, какую информацию можно получить из корпусов художественных текстов с помощью дальнего чтения.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Как превратить текст в видео?

Недавно компания OpenAI, создавшая модели GPT и сервис ChatGPT, выпустила новую модель Sora, которая генерирует видео по текстовому описанию. Она способна создавать качественные видео в высоком разрешении (вплоть до FullHD), консистентные от начала до конца. Рассказываем, как работает Sora, какие у неё есть ограничения и неожиданные особенности.

Кратко: как она работает?

Любое видео — набор изображений. Для генерации изображений используют диффузионные модели. Такие модели обучаются восстанавливать картинки из шума случайных пикселей и текстового описания. Генерация видео диффузионной моделью — это покадровая генерация картинок из шума с учетом текстового описания для видео и предыдущих картинок.

Помимо генерации новых видео, Sora может продолжать уже существующие: и вперёд, и назад по времени. А ещё — создавать видео виртуальных миров: например, она может сгенерировать геймплей Minecraft. Это способность модели в будущем может быть использована в игровой индустрии.

О том, почему используются именно диффузные модели, как именно устроено обучение Sora и какие проблемы с физикой у нее возникают, узнаете из полной версии статьи.

P.S. Заметили ли вы, что не так в видео с котом? Пишите в комментариях 😸

Время чтения: 7 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Книги про питание: проверка на обман

На самом деле, все цитаты в опросе действительно встречались в текстах! Даже самые дикие и безумные на ваш взгляд. Редакции не пришлось ничего придумывать ;)

Будьте осторожны: к подобным книгам надо относиться критически. В нашей статье мы разбираем, что все эти утверждения из книг о питании авторы исследования признали спорными и/или необоснованными.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Привычки птиц и храп мини-пигов: подборка статей по биологии

«Системный Блокъ» рассказывает о применении цифровых методов в разных областях знаний, в том числе — в биологии. Собрали для вас пять необычных материалов о том, как современные технологии помогают исследовать растения, животных и человека.

🐦 Цифровой «взлет»

Какие привычки у птиц, где они обитают и что едят? Проект «Птицы Москвы и Подмосковья» собрал фото, видео с камер наблюдения и сообщения горожан о пернатых на одном сайте. Благодаря нему можно увидеть закономерности между погодой и поведением птиц, посмотреть, где птицы летали и в каких местах селились. Подробнее — в полном тексте статьи.

🐷 Сон мини-пигов

Синдром обструктивного апноэ сна (СОАС) — болезнь, для которой характерны частые остановки дыхания во время сна, сопровождающиеся сильным храпом. СОАС достаточно часто встречается у людей, но пока мало изучен. Оказалось, что у свиней (в отличие от крыс и кроликов) эпизоды апноэ тоже случаются с некоторой периодичностью и связаны с сильным сужением горла при ожирении. О том, как эти данные помогут изучить людей и в чём несовершенство этой идеи, узнаете из статьи.

🐭 Пальмы, мыши и люди

Биологи успешно создают визуализации для самых разных данных. Например, с помощью графиков можно отобразить синтению — сохранение порядка генов на хромосомах двух видов. Благодаря этому можно увидеть, чем финиковая пальма похожа на масличную, а мы — на мышей. Другие графики позволяют построить древо жизни и увидеть участки генома, отвечающие, например, за развитие болезни Альцгеймера. Изучить их подробнее можно здесь.

👴🏻 Терапия инфаркта и диабета


Часто болезнь человека можно представить в виде сценария, в котором хранится информация о симптомах, лечении и исходе. Собрав достаточно данных о совпадениях и пересечениях в разных историях болезни, можно поделить пациентов на группы, смоделировать такой сценарий благодаря алгоритмам машинного обучения и узнать, как заболевание может прогрессировать. Подробнее — в полной версии материала.

🤖 Роботы-животные

Создавая роботов, изобретатели часто вдохновляются животным миром. Например, в Китае в рамках программы «Птицы-шпионы» (!) инженеры представили робота-голубя Dove, который имитирует движения крыльев и тел настоящих птиц на 90%. Робот делает фото и видео и при этом умеет «обманывать» радиолокаторы. Другой пример — роборыба, разработанная в США. «Бесшумный Немо» должен стать важной частью подводной разведки и доставлять грузы. Он полностью копирует поведение рыб, делает резкие повороты и двигается бесшумно. Посмотреть на эти разработки и узнать, на что ученых вдохновили слоны, осьминоги и собаки можно здесь.

🍀Бонус🍀

Тест по растениям России из Цифрового гербария МГУ! Попробуйте отличить лопух от репейника, а камыш — от тростника (спойлер: это сложнее, чем кажется). А про сам гербарий можно почитать здесь.

🤖  «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Новый реагент: самая зимняя инфографика

Испорченная обувь, обожжённые собачьи лапы, гололед… Провожаем февраль материалом о гололеде и реагентах. «Системный Блокъ» изучил, как используется средство «Бионорд», которое власти называют безвредным.

Кратко: о чем статья?


На конец января 2024 года от гололеда только в центре Санкт-Петербурга пострадали 489 человек. В других городах ситуация не сильно лучше.

Во многих из них для борьбы с гололедом используют средство «Бионорд», которое растапливает снег даже в условиях сибирской зимы и… не прошло федеральных исследований. Поэтому точно судить о его безопасности нельзя. Жители Красноярска, например, создали петицию против его использования ещё в 2019 году, но, как видно из нашей инфографики, многие регионы продолжают закупать и использовать именно это реагент.

Из полной версии статьи узнаете, какие аргументы в пользу средства «Бионорд» предлагают производители и власти регионов, что о нем думает эколог Глеб Бабич (спойлер: думать о нем сложно, ведь на сайте производителя нет информации о химическом составе), и, наконец, к каким альтернативным методам борьбы с гололедом прибегают в разных городах.

Время чтения: 12 минут.

🤖  «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Айтрекинг, музыка и младенцы: подборка материалов из рубрики «Нейронауки»

На этой неделе предлагаем вам вспомнить статьи «Системного Блока» о том, как ученые используют нейротехнологии в разных областях знания.

👀 Своими глазами

Технология айтрекинга, позволяющая отслеживать координаты взора, давно популярна в психологии и психолингвистике. В последние десятилетия она развивается особенно интенсивно, но её историю можно вести от Аристотеля или древнеримского хирурга Клавдия Галена. Узнать об их наблюдениях и экспериментах, а также о том, как тупая игла на веке или присоска с радиоантенной сменились на бесконтактные технологии можно из поста об истории метода.

О примерах применения айтрекинга мы рассказывали сразу в нескольких материалах. В одном из них собрали целых пять исследований из разных областей: от спорта и маркетинга до исскусства и лингвистики. Другой текст был посвящен анализу методом сканпаф (от англ. scanpath), с помощью которого изучали паттерны чтения в разных русскоязычных группах у детей с дислексией. Наконец, можно почитать и про метод с говорящим названием Визуальный мир, про него мы рассказали здесь.

🎧 Своими ушами

Нейропластичность мозга ученым помогает изучать музыка. Когда мы учимся играть на инструменте, в мозге происходят структурные и функциональные изменения, что может влиять на внимание, память, эмоции и даже язык! Подробнее рассказывали в статье. А ещё можете почитать, как исследователи отслеживали мозговую активность и эмоциональное состояние испытуемых при прослушивании музыки и выяснили, откуда берутся мурашки.

👩🏻‍🍼Устами младенца

Ещё одна интересная задача нейронаук — помочь нам понять младенцев. Например, системы автоматического распознавания плача малышей постепенно учатся определять, какие звуки характерны для признаков голода, а какие — для желания спать. О них мы рассказывали здесь. А в другом исследовании разбирались, как младенцы переходят от плача и к речи учатся говорить, формируя представление о границах слов.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Как получить литературную премию с помощью ChatGPT

Престижная литературная премия Японии закончилась скандалом: награду получила Риэ Кудан, написавшая 5% текста с помощью ChatGPT. «Системный Блокъ» рассказывает, может ли искусственный интеллект заменить писателей.

Кратко: о чем статья?

Риэ Кудан дебютировала в литературе недавно, но за три года карьеры успела стать лауреатом трех премий для начинающих авторов. В декабре 2023 года она получила четвертую литературную премию за свой новый роман «Токийская башня сочувствия», в котором есть фрагменты, созданные ChatGPT.

Писательница решила использовать ИИ для написания книги из-за ее сюжета: действие романа разворачивается в ближайшем будущем, существует здесь и своя нейросеть, к которой часто обращаются главные герои. Риэ Кудан хотела противопоставить искусственные слова ИИ словам, которые используют люди, и предложила читателям разымышление о сущности языка и его трансформациях в современную эпоху.

Более подробно о нашумевшем романе и об осмыслении в нём философских и лингвистических последствий применения нейросетей, читайте в полной версии статьи.

Время чтения: 6 минут

P.S. А ещё у нас есть инструкция, как создавать художественные произведения при помощи ChatGPT и не облажаться, которую мы сделали вместе с главредом издательства «Индивидуум».

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Что такое K Nearest Neighbors?

Как компьютер сравнивает объекты для решения задач классификации и регрессии, рассказываем в материале «Системного Блока».

Кратко: о чем статья?

Идея, которая лежит в основе метода KNN, — если объекты похожи по одним характеристикам, то будут похожи и по другим. Этот алгоритм используется, например, в системах рекомендаций.

Есть два типа задач, которые можно решить с помощью K Nearest Neighbors — классификации и регрессии. Например, определить породу собаки по набору характеристик — задача классификации. Предсказать стоимость квартиры по её описанию — регрессии.

В обеих задачах выделяют объект — то, по чему делается предсказание, и целевую переменную — то, что надо предсказать. Если объекты «похожи», то их целевые переменные принимают те же (в случае классификации) или близкие (в случае регрессии) значения.

Предсказание целевой переменной делается на основе набора KNN с учетом рассчитанных расстояний между объектом и всеми объектами выборки. Само предсказание вычисляется по-разному в зависимости от задачи: это может быть голосование или усреднение. В случае породы собаки голосование работает так: когда есть 5 хаски и 2 маламута (K в этом случае равно 7), то предсказанием будет порода хаски.

Более подробно о предсказании целевой переменной, а также о сложностях, возникающих при применении метода К ближайших соседей, читайте в полной версии статьи.

Время чтения: 6 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Новый, мертвый, хороший: визуализация текстов Гражданской Обороны

16 лет назад умер Егор Летов — икона русского панк-рока, живой мёртвый классик, актуальный сегодня и всегда. Ведь мы по-прежнему лёд под ногами майора, вокруг нас по-прежнему русское поле экспериментов, а всё летит туда, куда оно летело ещё при жизни Летова... Сегодня отличный день, чтобы переслушать «Мою оборону» и перечитать наше исследование текстов Летова. 

💔 Я и мы
Мы собрали около 200 текстов Гражданской Обороны и еще одного проекта до 1997 года, автором которых был Егор Летов. Первое, что мы увидели — как из них постепенно исчезает я, уступая место местоимению мы.

❤️‍🩹 Здорово и вечно Хорошо и плохо
Язык Летова вполне разнообразен: слова, встретившиеся во всем корпусе только один раз составляют две трети всего словаря. При этом темы, конечно, повторяются из года в год и из альбома в альбом. Ключевая для творчества Летова — тема смерти. «Положительные» слова вроде хороший, смех, праздник, радость, веселый встречаются тоже, но на них всегда важно смотреть в контексте: у Летова «хороший царь» означает ровно противоположное, а «веселый сок» — это кровь.

Узнать о том, как менялась лексика в текстах Летова с 1985 до 1997 и какие глаголы, прилагательные и существительные были особенно характерны для альбомов разных периодов можно из полной версии статьи.

Время чтения: 7 минут.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Сегодня в колонии ИК-3 в Харпе погиб Алексей Навальный. Он умер в ШИЗО, куда его поместили в 27-й раз за последние 1,5 года. ШИЗО — это штрафной изолятор, место с тяжелыми условиями содержания, холодом и минимумом пищи. Навальный попадал туда за то, что «не держал руки за спиной», «регулярно расстегивал верхнюю пуговицу робы», «отказался представиться по форме» и за другие «провинности». Иногда между заключениями в изоляторе проходило меньше суток. По мнению представителя СПЧ Евы Меркачевой к смерти политика могло привести именно постоянное заключение в ШИЗО.

С августа 2022 Алексей Навальный провел в ШИЗО каждый второй день своего заключения. Несмотря на тяжелые условия, он до последних дней находил место иронии и оптимизму в своих посланиях из-за решетки. Мы едва ли найдем их сегодня. Мы соболезнуем семье, близким и соратникам политика.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Цвет антиутопии зеленый: цифровая рецензия на роман «Радио Мартын»

Гуманитарии осваивают цифровой мир и смотрят на литературные произведения через цифровую оптику. Это позволяет увидеть в толще текста неочевидные стилевые особенности текста. Мы проанализировали книгу «Радио Мартын» Филиппа Дзядко с помощью языка программирования R и отразили в цифрах уникальность авторского стиля писателя. Спойлер: в этом посте спойлеров нет, а вот в полной статье — очень даже.

Кратко: о чем статья?

Стиль романа – отрывистая, сухая речь с частыми повторениями одних и тех же словосочетаний. Чаще всего здесь встречаются предложения всего из трех слов, но вообще их длина колеблется от одного слова до шести.

Что же касается самих слов, самое употребительное прилагательное – другой – выводит на первый план инаковость главного героя антиутопии. Ещё в романе часто встречаются цвета, но только три — черный, белый и зеленый. Анализ словосочетаний, в которых они обычно употребляются, показал, что черный закономерно ассоциируется с чем-то тревожным и страшным, а белый — с приятными воспоминаниями о любви и домашнем уюте.

Если не боитесь спойлеров и хотите узнать, какое облако слов окружает зеленый и что происходит в предложении длиной в целую главу, переходите к полной версии материала.

Время чтения: 7 минут.


🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

👋 Тест: какой вы жест из мультимедийного корпуса русского языка?✍️

«Закатить глаза» или «поднять бокал»? Пройдите тест и узнайте, каким жестом вы были бы во вселенной мультимедийного корпуса русского языка.

А если вы ещё думаете, переходить ли по ссылке, спойлер: в одном из вопросов нужно выбрать стихотворение про кота 😼

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Как автоматически расшифровать аудио: пошаговая инструкция для Whisper

Расшифровка аудиозаписи — дело утомительное и времязатратное. К счастью, появляется все больше сервисов, которые умеют это делать автоматически. Рассказываем, как это сделать с помощью модели Whisper от OpenAI, и смотрим, насколько хорошо она справляется с русскоязычными записями.

👞 Шаг 0. Готовимся к работе и запуску Google Colab 
Чтобы превратить аудио в текст с помощью Whisper, мы используем Python, потому что своего официального интерфейса у модели нет. Проще всего это сделать в Google Colab. Когда вы завели Colab-тетрадку, нужно настроить её так, чтобы она не «засыпала».

👟 Шаг 1. Загружаем аудио
Здесь мы напишем о самом простом, но и самом долгом способе загрузить файл. Его нужно просто выбрать с компьютера при помощи готовой функции из библиотеки files и вставить код из нашей инструкции.

👡Шаг 2. Делаем из аудио текст
Когда файл загружен, можно запустить программу, которая установит Whisper, применит его и запишет результат расшифровки в txt-файл. После этого останется открыть получившийся текст и поправить то, с чем машина не справилась.

🛼 Шаг 3. Метод Кондо: чистим текст
К сожалению,  реплики собеседников придется разделять вручную, так как Whisper их не различает. А ещё кое-что придется переписать, потому что некоторые слова Whisper распознает неправильно (например, нам он предложил миросети вместо нейросетей). А вот знаки препинания Whisper расставляет неплохо, но иногда своеобразно. Например, придется разделить длинную фразу на пару предложений покороче или добавить тире. Наконец, названиям придётся добавить кавычки, но… это всё равно займет намного меньше времени, чем расшифровка вручную.

Скопировать необходимые коды и найти ещё два способа загрузки аудио (более сложных, зато более быстрых) можно в статье на сайте.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

Что влияет на продовольственную безопасность?

«Системный Блокъ» подготовил инфографику о связи голода с географией, экономикой, погодными бедствиями и вооружёнными конфликтами.

О том, как число людей, страдающих от нехватки продовольствия, выросло за последние годы, из-за чего случается продовольственный кризис и насколько мир зависит от экспорта зерна из России и Украины, узнаете из наших карточек. А ещё больше информации о продовольственной безопасности найдете в этом посте.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

О дивный «Визуальный мир»

При помощи записи движения глаз учёные изучают, как мозг человека понимает предложения и справляется с лингвистической неоднозначностью. Продолжаем серию материалов про айтрекинг и рассказываем об одном из направлений нейролингвистических исследований: экспериментальном методе «Визуальный мир».

Кратко: о чем статья?

Первое исследование в парадигме «Визуальный мир» было представлено в 1994 году в Нью-Йорке, но сама история этого айтрекинг-метода началась гораздо раньше. В 1974 году американский лингвист Роджер Купер выяснил, что в большинстве случаев взгляд человека останавливается на названном объекте ещё до того, как слово полностью произнесено.

Во время эксперимента по методике «Визуальный мир» испытуемые прослушивают устные инструкции и по-разному взаимодействуют с некоторыми предметами: смотрят на них, двигают, дотрагиваются. Среди предметов обязательно есть объект-мишень, который используется в устной инструкции, и объект-конкурент, название которого похоже на название мишени по звучанию или значению (например, candle и candy). Ещё есть отвлекающие объекты-дистракторы. Запись движений глаз в «Визуальном мире» позволяет отследить обработку предложения во время его звучания.

Какие исследовательские проблемы решают с помощью «Визуального мира» и как с ним экспериментируют на русском языке — читайте в полной версии статьи.

Время чтения: 4 минуты.

🤖 «Системный Блокъ» @sysblok

Читать полностью…

Системный Блокъ

«Нам надоели префиксы и инфиксы, что мы можем для людей сделать?»: Ольга Драгой о настоящем и будущем нейролингвистических исследований

Нейролингвистические исследования находятся на стыке психологии, неврологии и лингвистики: здесь изучается речь пациентов, переживших инсульт, разрабатываются приложения для определения дислексии и даже синтезируются слова по активности нейронов. А еще нейролингвисты работают прямо в операционных, помогая хирургам сохранить способности пациента (от речи до игры на гитаре) во время операций на мозге.

О соединении нейролингвистических экспериментов с машинным обучением «Системный Блокъ» поговорил с Ольгой Драгой — директором Центра языка и мозга НИУ ВШЭ и доктором филологических наук.

🎓 От университета до Мегагранта

Когда Лаборатория нейролингвистики НИУ ВШЭ только появилась, в ней занимались клинической лингвистикой, афазиологией, но с большим налётом современной экспериментальной науки. А уже через год лаборатория выросла от университетской до международной, получила большие гранты, и возможности значительно расширились. Появились проекты в областях нейрохирургии и картирования речи.

⛰️ Об экспедиции в адыгейский аул

Не главная, но важная часть исследований лаборатории — экспедиции. Например, в Адыгее сотрудники лаборатории сделали первый эксперимент с видеоокулографом, изучали чтение на адыгейском полисинтетическом языке и сравнивали с русским, смотрели, есть ли у участников-билингвов особые техники чтения. Спойлер: есть, билингвы «приземляются» глазами не в центр слова, а ближе к началу, и делают это и в русском, и в адыгейском языке.

🧠 О будущем нейролингвистики в медицине

Есть надежда, что с помощью машинного обучения можно будет по записанной речи определять психические патологии: например, депрессию или расстройства шизофренического спектра. А из идей, которые предстоит реализовать в более далекой перспективе, — синтез речи по нейрональной активности. Если пациент, например, парализован, периферически он не может передать сигнал из моторной коры на органы артикуляции. Нейролингвистам нужно будет поймать этот сигнал и перевести его в акустическую волну, оречевить его. То есть пациент заговорит своей моторной корой, не подключая щёки, губы, язык. 

О других целях и проектах лаборатории, об интересе программистов и специалистов по машинному обучению к нейролингвистике, а также о стандартизированных тестах, приложениях для Android и внедрении ИИ читайте в полной версии интервью.

🤖 «Системный Блокъ» @sysblok

Читать полностью…
Подписаться на канал