В университете Мюнстер, где я учусь и работаю официально объявили, что запрещено пользоваться ChatGPT и подобными моделями генерации языка для написания любого типа работ в университете, от эссе до диссертации. У вас в вузах уже официально запретили?
Читать полностью…На прошлой неделе мне посчастливилось быть приглашённым спикером на конференции https://lithme.eu/ в Финляндии! Теперь я официально член рабочей группы 8, которая фокусируется на вопросах языковой вариативности в мире Human-Computer Interaction:) Очень рада была посетить конференцию не онлайн. Мы соединили поездку в Финляндию с семейным отпуском, пожили в домике у озера и погуляли по Хельсинки!
Читать полностью…Хочу сказать, что очень много лингвистов без какого-либо опыта в дизайне диалоговых систем, отлично работают в данной индустрии. В том числе без навыков программирования! В разных проектах используются совершенно разные платформы и инструменты. Вы можете потренироваться работать в https://www.voiceflow.com/ и просмотреть их тьюториалы! С этой базой можно потом легко то же самое делать в других программах! Везде очень интуитивный интерфейс:)
Читать полностью…Ребята, я тут ненадолго пропадала, потому что я решила попробовать податься на работу в сфере voice user interface design, и со вчерашнего дня я уже архитектор голосовых систем:) очень рада вступить на этот путь! Я уже несколько лет слушаю все подкасты из этой индустрии, и решила, что если я не попробую эту сферу на практике всегда буду жалеть! Я очень люблю университет, науку, преподавание, но всегда тянуло в индустрию! Надеюсь, смогу всё совмещать🌟
Читать полностью…Трудно было о чём-то писать в эти выходные, пока вот нашёлся ещё один заманчивый подкаст, ещё не слушала, жду прогулки с Леопольдом 💫
Читать полностью…На сайтах про voice user interface/experience design очень хвалят этот подкаст. Я пока слушаю только конкретные эпизоды и часто перематываю, потому что мало узнаю нового. Но если кто-то только знакомится с этой сферой, очень должно обогатить ваши знания! Я этой областью уже давно увлекаюсь, но именно теоретически, для своей диссертации по Human-Computer Interaction.
Читать полностью…Здесь кто-нибудь есть у меня из области voice user interface/experience design? Если вас эта область интересует, слышали о ней, отправьте реакцию, а если работаете в этой сфере, напишите комментарий:)
Читать полностью…Мультилингвизм, мультикультурность, мультинациональность
Люди мыслят категориями с младенчества. Благодаря категоризации, дети понимают, что на сколько бы не были разными лица окружающих – это лица. Представьте, как по-разному выглядят наши улыбки? А грудной ребёнок может узнать улыбку на любом лице.
⠀
Усвоение языков также поддерживается созданием категорий. В системе восприятия ребенка создаются категории звуков, которые он часто слышит. Например, у ребёнка выросшего в русской среде, будет примерно 5 категорий гласных звуков, а у ребёнка, выросшего в немецкой среде около 15. Всё, что окружает ребёнка ведёт к тому, как выстраиваются категории в его сознании, в том числе и категории «свой»-«чужой».
⠀
Язык и лицо человека всегда были связаны с категориями «свой»-«чужой». В языке даже минимальное отклонение в речи собеседника может показать, что человек вырос в окружении другого языка. Потенциально, это может вести к тому, что собеседника мозг быстро отправит в категорию «чужого».
⠀
Если ребёнок с детства растёт в окружении многих языков/диалектов/акцентов, в его мозге уже нет категоричного разделения на «свой»-«чужой». Более того, владение каким-то языком не ведёт напрямую к связи с одной национальностью, потому что через языки и опыт, человек приобретает черты разных культур.
⠀
У би-мультилингвов есть и би-мультикультурность. Из-за этого, такие люди часто с трудом могут сказать, кто они по национальности. Билингвы с детства усваивают, что мир людей РАЗНООБРАЗНЫЙ, а не бинарный (свой/чужой). Раннее осознание разнообразия ведёт к толерантности, любви к разному и новому.
Внутри каждой из категории отдельной национальности заложены миллионы судеб и сотни мнений. Даже если мозг вперёд вашего сознания делает вывод «чужой», не поддавайтесь и поговорите с человеком, только диалог показывает «свой» или «чужой».
Я уверена, все и так это понимают, просто хотелось напомнить в это тяжёлое время. Хочется, чтобы какими бы разными мы ни были, мы всегда могли договориться. Я надеюсь, мой аккаунт вносит вклад в то, что больше людей будет ценить мультиязычие и мультикультурность. Это путь к толерантности и принятию разнообразия! ➡️ Мир 🌍
Ребята, присоединяйтесь в клуб ученых-лингвистов в Clubhouse! Подписывайтесь на @superannk ! Давайте обсуждать наши проекты в области лингвистики, дискутировать о методах исследования и теориях! Очень жду встречи и знакомства со всеми:)
Читать полностью…Ссылка на мой Инстаграм:) https://www.instagram.com/p/B96yNqcCV7Q/?igshid=1240l1htxye91
Читать полностью…«Смотря в каком контексте»: от word2vec к BERT
Специалист по дистрибутивной семантике, основатель сайта RusVectōrēs, докторант и сотрудник группы языковых технологий в университете Осло Андрей Кутузов рассказал на школе #fall4digital о том, почему мир переходит на контекстуализированные векторно-семантические модели (ELMo, BERT), а классический word2vec уже не в моде. Вот пересказ для тех, кто пропустил:
Дистрибутивные семантические модели — фундамент современных прикладных компьютерно-лингвистических систем. Старая идея о том, что значение слова может быть выражено через обобщение контекстов его употребления (это говорил еще Витгенштейн, а из лингвистов — Зеллиг Харрис и Джон Фирс), получила успешную реализацию в алгоритмах вроде word2vec — и в некотором смысле сделала лексическую семантику доступной машине. Когда исследователи научились получать контекстные вектора слова на достаточно больших корпусах, это подстегнуло и машинный перевод, и информационный поиск, и вопросно-ответные системы. Возможность взять семантические векторы и вычислить, что слово помидор близко к слову томат, но далеко от слова поминать, улучшило качество алгоритмов обработки и понимания естественного языка.
Однако даже самая идеальная дистрибутивная модель обладает врожденной проблемой. Обучившись раз, она сохраняет один статичный вектор каждого слова — и в процессе использования уже не может опираться на контекст. Эта проблема легко заметна в случае с многозначными словами (лук, рок, бот...). Попытки «расщепить» векторы многозначных слов в модели на несколько (например, AdaGram) оказались половинчатым решением...
И тут на сцену выходят контекстуализированные векторно-семантические модели — ELMo, а затем BERT. Такие модели обучаются строить вектор каждого слова с учетом контекста. Т.е. в них нет четко заданного вектора слова лук — он порождается в тот момент, когда на вход системе приходит предложение с этим словом. То, каким будет вектор лука, и как он будет относиться к словам чеснок или колчан, зависит от контекста: для предложения Выпустил стрелу из лука вектор будет совсем не таким, как для Зеленый лук растет на грядке.
Сегодня ELMo и BERT (особенно BERT) — это «новый черный» мира Natural Language Processing. Замена статической векторной модели на контекстуализированную приводит к повышению качества работы очень многих систем автоматической обработки языка.
#dhvoronovo
У меня прошла первая неделя школы по компьютерной лингвистике в университете Штутгарта! И я в полном восторге! Программа школы идеально составлена, так как и теоретические, и прикладные, и компьютерные лингвисты узнают что-то новое! На первой неделе до обеда шел курс Eva-Maria Vecchi, на котором мы узнали всё от самых простых векторов до супер новых форм embeddings BERT, которые изменили не только область NLP, но и вообще о них все только и говорят!
А на курсе Nils Reiter после обеда мы узнали о механизмах machine learning для анализа текста, и даже попробовали сами улучшить модель decision trees. Мне было очень интересно всё это попробовать, и моя модель победила по accuracy. Я еще не умею программировать, и большую часть времени я потратила не на то, чтобы улучшить модель, а на то, чтобы зайти на сервер для того, чтобы модель могла обучиться на большом корпусе, и для того, чтобы отправить результаты моей лабораторной! Компьютерные лингвисты пробовали изменить код, тестировали разные опции, а я просто убрала features, которые мне показались не релевантными для обучения модели. Но вывод еще можно сделать, что machine learning очень непредсказуемая тема.
Если кого-то не интересует компьютерная лингвистика, то не обращайте внимание на это сообщение, но просто знайте, что компьютерные лингвисты без работы не останутся:) Для участников школы даже была организована встреча с представителями Bosch, Sony и IBM, где есть места для оплачиваемой практики и написания магистерских, бакалаврских работы, или даже три года можно там PhD писать. А для тех, кто интересуется компьютерной лингвистикой, советую зайти на сайт школы, перейти по ссылке на материалы курсов и посмотреть слайды лекций:) https://dgfs-clschool19.github.io/progra#embd-course
Список литературы к подкасту, который можно прослушать здесь:)
https://soundcloud.com/user-885341914/protsess-sblizheniya-lyudey-vo-vremya-obshcheniya
https://anchor.fm/--457/episodes/ep-e436eu/podcast-afm6v2
Barr, D. J., & Keysar, B. (2002). Anchoring comprehension in linguistic precedents. Journal of Memory and Language, 46, 391–418.
Branigan, H. P., Pickering, M. J., & Cleland, A. A. (2000). Syntactic coordination in dialogue. Cognition, 75, B13–B25.
Brennan, S. E., Chen, X., Dickinson, C. A., Neider, M. B., & Zelinsky, G. J. (2007). Coordinating cognition: The costs and benefits of shared gaze during collaborative search. Cognition, 106, 1465–1477.
Brennan, S. E., & Clark, H. H. (1996). Conceptual pacts and lexical choice in conversation. Journal of Experimental Psychology: Learning, Memory, and Cognition, 6, 1482–1493.
Clark, H. H., & Brennan, S. E. (1991). Grounding in communication. In L. B. Resnick, J. Levine, & S. D. Teasley (Eds.), Perspectives on socially shared cognition (pp. 127–149). Washington, DC: APA Reprinted in R. M. Baecker (Ed.), Groupware and computer- supported cooperative work: Assisting human–human collaboration (pp. 222–233). San Mateo, CA: Morgan Kaufman Publishers.
Clark, H. H., & Wilkes-Gibbs, D. (1986). Referring as a collaborative process. Cognition, 22, 1–39.
Grice, H. P. (1975). Logic and conversation (from the William James lectures, Harvard University, 1967). In P. Cole & J. Morgan (Eds.), Syntax and semantics 3: Speech acts (pp. 41–58). New York, NY: Academic Press.
Keysar, B., Barr, D. J., Balin, J. A., & Paek, T. S. (1998). Definite reference and mutual knowledge: Process models of common ground in comprehension. Journal of Memory and Language, 39, 1–20.
Lewis, David. 1969. Convention: a philosophical study. Cambridge, MA: Harvard University Press.
Pickering, M. J., & Garrod, S. (2004). Toward a mechanistic psychology of dialogue. Behavioral and Brain Sciences, 27, 167–226.
Schoot, L., Heyselaar, E., Hagoort, P., & Segaert, K. (2016). Does Syntactic Alignment Effectively Influence How Speakers Are Perceived by Their Conversation Partner?, 1–22.
🔥 Have you applied for NYI yet?! Space is limited! Our application deadline is soon approaching, so make sure you get your applications in by January 10! You can visit www.nyispb.org to start your application, or follow this link directly to our application form: https://forms.gle/W2PMYVsLyufmMYL29
V-NYI #6 takes place January 16-27. You won’t want to miss what we have in store! Fill out your application today, and we’ll see you soon in the virtual sky!
Всем привет! Как и обещала, рассказываю, что делаю на работе по специальности voice user interface architect:)
*научилась создавать Regexes (regular expressions) для определенной задачи. Я должна предвосхищать, как пользователь может сформулировать определенный запрос и запрограммировать его с помощью Regex. Сама умею записать intent и максимально возможные примеры пэттернов. Загружаю всё это сама в виде merge request на git. Этому пришлось научиться сразу.
*провожу user research. Этот вид исследований разительно отличается от Academic Research, хотя тоже есть тестирование гипотез и выводы. Посмотрела кучу видео на ютюбе и со мной работал тренер из нашей фирмы, в итоге первое моё исследование сразу вышло не комом:)
*создаю дизайн и документацию к нему. Как дизайнер я должна уметь структурированно описывать свою идею и план, чтобы разработчики всё понимали и могли работать по моей документации.
Было ещё много задач с дизайном письменных ответов в виде карточек-notification. Для их дизайна сейчас прохожу воркшоп. Сказала своему Team lead, что чувствую неуверенность в этом задании, и он мне подбирает литературу и источники:)
Скажу честно, что первые три месяца прошли достаточно стрессово, но после родов мне кажется, что я всё могу😅
Есть ли вариативность и акценты в языках жестов? https://www.degruyter.com/document/doi/10.1515/applirev-2020-0144/html
Читать полностью…Итак, первым делом, чтобы попрактиковаться в voice user interface design, советую зарегистрироваться на этом сайте и проходить каждый день vui challenge! Создатель сайта и инициативы – очень классный дизайнер:) https://vuichallenge.com/
Читать полностью…https://developer.amazon.com/en-US/alexa/alexa-skills-kit/new/get-connected/developer-podcast
Читать полностью…Я раньше всем отказывала в рекламе канала, руководствуясь тем, что у меня только контент, который мне нравится и за который я отвечаю! Многие мне по несколько раз писали, и я не отвечала😣😖🥺
Сейчас я пересмотрела свою точку зрения на вопрос рекламы других, часто, маленьких новых каналов. Вдруг, кому-то из моих подписчиков тема какого-то канала очень заинтересует! Я предлагаю делать так: я пишу какую тему-пост, а вы в комментарии рассказываете о своих каналах, и я упоминаю ваши каналы тоже, если будет в тему и к слову! Многие сейчас начинают продвигаться через телеграмм, и я просто хочу помочь. Сэкономленные деньги за оплату рекламы вы можете перевести на счёт организации благотворительной, которой доверяете! Я поняла, что телеграмм с комментариями может стать отличным местом для собрания комьюнити и мнения по определенным вопросам. Например, в предыдущей теме откликнулась специалист/ка в области voice user interface design! Если у кого-то будут каналы по темам схожим с какими-то моими постами, рекламируйте себя в комментариях. Так вы можете найти клиентов, единомышленников, конкурентов, коллег. Как вам идея?
Конечно, такая политика канала предполагает, что я регулярно что-то посчу. С этим у меня проблемы, но посмотрим, как пойдёт:) Попробуем уже на этой неделе!
Мы давно не виделись с вами всеми на этом канале. Я в данный момент нахожусь в декретном отпуске ещё до октября 2022, в декрете пытаюсь дописать PhD диссертацию. Территориально я в Германии! Диссертацию писать очень хочется, но главным фокусом остаётся мой сын Леопольд:)
Читать полностью…Когда маленькие дети начнают учить язык, они сначала вырабатывают то, что по-английски называется proto-lexicon, эдаким «дословарём». Они не понимают смысл (семантику) лексических единиц, но могут разделять поток речи на слова, и отличают слова этого языка от слов других языков.
Взрослые же обычно начинают учить язык «с нуля», когда им дают слова сразу с переводом.
В Новой Зеландии ситуация несколько иная: большинство населения там англоязычны, они не говорят на маори и не понимают его, но при этом постоянно слышат слова и фразы на маори в школе, во время разнообразных мероприятий и в других ситуациях; около половины топонимов — маорийские. В конце 2020 года в Nature было опубликовано первое в своём роде исследование, подтвердившее, что у не говорящих на маори новозеланд_ок формируется «дословарь». Они могут отличать настоящие маорийские слова от выдуманных не хуже носитель_ниц! При этом контрольная группа с людьми из США делала это намного хуже.
На иллюстрации видно, что оценки носитель_ниц (чёрная линия) почти полностью совпадают с оценками не говорящих на маори новозеланд_ок (красная линия) и совсем не совпадают с оценками не говорящих на маори американ_ок (жёлтая): https://i.imgur.com/WJfNRmn.png
Исследовательская группа заключила, что в среднем у не говорящих на маори новозеланд_ок в памяти уже было как минимум 1500 слов. Предварительное погружение в язык помогает его изучению, поэтому если собираетесь заняться каким-то языком, но пока на это нет сил или времени, слушайте на нём радио или смотрите кино с субтитрами; позже вы сможете активировать этот кусок памяти и обучение пойдёт веселее.
Также важность этого исследования в том, что оно показывает, что взрослые могут учить язык «детскими» методами, начав с погружения. Каким-то невероятным образом это до них никогда не исследовали.
Литература
* https://www.nature.com/articles/s41598-020-78810-4
Всем привет, давно меня не было тут слышно:) Я создала Инстаграм аккаунт, где я сузила тему контента до изучения языков и билингвизма/мультилингвизма. Вчера выложила интересное видео на необычный исход усвоения языков ребёнка в ситуации мультилингвизма! Заходите в гости в инстаграм super.multi.language :) https://www.instagram.com/tv/CD1qW8uicWJ/?igshid=hf83ftbd0edr
Читать полностью…Ребята, вчера у меня был день рождения, и так как Германия на карантине, я в Инстаграм проводила live вечеринку про про изучение языков, про то, как дети учатся говорить и так далее:) Мой Инстаграм superannk! На вечеринку я сразу всех не звала, потому что стеснялась делать live, но получилось довольно интересно! Всё висит в моих сторис, заходите!
Читать полностью…Отлично написано про самые новые методы того, как научить систему «понимать» значение слов!
Читать полностью…Ребята, ну понятно, что блогер я не очень, но это ведь не главное! Как только у меня на учебе и работе сверх-активная деятельность, на канал я никак не могу найти время написать! Потом мне кто-нибудь из подписчиков или подписчиц напишет, что вот канал такой хороший, и я сразу чувствую себя такой нужной обществу! Я решила исправляться, и в сентябре нас с вами ждёт встреча по созданию Alexa Skill для ответов на вопросы по грамматике немецкого языка, двухнедельная школа по Natural language processing на факультете компьютерной лингвистики в Уни Штутгарт, конференция Dialog Expectations в Берлине и подготовка моего первого (надеюсь, не последнего) семинара в Уни Мюнстер на тему «Психолингвистические и прагматические аспекты диалога». На русском звучит коряво... как и на немецком, в принципе! Я очень рада, что буду преподавать, но до сих пор неожиданно, что на немецком. Уже приснился сон, как я захожу в аудиторию в своих новых туфлях, которые для преподавания купила, и вдруг забыла все немецкие слова:( Ещё в сентябре дедлайн подачи заявки на грант немецкого министерства образования, куда тоже мы с научными руководителями посылаем заявку на финансирование проекта. Совершенно не знаю, как это всё успеть! Ещё перед школой nlp хотела успеть дочитать учебник один и доделать один курс онлайн, чтобы не совсем сильно отставать, но видимо уже буду ориентироваться по обстановке! В середине школы нас ждёт поездка на винные виноградники, прогулка и обед! Уже скорее хочу вот эту прогулку и обед! Я желаю всем вам, мои подписчики, очень хорошего настроения, вдохновения и радости:) АняК
Читать полностью…Аттенш!
Друзья, я вам не сказал, а вы и не заметили, что посты на канале стали реже. Всё из-за диплома. Но у меня есть приятная новость для аудиалов и не только.
Мы связались с Аней с канала Супер Прикладная Лингвистика и решили сделать коллабу. Эта мысль переткела в идею записи подкаста-лекции. И вот спустя какое-то время, мы готовы отдать его вам на прослушивание.
Тема подкаста: процесс сближения людей во время общения. Спикер — Аня. Она в научно-популярной форме расскажет о том, как происходит взаимопонимание между людьми, как мы создаём условия общения с каждым человеком, а также поведает об интересных исследованиях.
Аня — закончила Боннский университет в Германии. Сейчас проживает в Мюнстере, работает в Мюнстерсском университете и пишет диссертацию в рамках программы "эмпирическая и прикладная лингвистика". На своём канале она делится научными знаниями и исследованиями в мире лингвистики. Нечастые, но полезные информативные посты — вот что отличает канал Ани. Если вам нужны источники, использованные в подкасте, их вы найдёте у Ани.
Где слушать подкаст?
Soundcloud — https://soundcloud.com/user-885341914/protsess-sblizheniya-lyudey-vo-vremya-obshcheniya
Anchor — https://anchor.fm/--457/episodes/ep-e436eu/podcast-afm6v2
Ещё мы загрузили в itunes, но работники эпла видимо ещё не отошли от майских праздников. Так что, возможно, в будующем запись появится на айфонах.
Приятного прослушивания! Ждём ваших отзывов :)