Сколько различных областей прикладной лингвистики, столько и источников естественных данных (naturally occurring data) для проведения собственных исследований. Логично, что если нам нужно ответить на научный вопрос из области межкультурной коммуникации, например, как различается уровень вежливости в онлайн переписке преподавателей со студентами в России и в США, нам достаточно получить разрешение на использование личных данных у выбранных нами участников исследования в России и США, и затем проанализировать тексты электронных писем. Более того, для ответа на многие научные вопросы, можно использовать данные из онлайн блогов и социальных сетей, где и официальное разрешение авторов текстов не нужно. Например, если раньше анализу подвергались инаугурационные речи президентов США, то сейчас еще и твиттеры кандидатов на пост Премьер Министра Великобритании стали интересным источником данных.
С письменными данными всё довольно понятно, но что делать, если мне захотелось исследовать, случаи смешения кодов (спонтанное переключение говорящего с одного языка на другой) в многонациональных семьях? Согласитесь, довольно тяжело быть 24 часа в сутки в семье участников исследования и ждать, что кто-то из взрослых или детей внезапно переключится с одного языка на другой? Что если за весь день, проведенный с испытуемыми, вы соберете всего 3 случая смешения кодов? Где гарантия, что в положенные сроки вы соберете достаточно данных для анализа? Хорошим планом в таком случае будет пригласить участников на интервью, где в ходе беседы вы сможете выяснить, когда чаще всего случается переключение языков и в дальнейшем сфокусироваться на этих конкретных случаях. Так, например, существует милое исследование про угрозы родителей aдрессованные детям во время приёма пищи (Hepburn & Potter 2011), например, «Если ты сейчас не съешь кашу, не пойдем в зоопарк». Согласитесь, что если знать, что за столом родители часто «угрожают» детям, нам не надо весь деть ждать угроз, а мы просто можем попросить семью записывать на диктофон их совместные трапезы.
Замечательно, когда данные для исследования можно собрать не выходя из дома, и конечно, хорошо, если благодаря интервью или другим видам опросов можно выяснить, когда можно ожидать появление интересующего вас явления в языке. Но что делать, если вы решили изучать грамматику одного из редких языков, например, язык леко? Около 20 человек в Южной Боливии единственные носители этого языка, все они старше 60 лет, так что не стоит возлагать большие надежды на твиттеры или блоги написанные на языке леко! Выхода нет, придется пробыть пару тройку месяцев среди носителей языка леко, наблюдать за речью пожилых участников исследования и делать заметки относительно структуры редкого языка.
Такой метод сбора данных называется «полевые работы» (англ. field research), и именно полевой лингвистикой пришлось заняться лингвисту из фильма «Прибытие». Перед девушкой стояла задача понять цель визита пришельцев. Естесственно, для этого ей нужно было войти в контакт с внеземными существами. Но как? Если мы примерно понимаем, что язык леко, хоть и исчезающий, но он создан людьми, и его структура предсказуема, то где гарантия того, что у пришельцев вообще есть система языка? Одним словом, героиня фильма ФАНТАСТИЧЕСКИ справилась с расшифровкой языка пришельцев. Молодец! Я бы вообще побоялась туда идти. Более того, я бы и в Южную Боливию вряд ли поехала! К счастью, в прикладной лингвистике есть еще и другие методы сбора данных, и если данных еще нет в естественной среде (англ. naturally occurring data), то их можно попробовать создать.
Использованная литература:
Hepburn, A., & Potter, J. (2011). Threats: Power, family mealtimes, and social influence. British Journal of Social Psychology, 50(1), 99-120.
http://www.ru.nl/lenguasdebolivia/languages/languages/
Примечание: опубликованных исследований о твиттерах кандидатов на пост ПМ Великобритании не нашла, пишу со слов преподавателя Лидского университета (University of Leeds) Доктора Элисон Джонсон (Doctor Alison Johnson). Она вела у нас несколько лекций о лингвистической экспертизе в июне 2016, и мы проводили небольшой анализ твитов из базы данных, которую они готовили (UK General Election Corpus).