PDA

Просмотр полной версии : Проект "Один речевой день"


Sladkaya_N
09.02.2011, 21:04
ОСТОРОЖНО! БУКВ РЕАЛЬНО МНОГО!!))
Но мне очень понравилось и заинтересовало. Прочитайте, даже если не интересуетесь лингвистикой - будет интересно.)

***
Наша устная речь имеет мало общего с классической русской грамматикой — к такому выводу пришли питерские ученые. Вот уже три года они вешают на шею добровольцам диктофоны и записывают их речь так, как она звучит на самом деле. Проект «Один речевой день» — первая попытка серьезного изучения реального русского языка, на котором не написано ни одной книжки, но на котором мы все говорим.

Во внутреннем дворике филфака Санкт-Петербургского университета на крылечке лежит небольшой бегемот. Табличка гласит, что, если девушка потрет его правое ухо, в ее личной жизни все сложится хорошо. Левое ухо — для молодых людей. Одно бронзовое ухо бегемота натерто до блеска. На бегу не успеваю заметить какое.
Кроме бегемота во дворике стоят Иосиф Бродский и Лев Щерба. Первый — поэт и нобелевский лауреат, второй — лингвист, автор знаменитой глокой куздры, которая штеко будланула бокра. Оба бронзовые. Мы с Анастасией Рыко, еще не бронзовые, стоим рядом с Щербой. Я верчу в руках диктофон.
— Эта машинка вам хорошо известна, — заигрываю я с кандидатом филологических наук, чей предмет исследований составляет устная русская речь.
— О да! — кивает она.
Если бы у научных проектов были свои символы, то у проекта «Один речевой день», запущенного три года назад в стенах питерского универа, им стал бы диктофон.
Диктофон на шею
Технология кажется простой. На шею добровольцам — по-научному информантам — вешают диктофон, который записывает всю речевую продукцию, производимую человеком и его собеседниками за сутки. Проснулся — что-то буркнул жене, поехал на работу — поздоровался, обсудил с коллегами сплетни — машинка фиксирует все.
Чтобы все было по-честному, речь должна быть максимально естественной. Главное — пресечь все попытки участников эксперимента как-то подыграть ученым. Для этого соблюдалась технология, похожая на ту, что применяют при тестировании новых лекарств. Во-первых, полная анонимность, когда сами исследователи не знают, как зовут информантов. Во-вторых, диктофон и инструкции передает только тот ученый, который не участвует в исследовании и гарантирует, что сам не будет работать с полученными записями.
На сегодня записано 40 информантов — несколько сотен часов устной речи. Пока расшифровано только 40 часов, по часу от каждого. Уж больно трудоемкий процесс. На расшифровку и разнообразную разметку одной минуты записи у эксперта уходит примерно час работы. Анализируется все сверху донизу: звучание, грамматика, лексика, строение фразы.
С русского на папуасский
Ничего подобного отечественная лингвистика за несколько столетий своего существования не знала. До сих пор всевозможные нормативные описания языка строились на основе письменных текстов, а звуковой стороной языка занималась исключительно фонетика. Возникает законный вопрос: зачем вообще исследовать устную бытовую речь?
Представим такую ситуацию. Вы прилетели к инопланетянам, говорящим, естественно, по-инопланетянски. Что делать? Фантасты хором предлагают нажать кнопочку на скафандре — и пожалуйста, полное взаимопонимание достигнуто. На месте инопланетян, разумеется, могут быть и французы, и англичане, и носители языка суахили. Для письменной речи такая кнопочка уже существует: электронные переводчики встроены и в Google,и в Яндекс. А вот с живой устной речью пока никакая машина справиться не может.
Конечно, и фантастика может стать реальностью, но с одним условием: для начала надо разобраться, что такое устная речь и чем она отличается от письменной.
— После того как Кирилл и Мефодий тысячу лет тому назад создали славянскую азбуку, язык очень сильно изменился, — говорит автор и главный идеолог проекта, доктор филологических наук Александр Асиновский. — Изменилась его фонетическая природа. Мы сохраняем традиции письменности, но говорим как в известной английской поговорке: «Пишем “Манчестер” — читаем “Ливерпуль”».
— Вы хотите сказать, что речевая практика строится по иным грамматическим схемам, чем речь письменная?
— Я осмелюсь предположить, что по другим. Мы еще в самом начале пути. Еще год назад я вообще не знал, какой у современного человека словарный запас. Не тот, который в словарях записан, а тот, которым мы реально пользуемся.
Слово «реально» — повседневный кошмар питерских лингвистов. То, с чем им приходится иметь дело в проекте «Один речевой день», обнаруживает чудовищную истину: мы говорим не по тем законам, которые описаны в классических учебниках.
Вот кусочек расшифровки: «здрасть / отдел кадров уже закрыт? ага / сёння же пятница / они... они-и... до полтретьего / а то и... до двух // они же почти без обеда работают // я грю / кадры почти без обеда работают / поэтому щас они закрыты / пятница же… ну... хошь ночуй / хошь уезжай». Можете ли вы с точностью сказать, что понимаете, о чем здесь речь? Зато какой материал для словаря редуцированных форм русской речи! Все эти «здрасть», «сёння» и «грю» так выразительны, как будто их произносят с театральных подмостков. Но это совсем не театр, это наша жизнь.
О том, что устная речь отличается от письменной, догадывались уже давно. Тот самый академик Щерба, рядом с которым мы сейчас стоим, еще в начале XXвека утверждал: если мы начнем изучать устную русскую речь, мы получим другой язык.
— В этом подходе есть правда, — соглашается Асиновский, — приходится отказываться буквально от всего, чему тебя учили. Филология вообще достаточно традиционная наука. Но наша эмпирика постоянно выбивает почву из-под ног. У нас работают люди, которым интересно добывать новые знания, а не пр******* в ситуации защищенного цехового профессионализма.
Анастасия Рыко как раз из тех, кто не боится нового знания.
— Понимаете, результаты расшифровок напоминают хаос. Практически все традиционные единицы, с которыми мы, лингвисты, привыкли иметь дело, совершенно не работают: ни фонемы, ни морфемы, ни предложения. Ничего этого нет! Мы приходим к полной деструкции всех известных моделей, в рамках которых вообще можно что-то описывать. Наша задача — попытаться создать некоторую новую модель.
Лев Щерба строго косится на Анастасию, но та полна энтузиазма.
— Мы пытаемся описать звучащую речь как неизвестный нам язык. Вот допустим, мы приехали к папуасам, они говорят на каком-то языке, и мы слышим некий звуковой поток. Собственно говоря, это опыт полевой лингвистики. Мы изучаем звуковой поток.
Окончание, где ты?
Звуковой поток похож на Ниагарский водопад. Современные технические средства вроде голландской программы Praatпозволяют звук не только услышать, но и увидеть. Лохматая дорожка на экране — осциллограмма того, как мы говорим. С ее помощью можно, например, посчитать длительность и отследить качество произносимого звука. На слух это уловить почти невозможно. Если, конечно, вы слушаете не Юрия Левитана, говорящего в микрофон свое знаменитое «ОТ СОВЕТСКОГО ИНФОРМБЮРО». Но попробуйте сказать быстро фразу: «Молоко сегодня вкусное». А теперь попытайтесь определить, что вы произнесли вместо орфографических «о» и «е»? Да черта с два! А с программой — пожалуйста.
— Вообще-то эталонным для любого языка считается так называемый полный тип произнесения, — объясняет профессор Асиновский. — ВОТ КОГДА Я С ВАМИ СЕЙЧАС ГОВОРЮ — медленно, с паузами, четко артикулируя все слова, — это и есть полный тип. В нем можно легко найти любую фонему, и эта фонема будет соотнесена с определенной частью слова, то есть с той грамматикой, что в учебниках прописана. Но в нашем материале ничего подобного нет вообще.
Наш язык предполагает, что слово кроме корня состоит из целой кучи морфем — разнообразных суффиксов, приставок, окончаний. Слушая Левитана, мы можем точно сказать, из каких морфем состоит и в какой форме употреблено то или иное слово. И падежи, и роды, и числа, и прочее грамматическое богатство в его исполнении отлично слышно.
Однако результаты фонетического анализа доктора Асиновского и его группы обнаруживают, что до Левитана нам, мягко говоря, далеко. Вместо суффиксов и префиксов в живой устной речи — каша из сильно редуцированных, то есть ослабленных до неузнаваемости звуков, которая только намекает на присутствие здесь некой классической морфемы.
— Вот, к примеру, фраза из спонтанного монолога: «Я запомнил ее на всю оставшуюся жизнь», — с академическим достоинством продолжает Асиновский. — Возьмем из нее кусочек — «всю оставшуюся». Обнаруживается, что конец первого слова сливается с началом второго и вместо идеального сочетания двух гласных «у а» слышен однородный гласный, что-то вроде «ё». Если фрагмент вырезать и дать прослушать, у вас и сомнений никаких не возникнет: это «ё». И гласный на стыке слов довольно короткий. А там ведь и словесное, и фразовое ударение! По классике там должно быть не меньше 200 миллисекунд звучания и, конечно же, неоднородный гласный. Должно быть. Но этого нет, причем нет сплошняком!
Профессор Асиновский уже растерял свою академическую величественность и говорит яростно и страстно. У всех сорока информантов все стыки слов звучат совершенно одинаково. Причем неважно, сколько гласных сталкивается на границах слов: две — так две, четыре — так четыре. Все равно на месте их столкновения будет звучать некий невнятный гласный длительностью примерно 100 миллисекунд. И где тут, позвольте спросить, окончание или суффикс?
Исчезает и различение безударных гласных. Все стянуто в нечто короткое и однородное. Например, осциллограмма четко показывает, что различий между окончаниями в словах «рыжий» и «каждую» в естественной речи просто нет. О грамматических формах того и другого мы просто догадываемся.
Редукции, то есть ослаблению, подвергаются не только гласные. Согласный звук «j» (что-то вроде «й») в окончаниях прилагательных типа «синий», «синяя», похоже, и вовсе безвозвратно исчез. Та же участь постигла и предлоги, и сложные составные суффиксы. Во фрагментах типа «который у них» нет ни окончания «ый», ни предлога «у». А в слове «обворовывал» на месте сложной комбинации суффиксов «ов», «ыв» и «а» слышится невнятное «ав» непонятного происхождения.
Китайский акцент
Число грамматических форм, используемых в устной речи, сведено к довольно смешному минимуму. Наиболее употребителен именительный падеж. Присутствуют еще родительный и винительный. К примеру, по статистике на тридцать употреблений «человек» приходится только одно «человеком». А формы множественного числа творительного падежа вообще услышишь в редчайших случаях.
Из глагольных форм чаще всего встречается прошедшее время типа «говорил» и «говорила». А уж всякие там причастия, деепричастия, сложные будущие времена и прочая великая грамматика используются гомеопатически мало.
— Понимаете, что получается?! — со страстью восклицает Асиновский. — Когда мы пытаемся найти в естественной речи флексии, мы ищем то, чего нет. Для того чтобы понять, какие там фонемы, нам сначала нужно понять, что сказано. Понимаете? Сначала понять, а потом найти фонемы. Тогда у нас и части слова появятся, и звуки правильные. Но они появятся потом. А сначала нужно понять. О чем это говорит? — риторически вопрошает он.
Я что-то мычу в ответ. Асиновский машет рукой и чеканным голосом первооткрывателя отвечает сам:
— Это говорит о том, что в естественной русской речи грамматические значения с помощью окончаний и суффиксов больше не реализуются! Ну реально нет этих самых флексий, они в природе не встречаются. Их невозможно услышать, их невозможно вычленить.
Нелингвисту понять всю глобальность этого умозаключения довольно трудно. Но если Асиновский прав, нам грозит что-то вроде грамматической революции. Русский относится к синтетическим языкам, где значение и грамматическая форма выражены в пределах одного слова. Однако, изучая письменную речь последних десятилетий, специалисты всерьез опасались, что русский движется в сторону аналитизма, то есть стремится разделить грамматическое и лексическое значения.
Работы Асиновского и его коллег приводят к совсем другому выводу: русский язык в его устной форме постепенно становится изолирующим, то есть сокращает смысл слова до одного корня. Самый изученный изолирующий язык — китайский. Там все смыслы выражаются ничем не отягощенными корнями. Например, если я представлюсь незнакомому человеку, правильная синтетическая русская фраза может звучать примерно так: «Меня зовут Ольга, я работаю в “Русском репортере”». Если бы оказались правы «аналитики», мне бы пришлось представляться примерно так: «Мое имя есть Ольга, я являюсь сотрудником редакции журнала “Русский репортер”». Но в реальной жизни я говорю так же, как и все журналисты в России: «Ольга. “Русский репортер”». Именно так и говорят китайцы.
Самые частые слова
(...)
— Понимаете, — начинает объяснять Татьяна, — есть слова, которые, как нам кажется, мы постоянно используем. А на самом деле мы их вообще не употребляем. А вместо них говорим «вот», «блин» или что-то подобное.
Частотный словарь естественного русского языка при современной технике делается довольно просто: из расшифрованных текстов выбираются все слова и ранжируются по частоте повторов.
— Самое часто встречающееся слово — «я», — рассказывает Татьяна и добавляет: — Что неудивительно.
В самом деле, когда англичане лет двадцать назад запустили у себя аналогичный проект, у них тоже на первом месте оказалось «I». И это единственное, что нас с ними роднит.
— Угадайте, какое слово по частоте у нас на втором месте? — хитро спрашивает Анастасия.
Я подозреваю подвох и говорю первое, что приходит в голову:
— Допустим, «вот».
— Не-е, — смеются девушки.
— А какое?
— «Не-е»!
Не, вы поймите лингвистов правильно! Мы, русскоговорящие папуасы, вовсе не склонны к тотальному отрицанию всего и вся. Не, честное слово, не склонны! Просто для нас, как выяснилось, «не» — это вполне традиционное начало фразы. Если вам нужно, чтобы вас услышали, безотносительное «не» вырвется у вас рефлекторно. Даже если вы хотите сказать, что ваш собеседник прав. Не, реально, так поддерживается диалог по-русски.
В английской естественной речи все оказалось вполне ожидаемым. На первом месте сакраментальное «I», на втором не менее сакраментальное «you», на третьем «is». Англичане — люди простые и говорят именно то, что хотят сказать. Нет — так нет, да — так да.
По-русски все сложнее. Больше половины слов, используемых в естественной речи, не значит вообще ничего. В мировой лингвистике существует термин «дискурсивная лексика», или пустая форма. Это что-то вроде «э», заполняющего речевую паузу, или того же «вот» — слова, позволяющие установить контакт с собеседником. Но это вовсе не слова-паразиты, с которыми традиционно борются блюстители чистоты русской речи. Именно с их помощью, то есть дополняя слово мимикой, интонацией и жестом, мы передаем смысл. Понимаете? Мы передаем смысл словами, лишенными смысла!
Смотрим статистику. Первый полноценный глагол в частотном словнике — «знаю» — стоит на 40-м месте. Ни одного полноценного существительного в списке 150 самых употребительных слов не обнаружилось. Зато есть «блин» (85-е место), «типа» (118-е место) и, наконец, сакраментальное «бл…ь» — на 116-м месте.
— Вот пример, который я очень люблю, — говорит Татьяна. — Это расшифровка речи фотографа, очень образованного человека. Здесь у нас момент, когда он разговаривает с клиентом. Вот посмотрите: на 48 слов только 10 имеют смысл.
Татьяна открывает соответствующий файл. Так вот, оказывается, как мы говорим:
«А вот (э-э) на... н... вот наше вот это вот (э-э) вот это вот / вот тут / тут сложнее гораздо / да // потому что / значит / я вот вот (э-э) вот эти / ну в принципе / значит / ну / п... по моим / понятиям значит / я же не отличу так скажем / таджика от узбека что называется / да да да // да?»
— Позвольте, — я пытаюсь сделать хоть какие-то выводы из всего услышанного, — может быть, все это личные стилистические особенности данного говорящего? Но тогда все еще хуже. Для каждого придется придумывать свою собственную грамматику, фонетику и прочее?
— Вовсе нет! — в один голос отвечают Татьяна и Анастасия. — Понимаете, мы в огромной степени говорим шаблонами. Именно шаблоны покрывают очень большой процент речи. Как раз индивидуального мы встречаем очень мало…(...)
Мы не придумываем язык, мы его берем от родителей, из телевизора, от приятелей. Где-то услышали, нам понравилось, мы повторили. А потом уже начинаем как-то синтезировать, варьировать. Для человека язык — это цитата.
http://www.rusrep.ru/article/2010/09/29/lingvistika/ - вот дальше, но там уж совсем умно.))

cherrybumbum
09.02.2011, 21:09
шикарная статья. интересно и доступно написана. :-)

Sladkaya_N
09.02.2011, 21:40
Вот, кстати, 15 самых употребляемых слов, очень забавно)):
1. Я
2. Не
3. Вот
4. Ну
5. Да
6. А
7. И
8. Что
9. В
10. Это
11. Там
12. У
13. Так
14. На
15. Ты