Quantifying the evolutionary dynamics… of language

В останньому випуску Nature поряд з урочистими статями присвяченим свіжим нобелівським лауреатам, освітленням проблем біопалива, європейської науки та молекулярним першопричинам раку, раптом знайшлась стаття про еволюцію. Правда на цей раз про еволюцію мови. Щоб сказати точніше, про еволюцію дієслів в англійській мові. Ще Докінз порівнював біологічні еволюційні процеси в генетиці з лінгвістичними еволюційними процесами. Власне ні для кого не секрет, що мова еволюціонує, але мені видалось цікаво, що там також існують певні

Відомо, що людська мова базується на граматичних правилах. Культурна еволюція сприяє постійній зміні цих правил: одні стають більш вживаними, інші просто відмирають. Для обчислення динаміки мовної еволюції вчені Гарвардського університету, до речі спеціалісти еволюційної та системної біології, використовуючи свій природничо-статистичний підхід, проаналізували процес утворення в англійській мові правильних дієслів з неправильних на протязі останніх 1200 років. В подальшому для скорочення будем називати перетворення неправильних дієслів у правильні «регуляризацією» (від regularization).

Нагадаю, в сучасній англійські мові правильні дієслова утворюють форму минулого часу додаванням суфіксу ‘-ed’ до кореня. Наприклад infinitive/simple past/past participle: talk/talked/talked. Неправильні дієслова відповідають або антикварним правилам (sing/sang/sung), або, в деяких випадках, взагалі жодному правилу (go/went). Нові дієслова, які входять в англійську мову, як правило одразу «регуляризуються» (google/googled/googled). Набагато рідше зустрічаються випадки, коли правильне дієслово стає неправильним. Тільки 3% сучасних дієслів є неправильними, причому серед них 10 найбільш вживаних (be, have, do, go, say, can, will, see, take, get). Лінгвісти розробили еволюційну гіпотезу частоти неправильних дієслів: рідкі неправильні дієслова мають тенденцію до зникання більш швидше, тому що вони повільніше вивчаються і швидше забуваються.

Для аналізу взяли 177 старо-англійських неправильних дієслів, з яких вже в середньо-англійські часи залишилось тільки 145 неправильними, а в сучасній англійській лише 98. Частоту вживання слова виражали в одиницях пероду напіврозпаду. (О, будь-ласка, перша лінгвістична перешкода! «Період напіврозпаду» якось коряво розуміється у порівнянні з «half-life»). Як би там не було, період напіврозпаду це ніщо інше як квадратний корінь з частоти вживання дієслова. Висновок виражається у прекрасних круглих числах: дієслово, яке вживається в 100 раз рідше, «регуляризується» в 10 разів швидше. Червоним у таблиці позначено слова, які починали своє існування неправильними, а з часом стали правильними. Видно, що це чітко корелює з вживанністю.

Теорія працює тільки тоді, коли її можна екстраполювати. Якщо розрахунки правильні, то вже до 2500 року в англійській мові залишиться тільки 83 неправильних дієслова. Ну і як ви думаєте? Який наступний кандидат на регуляризацію? It is likely to be wed/wed/wed. Частота вживання ‘wed’ тільки 4.2 використання на мільйон дієслів, що опускає його на останню щаблину списку сучасних неправильних дієслів. І дійсно, все частіше в деяких випадках це слово вживається як wed/wedded/wedded. Так що зараз у вас ще є останній шанс бути ‘newly wed’. The married couples of the future can only hope for ‘wedded’ bliss.

Реклама

27 Responses to Quantifying the evolutionary dynamics… of language

  1. я так розумію, це щось лічноє, да?

  2. так. для мене неправильні дієслова це просто каторга якась. Тепер я перестану їх вживати і зроблю праивльними!

  3. креацонізм, де я кріейтор!
    а ти знаєш, що найбільш частотні слова – найбільш дрєвні, найкоротші, і першими десятьма з них є прєдлогі, а перший іменник десь на 20-му місці ?! Ех, нічого ти не знаєш. І ничим не цікавишся.

  4. дозвольте і мені приєднатись до вашого загону поборників неправильних слів!

  5. я ці слова ненавиджу ше з ранньої молодості. тому готовий боротись з ними будь-де та будь-коли!

  6. Дуже цікаво. Вже бачив зранку цю новину на бібісі, але полінувався читати.
    Я не зовсім зрозумів. Остання колонка по суті повторює першу? І в таблиці нема часу, коли слова регуляризувалися, так? Залежність тільки між частотою вживання (в групі) і процентом регуляризації цієї групи. А звідки час?

  7. Остання колонка по суті повторює першу? «..період напіврозпаду це ніщо інше як квадратний корінь з частоти вживання дієслова»

  8. (вздихає) решті красівих графіків drawed в ориджінал пейпа

  9. а, це журнал ще не вийшов?

  10. Цікаво, які параметри взяти в українській мові.

  11. (підказує) там в тексті лінк «Стаття про еволюцію». але у тебе нема підписки (ще раз підказує)

  12. ну ось. є над чим поразмисліть? давай! ми вже чекаємо на відкриття еволюційних процесів в українській мові.

  13. кльово. до речі, це перший пост українською тут. спричинено чимось конкретним?

  14. да, я пам’ятаю, як ти fighted з ним.

  15. Хм. А мене просто заставила наша авторитарна вчителька з англійської її вивчити, і ця проблема відпала сама собою.
    Порівняння розвитку мови і еволюції генів свого часу зробив Станіслав Лем. Мені цу здалось дуже логічним. Він казав шось в Сумі Технологій, шо генотип, — це message надісланий ніким в нікуди :).

  16. а можна, будь-ласка, точну назву статті і автора?

  17. а можна, будь-ласка, точну назву статті і автора?

  18. Erez Lieberman, Jean-Baptiste Michel, Joe Jackson, Tina Tang & Martin A. Nowak Quantifying the evolutionary dynamics of language Nature 449, 713-716 (11 October 2007)

  19. Erez Lieberman, Jean-Baptiste Michel, Joe Jackson, Tina Tang & Martin A. Nowak Quantifying the evolutionary dynamics of language Nature 449, 713-716 (11 October 2007)

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s

%d такие блоггеры, как: