Мови виявилися схожими на швидкість передачі інформації

Французькі лінгвісти проаналізували промову носіїв 17 різних мов і з'ясували, що їх можна об'єднати швидкістю передачі інформації. Для цього вчені розрахували швидкість мовлення 170 носіїв та інформаційну щільність одного слогу кожної з їхніх мов і з'ясували, що для всіх них характерна швидкість передачі інформації в 39,15 біта в секунду. Ймовірно, цей показник може претендувати на роль універсального параметра, характерного для всіх природних мов, пишуть вчені в.


За всю історію існування людства з'явилося безліч (за різними підрахунками від чотирьох до семи тисяч) різних мов. Відстежити їх появу найчастіше вдається тільки до якоїсь спільної мови-предка або праязика: скажімо, для індоєвропейських мов прийнятою прамовою вважається праіндоєвропейська. За предком, можна зрозуміти, чому і чим мови з однієї мовної родини схожі.


При цьому, зрозуміло, має існувати і те, що об'єднує всі мови незалежно від їхніх сімей - якась універсальність, притаманна їм усім. Мова насамперед - це засіб комунікації, тому сліди мовної універсальності необхідно в першу чергу шукати в живій людській промові. Минулого року вченим, наприклад, вдалося виявити, що уповільнення артикуляції перед існуючими характерно для носіїв дев'яти природних мов з різних сімей.

Лінгвісти під керівництвом Франсуа Пеллегріно (Fran^ ois Pellegrino) з Ліонського університету вирішили підрахувати швидкість передачі інформації для однієї одиниці в промові 17 мов представників австроазіатських, індоєвропейських, сине-тибетських, тюркських, уральських, і тай-кадайських сімей, а також баскського, японського і корейського. Як мовну одиницю для аналізу вчені вибрали складо. Вибрані для аналізу мови суттєво відрізняються кількістю можливих для них складів: скажімо, в англійській мові складів близько семи тисяч, тоді як в японській - всього лише кілька сотень. При цьому і японська, і англійська дозволяють своїм носіям однаково ефективно передавати інформацію один одному. Цікаво, тому, подивитися, як розрізняється інформаційна щільність кожного слогу і те, як від неї залежить швидкість передачі інформації.

Для цього вчені попросили 170 носіїв 17 використаних мов прочитати 15 коротких семантично пов'язаних текстів: тексти необхідно було прочитати кілька разів, щоб у підсумковій версії учасники не збивалися і читали текст чітко. Записи зачитаних текстів розділили на окремі склади: слід уточнити, що враховувалися тільки канонічні для певного слова склади поза діалектними варіантами.

Далі вчені розрахували два параметри: швидкість мови (кількість складів, вимовлених на секунду) та інформаційну щільність (скільки інформації в бітах несе один слог у мові). Останній параметр розрахували за письмовим корпусом кожної мови: від відображає, скільки біт інформації переносить кожен окремий слог (якщо просто - скільки семантичної інформації несе один шар мови на основі однакових за змістом текстів з різних мов).

Незважаючи на те, що мови відрізнялися як за інформаційною щільністю, так і за швидкістю мови, вчені помітили закономірність: менш «щільні» мови відрізняються швидкою мовою, в той час як мови з більшою інформаційною щільністю - мовою повільніше. Наприклад, у в'єтнамській - мові з щільністю 8 біт на слог - швидкість мови становила близько 5 складів на секунду, тоді як у фінському інформаційна щільність була близько 5,5 біта на складі, а швидкість мови - трохи більше 7 складів на секунду. З урахуванням наявності такої лінійної залежності автори розрахували, що в середньому у всіх вивчених мовах швидкість передачі інформації (інформаційна щільність помножена на швидкість мови) становить близько 39,5 біта в секунду.

Незважаючи на те, що до вибірки вчених потрапили мови з різних сімей, говорити про універсальність цього параметра поки що рано (хоча на неї звернули увагу в редакційній замітці). Цікаво, однак, те, що автори виявили зворотну залежність між швидкістю мовлення та інформативністю мови: на думку вчених, це відображає взаємодію біологічних та еволюційних особливостей народу і параметрів мови, якою вони розмовляють.


Зрозуміло, це не єдина спроба вчених систематизувати мови у вигляді двійкового коду. Навесні американські психологи підрахували, скільки біт інформації про свою рідну мову до 18 років вивчає носій англійської і з'ясували, що всю цю інформацію можна розмістити на звичайній дискеті обсягом в 1,5 мегабайта.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND