УМОВИ ВІРОЯТНОСТІ ПОЯВИ - Студопедія
Як ми бачили, поява окремої одиниці (звуку або літери, одиниці виразу, слова тощо) може бути повністю або частково детермінована контекстом. Тепер ми повинні внести ясність у поняття контекстуальної детермінованості (або обумовленості) і вивести ті імплікації, які має для лінгвістичної теорії. Для простоти ми спочатку обмежимо свою увагу розглядом контекстуальної детермінованості, що діє у межах синтагматично пов'язаних одиниць одного рівня мовної структури; Інакше кажучи, ми зараз знехтуємо тим дуже важливим моментом, що комплекси одиниць нижчого рівня реалізують одиниці вищого рівня, які мають контекстуально детерміновані ймовірності.
Ми вживатимемо символихіуяк змінні, кожна з яких позначає окрему одиницю або синтагматично пов'язану групу одиниць; крім того, ми припустимо, щохіусамі перебувають у синтагматичному зв'язку. (Наприклад, на рівні одиниць виразухможе позначати /b/ або /b/ + /i/, ау- /t/ або /i/ + /t/; рівні слівхможе позначати men 'чоловіки' або old 'старі' + men, ау— sing 'співати' або sing + beautifully 'прекрасно'.) Якх, іумають середнюa prioriймовірність появи —рхірувідповідно. Подібним чином поєднаннях+умає середню ймовірність появи, яку ми позначимо якpху.
У граничному випадку статистичної незалежності міжхіуймовірність поєднаннях+удорівнюватиме добутку ймовірностейхіу:рху=рх×ру. Цей фундаментальний принцип теорії ймовірності можна проілюструватиза допомогою простого числового прикладу. Розглянемо числа від 10 до 39 (включно) і позначимо черезхіуцифри 2 і 7 у першій та другій позиції їх десяткового уявлення: поєднанняxтаубуде, таким чином, позначати число 27. У межах ряду чисел (виходячи з припущення, що всі 30 чисел рівноймовірні)рх= 1/3 іpy= 1/10. Якби ми «задумали число між 10 і 39» і попросили когось відгадати задумане число, його шанс вгадати правильно (без допомоги іншої інформації) був би один із тридцяти:рхy= 1/30. Але припустимо, що ми сказали йому, що це число є кратним 3. Ясно, що його шанс правильно відгадати зростає до 1/10. На наш погляд, більш істотно (оскільки ми розглядаємо ймовірність появи одного знака в контексті іншого) те, що вибір одного з двох знаків не є більш статистично незалежним від вибору іншого. Імовірністьу, якщо дано, щох= 2, дорівнює 1/3, оскільки лише три числа кратні 3 у цьому ряду (21, 24, 27); а ймовірністьx, якщо дано, щоу= 7, дорівнює 1, оскільки лише одне число в межах даного ряду закінчується на 7 і кратно 3. Можна позначити ці рівності якpy(x) = 1/3 ірх(у) = 1.Умовна ймовірністьпоявиуу контекстіхдорівнює 1/3, а умовна ймовірністьхпри даномуудорівнює 1. (Два вирази «в контексті» і «при даному » слід розуміти як еквівалентні, обидва уживані в роботах зі статистичної лінгвістики. 4>х у контекстіудорівнює його апріорної, необумовленої, ймовірності), тохє статистично незалежним віду; якщо ж ймовірністьпоявахзбільшується або зменшується з появоюу, тобто якщорх(у) >рхаборх(у) >рх,тох«позитивно» або «негативно» обумовленийу. Крайнім випадком «позитивної» обумовленості є, звичайно, повна надмірність прирх(у) = 1 (упередбачаєх), а крайнім випадком «негативної» обумовленості - «неможливість», тобторх(у) = 0 (увиключаєх). Важливо мати на увазі, що контекстуальна обумовленість може бути і «позитивною» і «негативною» (у тому сенсі, в якому ці терміни тут вживаються), а також що ймовірністьхпри цьомууне завжди, а точніше, лише в окремих випадках, дорівнює ймовірностіупри цьомух.
Необхідною умовою того, щоб результати будь-якого статистичного дослідження становили інтерес для лінгвістики, є розмежування між різними видами обумовленості. Як ми бачили вище, синтагматичні відносини можуть бути лінійними чи нелінійними; тому і обумовленість може бутилінійноюабонелінійною. Якщохіулінійно пов'язані, то за будь-якоїрх(у) ми маємо справу зпрогресивноюобумовленістю у тих випадках, колиупередуєх, і зрегресивноїу тих випадках, колиуслідує зах>. Незалежно від того, чи є обумовленість прогресивної або регресивної,хіуможуть безпосередньо сусідити (перебувати поруч у лінійно упорядкованому синтагматичному комплексі); у разі, якщохзумовленийу, говоримо пропереходной(transitional) обумовленості. Багато популярних описів статистичної структури мови схильнізображати справу так, ніби умовні ймовірності, що діють на всіх рівнях мовної структури, обов'язково передбачають лінійну, перехідну та прогресивну обумовленість. Це, зрозуміло, не так. Наприклад, умовна ймовірність появи певного іменника як суб'єкта чи об'єкта при певному дієслові в латині не залежить від відносного порядку, з яким слова зустрічаються в часовій послідовності (пор. § 2.3.5); вживання префіксів un- та in- в англійській мові (у таких словах, як unchanging 'незмінний' та invariable 'незмінний') регресивно обумовлено; можливість появи певної одиниці виразу на початку слова може бути «позитивно» або «негативно» обумовлена наявністю певної одиниці виразу наприкінці слова (або навпаки) тощо.
Звісно, у принципі можна підрахувати умовну ймовірність будь-якої одиниці щодо будь-якого контексту. Істотно, однак, правильно вибрати контекст і напрямок обумовленості (тобто, скажімо, підраховуватирх(у), а нерy(x)) у світлі того, що вже відомо про загальну синтагматичну структуру мови. (Певний клас одиницьXможе припускати або допускати появу одиниць іншого, синтагматично пов'язаного з ним класуYна певному по відношенню до нього місці (і може також виключати можливість появи одиниць третього класу>Z).За умови, що це так, можна підрахувати умовну ймовірність окремого члена класуY). Результати матимуть статистичний інтерес тоді, і тільки тоді, колирх(у) аборy(x) істотно відрізнятимуться відрхірy.
2.4.9. ПОЗИЦІЙНІ МОЖЛИВОСТІ АНГЛІЙСЬКИХ ЗГОДНИХ *
Можливості можна також підраховувати дляокремих структурних позицій Наприклад, у таблиці 4 для кожного з 12 приголосних усного англійського мовлення наводяться 3 ряду ймовірностей: (i) апріорна ймовірність, середня для всіх позицій; (ii) ймовірність у позиції початку слова перед голосними; (iii) ймовірність у позиції кінця слова після голосних.
Імовірності деяких англійських приголосних у різних позиціях у слові
| «Абсолютна» | Початкова | Кінцева | |
| [t] | 0,070 | 0,072 | 0,105 |
| [n] | 0,063 | 0,042 | 0,127 |
| [l] | 0,052 | 0,034 | 0,034 |
| [d] | 0,030 | 0,037 | 0,039 |
| [h] | 0,026 | 0,065 | - |
| [m] | 0,026 | 0,058 | 0,036 |
| [k] | 0,025 | 0,046 | 0,014 |
| [v] | 0,019 | 0,010 | 0,048 |
| [f] | 0,017 | 0,044 | 0,010 |
| [b] | 0,016 | 0,061 | 0,0005 |
| [p] | 0,016 | 0,020 | 0,008 |
| [g] | 0,015 | 0,027 | 0,002 |
Можна помітити суттєві відмінності частотностей окремих приголосних у різних позиціях у слові. Наприклад, із перелічених одиниць [v] — найменш часта в позиції початку слова, але третя за частотністю в позиції кінця слова; з іншого боку, [b] - третя за частотністю одиниця в початковій позиції слова, але найменш часта в позиції кінця слова (за винятком [h], який взагалі не зустрічається на кінці. NB: ми говоримо про звуки, а не букви). Інші (як [t]) маютьвисоку ймовірність або (як [g] та [р]) низьку ймовірність для обох позицій. Також зауважимо, що діапазон коливань між найвищою та найменшою ймовірністю більше для кінця слова, ніж для початку. Факти цього одержують відображення в описі статистичної структури фонологічних слів англійської мови.
Імовірності для початкової та кінцевої позицій, що використовуються для цих розрахунків (див. табл. 4), ґрунтуються на аналізі зв'язкового тексту. Це означає, що частота появи певного приголосного, що зустрічається у відносно невеликій кількості високочастотних слів, може перевищити частоту появи іншого приголосного, що зустрічається у дуже великій кількості низькочастотних слів (пор. зауваження, зроблені в § 2.4.1 у зв'язку з поняттям «функціонального навантаження» ). Згідний [ð], який зустрічається на початку таких англійських слів, як the, then, their, them тощо, ілюструє ефект такої переваги. У початковій позиції це найчастіший з усіх приголосних з ймовірністю близько 0,10 (пор. ймовірність 0,072 для [t], 0,046 для [k] і т. д.). Але цей приголосний зустрічається лише у жменьці різних слів (менше ніж у тридцяти у сучасній мові). Навпаки, початкове [k] ми знаходимо у багатьох сотнях різних слів, хоча ймовірність його появи у зв'язному тексті більш ніж удвічі менше, ніж ймовірність появи [ð]. Порівняння всіх англійських слів, що реалізуються як приголосний + голосний + приголосний (що саме по собі є досить звичайною структурою для англійських фонологічних слів), показує, що взагалі існує більше слів з високочастотним початковим і кінцевим приголосним, ніж слів з низькочастотним початковим і кінцевим приголосним, і що перші, до того ж, зазвичай мають велику частоту появи. У той же час слід наголосити, що деякі слова значно більшечастотні або значно менш частотні, ніж можна було б передбачити, виходячи з ймовірностей складових їх елементів виразу.
Чи не знайшли те, що шукали? Скористайтеся пошуком: