1_korpusnaya-ling - Стор 11
Аналіз значення слів ускладнюється тим, що багато словоформ
в англійській мові мають багато граматичних функцій. Так, словоформа deals може бути використана як дієслово в особі однини і як іменник у множині. Deal і dealing можуть бути використані як дієслово і іменник. Списки частотності, побудовані на даних неанотованих корпусів, обмежені у своїй корисності, оскільки демонструють, які граматичні вживання слів є частими, які - рідкісними.
в однині (грама nn) 115 разів, як власне ім'я (np) – 1 раз, як дієслово (vb) – 66 разів і т.д. З такою інформацією з анотованого корпусу можна продовжувати вивчення DEAL більш докладно, звертаючи увагу на розподіл його дієслівних і субстантивних форм і порівнюючи їх використання в різних регістрах.
Частотність форм DEAL в анотованому корпусі
Розподіл DEAL по регістрам
Слова нерідко вживаються у різних регістрах, тому всеосяжні (overall) властивості слова можуть відбивати реальний стан справ у мові. Спочатку розглянемо лексему DEAL як іменник в анотованому корпусізвертаючи увагу лише на форми однини і множини (deal і deals).
Оскільки корпус складається з текстів різних регістрів, таких як наукова література, художня проза, пригодницька література та ковбойські романи, є можливість порівняти частотність deal та deals у різних регістрах
Таблиця 6 включає безпосередні (сирі) підрахунки (raw counts) та нормовані підрахунки (normed counts). Безпосередні підрахунки показують кількість випадків народження слова в кожному регістрі; наприклад, у репортажах пресивиявлено 14 випадків іменника deal, в оглядах преси - 4, в науковій літературі - 16 і т.д.
Частотність іменника DEAL у певних регістрах, нормована на 100 тис. слів
Однак ці підкорпуси включають різну кількість слів: у репортажах преси – 88 тис. слів, оглядах преси – 34 тис. слів, а в науковій літературі – 160 тис. слів. Тому порівняння безпосередніх підрахунків не можна використовувати як критерій для виведення про більшу або меншу частотність слова в одному регістрі в порівнянні з іншим. Адже якщо почати аналізувати більший приклад тексту з того ж регістру, цілком імовірно, що розкриються інші випадки вживання слова, що шукається. Очікується, що безпосередні підрахунки для DEAL у репортажах преси будуть нижчими, ніж підрахунки в науковій літературі, просто тому, що проаналізовано набагато менший підкорпус з репортажів преси, і це не обов'язково означає, що DEAL зустрічається в репортажах преси рідше. Швидше, потрібні виміри того, як часто читач зустріне DEAL як іменник.
Про такі виміри говорять як про «нормовану» (нормалізовану) частотність. Нормовані підрахунки перетворять кількість випадків народження слова за стандартною
шкалою, зазвичай, у перерахунку на 1 млн. слововжитків, чи, у разі, на 100 тис. Коли підрахунки нормовані, у репортажах преси виходить 15,9 випадків встречаемости на 100 тис. слів, а наукової літературі – лише 10 випадків на 100 тис. слів тощо. Отже, лише нормовані підрахунки забезпечують достовірні підстави порівняння по регістрам.
Коли випадки іменника deal розподілені по регістрам, проблема розміру корпусу для лексикографічної роботи стає ще більш очевидною.Таблиця 6 показує, що у чотирьох з восьми підкорпусів зазначено всього випадків народження. У жодному з регістрів немає достатньо великої кількості вжитків DEAL, максимальна кількість – 24 (художня проза). Зрозуміло, що корпус занадто малий для детального аналізу використання DEAL як іменник, тому далі будуть розглянуті моделі його розподілу по регістрам на матеріалі більш солідного за обсягом корпусу
Частотність іменника та дієслова deal у підкорпусах із двох регістрів корпусу
Нормовані підрахунки на
слів у підкорпусі
Таблиця 7 показує, що в корпусі deal і deals зустрічаються набагато частіше, і це забезпечує більшу базу для аналізу їх вживання. Завдяки даним таблиці частотності стають очевидними кілька цікавих моделей.
нормовані підрахунки всім прикладів текстів (всеосяжні підрахунки) показують, що deal/deals як дієслово лише набагато частіше зустрічається, ніж deal/deals як іменник (119 слів на млн. проти 90 словами на млн.). Однак якщо розглянути зустрічальність по регістрам, з'явиться інша картина. У науковій літературі deal/deals функціонує як дієслово вдвічі частіше, ніж іменник (176 проти 74 на млн. слів). Художня проза показує протилежну модель, в якій вживання deal/deals як іменник набагато частіше, ніж як дієслово (107 проти 63 на млн. слів).
Ці моделі вживання DEAL висвічують і інший важливий момент у створенні корпусу: корпус, обмежений одним з регістрів, не представлятиме мову в інших регістрах. Так неможливо узагальнення на матеріалі одного регістру для моделей, які будуть знайдені в інших регістрах. Приклад показує, щовідносна частотність DEAL як іменника і як дієслова у науковій літературі є цілком протилежною їх відносної частотності у художній прозі. Корпус, обмежений будь-яким із цих регістрів, зовсім не показав би того, що знайдено в іншому регістрі, і побудова моделей мовного використання цього слова була б неправильною.
Крім того, цей приклад показує, якими помилковими та недостовірними можуть бути всеосяжні узагальнення. Вони приховують протилежні моделі використання, які насправді мають місце, і в результаті часто є неточними для будь-якого різновиду, описуючи тип мови, яка взагалі не існує насправді.
Щоб відповісти на запитання, що може пояснити різний розподіл субстантивних і дієслівних форм по регістрам, необхідно проаналізувати різні значення слова та методи його вживання в кожному регістрі.
Розподіл смислів (значень) по регістрам
Корпуси дозволяють досліджувати значення слів шляхом використання конкордансів. Почати дослідження смислів слів можна з аналізу їх колокотів (collocates) - слів, з якими аналізоване слово (часто) зустрічається разом. Для кожної коллокації (collocation) існує сильна тенденція асоціюватися з одним змістом або значенням (хоча більш ніж одне поєднання може асоціюватися з тим самим змістом). Тому, виділяючи найчастіші колокації слова, можна ефективно та надійно аналізувати смисли. Далі потрібно порівняти те, що демонструє аналіз колокатів іменника DEAL у корпусі, з його словниковими дефініціями.
У таблиці 8 наведені колокати для іменника deal у двох регістрах з корпусу.різних програм конкордансів.
Ліві колокати – це слова, які безпосередньо передують іменнику deal. Наприклад, даних, представлених у таблиці 8, випливає, що слово good є частим лівим колокатом для deal. Праві колокати – це слова, які безпосередньо йдуть за іменником deal. Наприклад, слово of є частим правим колокотом для deal. Списки у цій таблиці представляють лише перше слово праворуч і ліворуч від deal, але самі технології дозволяють досліджувати сполучуваності з відривом (наприклад, з відривом двох чи трьох слів). Як видно з таблиці, у науковій літературі найчастішим лівим колокатом іменника deal є прикметник great (45 разів на млн. слів), потім слідує прикметник good (23 рази на млн. слів). Наступні по порядку колокати (package і that) зустрілися двічі, і тому не були внесені до таблиці 8, яка показує тільки колокати, що зустрілися хоча б 3 рази на мільйон слів у кожному регістрі.
Часті колокати іменника deal у двох підкорпусах (5,7 млн. слів) корпусу
Нормовані підрахунки на 1
(Підкорпус 2,7 млн. слів)
(Підкорпус 3 млн. слів)
У науковій літературі, очевидно, колокації good deal і great deal позначатимуть велику кількість або операції в бізнесі. При розгляді правих колокатів стає зрозумілим, що значення, що відноситься до кількості, є для найбільш частотним. Це підтверджує й частотність правого коллоката of (39 разів на млн. слів). Частотність наступного коллоката набагато менше, порівн.: more (7 разів на млн. слів), in і to (3 рази на млн. слів). Отже, іменник deal найчастіше має значення кількості, як у словосполученнях a good/great deal of.
порівн.: a great deal in common,differ a great deal in their understanding, a great deal to be desired, a great deal to offer.
Таблиця 8 показує, що словосполучення в художній прозі мають цікаві подібності та відмінності зі словосполученнями у науковій літературі. Знову найчастішими лівими колокатами є great і good. Дійсно, спільна зустрічальність good deal і great deal дуже схожа у двох регістрах (приблизно 68 разів на млн. слів). Однак у художній літературі є значна кількість випадків народження (96 прикладів), що не належать до моделі «good/great + deal». Коллокати тут розподілені ширше – the зустрічається 8 разів на млн. слів і big зустрічається 3 рази на млн. слів, тоді як решта 37 колокатів зустрічаються не частіше двох разів.
Модель словосполучень передбачає, що значення кількості для художньої прози центральним, але з єдиним. Наприклад, лівий колокат the використовується c DEAL у значенні домовленості, як у прикладах part of the deal is… та Isn't that the deal? Колокат big представляє інший сенс. Він показує відсутність важливості у виразах типу no big deal і what's the big deal?
Крім того, багато колокатів, нечастотних індивідуально, асоціюються з операціями в бізнесі: property deal, record deal, cash deal, land deal, mining deal. Хоча ці слова не відносяться до п'яти основних колокатів DEAL, вони демонструють важливий зміст.
Словосполучення з deal у художній прозі також розкривають значення, не знайдене у науковій літературі. У списку правих колокатів є 4 випадки народження table і 1 випадок народження box, коли йдеться про тип дерева (деревини). Ці колокати не є частотними, але вони вказують на ще одне використання deal у художній прозі, а їхвстречаемость в 5 різних текстах свідчить, що це використання щодо поширене.
Таблиця 9 показує 7 значень іменника deal, які найчастіше повторюються в п'яти словниках. Більшість словників згадує всі 7 значень, проте порядок їхнього розташування різний. Наприклад, значення «велика, але невизначена кількість» вводиться в першій словниковій статті в Webster's Third Dictionary в дефініції 2 і Random House Dictionary в дефініції
21. Порівнюючи ці словникові визначення з результатами дослідження іменника deal за допомогою корпусів, можна виділити кілька проблем. Вживання іменника deal у значенні кількості, безперечно, є найбільш частотою для обох аналізованих регістрів корпусу. Тим не менш, цей сенс не розкривається до або навіть дефініції у двох словниках. Крім того, аналіз колокатів виявив відносно частотний зміст, не зазначений у цих словниках: використання big deal у значенні "незначності". Нарешті, у всіх п'яти словниках реєстрові відмінності не беруться до уваги, хоча більше
пізні словники, створені з урахуванням корпусних даних, починають враховувати важливі регістрові моделі.