Українські реферати, курсові, дипломні роботи
UkraineReferat.org
українські реферати
курсові і дипломні роботи

Синтаксичний аналіз у системах автоматичного перекладу. Концепції та алгоритми

Реферати / Комп'ютери і технології / Синтаксичний аналіз у системах автоматичного перекладу. Концепції та алгоритми

Більшість ознак, що утворюють інформацію, є синтаксичними розрізнюваними ознаками словоформ та сегментів.

Увесь процес аналізу зводиться послідовно на декількох рівнях. Спочатку з окремо взятих гіпотетичних словоформ, точніше з інформацій до морф, на які ці словоформи розбиваються, виводиться інформація до словоформ, потім з інформацій до словоформ виводиться інформація до гіпотетичних сегментів; і нарешті, з інформацій до гіпотетичних сегментів виводиться синтаксична структура фрази. Одночасно гіпотетичні об’єкти перероблюються на приведені.

Відповідно, аналіз підрозділяється на формологічний (розбір окремих словоформ і отримання інформацій до них) та синтаксичний (все інше). Синтаксичний аналіз, в свою чергу, поділяється на внутрішньосегментний (розбір окремих гіпотетичних сегментів і отримання інформацій до них) та міжсегментний (розбір всієї фрази в цілому).

В межах гіпотетичних сегментів багато зв’язків між словоформами не можуть бути встановлені зовсім або встановлюються неправильно, тому в інформації до сегменту застосовуються j - ознаки (вказівки про невстановлені, але передбачувані зв’язки) та r - ознаки (вказівки про можливі помилки у встановлених зв’язках). Ці ознаки використовуються при міжсегментному аналізі.

Особливо треба відзначити l - ознаки, які виробляються на всіх етапах аналізу і спочатку входять в інформації до сегментів, а звідти – в інформації до фраз. l - ознаки – це вказівки про синтаксичні неоднозначності, які не можуть бути розв’язані навіть в межах фрази, без залучення загального смислу тексту.

Для пошуку одиниць синтаксичного аналізу – змістовних сполучень – всі вони оформлюються у вигляді шаблонних пошукових правил – конфігурацій. Конфігурації складаються з 5 частин: 1) містить порядковий номер конфігурації, в 2) записано перший і другий члени конфігурації, що задають члени змістовного сполучення, 3) відведена для допоміжної інформації, в 4) знаходиться основна інформація (назва стандартної операції, що виконує переробку інформацій та її параметри), 5) відведена для “переадресації”, тут записуються номери конфігурацій, до яких треба переходити у певних випадках.

Конфігурації зібрані в таблицю, в своєрідний “синтаксичний словник”. Окремо від таблиці існує “власне алгоритм” – інструкція по використанню словника. Власне алгоритм синтаксичного аналізу записується у вигляді набору стандартних алгоритмічних операторів.

Синтаксичний аналіз організований циклічно. При внутрішньосегментному аналізі кожний гіпотетичний сегмент оброблюється 5 раз. Для міжсегментного аналізу також пропонується 5 циклів.

“Власне алгоритм” та будова таблиці конфігурацій не залежать від конкретної мови.

Завантажити реферат Завантажити реферат
Перейти на сторінку номер: 1  2  3  4  5  6 

Подібні реферати:


Останні надходження


© 2008-2024 україномовні реферати та навчальні матеріали