Рабочие листы
к вашим урокам
Скачать
1 слайд
ЛЕКСИКО-СИНТАКСИЧЕСКИЕ ШАБЛОНЫ
В ЗАДАЧАХ
АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТА
Большакова Е.И., Баева Н.В., Бордаченкова Е.А., Васильева Н.Э., Морозов С.С.
МГУ им. М.В. Ломоносова Факультет ВМиК
bolsh@cs.msu.su
2 слайд
СОДЕРЖАНИЕ ДОКЛАДА
Задача формального описания лексических и морфосинтаксических особенностей текстовых единиц.
Результаты сравнительного анализа средств описания (НКРЯ, Alex, RCO).
Концепция лексико-синтаксического шаблона языковых конструкций.
Основные возможности языка записи лексико-синтаксических шаблонов (далее LSPL).
3 слайд
ЗАДАЧА ОПИСАНИЯ
ЯЗЫКОВЫХ КОНСТРУКЦИЙ
Изучение терминологических и дискурсивных особенностей НТ прозы
Потребность формализовать характерные конструкции
(Под T будем понимать D, Далее докажем P, Допустим, что S)
Определение множества лексем, грамматических форм,
синтаксических условий
Фиксирование в виде декларативной структуры
лексико-синтаксического шаблона языковой конструкции
NGACC [«мы»] «будем называть»TINS
4 слайд
СРЕДСТВА ОПИСАНИЯ ЕДИНИЦ ТЕКСТА
ДЛЯ ПОИСКА ФРАГМЕНТОВ В ТЕКСТАХ НА РУССКОМ ЯЗЫКЕ
Единицы текста: словоформы, последовательности слов, словосочетания
Национальный корпус русского языка (НКРЯ)
ограниченность корпуса; лингвистическая разметка
поиск последовательности слов по их грамматическим и лексико-семантическим характеристикам
Система Alex
лексические шаблоны для узкоспециализированных текстов
средства описания словосочетаний, без указания грамматических признаков
RCO Pattern Extractor/система GATE
правила и шаблоны для извлечения из текста специфических объектов
формальный язык в стиле ЯП (атрибутно-объектная модель текста)
5 слайд
СРАВНЕНИЕ ЯЗЫКОВЫХ СРЕДСТВ:
ОПИСАНИЕ ЛЕКСИКО-ГРАММАТИЧЕСКИХ ОСОБЕННОСТЕЙ
Лексико-графические единицы
Морфо-синтаксические условия
6 слайд
СРАВНЕНИЕ ЯЗЫКОВЫХ СРЕДСТВ: ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ
Логические операции
Запись конструкций
7 слайд
Разработка формального языка для:
записи специфических языковых конструкций для их представления в системе автоматической обработки НТТ;
записи запросов на поиск конструкций для системы поддержки лингвистических исследований.
Лексико-синтаксический шаблон – структурный образец языковой конструкции, отображающий ее лексические и поверхностно-синтаксические свойства.
Принцип отбора выразительных средств:
гибкая и интуитивно понятная запись основных лексических и поверхностно-синтаксических свойств конструкций.
ЛЕКСИКО-СИНТАКСИЧЕСКИЙ ШАБЛОН
8 слайд
ЯЗЫК LSPL-ШАБЛОНОВ:
ОСНОВНЫЕ ВОЗМОЖНОСТИ
Элемент-слово включает:
часть речи (A, N, V, Pa и т.д.) – A
индекс – A1 A2 N
лексема (< >) – A<важный>
уточнение грамматических характеристик (имя=значение) – A<важный; case=nom, gen=fem>
Грамматическое согласование элементов шаблона:
A<тяжелый> N <A.gen=N.gen, A.num=N.num, A.case=N.case>
A<тяжелый> N <A=N>
Слово тяжелый и следующее за ним существительное согласованы в роде, числе и падеже: тяжелым вечером, тяжелых камней, тяжелое тело
9 слайд
ЯЗЫК LSPL-ШАБЛОНОВ:
ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ
AP = A(A) | Pa(Pa)
AS= { AP } N<стол,c=nom> [“в”] <AP=N> (N)
Элемент-слово
Имя шаблона
Экземпляр шаблона
Условия согласования
Альтернативы |
Повторение {}
Опциональное вхождение []
Параметры шаблона
Элемент-слово
Имя шаблона
Экземпляр шаблона
Условия согласования
Альтернативы |
Повторение {}
Опциональное вхождение []
10 слайд
ДОПОЛНИТЕЛЬНЫЕ ПРИМЕРЫ
Однородные члены в виде именных групп:
SNG = AN1 {“,” AN2}<1> [“и” AN3] <AN1.c=AN2.c=AN3.c> (AN1)
Дама сдавала в багаж диван, чемодан, саквояж, картину, корзину, картонку и маленькую собачонку
Шаблон типичной для деловой и НТ прозы конструкции:
NP = AN1 {AN2<case=gen>} (AN1)
Характерная конструкция определения новых терминов:
DT = NP1<c=acc> ["мы"] "назовем" NP2<c=ins> <NP1.n = NP2.n>
Указанную операцию назовем операцией поиска примеров
11 слайд
ЯЗЫК LSPL-ШАБЛОНОВ:
СРАВНИТЕЛЬНЫЙ ПРИМЕР
Прилагательное и существительное
в именительном падеже единственного числа
Язык LSPL:
A<c=nom, n=sign> N<c=nom, n=sign>
Язык RCO Pattern Extractor:
{Morph.SpeechPart=“Noun”, Morph.Case=“Nominative”,
Morph.Number=“Singular”}
{Morph.SpeechPart=“Adjective”, Morph.Case=“Nominative”,
Morph.Number=“Singular”}
12 слайд
ЗАКЛЮЧЕНИЕ
Разработана первая версия программного модуля для поиска в тексте фрагментов, соответствующих заданному LSPL-шаблону.
Изучаются возможности развития языка LSPL:
усиление его выразительности:
логическое комбинирование условий;
грамматическое управление;
введение операций над фрагментами:
подсчет статистики;
извлечение составных конструкций.
СПАСИБО ЗА ВНИМАНИЕ!
Рабочие листы
к вашим урокам
Скачать
6 662 973 материала в базе
Настоящий материал опубликован пользователем Холмовая Александра Ивановна. Инфоурок является информационным посредником и предоставляет пользователям возможность размещать на сайте методические материалы. Всю ответственность за опубликованные материалы, содержащиеся в них сведения, а также за соблюдение авторских прав несут пользователи, загрузившие материал на сайт
Если Вы считаете, что материал нарушает авторские права либо по каким-то другим причинам должен быть удален с сайта, Вы можете оставить жалобу на материал.
Удалить материалВаша скидка на курсы
40%Курс профессиональной переподготовки
300/600 ч.
Курс профессиональной переподготовки
300/600 ч.
Курс профессиональной переподготовки
600 ч.
Мини-курс
5 ч.
Мини-курс
4 ч.
Мини-курс
6 ч.
Оставьте свой комментарий
Авторизуйтесь, чтобы задавать вопросы.