Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

Подписываем
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Предоплата всего
Подписываем
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
Институт Институт кибернетики
Направление Информатика и вычислительная техника
Кафедра Оптимизация систем управления
РАЗРАБОТКА МОДУЛЯ КОНТРОЛЯ ЗНАНИЙ ИМЕННОГО СКЛОНЕНИЯ ДЛЯ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ОБУЧЕНИЯ РУССКОМУ ЯЗЫКУ КАК ИНОСТРАННОМУ
Выпускная квалификационная работа
(на соискание квалификации магистр)
Студент гр. 8ВМ15 |
__________________ |
__________________ |
Д. И. Фирстов |
Руководитель |
|
|
|
Допустить к защите: |
|
|
|
Томск 2013 |
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
Кафедра ОСУ
УТВЕРЖДАЮ:
Зав. Кафедрой _____________ О. Б. Фофанов
ЗАДАНИЕ
на выполнение выпускной квалификационной работы
Студенту гр. 8ВМ15 Фирстову Дмитрию Игоревичу
Руководитель ____________ А. П. Савинов
____________
Задание принял к исполнению
____________ Д. И. Фирстов
____________
Отчёт по выпускной квалификационной работе содержит 58 стр., в том числе 2 рисунка, 4 таблицы, 16 использованных источников, 1 приложение.
Основная задача выпускной квалификационной работы разработка алгоритмов контроля знаний именного склонения для системы обучения русскому языку как иностранному.
В работе проводится анализ существующих на рынке автоматизированных систем обучения, даётся описание требований к разрабатываемой системе в целом и к модулю контроля знаний в частности, приводится описание используемых лингвопроцессорных средств, делается обоснование их выбора. В последней главе подробно рассматриваются разработанные алгоритмы, их достоинства и недостатки.
[1] Реферат [2] Оглавление [3] Введение [4] Автоматизированные обучающие системы [4.1] Инструментальные оболочки [4.1.1] Moodle [4.1.2] Blackboard Learning System [4.1.3] СТ Курс [4.2] Интеллектуальные обучающие системы [5] Система КЛИОС [5.1] Общие требования к системе [5.2] Модуль проверки упражнений [6] Лингвистические процессоры [6.1] АОТ [6.2] Cognitive Dwarf [6.3] DictaScope [6.4] pymorphy2 [6.5] ABBYY Compreno [7] Алгоритмы решения и проверки упражнений на именную часть русского языка [7.1] Алгоритм проверки упражнений типа «Заданный ответ» [7.2] Алгоритм проверки упражнений типа «Поставить слово / словосочетание в заданную форму» [7.3] Алгоритм проверки упражнений типа «Склонение с числами» [7.4] Алгоритм проверки упражнений типа «Ответить по модели» [7.4.1] Выявление преобразований [7.4.1.1] Склонение слов в скобках [7.4.1.2] Удаление [7.4.1.3] Вставка новых слов [7.4.1.4] Замена слов [7.4.1.5] Перестроение дерева [7.4.2] Применение правил преобразования [7.5] Недостатки алгоритмов [8] Заключение [9] Список литературы [10] Приложение А [11] Introduction [12] Web-based educational systems: a review of technologies [12.1] ITS technologies in Web-based education [12.1.1] Curriculum sequencing [12.1.2] Problem solving support technologies [12.1.2.1] Intelligent analysis of student solutions [12.1.2.2] Interactive problem solving support [12.1.2.3] The example-based problem solving support [12.2] Adaptive hypermedia technologies in Web-based education [12.3] Web-inspired technologies in Web-based education [13] Conclusion [14] References |
Томский политехнический университет уже более 10 лет занимается обучением иностранных студентов. По данным сайта ТПУ на сегодняшний день международная среда университета представлена 2100 студентами из 40 стран мира [1]. Иностранные студенты сильно различаются по уровню языковой подготовки. Русским языком владеют лишь единицы. Так как обучение в ТПУ ведётся в основном на русском языке, кафедра РКИ ИМОЯК проводит специальные курсы, на которых студенты изучают основы русского языка.
Студенты приезжают из разных стран, у них разные национальные особенности. Из-за этого при обучении требуется индивидуальный подход, что в силу большого количества приезжих студентов обеспечить в полной мере невозможно. По этой причине было принято решение создать в Томском политехническом университете автоматизированную систему обучения русскому языку как иностранному.
В настоящее время автоматизированные обучающие системы набирают всё бо́льшую популярность. Их достоинства очевидны. Такие системы позволяют проводить дистанционные занятия, что экономически выгодно [2]. Кроме того, они подталкивают студента к самостоятельной учебной деятельности, что приводит к снижению нагрузки на преподавателя. Также, обучающие компьютерные программы позволяют широко использовать возможности мультимедиа, что способствует, по мнению психологов и педагогов, лучшему усвоению материала [3].
Предполагается, что создание такой системы позволит повысить эффективность преподавания русского языка как иностранного. Система планируется как веб-ориентированая, поэтому студенты могут пользоваться ей из дома или из любого другого места, где есть выход в сеть Интернет. Автоматизированный интеллектуальный контроль знаний позволит им работать над своими языковыми навыками самостоятельно, без непосредственного участия преподавателя. Также система может использоваться и на очных занятиях в качестве дополнительного учебного материала.
Важной частью этой системы является модуль проверки упражнений. Основная задача этого модуля контроль знаний студентов. Модуль должен анализировать ответы студентов на естественном языке и оценивать их правильность.
Первым этапом в обучении студентов русскому языку является именная часть русской грамматики. К этой части относится склонение существительных, местоимений и прилагательных.
Исходя из сказанного выше, можно сформулировать цель данной работы. Основной целью является разработка программного модуля, который должен в автоматическом режиме проверять упражнения на именную часть русской грамматики и оценивать качество их выполнения. Для этого требуется решить следующие задачи:
Автоматизированные обучающие системы можно условно разделить на два типа [4]:
На сегодняшний день наиболее известны на российском рынке три инструментальные системы (оболочки): «Blackboard Learning», СДО «СТ Курс» и «Moodle» [4].
Типовая структурная схема, характерная для вышеуказанных инструментальных оболочек, изображена на Рис. 1.
Возможности, предоставляемые данными комплексами разработчикам учебных курсов, незначительно отличаются друг от друга, и поэтому создаваемая преподавателями система дистанционного обучения обычно состоит из независимых подсистем обучения и контрольного тестирования.
Подсистема обучения представляет собой программу, осуществляющую вывод на дисплей в установленной последовательности порций учебного материала в текстовой форме, написанного на языке HTML, который сопровождается дополнительными средствами отображения информации (анимация, мультипликация, звук, гипертекст, глоссарий и т. д.). Наполнение программ конкретным предметно-ориентированным содержанием обеспечивает создание различных типов обучающих курсов в учебных целях.
Рис. . Пример структурной схемы системы дистанционного обучения «СТ Курс»
Контрольное тестирование использует методы стандартизованного контроля знаний. Суть их состоит в том, что обучаемому предлагается выборка специальных заданий и по ответам на неё выносится суждение о его знаниях.
Для этого выделяются некоторые признаки, в соответствии с которыми ответ обучаемого относится к категории правильных или неправильных. Чаще всего это происходит путём указания эталона ответа и определения процедуры сравнения.
На каждый вопрос имеется простой ответ, который может быть формально проверен и оценён как правильный, неправильный или частично правильный (например, неполный). Вопросы обычно классифицируются по типам соответственно типу ожидаемого ответа.
Наиболее распространенная форма ответов выборочная: вопрос сопровождается несколькими готовыми вариантами ответов, из которых нужно выбрать один или несколько правильных ответов.
Вторым по популярности идёт числовой ответ. Обычно это результат решения предложенной задачи.
Кроме этого, иногда используется текстовый ответ, но без анализа, т. е. правильным считается ответ, полностью совпадающий с эталоном.
Также применяются тесты, в которых предоставляется возможность в ответе устанавливать соответствие между элементами двух списков:
Более продвинутые типы вопросов включают вопросы на правильную последовательность, вопросы на указывание (ответ одна или несколько областей на рисунке), а также графические вопросы (ответ простой граф).
Рассмотрим более подробно указанные системы.
Moodle (Modular Object-Oriented Dynamic Learning Environment Модульная объектно-ориентированная динамическая среда обучения) это свободная система с открытым исходным кодом. Она предоставляет студентам и преподавателям следующие возможности [5]:
Blackboard Learning System это коммерческая оболочка для создания электронных курсов. Она состоит из четырёх модулей [6]:
Что касается автоматизированного контроля знаний, данная система предоставляет все описанные выше методы тестирования.
«СТ Курс» это российская система дистанционного обучения, разработанная компанией Cognitive Technologies. На данный момент её развитие прекращено.
Система в первую очередь ориентирована на создание платных курсов на договорной основе. В системе есть специальный модуль, отвечающий за оформление договоров на обучение [7].
Все предоставляемые системой возможности изображены на Рис. 1.
Анализ ответов, вводимых в свободной текстовой форме, является самой естественной и наиболее сложной задачей при организации системы контроля знаний обучаемых. К сожалению, рассмотренные выше инструментальные комплексы не позволяют создавать преподавателям русского языка интеллектуальные системы обучения РКИ.
Интеллектуальный анализ решений это процедура проверки, при которой обучающая система способна проанализировать ответы студента на тестовые задания, указать, что именно неправильно или неполно освещено в ответе и, как следствие, какие знания недостаточно усвоены студентом. В связи с этим интеллектуальные обучающие системы могут предоставлять обучаемому подробную информацию об ошибках и соответственно адаптировать учебный процесс к индивидуальным особенностям студента.
Эта адаптация может включать, например, постоянный подбор и организацию структуры следующей порции учебного материала в зависимости от того, какие компоненты знания и процедуры изучаемого предмета обучаемым и насколько хорошо.
Также могут учитываться его эмоциональное и когнитивное состояние, мотивация к обучению, учебные цели (подготовка к итоговому экзамену по предмету или изучение полного курса «с нуля», в индивидуальных формах и темпе).
Интеллектуализация компьютерного обучения предполагает использование методов и моделей представления знаний на базе систем, основанных на знаниях.
В последние десять лет в мире появилось немало интеллектуальных обучающих систем для формализованных предметных областей отличных от РКИ. Некоторые из них являются коммерческими. Одним из лидеров, например, может быть названа компания СarnegieLearning, продающая ИОС для изучения математики сотням школ в США. Обзор и состояние работ по созданию интеллектуальных систем обучения за рубежом дан в работе [8].
В России, к сожалению, такие работы ведутся пока в сравнительно небольших масштабах и не вышли на коммерческий уровень. К числу интересных работ можно отнести работы, по созданию ИОС «Волга», разрабатываемой ИПУ РАН в сотрудничестве с КГТУ и другими вузами. Поскольку эту работу можно отнести к числу пионерских в области создания интеллектуальных обучающих систем нацеленных на изучение математики в вузах и в школах, рассмотрим её подробнее.
ИОС «Волга» позволяет осуществлять углубленную индивидуализацию обучения на основе логико-оптимизационных методов автоматизации планирования действий ИОС с веб-интерфейсом для удалённых пользователей. В рамках данного проекта разрабатываются и внедряются оригинальные методы дедукции, абдукции, решения логических уравнений и многокритериальной оптимизации.
Центральное место в ИОС занимает модуль управления процессом обучения, который использует для планирования и выбора действий системы логические «решатели» и методы теории принятия решений. Для генерации новой порции учебного материала и помощи обучаемому этот модуль задействует знания о предметной области и педагогическую модель. Также он использует сведения об обучаемом, которые хранятся в модели обучаемого и извлекаются по запросу анализатором действий.
Метазнания о компетенции обучаемого первоначально формируется путём диагностирования обучаемого с помощью тестов, когда осуществляется испытание обучаемого на знание определений, правил, исключений и т. п., а также на умение выполнять простейшие или более сложные упражнения. При этом осуществляется последующее итеративное уточнение компетентностной модели обучаемого по результатам его ответов в ходе решения задач после изучения им очередной порции материала, предложенной ему с учётом достигнутой компетенции.
Для отслеживания уровня умений и поддержки индивидуального подбора задач используется оверлейная модель обучаемого (это модель, которая предполагает, что знания (умения) обучаемого являются подмножеством знаний (умений) о предметной области, имеют ту же структуру и отличаются лишь тем, что менее полны). Умения обучаемого моделируются как набор продукционных правил вида «если то», имеющиеся в когнитивной модели обучения и помеченные маркерами «выучено» или «не выучено».
Система содержит компьютерные программы («решатели») автоматического решения следующих школьных и вузовских задач:
1) Вычислительного типа «дано требуется»;
2) На доказательство предъявленного утверждения;
3) На поиск условий разрешимости задачи того или иного типа и др.
Знания о предметной области, которые использует «решатель» в настоящий момент, охватывает некоторые разделы геометрии и математической статистики. «Решатель» участвует в проверке решения студента на завершенность и в генерации подсказок.
В первом случае среди найденных автоматически вариантов решений ищутся совпадающие с решением студента или наиболее близкие к нему.
Во втором случае повторяется такой же поиск; подсказывается первый незавершённый шаг из найденного решения. Если это не помогает студенту, то в дальнейшем выводится поочередно последовательность подсказок, постепенно, приводящих решение задачи к конечному результату.
Эта система на данный момент непригодна для обучения студентов русскому языку из-за её ориентированности на точные науки.
Анализ процесса обучения РКИ показал, что компьютерная система для обучения иностранных студентов русскому языку должна отвечать следующим функциональным требованиям, выполнение которых обеспечивает достижение высокой эффективности в изучении русского языка в вузе [4].
Наличие в системе справочно-обучающих функций, позволит пользователям не только подготовительного отделения, но и старших курсах университета найти необходимую справочную информацию по грамматике русского языка, произношению и объяснению смысла незнакомых слов, встречающихся по произвольному тексту. Кроме того система в этом режиме работы даёт возможность пользователю самостоятельно изучать русский язык, последовательно осваивая теоретический и практический материалы, содержание которых соответствует выбранному пользователем стандарту обучения: элементарному, базовому или первому уровню.
В тренажёрном режиме работы система должна предоставлять каждому студенту для самостоятельного выполнения совокупность упражнений по фонетике или грамматике изучаемого раздела языка. Система оценивает правильность их исполнения и при наличии ошибок даёт дополнительный материал на данную тему пока студент не добьётся результатов, близких к 100%.
Тестирующие функции системы должны позволять не только оценивать общий уровень владения русским языком, но и диагностировать пробелы в знаниях РКИ, контролировать усвоение изучаемого материала по конкретной тематике с установлением количественной меры его измерения (в процентной или бальной системе).
Система должна предоставлять преподавателям возможность создания традиционных тестирующих упражнений: множественный выбор, соответствие, установление правильной последовательности, подстановка пропущенные в слове символов, краткий ответ. Кроме этого, система должна самостоятельно без привлечения преподавателя проводить обработку текстового материала задания, и производить оценку правильности его выполнения студентом путем сравнения его с результатами, полученными самой системой.
Кроме того она должна использоваться на старших курсах, как справочная система, воспроизводящая произношение незнакомого слова и определяющая его смысл, при условии, что тезаурус системы будет предварительно заполнен преподавателями специальных предметов.
Наряду с обеспечением требований, предъявляемых к выполнению системой функций и области её применения система должна удовлетворять и конкретным требованиям, выполнение которых обеспечивает достижение высокой эффективности в изучении русского языка в вузе.
Неотъемлемой частью системы КЛИОС является интеллектуальный модуль проверки упражнений. Под интеллектуальностью модуля мы понимаем возможность решать задания в автоматическом режиме и сравнивать полученные результаты с ответами, данными студентом.
На наш взгляд такое решение позволит значительно повысить качество проверки. Дело в том, что в такой области как русский язык довольно сложно составить формализованные тесты для проверки знаний. Приведём пример из предоставленных преподавателями русского языка упражнений:
Упражнение
Ответьте на вопросы, используя слова из скобок.
Рассмотрим первый вопрос из списка. Он может быть обращён как к группе людей, так и к одному человеку, соответственно на него можно дать, например, такие ответы:
Вчера мы были в нашем университете.
Вчера я был в нашем университете.
Вчера я была в нашем университете.
Однако слово «вчера» в данном случае не обязательно должно располагаться в начале предложения. (Строго говоря, его положение зависит от семантического ударения предложения, то есть от того, что хочет подчеркнуть автор. Например, в данной ситуации семантическое ударение падает на слово «университет». Если же автор хочет подчеркнуть, что он был в университете именно вчера, ему требуется поставить обстоятельство времени в конец предложения. Однако пока такие тонкости построения предложений учитывать не требуется.) Мы можем ответить ещё и следующим образом:
Мы были в нашем университете вчера.
Мы были вчера в нашем университете.
Таким образом, комбинируя предложенные выше варианты, мы получаем всего девять возможных ответов на первый вопрос упражнения. При использовании традиционных систем контроля знаний, преподавателю бы пришлось во время создания упражнения задать все девять вариантов, что привело бы к резкому падению эффективности его труда. Если же система будет сама генерировать все возможные ответы на вопрос, а потом сравнивать ответы студента со сгенерированными ответами, такой проблемы удастся избежать.
Кроме того, система позиционируется не только как учебное пособие, но и как тренажёр для самостоятельного обучения. Подобный подход может позволить студентам без участия преподавателя проверять свои знания по интересующей их части грамматики.
Чтобы добиться описанной выше интеллектуальности, требуется использовать средства автоматического лингвистического анализа лингвистические процессоры.
Фактически, нам требуется проводить преобразование вопроса в ответ. Для этого нам нужно иметь возможность выполнять следующие изменения предложения:
Таким образом, от лингвистических процессоров требуется следующее:
Правильное снятие омонимии очень важно для правильного склонения слов. О том, какие лингвистические процессоры были рассмотрены и как они удовлетворяют заданным требованиям, рассказывается в следующей главе.
Лингвистический процессор это компьютерная программа, которая каким-либо образом преобразует входной текст на естественном языке. В литературе также используется термин «анализатор». Это понятие несколько уже. Под анализатором в данной работе понимается программа, преобразующая входное предложение в некоторое машинное представление. Условно лингвистические анализаторы можно разделить на четыре вида:
Графематический анализ представляет собой начальный этап обработки текста, в ходе которого определяются элементы грамматической структуры (слова, знаки пунктуации, числа, сокращения и т. д.). Можно выделить следующие основные функции графематического анализа [9]:
Морфологические анализаторы служат для получения начальной формы слов, выделенных на этапе графематического анализа, части речи и их морфологических характеристик, а также для склонения слов. В данной работе мы рассматриваем два морфологических анализатора: морфологический анализатор из пакета АОТ и библиотека pymorphy2.
На этапе синтаксического анализа определяются синтаксические связи между словами, устанавливается, какую синтаксическую функцию выполняет каждое слово. На выходе обычно строится синтаксическое дерево, где узлы это слова, а связи отношения между ними. В данной работе рассматривается четыре синтаксических анализатора: синтаксический анализатор из пакета АОТ, DictaScope Syntax, Cognitive Dwarf и Abbyy Compreno.
Семантический анализатор возвращает семантический граф, где узлы это понятия языка, а связи отношения между ними. В данной работе семантические анализаторы не используются.
Программный пакет АОТ это набор лингвистических процессоров, осуществляющих последовательную обработку текста [10]. Общая схема представлена на Рис. 2.
Рис. . Структурная схема пакета АОТ
Кроме анализа, система предоставляет возможность синтеза текста на другом языке. За это отвечают процессоры «Трансфер» и «Синтез». Однако как было сказано выше, нас интересует только морфологический и синтаксический анализ.
Русский морфологический словарь АОТ базируется на грамматическом словаре А. А. Зализняка и включает на данный момент около 161 тысячи лемм. Также, модуль морфологического анализа позволяет получать все формы заданного слова, что можно использовать для решения обозначенной ранее задачи склонения.
Большим недостатком морфологического анализатора является отсутствие поддержки буквы «ё», тогда как, согласно Официальному порталу Комиссии «Русский язык в СМИ» Совета по русскому языку при Правительстве Российской Федерации, употребление буквы «ё» обязательно в учебных пособиях для иностранцев [11].
Что касается синтаксического анализатора, даже на простых предложениях он выдавал неверные результаты (см. Таблицу 1). Здесь и далее работа анализаторов показывается на примере предложений из упражнений, предоставленных преподавателями русского языка кафедры РКИ ИМОЯК.
Таблица . Результаты работы синтаксического анализатора АОТ
Исходное предложение |
Результат разбора |
Папа мыл пол. |
пол сказуемое (ПОЛЫЙ, кр. прил.) ├ Папа подлежащее (ПАПА, сущ.) └ мыл (МЫЛО, сущ.) |
Какие это часы? Это часы с будильником. |
часы (ЧАСЫ, сущ.) └ Какие (КАКОЙ, мест. прил.) это (ЭТОТ, мест. прил.) |
Чья машина стоит у подъезда? |
стоит сказуемое (СТОЯТЬ, глаг.) ├ машина подлежащее (МАШИНА, сущ.) │ └ Чья (ЧЕЙ, мест. прил.) └ у подъезда предложная группа |
Как мы видим из результатов тестирования, не все предложения разобраны правильно. На первое предложение дана хоть и грамматически верная, но маловероятная интерпретация. Для второго предложения не было построено связного дерева. Для третьего предложения дан верный разбор.
Cognitive Dwarf это программный пакет, включающий в себя синтаксический анализатор для русского и английского языков и систему автоматического перевода (русско-английское и англо-русское направления) [12].
В настоящее время существует только консольное приложение, предоставляющее доступ к функциям пакета. На вход этому приложению поступает файл с текстом на русском или английском языке. Результат работы консольного приложения сохраняется в выходном файле, который в зависимости от параметров запуска может содержать следующее:
Как видно из описания, программа не позволяет склонять отдельные слова и делать какие-то иные преобразования над входными данными, кроме перевода.
Программа распространяется бесплатно, однако исходные коды её закрыты, и лицензия разрешает использование данного пакета только в целях исследования или обучения.
Протестируем программу на тех же примерах, что и предыдущий пакет. Результаты приведены в Таблице 2.
Таблица . Результаты тестирования программного пакета
Cognitive Dwarf
Исходное предложение |
Результат разбора |
Папа мыл пол. |
мыл сказуемое (мыть, глаг.) ├ Папа подлежащее (папа, сущ.) └ пол прямое дополнение (пол, сущ.) |
Какие это часы? Это часы с будильником. |
Какие (какой, мест. прил.) это (этот, мест. прил.) часы (час, сущ.) |
Чья машина стоит у подъезда? |
стоит сказуемое (стоять, глаг.) ├ машина подлежащее (машина, сущ.) │ └ Чья определение (чей, мест. прил.) └ у предложная группа (у, предл.) └ подъезда (подъезд, сущ.) |
Как мы видим из данной таблицы, для первого и для третьего предложения был получен верный разбор. Однако результаты разбора второго предложения даже хуже, чем в АОТ: здесь вообще нет связей в дереве, а также слово «часы» нормализовано неверно.
Синтаксический анализатор DictaScope Syntax, строит дерево зависимостей для входного предложения на естественном языке (русском) [13]. При построении дерева снимается морфологическая омонимия, словам (лексемам) присваиваются грамматические значения, для каждой подчинительной связи определяется её тип. Производится сегментация предложения: выделение простых предложений в составе сложного, выделение оборотов, в том числе вложенных причастных, деепричастных, адъективных и так далее, определение рядов однородных членов. Снимается функциональная омонимия знаков препинания, определяются их роли. Учёт пунктуации позволяет добиться правильного анализа длинных предложений со сложной структурой.
Выделяются некоторые составные текстовые объекты (организации, даты и так далее). Каждый составной объект представлен в дереве одной вершиной, имеющей синтаксические связи.
Кроме того программа выполняет следующие функции:
Как мы видим, данный программный продукт не предоставляет возможности склонения слов и словосочетаний, а также любого другого изменения входного предложения.
Ядро анализатора DictaScope Syntax реализует универсальные языковые зависимости, что позволяет применять его для разработки анализаторов различных языков на единой платформе. Созданы экспериментальные версии для английского и немецкого языков. Русская версия является в настоящее время наиболее проработанной.
Компания Диктум предоставляет бесплатный доступ к веб-сервису DictaScope Syntax для образовательных учреждений.
В Таблице 3 приведены результаты тестирования программы DictaScope Syntax.
Таблица . Результаты тестирования синтаксического анализатора DictaScope Syntax.
Исходное предложение |
Результат разбора |
Папа мыл пол. |
мыл (мыть, глаг.) ├ Папа (папа, сущ.) └ пол (пола, сущ.) |
Какие это часы? Это часы с будильником. |
часы (часы, сущ.) ├ Какие (какой, мест. прил.) └ это (этот, мест. прил.) |
Чья машина стоит у подъезда? |
стоит (стоять, глаг.) ├ машина (машина, сущ.) │ └ Чья (чей, мест. прил.) └ у (у, предл.) └ подъезда (подъезд, сущ.) |
Сразу следует отметить, что в отличие от других программных пакетов, DictaScope Syntax не возвращает синтаксические функции слов.
Что касается результатов разбора, то можно заметить, что в первом предложении неверно нормализовано слово «пол». В то же время, второе предложение было проанализировано правильно. Для третьего предложения результат получился практически идентичным первым двум анализаторам.
pymorphy2 это библиотека для морфологического анализа и склонения слов. Она распространяется по лицензии MIT, что позволяет использовать её в любых целях.
Возможности библиотеки [14]:
При работе используется словарь OpenCorpora проекта по созданию открытого и свободного корпуса русского языка. Кроме того, библиотека может обрабатывать слова, не содержащиеся в словаре.
Большим плюсом является поддержка буквы «ё», которая, как было показано выше, необходима при обучении иностранцев русскому языку. Этот фактор послужил решающим при выборе данной библиотеки в качестве инструмента для склонения слов в модуле контроля знаний.
ABBYY Compreno это разрабатываемая в данный момент технология синтаксического и семантического анализа текстов на естественном языке [15]. Центральным ядром создаваемой технологии служит универсальная иерархия понятий и модель отношений между этими понятиями. В литературе это дерево понятий называется Universal Semantic Hierarchy (USH).
Второй, но не менее важной частью технологии является полный синтаксический разбор текста. Семантические отношения универсальны, а способы их реализации в каждом языке свои. Для каждого языка синтаксическое описание делается заново, но сами средства, которые разные языки используют для кодирования смысла, перечислимы. При описывании нового языка используется разные элементы конструктора (тот же линейный порядок, различные типы синтаксических преобразований, грамматические значения, предлоги, специальные конструкции).
Технология Compreno также позволяет определять и более сложные синтаксические связи, такие как анафора: «Хоть мальчик и хотел поиграть, но он понимал, что у него мало времени», эллипсис: «он любит красное вино, а она белое». Выделяемые системой связи между понятиями также выражаются в древесной структуре. Таким образом, система стремится к определению смысла текста, написанного на обычном языке, позволяя машине «понять» этот текст и трансформировать его в универсальное представление, не зависящее от языка.
При анализе используется USH, синтаксическое описание языка, а также статистика взаимоотношений между словами.
Таблица . Результаты работы синтаксического анализатора
ABBYY Compreno
Исходное предложение |
Результат разбора |
Папа мыл пол. |
мыл сказуемое (мыть, глаг.) ├ Папа подлежащее (папа, сущ.) └ пол прямое дополнение (пол, сущ.) |
Какие это часы? Это часы с будильником. |
часы подлежащее (час, сущ.) └ Какие определение (какой, мест. прил.) └ это частица (этот, мест. прил.) |
Чья машина стоит у подъезда? |
стоит сказуемое (стоять, глаг.) ├ машина иная функция (машина, сущ.) │ └ Чья определение (чей, мест. прил.) └ подъезда обстоятельство (подъезд, сущ.) └ у предлог (у, предл.) |
Среди результатов разбора можно заметить две ошибки. Во втором примере неверно определён контекст, и как следствие, неверно нормализовано слово «часы». В третьем предложении для слова «машина» не определена синтаксическая функция (в этом случае слову присваивается функция «иная функция»).
После тестирования мы можем сделать вывод о том, что на данный момент самый качественный синтаксический анализ проводит ABBYY Compreno. Ошибка с неверной нормализацией слова «часы» связана с невозможностью на данный момент обеспечить полное понимание системой контекста предложения. Это следует учитывать при дальнейшей разработке, однако мы не считаем подобные ошибки критичными.
Как уже было сказано, для склонения слов будет использоваться библиотека pymorphy2. Так как сам модуль контроля знаний пишется на языке C#, библиотека pymorphy2 была оформлена в виде сервиса Windows, к которому можно обращаться через определённый порт машины.
Именные части речи в русском языке это имя существительное, имя прилагательное, имя числительное, местоимение. Именные части речи это самостоятельные (имеющие значение), изменяемые (склоняемые) части речи, являющиеся членами предложения [16].
Имя существительное занимает одно из главных мест в нашей речи. Все, что существует в мире, названо словом именем существительным.
Имена существительные делятся на одушевлённые и неодушевлённые. Деление на одушевлённые и неодушевлённые имена существительные не всегда совпадает с делением всего существующего в природе на живое и неживое. Например, названия растений, слова «народ», «детвора», «стая», «молодёжь» относятся к неодушевленным. А такие слова как «кукла», «мертвец», «покойник», «туз», «валет», «козырь» (карточные термины) к одушевлённым.
Имена существительные относятся к мужскому, женскому, среднему роду. Обычно определить род имён существительных нетрудно, но есть группа слов, у которых правильно определить род можно, только обратившись к словарю: лебедь мужской род; шампунь мужской род; шасси средний род. На подобные слова студентам следует обратить особое внимание и научиться правильно определять их род.
Некоторые существительные мужского рода, обозначающие профессию, род занятий, могут употребляться для обозначения лиц как мужского, так и женского пола (адвокат, геолог, продавец). Это вызывает некоторую сложность при генерации правильного ответа. Например, в следующем упражнении возможны по два варианта решения каждого задания:
Упражнение
Поставьте прилагательные из скобок в правильную форму.
Имена прилагательные обозначают признак предмета и отвечают на вопросы какой? какая? какое? какие? С помощью имён прилагательных предмет можно охарактеризовать с различных точек зрения.
Местоимения это слова, которые используются вместо имени, обозначают лица (я, ты, мы, вы, он, она, оно, они), указывают на предметы, признаки предметов, количество предметов, не называя их конкретно (тот, этот, всякий, столько). От всех других именных частей речи местоимения отличаются тем, что они сами по себе не имеют самостоятельного значения, но в речи, в тексте это значение становится конкретным, потому что соотносится с конкретным лицом, предметом, признаком, количеством. Из-за этого возникают проблемы при решении некоторых заданий: на вопросы с местоимениями можно дать по несколько разных ответов. Подробно это было проиллюстрировано в пункте 2.2.
По значению и грамматическим особенностям выделяется девять разрядов местоимений:
На элементарном уровне студенты изучают личные, притяжательные и вопросительные местоимения.
Местоимения имеют морфологические признаки той части речи, с которой соотносятся.
Начальная форма для именных частей речи именительный падеж, единственное число, мужской род (кроме имени существительного). Непостоянные признаки также общие. Именные части речи изменяются по падежам, числам, родам (кроме имени существительного).
Упражнения на именную часть русской грамматики направлены на развитие у студентов умения безошибочно склонять слова в правильную с точки зрения грамматического контекста форму. Поэтому среди упражнений на именную часть можно выделить два основных типа:
По своей форме упражнения можно разделить на четыре категории:
Упражнение 1.
Раскройте скобки по модели.
Модель: Я люблю гулять (город) Я люблю гулять по городу.
Упражнение 2.
Отвечайте на вопросы по модели.
Модель: Чьи тетради лежат на столе? (наш студент Борис) Тетради нашего студента Бориса лежат на столе.
Упражнение 3.
Поставьте слова в форму творительного падежа.
Упражнение 4.
Поставьте слова из скобок в форму предложного падежа.
Упражнение 5.
Поставьте слова в правильную форму.
К упражнениям, которые не требуют интеллектуальной проверки, относятся упражнения на изучение слов:
Упражнение 6.
Напишите названия месяцев в заданном порядке.
На каждый из этих вопросов можно дать однозначный ответ, поэтому для их проверки не требуется привлечение искусственного интеллекта.
Также к данному типу относятся упражнения, которые система не может решить на данный момент. Например, это задания, где нужно вставить подходящий по смыслу предлог:
Упражнение 7.
Вставьте подходящий по смыслу предлог.
Для решения подобных заданий требуется понимание контекста, что пока невозможно.
Кроме того, в этом типе могут быть реализованы и различные мультимедийные задания: упражнения с видео, аудио и игровыми компонентами.
В данном типе упражнений можно выделить три основных подтипа:
Алгоритмы проверки первого и второго подтипов не представляют интереса. Проверка же третьего подтипа отличается от традиционных систем контроля знаний тем, что и ответ, данный студентом, и ответ, заданный преподавателем проходят через синтаксический анализатор, после чего происходит сравнение полученных синтаксических деревьев. При этом сравниваются не только сами слова, но и их синтаксическая функция. Это позволяет зачесть ответ студента как правильный даже в том случае, когда он несколько отличается от ответа преподавателя. Проиллюстрируем это примером.
Преподаватель создаёт упражнения, в которых студенту требуется составить предложение со словом, которым обозначается предмет, изображённый на рисунке. Студенту показывается модель ответа. Например, на картинке изображено яблоко, а студенту требуется составить просьбу обращение к продавцу: «Дайте мне, пожалуйста, это яблоко».
Преподаватель загружает другие картинки и составляет правильные ответы к ним: «Дайте мне, пожалуйста, этот учебник», «Дайте мне, пожалуйста, эту тетрадь» и т. д.
Предположим, что студент даст на первый вопрос следующий ответ:
Дайте мне этот учебник, пожалуйста.
Очевидно, что из-за перестановки вводного слова «пожалуйста» правильность ответа не пострадала, но если здесь применить подход, применяемый в традиционных системах контроля знаний (а именно, посимвольное сравнение), ответ будет помечен как неверный. Это может привести к неправильному пониманию студентом данной темы.
Теперь посмотрим, как будут выглядеть синтаксические деревья ответа студента и ответа преподавателя. Как было сказано выше, для получения синтаксического дерева используется анализатор ABBYY Compreno.
Дайте мне, пожалуйста, этот учебник.
Дайте сказуемое
├ мне косвенное дополнение
├ пожалуйста частица
└ учебник прямое дополнение
└ этот согласованное определение
Дайте мне, пожалуйста, этот учебник.
Дайте сказуемое
├ мне косвенное дополнение
├ учебник прямое дополнение
│ └ этот согласованное определение
└ пожалуйста частица
Как мы видим, данные синтаксические деревья отличаются лишь расположением веток, что не влияет на работу алгоритма сравнения.
Теперь предположим, что студент ввёл ответ с верными словами, но с некорректным для русского языка порядком слов:
Дайте учебник мне, пожалуйста, этот.
Дерево для этого ответа уже будет другим:
#субстантиватор подлежащее
├ Дайте сказуемое
│ ├ учебник прямое дополнение
│ └ мне косвенное дополнение
├ пожалуйста частица
└ этот согласованное определение
Сравнение этих деревьев вернёт отрицательный результат. Однако студент правильно написал все слова, поэтому ему может быть присвоена половина от максимального балла за ответ. В будущем, когда будет создана подсистема корректировки курса, в таких случаях туда будет отправляться информация о том, что студент выучил предложенные слова, однако не может правильно составить предложение (ошибка неверный порядок слов). И подсистема должна будет скорректировать курс так, чтобы увеличить количество упражнений на правильный порядок слов и уменьшить количество упражнений на изучение новых слов.
В упражнениях этого типа преподавателю не требуется вводить верный ответ. Он может быть сгенерирован машиной. Преподавателю нужно лишь указать форму, в которую будут склоняться слова. Формой может быть число или падеж. Для прилагательных может быть ещё и род. Алгоритм генерации правильного ответа на задания данного типа таков:
После генерации правильного ответа нужно провести синтаксический анализ ответа студента. После этого происходит сравнение синтаксических деревьев по алгоритму, описанному в пункте 4.1.
Также, студенту нужно вернуть текстовое представление правильного ответа. Оно получается по следующему алгоритму:
При реализации данного алгоритма проверки пришлось немного изменить алгоритм склонения из предыдущего типа. Причина этого кроется в том, что при постановке слова во множественное число не всегда соблюдается согласование слов. Об этом подробнее говорилось при описании данного типа. Чтобы обойти данную проблему, было введено такое понятие как форма для зависимых слов. Теперь при склонении словосочетаний зависимым словам может присваиваться форма, отличная от той, которая присваивается главному слову.
Алгоритм генерации правильного ответа выглядит следующим образом:
В упражнениях этого типа преподаватель вводит модель, которая анализируется системой. Модель, фактически, показывает, как преобразовать вопрос в ответ. Мы выделяем следующие виды преобразований:
Смысл этих преобразований был рассказан в пункте 2.2. Здесь мы подробнее остановимся на алгоритмах данных преобразований. Данные алгоритмы должны последовательно применяться к исходному предложению. В результате их работы должен получаться верный ответ.
Для выявления необходимых преобразований используются два синтаксических дерева: дерево модели вопроса (ДМВ) и дерево модели ответа (ДМО). В результате работы каждого из приведённых ниже алгоритмов получается список преобразований данного типа. После создания списка преобразований очередного типа, происходит преобразование ДМВ в соответствии с выявленным списком.
Для того чтобы просклонять слова в скобках, требуется сначала определить форму, в которую их нужно ставить. Так как мы работаем над именной частью русского языка, формой этой будет число и падеж. Для определения нужной формы сначала выделяется главное слово в скобках (это слово, которое не имеет родителя). Если таких слов несколько, то берётся первое из них. Далее в ДМО ищется слово с такой же нормальной формой, как у главного слова из скобок. При нахождении такого слова создать правило склонения слов в скобках, в котором будет содержаться падеж и число этого слова. Также, после этого нужно просклонять слова в скобках в запомненную форму. Пример:
Вы смотрите фильм? (программа «Новости»)
Нет, я смотрю программу «Новости».
Главным словом в скобках является слово «программа». В ДМО оно стоит в винительном падеже единственного числа. Следовательно, слова из скобок нужно ставить в эту форму. После работы алгоритма исходное предложение будет выглядеть так:
Вы смотрите фильм? (программу «Новости»)
А в списке правил преобразования будет одно правило, предписывающее склонять слова из скобок в форму единственного числа винительного падежа.
Для того чтобы определить, слова с какими синтаксическими функциями требуется удалить из предложения, нужно сравнить каждую ветку ДМВ с каждой веткой ДМО. При отсутствии какой-либо ветки формируется правило удаления этой ветки. В правиле содержится лишь синтаксическая функция удаляемого слова. При этом следует учитывать, что при ответе на вопросы меняется форма местоимений. Также удаляются все знаки препинания, отсутствующие в ДМО.
Проиллюстрируем это на примере:
Вы смотрите фильм? (программу «Новости»)
Нет, я смотрю программу «Новости».
Модель вопроса состоит из двух предложений, соответственно в ней два корня. Проверяем наличие первого корня («смотреть») в ДМО. Затем проверяем наличие слова «вы» в ДМО. Его там нет, но есть замена для него слово «я». Значит слово «вы» не должно удаляться. Теперь проверяем наличие слова «фильм». Оказывается, что его нет в ДМО, поэтому формируется правило, что из вопроса требуется удалять прямое дополнение (коим и является слово «фильм»). Вся ветка, начинающаяся со слова «программа» присутствует в ДМО. Кроме прямого дополнения нужно удалять ещё знак вопроса и скобки, которые также отсутствуют в ДМО.
В результате получается следующее:
Вы смотрите программу «Новости»
Эта операция аналогична удалению, только здесь алгоритму предстоит добавлять в ДМВ слова из ДМО, которые пока отсутствуют в ДМВ. Покажем это на примере. Сейчас в ДМВ отсутствуют слово «Нет» и знаки препинания: запятая и точка. Слово «Нет» присоединяется к слову «смотрите». Ему назначается синтаксическая роль частица. Запятая вставляется после слова с синтаксической ролью частица. Точка вставляется в конец предложения. В результате исходное предложение будет выглядеть так:
Нет, Вы смотрите программу «Новости».
Этот этап выполняется, если в данном упражнении происходит смена вопроса на ответ, либо утвердительного предложения на вопросительное. В этом случае происходит замена местоимений первого лица на второе и наоборот. Следует отметить, что в результате работы этого правила может получиться несколько вариантов ответа. Рассмотрим наш пример.
В данном случае нужно заменять слово «Вы» на местоимение первого лица: местоимение «мы» или местоимение «я». При этом также требуется склонять главный для местоимения глагол в нужную форму. В результате проведённой замены мы получим два ответа:
Нет, я смотрю программу «Новости».
Нет, мы смотрим программу «Новости».
Эти ответы выглядят как правильные, однако если взглянуть на получившееся дерево, мы заметим, что оно некорректно:
смотрю
├ нет
└ я
программу
└ Новости
смотрим
├ нет
└ мы
программу
└ Новости
Под перестроением дерева понимается восстановление правильного вида дерева. Здесь происходит сравнение текущего дерева с ДМО. В случае каких-либо несоответствий формируется правило, устраняющее их.
Для данного примера таким несоответствием является то, что прямое дополнение сейчас не присоединено к сказуемому. Создаётся правило, исправляющее данную ситуацию:
смотрим
├ нет
├ мы
└ программу
└ Новости
В результате мы получаем полностью идентичное ответу дерево. После всех преобразований у нас формируется список правил, применяя которые мы можем преобразовывать и другие вопросы из упражнения.
Рассмотрим, как будет преобразован следующий вопрос:
Они строят магазин? (больница)
Первое правило заставляет алгоритм склонять слово «больница» в винительный падеж:
Они строят магазин? (больницу)
Следующее правило говорит о том, что должны быть удалены прямое дополнение («магазин»), а также вопросительный знак и скобки:
Они строят больницу
Далее вставляются слово «Нет» и знаки препинания: точка и запятая:
Нет, они строят больницу.
Далее должна происходить замена слов, однако в данном случае она не требуется, так как в нашем примере нет местоимений первого или второго лица. Поэтому следующим шагом формируется окончательное дерево решения:
строят
├ Нет
├ они
└ больницу
Большим недостатком разработанных алгоритмов является возникновение ошибок при отклонении от модели задачи. Например, если с той же моделью попробовать преобразовать предложение «Они играют в футбол? (баскетбол)», то получится ответ: «Нет, они играют баскетбол», так как предлог «в» не предусматривается моделью. Он будет удалён вместе с дополнением «футбол».
Также, в заданиях «Ответить по модели» не могут употребляться разные предлоги. То есть, к примеру, в Упражнение 1 мы не можем вставить выделенный вопрос:
Упражнение 1.
Раскройте скобки по модели.
Модель: Я люблю гулять (город) Я люблю гулять по городу.
Четвёртый вопрос будет обработан неверно. Система вернёт ответ: «Луиза зашла по другу», что, конечно, неверно.
По тем же причинам нельзя в одном задании типа «Ответить по модели» использовать разные вопросительные слова.
Чтобы устранить проблемы, вызванные отклонениями от модели, нужно накапливать в системе модели предложений и их возможных изменений. Также требуется разработать механизм, который будет определять принадлежность того или иного предложения определённой модели. Это позволит постепенно уйти от необходимости задавать модель в некоторых упражнениях (например, в упражнениях, в которых требуется ответить на вопрос, используя слова из скобок). Также это позволит сделать общение с системой более естественным.
Что касается проблем связанных с разными предлогами, то здесь пока сложно что-то исправить. Ведь выбор правильного предлога требует понимания контекста, а как было показано в главе 3, современные лингвистические процессоры пока не могут этого позволить. Данная проблема будет одним из направлений моего исследования в аспирантуре.
Итак, исходя из целей работы, сделаем выводы. Имеющиеся на рынке системы автоматизированного обучения не упрощают преподавателям задачу обучения студента, а скорее усложняют её за счёт несовершенства применяемых в них средств контроля знаний. С целью снять имеющиеся в таких системах ограничения была начата разработка системы КЛИОС, составной частью которой является интеллектуальный модуль проверки упражнений, который является предметом данной работы.
В ходе проведённой работы были проанализированы имеющееся на рынке лингвистическое программное обеспечение. Исходя из результатов тестирования лингвистических процессоров, были выбраны два наиболее подходящих для решения поставленной задачи.
На их основе были разработаны алгоритмы проверки упражнений на именную часть русского языка. Кроме проверки, система может сама генерировать правильный ответ на упражнения большинства рассмотренных типов. Это позволяет повысить эффективность труда преподавателя и даёт возможность использовать систему в качестве тренажёра для самостоятельного обучения. Также, как было показано в четвёртой главе, результаты проверки упражнений могут быть использованы для корректировки личного плана обучения студента.
Результаты работы применены в системе КЛИОС и используются преподавателями русского языка кафедры РКИ на подготовительных курсах. В дальнейшем работа будет развиваться, добавятся упражнения по системе глагола.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(обязательное)
Development of knowledge control module for intelligent training system “Russian as Foreign”
Студент гр. 8ВМ15 |
__________________ |
__________________ |
Д. И. Фирстов |
Консультант кафедры ОСУ |
|
|
|
Консультант-лингвист |
|
|
|
Web-based education (WBE) is currently a hot research and development area. Benefits of Web-based education are clear: classroom independence and platform independence. Web courseware installed and supported in one place can be used by thousands of learners all over the world that are equipped with any kind of Internet-connected computer or other device. Thousands of Web-based courses and other educational applications have been made available on the Web within the last five years [1]. The problem is that most of them are nothing more than a network of static hypertext pages. A challenging research goal is the development of advanced Web-based educational applications that can offer some amount of adaptivity and intelligence. These features are important for WBE applications since distance students usually work on their own (often from home). An intelligent and personalized assistance that a teacher or a peer student can provide in a normal classroom situation is not easy to get. In addition, being adaptive is important for Web-based courseware because it has to be used by a much wider variety of students than any “standalone” educational application. A Web courseware that is designed with a particular class of users in mind may not suit other users.
Tomsk Polytechnic University has over ten-year experience of teaching foreign students. According to the TPU website 2100 students from 40 countries of the world are studying in TPU at present [3]. Foreign students vary by the level of language skills. There are a very small number of students who speak Russian language. Since education at TPU is mainly in the Russian language, the Department of Russian as Foreign of Institute of International Relations and Language Communications performs special courses where students can learn the Russian language.
Students come from different countries and have different national characteristics. Because of this training requires an individual approach, that due to the large number of students is difficult to provide. For this reason it was decided to create in Tomsk Polytechnic University automated training system for teaching Russian as a foreign language.
The creation of this system can improve the effectiveness of teaching Russian. The system is developed as a web-oriented, so students can use it from the home or any other place where there is access to the Internet. Automated and intelligent control of knowledge will allow them to work on their language skills independently, without the direct participation of a teacher. Also the system can be used in classroom activities as an additional teaching material.
Web-based Adaptive and Intelligent Educational Systems (AIES) are not an entirely new kind of systems. Historically, almost all Web-based AIES inherit from two earlier kinds of AIES: intelligent tutoring systems (ITS) and adaptive hypermedia systems. Most of adaptive and intelligent technologies applied in Web-based AIES systems were directly adopted from either the ITS area or the adaptive hypermedia area. As long as Web-based AIES research gets more mature, it will produce original technologies inspired by the Web context. At least one of these Web-inspired technologies could already be identified (model matching). This section provides a review of existing technologies grouped by its origin. For each technology we list existing Web-based AIES and projects, which implements variations of this technology and discuss the ways to implement it on the Web.
Intelligent tutoring systems is a traditional area of research that investigates problems of developing AIES. The goal of various ITS is the use the knowledge about the domain, the student, and about teaching strategies to support flexible individualized learning and tutoring. A review of existing intelligent tutoring systems performed by the Peter Brusilovsky in 1990 helped to identify three core ITS technologies: curriculum sequencing, intelligent analysis of students solutions, and interactive problem solving support. All these technologies were implemented in numerous ITS. Web-based AIES that use traditional ITS technologies are usually called Web-based ITS. First Web-based ITS were reported in 1995-1996. These systems still constitute a rather small stream inside the ITS area.
The goal of the curriculum sequencing technology (also referred to as instructional planning technology) is to provide the student with the most suitable individually planned sequence of knowledge units to learn and sequence of learning tasks (examples, questions, problems, etc.) to work with. In other words, it helps the student to find an “optimal path” through the learning material. The classic example is the BIP system. There are two essentially different kinds of sequencing: active and passive. Active sequencing implies a learning goal (a subset of domain concepts or topics to be mastered). Systems with active sequencing can build the best individual path to achieve the goal. Passive sequencing (which is also called remediation) is a reactive technology and does not require an active learning goal. It starts when the user is not able to solve a problem or answer a question (questions) correctly. Its goal is to offer the user a subset of available learning material, which can fill the gap in student's knowledge of resolve a misconception. For active sequencing systems, it makes sense to distinguish systems with fixed and adjustable learning goal. Most of existing systems can guide their students to the fixed learning goal the whole set of domain concepts. A few systems with adjustable learning goal let a teacher or a student to select a subset of the whole set of concepts as the current learning goal.
In most of ITS systems with sequencing it is possible to distinguish two levels of sequencing: high and low. High-level sequencing or knowledge sequencing determines next learning subgoal: next concept, set of concepts, topic, or lesson to be taught. Low-level sequencing or task sequencing determines next learning task (problem, example, test) within current subgoal. High and low level sequencing are often performed by different mechanisms. In many ITS systems only one of these two mechanisms are intelligent, for example, a lesson is selected by a student, while learning tasks within this lesson are adaptively selected by the system. Some systems can only manipulate the order of task of one particular kind: usually problems or questions. In this case it could be also called problem or question sequencing.
In our system curriculum sequencing is planned but not realized now. But knowledge control mechanism allows finding the gaps in students knowledge. This information can be used for sequencing in a future.
In [1] is identified three problem solving support technologies: intelligent analysis of student solutions, interactive problem solving support, and example-based problem solving support. All these technologies can help a student in a process of solving an educational problem, but they do it by different ways.
Intelligent analysis of student solutions deals with students final answers to educational problems no matter how these answers were obtained. To be considered as intelligent, a solution analyzer has to decide whether the solution is correct or not, find out what exactly is wrong or incomplete, and possibly identify which missing or incorrect knowledge may be responsible for the error (the last functionality is referred as knowledge diagnosis). Intelligent analyzers can provide the student with extensive error feedback and update the student model.
This technology is realized in our system. Russian part of this work is describing how this mechanism works, its algorithms and linguistic processors that was used in it.
Interactive problem solving support is a more recent and a more powerful technology. Instead of waiting for the final solution, this technology can provide a student with intelligent help on each step of problem solving. The level of help can vary: from signaling about a wrong step, to giving a hint, to executing the next step for the student. The systems which implement this technology (often referred to as interactive tutors) can watch the actions of the student, understand them, and use this understanding to provide help and to update the student model.
Our system can solve exercises itself. Therefore it can support student when he doing those exercises. But now this support is not realized.
The example-based problem solving technology is the newest one. This technology is helping students to solve new problems not by articulating their errors, but by suggesting them relevant successful problem solving cases from their earlier experience (it could be examples explained to them or problems solved by them earlier).
In our system teacher can provide examples of exercises for a student. It can help him in problem solving.
In the area of traditional ITS, the interactive problem solving support technology absolutely dominates. Interactive problem solving support is an ultimate goal of almost any ITS, while intelligent analysis of student solutions is often considered imperfect (and example based problem solving support is too rare to consider as a competitor). Again, the Web context changes the situation. Both intelligent analysis of student solutions and example based problem solving support appears to be very natural and useful in Web context. Both technologies are passive (works by student request) and can be relatively easy implemented on the Web using a CGI interface. Moreover, an old standalone AIES, which uses these technologies, could be relatively easy ported to the Web by implementing a CGI gateway to the old standalone program. It is not surprising that these technologies were among the first implemented on the Web. An important benefit of these two technologies in the Web context is their low interactivity: both usually require only one interaction between browser and server for a problem solving cycle. This is very important for the case of slow Internet connection. These technologies can provide intelligent support when a more interactive technology will be hardly useful. Currently, these technology dominates in Web context over more powerful and interaction hungry interactive problem solving support.
Adaptive hypermedia is a relatively new research area. Adaptive hypermedia systems apply different forms of user models to adapt the content and the links of hypermedia pages to the user. We distinguish two major technologies in adaptive hypermedia: adaptive presentation and adaptive navigation support. Education always was one of the main application areas for adaptive hypermedia. A number of standalone (i.e., non-Web-based) adaptive educational hypermedia systems was built between 1990 and 1996. First Web-based AIES that use adaptive hypermedia technologies were reported in 1996. Since that the Web has become the primary platform for developing educational adaptive hypermedia systems.
The goal of the adaptive navigation support technology is to support the student in hyperspace orientation and navigation by changing the appearance of visible links. Adaptive navigation support (ANS) can be considered as a generalization of curriculum sequencing technology in a hypermedia context. It shares the same goal to help students to find an “optimal path” through the learning material. At the same time, adaptive navigation support has more options than traditional sequencing: it can guide the students both directly and indirectly. In a WWW context where hypermedia is a basic organizational paradigm, adaptive navigation support can be used very naturally and efficiently. There are several known ways to adapt the links.
The three ways that are most popular in Web-based AIES are direct guidance, adaptive link annotation, and adaptive link hiding. Direct guidance implies that the system informs the student which of the links on the current page will drive him or her to the “best” page in the hyperspace (which page is “best” is decided on the basis of student's current knowledge and learning goal). Often, if a link to the next best page is not presented on the current page, the system can generate a dynamic “next” link. As we can see, adaptive navigation support with direct guidance is almost equivalent to curriculum sequencing technology. There are some differences though (in addition to the different origin). A page suggested by a direct guidance technology is always a page of the existing hyperspace. The student usually could reach this page in one or several steps without the system guidance. The guidance just helps the student to realize that this page is “best” and to get there fast. In an ITS with adaptive sequencing a “page” with next best task or presentation could be completely generated from systems knowledge, thus the student has no ways to get to this material others than using sequencing. Also, direct guidance usually applies a one level sequencing mechanism (in comparison with two-level sequencing in most ITS): the best page is simply selected from the set of acceptable pages using some heuristics. However, the difference between these two technologies starts to disappear in the Web context. Web-based ITS systems are naturally moving to hypermedia platform representing at least some part of the learning material as a hyperspace. As long as some type of educational material (presentations, problems, and questions) is represented as a set of nodes in hyperspace, sequencing of it becomes indistinguishable from direct guidance. To stress this similarity we have represented adaptive sequencing and adaptive navigation support with direct guidance in the same column of the tables.
Another popular technology is hiding and disabling (a variant of hiding that keeps link visible but does not let the user to proceed to the page behind the link if this page is not ready to be learned).
The goal of the adaptive presentation technology is to adapt the content of a hypermedia page to the users goals, knowledge and other information stored in the user model. In a system with adaptive presentation, the pages are not static, but adaptively generated or assembled from pieces for each user. For example, with several adaptive presentation techniques, expert users receive more detailed and deep information, while novices receive more additional explanation.
The last group of technologies is probably the most exciting one since these technologies has almost no roots in pre-internet educational systems. Currently this group include only one technology. In [1] this technology is called student model matching (or simply model matching) because the essence of this technology is the ability to analyze and match student models of many students at the same time. Traditional adaptive and intelligent educational systems have no opportunity to explore this technology since they usually work with one student (and one student model) at a time. On the contrary, in the WBE context this opportunity happens naturally because student records are usually stored centrally on a server (at least for administrative reasons). It provides an excellent framework for developing various adaptive and intelligent technologies that can make some use of matching student models of different students. There are two examples of student model matching, which are called adaptive collaboration support and intelligent class monitoring. These examples quite differ from each other and probably could be considered as different technologies within the student model matching group.
The goal of adaptive collaboration support is to use systems knowledge about different students to form a matching group for different kinds of collaboration.
Intelligent class monitoring is also based on the ability to compare records of different students. However, instead of searching for a match, it searches for a mismatch. The goal is to identify the students who have learning records essentially different from those of their peers. These students may be different from others in many ways. They could be progressing too fast, or too slow, or simply have accessed much less material than others. In any case, these students need teacher's attention more than others to challenge those who can, to provide more explanations for those who cant, and to push those who procrastinate. In a regular classroom the teacher can simply track students attendance and activity to find students who need special attention. In a Web-based classroom, the teacher in the best case has only logging data tables with numbers which are very hard to grasp. At the same time, the need to identify a small subset of students who need help more than others is more important. In WBE context, communication between teacher and students is usually more time consuming and a distance teacher simply can't individually address more than a small subset of the class.
In this work modern technologies of e-learning were described. It was shown how these technologies are used in teaching students the Russian language. Applying of these technologies allows improving effectiveness of teachers work and students learning.
In the end it can be concluded that the technologies aimed at the analysis of student answers in our system are quite well developed. In the same time the technologies that enable the system to adapt to the student require further development. It will cause improvement in Russian language teaching.