Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
1. Определение понятия "информационные технологии". Краткая история развития ИТ. Причины создания ИТ.
ИТ - совокупность методов, процессов и программно-технических средств, интегрирующих с целью сбора, обработки. хранения, распространения и использования информации в интересах пользователя.
Телекоммуникации - средства, позволяющие вести обмен информацией на расстоянии. а также процесс передачи информации по линии связи.
Информационные и телекоммю технологии - технологии, возникшие в результате сочетания возможностей ПК и телекоммуник. техники передавать данные на расстоянии.
5 этапов развития ИТ:
1. с момента возникновения общества до 1-й пол. XIX века ("ручная технология") Инструментарий: перо, чернила. Коммуникации осуществляются ручным способом.
2. 2-я пол. XIX в. ("механическая технология"). Инструментарий: пишущая машинка, телефон, телеграф.
3. 40-60-е гг. XX в. ("электр. технология"). Инструментарий: электронаая пишущая машинка, портативный магнитофон. ЭВМ.
4. н. 70 - сер. 80-х гг. XX в. ("электронная технология"). инструментарий: ЭВМ, создаваемые на их основе АСУ (автоматизированные системы упр-я).
5. сер. 80-х - наши дни ("комп. технологии"). Инструментарий: ПК, комп. сети.
Причины:
1-я группа - технические достижения, которые способствовали появлению ИТ:
1) появление высокоскоростных ПК с большой внутр. и внешн. памятью.
2) разработка телекомю сетей.
3) разработка звук. плат, видеоплат, позвол. обрабатывать мультимедийную инф-ю;
4) создание мультимедиа процессоров;
5) разработка средств электронной связи (модемов);
6) появл. электронной оргтехники (принтеров...).
2-я группа - ПО (программное обеспечение)
1) новые сист. и инстр. средства:
а) сетевые операционные системы, программы-оболочки, утилиты
б) новые сист. программирования (языки)
2) прикладные системы обработки информации: информационно-поисковые системы, системы автоматич. аннотирования, редактирования и индексирования текста, эксперт. с-мы, с-мы искусственного интеллекта и др.
3-я группа - ИО (информационное обеспечение):
1) создание баз и банков данных и знаний
2) системы управления базами данных
3) электронные хранилища информации (электр. словари и т.д.)
4) e-mail
5) инет
2. Цель создания, основные черты ИТ. Примеры ИТ в лингвистике и в обучении.
Цель создания ИТ:
max информатизация и комп-ция соврем. общ-ва, обеспечив. знач. рост производительности труда
удовлетворения информационных запросов всех членов общ-ва
непрерывность повышения знаний и навыков работы самым совр. оборудованием
Основные черты:
комп. технологии
безбумажные технологии
доступность
интерактивность (диалог. режим обмена инф-ей)
альтернативность (возможность выбора ИТ на основе анализа некоторых аналогичных)
формализованность (т.е. возможность приведения инф. процессов к абстракт. виду и их записи на маш. языках)
открытость (возможность введения в инф. систему новых компонентов)
безопасность (мал. напряжение)
Примеры информационных технологий в лингвистике:
а) автоматическое создание словаря, слов. текстов какого-либо автора
б) определение автора неизвестного текста
в) опр-ние значения многозначного слова
г) автоматич. синтаксич. анализ предложения
д) индексирование текста (опр-ние основного содержания)
е) составление аннотации и реферата текста (авт. чтение и распознавание текста)
ж) перевод текста
з) порождение или построение нов. текста
и) понимание текста, произнесённого вслух
к) порождение или синтез чел. речи
Примеры в обучении языкам:
а) автомат. обучающие системы (ешко)
б) дистанционное обучение с помощью Internet
в) использование электронных учебников, словарей, энциклопедий
3. Структура ИТ. Информация: определения, виды. Методы получения и использования информации.
Структура:
теоретические основы ИТ
методы решения задач (метод моделирования)
средства решения задач использ. ИТ
а) аппарат. средства
б) програм. ср-ва
Теоретические основы ИТ сост. важнейшие понятия и законы информатики.
Информатика - наука о законах и методах получения, хранения, распространения и использования инф-и в естественных и искусств. системах с помощью ПК.
Информация - определённым образом связанные сведения, данные, понятия, отражённые в нашем сознании и изменяющие наше представление об окруж. мире.
Сообщение - форма представления инф-и в виде текста, речи. изображения, графика, таблиц.
Данные - результаты наблюдения над объектами или явлениями, кот. по каким-то причинам не использ., а только хранятся. Когда данные начинают исп. в каких-либо целях, они превращ. в информацию.
Виды информации:
I. по отношению к окружающей среде
1) входная (инф-я, кот. информ. сист. воспр. от окруж. среды)
2) выходная (инф-я, кот. сист. выдаёт в окруж. среду)
3) внутрисистемная (хран. и исп. внутри с-мы)
II. по изменчивости:
1) постоянная
2) переменная
3) смешанная
III. по полноте:
1) избыточная
2) достаточная
3) недостаточная
IV. по предметной области: научная, справочная, статистич., лингвистич....
Лингвистическая информация - множество опред. обр. связанных сведений, данных, понятий о языке и правилах его функционирования.
В зависимости от вида информации выделяют разн. типы инф-ки. Различают биолог., лингвист., соц.
Лингвистическая инф-ка - наука, изуч. законы и методы получ., хранения, распростр-я и исп-нмя лингв. инф-ии с помощью компьютеров.
Методы получения и исп-я инф-ии:
1. эмпирические м-ды (полученные опыт. путём) (наблюдение, сравнение, измерение, эксперимент, интервью, тестирование)
2. теоретич. (теории, гипотезы)
- восхождение от абстракт. к конкретному (получение знаний о с-ме на основе знания о его проявлениях в сознании, мышлении)
- формализация (получение знаний о с-ме с помощью формул, искусств. знаков)
- виртуализация ( с помощью создания искусств. среды)
3. эмпирико-теоретич. (абстрагирование - замена системы её моделью,
анализ - разъединение системы на подсистемы,
синтез - соединение подсистем в системы,
индукция - получений знаний о системе по знаниям о подсистемах,
дедукция - знание о подситст по знаниям о сист.
эвристика - знание по наблюдению, опыту
моделирование - использование приборов
ист. метод - знание с учётом предысторий
визуализация
мониторинг)
4. Понятие об информационных процессах и информациооных системах.
Информ. процесс - процесс, в результ. кот. осущ. приём, передача, переработка и использование информации.
Инф. процессы могут протекать не только в чел. обществе, но и в раст. и животном мире.
Инф. система - взаимосвязанная совокупность средств методов и персонала, участв. в обработке данных (банкомат, оплата за услуги и т.д.)
Система - любой объект, к. одновременно рассматр. и как единое целое, и как совокупность разнородных объектов, объединённых для достижения определённого результата.
Средства - аппаратн. и программ. средства, метод - метод моделирования, персонал - пользователь, потребитель.
Существуют 2 разовидности инф. систем:
1) разомкнутые информационные системы - с-мы, в кот. получаемая потребителем инф-я исп. произвольно, а после её получения в с-му ничего не поступает (комп. библ., справочная с-ма)
2) замкнутые инф. сист. - с-мы, в кот. сущ. тесная связь между пользователем и с-мой, осуществляющ. с помощью введения в структуру инф. с-мы канала обратной связи (оплата за моб. связь, продажа авиа- и ж/д билетов)
В инф. с-мах протекают сл. процессы:
1. ввод инф. из внешних и внутр. источников
2. обработка и представление инф-и в удобном виде
3. ввод и хранение инф-и
4. ввод инф. от потребителя через канал в обрат. связи (для замкнутых с-м)
Значение инф. систем:
1. освобожд. работников от рутинной работы за счёт её автоматизации
2. обеспеч. достоверность инф-и
3. обеспечение более рацион. орг-ю и обработку инф. на ПК.
Структура инф. систем:
1. подс-ма инф. обеспечения (совместимость всей инф-и, средства и м-ды её классификации)
2. подс-ма тех. обеспечения (ПК устройства сбора, хранения и вывода инф-и и линии связи)
3. подс-ма программного обеспечения (прикладные программы)
4. подс-ма матем. обес-я (сов-ть мат. модулей, алгоритмов)
5. подс-ма организ. обес-я (сов-ть документов, отр. правила обращения пользователей с тех. и программными средствами)
6. подс-ма правового обеспечения (правовые нормы)
16. Моделирование как основной метод решения задач ИТ. Общие принцпы решения лингвистических задач методом моделирования.
Суть метода моделирования заключ. в том, что для решения к.-либо задачи строится модель некоторого объекта, процесса или явления.
Модель - формализ. описание объекта, процесса или явления, выраж. конечным набором предложений к.-либо языка, матем. формулами, графиками, таблицами, спец. знаками или схемами.
Св-ва моделей:
1. м-ль выступает в кач-ве упрощённого аналогп изуч. объекта
2. м-ль не должна быть сложнее своего оригинала
3. метод моделирования должен быть более эконом. по сравнению с др. м-ми
4. д. быть предельно простой и не содержать противоречий
5. должна иметь универсальный характер, позволяющий использовать её для изуч. др. подобных объектов
6. должна отражать наиболее существенные черты реального объекта
Виды моделей:
1. структур. модели (служ. для изучения внутр. строения некот. объекта)
2. функц. м-ли (позволяют изучить поведение объекта или процесса
3. динамические м-ли (позв. объяснить явление, процесс в динамическом развитии)
В лингвистической информации чаще всего исп. функц. модели.
Этапы решения лингвистической задачи методом моделирования:
1. Постановка задачи
а) описание решаемой задачи
б) формирование цели моделирования
в) анализ оригинала м-ли объекта (выд. такие формальные признаки, которые бы легко ?обознать? ПК)
2. разработка модели
а) созд. алгоритм реш. задачи
Алгоритм - точное предписание о выполнении в определённом порядке некоторой последовательности действий (физ. или умств.), приводящее к решению некоторой типовой задачи.
Способы записи алгоритмов:
1) словесный
2) графический
3) табличный
4) словесно-графич. (чаще исп. для записи алгоритмов при решении лингвистических задач)
3. проведение комп. эксперимента (связано с созданием комп. программы на какой-либо алгоритм, отладка этой программы)
4. анализ результатов работы комп. модели (в процессе выявляются логические ошибки в р-те самой комп. программы и алгоритма)
5. Краткая история возникновения и развития ПК. Двоичная система исчисления
История создания комп-в
ЭВМ - электроное устройство или с-ма, способная выполнять задания чётко определённой последовательности действий вычислений.
Технологические достижения способствовали появлению ЭВМ:
1) изобретение электр. переключателей в виде электр. ламп.
2) разработка универс. м-да кодирования информации в виде двоичной системы исчисления.
3) создание модулей искусственной памяти
1946. (США) - первая ЭВМ ЭНИАК (интегратор и калькулятор)
1949 (Великобритания) - 1-я ЭВМ с искусственной памятью ЭДСАК
БЭСМ (Россия) - первая ЭВМ
Тех. прогресс позв. значительно изм. ЭВМ
1. размер ЭВМ значительно уменьшился
2. снижение стоимости
3. значительно упростилась процедура пользования
4. в миллионы раз увелич. быстродействие ПК и объём памяти
5. усовершенств. электр. детали:
- компьютеры 1-го поколения (40-60-е гг.) - ламповые
-комп-ы 2-го пок. (60-65-е гг.) переход к полупроводным элемантам и транзисторам
- комп-ы 3-го пок. (65-75-е гг.) исп. интегральные микросхемы
- комп-ы 4-го пок. (75-85-е гг.) раб. на базе микропроцессоров и стан. доступными рядовым пользователям
- комп-ы 5-го поколения (85 - наши дни) раб. на сверхбольших интегральных схемах.
ПК - ЭВМ универс. назначения, рассчитання на одного пользователя (1976 в США ПК "Apple")
1981 - IBM созд. 1-й ПК IBM PC (передача телеком-и и др.)
1984 - Macintosh (для работы с графикой, Apple Corporation)
Двоичная с-ма хранения данных
Вся инф-я представлена в ПК (его памяти) в двоичном коде. Это связано с тем, что в таком виде её можно легко технически смоделировать.
Например, в виде электронных сигналов (если по проводу идёт ток, то передаётся единица, если нет - 0; если магнитное поле некоторого участка поверхности магнитного диска имеет одно напряжение, то 1, если другое - 0; если определённый участок поверхности оптического диска отражает лазерный луч, то на нём записан 0, нет - 1)
Байт - минимальная адресная единица памяти комп-а.
Для хранения текстовой инф-и была создана код. таблица ASCII, по которой 1 символ занимал 1 байт.
1 байт = 8 бит (255+0 символов)
0-127 - осн. символика (раскладка клавиатуры)
128-255 - кириллица и др.
UNICODE - 1 символ заним. 2 байта, что позволяет закодировать 65536 символов.
Кажд. графическое изображение состоит из мельчайших точек, кажд. из которых можно отцифровать, используя лин. координаты и цвет.
Метод кодирования звука основан на том, что любой слож. звук можно разложить на последовательность простейших гармонич. сигналов разных частот, каждый из которых представляет собой прав. синусоиду и описан числ. параметрами.
Видео = звук + графика (большой объём)
Сегодня на ПК может храниться и обрабатываться в двоичном виде любой тип инф. (числа, текст, графика. звук, видео - мультимедийная инф.)
1 КБ = 1024 байта, соответственно 1 МБ, ГБ, ТБ.
6. Функциональные узлы ПК: устройства ввода информации.
PC = Hardware (аппарат. ср-ва) + Software (программные ср-ва)
Существует 2 классификации устройств ПК:
1. с точки зрения структуры в ПК выд. конструктив. блоки: сист. блок, монитор, клавиатура, мышь.
2. с точки зрения выполнения комп-м функций можно выд. функц. узлы: устройства ввода, вывода, хранения, обработки.
Устройства ввода (эти устройства преобраз. различн. виды инф-и в цифровую (двоичную) форму)
3 группы:
1) устройства ввода инф. от чел-ка (клавиатура, координат. манипуляторы, сканер, сенсорный экран, микрофон, веб-камера
2) устр-ва ввода данных с др. вычислительных систем (модем)
3) устр-ва, обеспечивающие ввод инф. из устройств хранения данных (USB-порт, дисководы)
- клавиатура - устр-во для ввода текстовой инф-и (виртуальная клавиатура и др.)
- координантные манипуляторы позвол. на расстоянии управлять графическими объектами (мышь - 1984, механическая - оптическая - беспроводная - лазерная; трекболл в портативных комп-ах - трекпоинт - тачпад, джойстики)
- сенсорный экран - координат. устр-во, позвол. путём прикосновения управлять объектами или осуществлять ввод данных в ПК
- стилус - световое перо, к. исп. для управления устройствами с сенсорными экранами.
- сканер - устройство для оптич. ввода изображения в память комп-а. Если при помощи сканера вводится текст, то комп. восприним. его как картинку. Для преобразования такого граф. текста в обычный символьный формат, исп. прог-ы оптического распознавания символов (Fine Reader)
Виды сканеров:
1) ручные
2) роликовые (листопротяжные, лист движется мимо зафиксир. света)
3) планшетные (лист фиксируется, а движется луч света)
4) сканеры штрихкода (в магазинах)
5) барабанные (применяются в полиграфии)
6) трёхмерные
- дигитайзер - кодирующее устройство, позв. поточечно вводить в ПК двумер. сложную граф. инф. (чертежи, схемы большого формата)
- микрофон - устр-во для ввода звук. информ., подключается к звуковой карте, кот. преобраз. звук в звук. цифровую форма
- веб-камера исп. для альтернатив. ввода (для ввода изображений)
- графический планшет
7. Функциональные узлы ПК: устр-ва вывода инф.
Устройства вывода преобразуют инф. из двоичной формы в привычные для пользователя виды (текст, графика и т.д.)
1. устр-ва, кот. выводят инф. для пользователя (принтер, аудиос-ма, видеопроектор, монитор)
2. устр-ва. кот. выводят инф. на др. ПК (сетевая карта, модем)
3. на устр-ва хранения (дисководы, USB-порты)
Монитор вместе с видеокартой составляет видеоподсистему ПК. Все изобр-я формир. на видеокарте, а затем переносятся на экран.
Хар-ки монитора:
1) разрешающая способность - кол-во пикселейпо горизонтали и вертикали
2) палитра или цветопередача (16,7 млн позволяют различать VGA и 24 млн KGA)
3) частота развёртки (смена кадров)
4) размер (в дюймах по диагонали) (17,19 дймов - самые распространённые)
Типы мониторов:
1) с электроннолучевой трубкой
2) ЖК-мониторы (компактность, экологически чистые, потребл. на зо% меньше электроэнергии - экологичны, но неадекватно отражают цвета)
3) плазменные (изобр-е не искажается в хорошо освещ. помещении)
4) полимерные дисплеи - мониторы, использующие светоизлуч. полимерные материалы, толщ. - 2 мм
принтер - устр-во, кот. позвол. получить жёсткую копию инф.
По способу печати делятся:
1) матричные (печ. головка сост. из иголок - матрица и через красящую ленту отпеч. символ) (в кассах, в банках, дешёвые в исп.)
2) струйные (катриджы им. 4 цвета чернил - красный, синий, жёлтый, чёрный; печатающие головки имеют малые отверстия (сопла); под давлением частички чернил прох. через сопло, смеш., образ. нужные цвета; недостаток - чернила высых.)
3) лазерные (высокое кач-во печати; заправ. порошком, скорость - 40 стр./мин; частички порошка (тонера) под воздействием луча лазера вправл. в лист бумаги)
4) сублимационные (исп. в полиграфии, позволяют получить фотографическое кач-во печати; газеты)
Плоттер (графопостроитель) - устр-во, выполн. функции вывода граф. инф. (чертежи, схемы, карты) на бумагу большого формата А0, А1
Уст-ва связи с др. ПК (и к устр-вам ввода, и к устр-вам вывода)
Модем - устр-во, кот. исп. для преобразования цифровой инф-ии в электрич. сигналы и наоборот. Бывают внутренние и внешние.
Сетевой адаптер - устр-во, обеспеч. подключение комп-а к локальной сети
Дополнит. устр-ва:
- цифр. фото- и видеокамеры
- сот. телефоны
- плейеры
- TV-тюнер
8. Функциональные узлы ПК: устр-ва хранения инф.
Комп. имеет 2 раздела памяти - внутр. и внешн.
Внутр. память предст. в виде электр. схем, расположенных на материнской плате. Внешняя память - накопители инф-и (винчестер и др.)
Внутр. память делится на 2 части:
1) ПЗУ - постоянно запоминающее устройство (в неё при сборке комп-а на заводе запис. комплекс программ BIOS, к. осущ. тестирование всех устр-в и нач. загрузку операц. с-мы)
2) ОЗУ - оперативно запоминающее уст-во (быстродейств. кратковр. память, к. предназначена для хранения программ и данных, с кот. в данный момент работает пользователь, после выключения ПК её содержимое пропадает)
Размер оперативной памяти 1-2 ГБ
Внешняя память: венчестер (жёсткий магнитный диск, первый - середина 50-ых гг. IBM)
Осн. хар-ки:
1) ёмкость
2) плотность записи данных на квадрат. дюйм
3) скорость вращения магн. пластин
4) время доступа (6-10 сек)
Сущ. съёмные жесткие диски, кот. подсоедин. через USB-порт.
Съёмные носители инф.:
дискета (3,5 дюйм) (1,44 МБ) - стриммер (магнит. ленты) (200 ГБ, служат для хранения архива или создания больших резервных копий) - магнитно-оптич. диск (очень большого объёма, 1,5 ТБ)
Оптические носители - это устройства, кот. записывают и считывают инф. с помощью лазер. измерения.
CD-диск - инф. записывается только с одной стороны (размер - 120 мм, объём - 650, 700, 800 МБ):
- CD-ROM (только для чтения)
- CD-R (однократно записываемый)
- CD-RW (переписывемый)
DVD-диск (цифровой универсальный диск) (1995 - инф может записываться с одной или двух сторон). DVD-ROM, DVD-R, DVD-RW. По технологии записи различают:
1) однослойные односторонние (4,7 ГБ)
2) однослойные двухсторонние (9,4 Гб)
3) односторонние двухслойные (8,5 Гб)
4) двусторонние двухслойные (17 Гб)
Уже появились и разработаны следующие поколения оптич. носителей:
1) трёхслойные диски (300 ГБ)
2) ультрафиолет. накопители (одна сторона - 500 ГБ)
3) голографические диски (до 1 ТБ)
Флеш-память представлена в виде карт, периферий разных форматов, кот. исп. для карманных ПК, сотовых телефонов, цифр. аудиоплейеров и фотовидеокамер.
Для настольных ПК флеш-память многолика: в виде микросхем, брелков, маркеров (их часто называют флеш-диски, ёмкость до 32 ГБ)
9. Функциональные узлы ПК: устройства обработки информации
Устройства обработки информации (процессор, микропроцессор) осущ. операции по обработке инф-ции ("мозг" комп-а)
Микропроцессор представляет собой микросхему с огромным числом транзисторов, расположенных на кристалле кремния.
Размер - 3-4 см, 1971 - ф. Intel
Состоит из АЛУ (арифметическое и логическое устройство) служ. для обработки инф-ии. Часто называется ядром микропроцессора.
Вторая составляющая микропроцессора - сопроцессор - устр-во, ускоряющее работу микропроцессора при выполнении матем. вычислений.
КЭШ-память (3-я сост. м-ра) - высокоскоростная память, исп. процессором для врем. хранения инф-и. Она увеличивает производительность, т.к. хранит наиболее часто исползуемые данные и команды "ближе" к процессору, откуда их можно быстрее получить.
Бывают 2-х уровней (последние модели - 3 уровня)
УУ - устр-во управления прочими компонентами ПК (4-я сост. м-ра)
Основные хар-ки микропроцессора:
1) тактовая частота указ., сколько электр. импульсов (тактов) выраб. за 1 сек. тактовый генератор (1-4 ГГц)
2) тип м-ра (2-ядерный, 4-ядерный)
3) разрядность - кол-во разрядов или бит иф-и, к. микропроцессор берёт в разработку за один такт (32-, 64-разрядные)
4) быстродействие - кол-во операциё в сек.
комп. в сек. производит 10-100 млрд. операций.
За счёт чего может увелич. производительность ПК:
1) за счёт увелич. числа транзисторов, содержащихся в м-ре, что происх. за счёт уменьш. их размеров
2) за счёт параллельной обработки данных (2-ядерн, 4-ядерн.)
В будущем будут исп. молекулярные ПК, ПК на базе молекулярных ДНК, квантовые ПК.
10. Классификация компьютеров по уровню специализации, по размеру и по совместимости.
I. по уровню специализации ПК делятся на:
1) универсальные - кот. решают широкий круг задач
2) специализированные - предназначенные для решения конкретного круга задач (напрю, бортовые к-ры автомобилей, судов и самолётов; ПК, встроенные в бытовую технику, промышленные комп-ы)
3)граф. станции - специализированные ПК, предназначенные для работы с графикой. Исп. при создании киновидеофильмов, подготовка рекламной продукции.
4) файл. серверы - специализированные ПК, объедин. комп-ы предприятия в одну локальную сеть
5) сетевые серверы - комп-ы, обеспечивающие передачу инф-ии между различными участниками сети Интернет.
Грань между специализированными и универсальными ПК порой незначительна.
II. по размеру:
1) настольные (широко распространены)
2) портативные модели (имеет все функц. узлы, что и у наст. ПК; ноутбук, нетбук, могут раб. от сети и от батареи (4-5 часов), удобно исп. в кач-ве средства связи (д. быть модем))
3) карманные модели:
а) КПК (англ. PDA), Растор (?всё ПО тран. в ПК?, вместо венчестера - флеш-память)
б) Смартфон - мобю телефон, раб. на своей операционной системе (ф-и навигации, исп. для видеосвязи, для доступа в Интернет, e-mail, смотреть видео и слуш. музыку через Интернет)
в) коммуникатор - карманный к-р со встроенным GSM-модулем (позвол. раб. с таблицами, текстами, графикой)
4) напольные комп-ы - суперкомп-ы, мощные многопроцессорные комп-ы (вес 40-100 т), площадь - 450 м2, быстродействие (10 трлн операций в сек.), выпуск. в единственном виде, исп. для решения сложных задач, которые нельзя решить на ПК: в сейсмологии (вулканы и др.), метеорологии
III. по совместимости:
по аппаратной совместимости различают 2 платформы:
1) к-ры IBM PC Intel (исп. в бизнесе, для обработки текстов, для работы с базами данных)
2) Macintosh Apple (исп. в настольно издат. с-х в период. издательстве, для работы с мультимедийной инф-ой)
Сущ. и другие виды совместимости:
- по уровню ОС
- програм. совм-ть
- совм-ть на уровне данных
11. Структура программного обеспечения. Системное ПО.
ПО - совокупность программ, представенных на машинных языках (комплекс программ, используемых комп-ом)
Все ПО делятся на 3 группы:
1) системное ПО (25%)
2) прикладные (пользовательские) программы (50%)
3) прикладные инструментальные средства (языки программирования)
Системное ПО - всё программное обеспечение, которое исп. для работы ПК и обслуживания ПК.
К системе ПО относят: операционные системы, утилиты, программы-оболочки, драйверы.
а) самой главной системной программой является операционная система.
ОС - программа, которая управляет работой ПК и загружается при включении ПК.
Основные функции ОС:
1) управление работой ПК и его ресурсами
2) запускает прикладные программы на выполнение
3) осуществляет диалог с пользователем, обеспечивая пользователю удоб. способ общения, т.е. интерфейс
б) классиф. ОС
I/ по интерфейсу:
1) текстовые (простые ОС) MS DOS 7 системы командной строки.
Эти ОС однозадачные, однопользовательские, 16-разрядные, не сетевые. Затем появл. проф.(?) оболочки (Norton Commander), потом графические операционные оболочки
2) графические ОС (1995 - Windows 95, имеет графический интерфейс, который характеризуется наличием окон, кнопок, пиктограмм, линеек-прокруток, упр-ние происх. с помощью мыши). Эти ОС многозадачные, многопользовательские, позволяют объединять комп-ы в сеть - сетевые, 32-разрядные (64-разрядные).
MS Widows 95/98/2000/XP/Vista/7
Mac OS, SYSTEM
Linux
Предполагается, что в будущем будут разрабатываться ОС, кот. должны будут поддерживать интерактивный ввод-вывод информации, т.е. будет диалог между пользователем и системой (социальный интерфейс)
II. по режиму работы:
1) автономн. ОС, кот. могут работать на отдельном ПК
2) сетевые, которые используются при создании сети, по архитектуре делятся:
а) клиент-клиент, где все ПК равноценны и выполняют одинаковые функции
б) клиент-сервер, т.е. архитектура корпорации и глобальных сетей (NT -> MS Windows 2000 Server -> Vista Server -> XP Server)
Основные функции сетев. ОС:
1. связ. все ПК и перифер. устр-ва сети
2. координир. все функции ПК и периф. устр.
3. обеспеч. защищён. доступ к данным устр-вам.
в) утилиты - вспомогательные или служебные программы, которые предоставл. ряд доп. услуг, помогают пользователю раб. с системой, повышают её эффективность. Условно делят на внутр. (встроенные) и внешн.
Ко встроенным утилитам отн.:
1) у-ты динамического сжатия данных
2) у-ты резервного копирования ( Back up)
3) у-ты оптимизации работы дисков (дефрагментация диска
4) у-та проверки диска на логические ошибки (Scan Disk)
5) у-та установки и удаления аппаратных и программных средств и т.д.
Внешн. у-ты - программы, кот. устанавл. доп. на ПК.
1) архиваторы WinZip, WinRar
2) антивирусная программа- прог-а, кот. исп. для предотвращения заражения комп. сети вирусом и ликвидации последствий.
Комп. вирус - прог-а, кот. может создавать свои копии и внедрять их в файлы, изм. состояние дисков и др. вредоносн. действия.
В зависимости от того, какие типы файлов поражает вирус, они делятся на:
1) вирусы, пораж. загруз. сектора
2) в., пораж. исполнимые файлы (exe, com)
3) макровирусы, пораж. файлы, документы
По принципу распространения сущ.:
1) черви (очень быстро распростр., но не очень зловредные)
2) троянские кони (обладают механизмом вторжения и поражения)
3) сущ. зловредные программы, которые разрушают защиты и пороли
Антивирусные программы6
- Norton Antivirus
- AVP (Касперского)
- Nod 32
Драйвер - программа, исп. для управления устроёствами ПК, чаще всего ввода и вывода (мыши, клавиатуры, сканера, принтера)
12. Прикладные программы. Прикладные инструментальные средства
Прикладные программы - программы. которые превращают ПК в инструмент для выполнения какого-то конкретного вида работ, необходимого для пользователе.
Условно делят на деловое и домашнее ПО.
Деловое:
- офисное. Входит:
1) программы автоматизации делопроизводства (текст. и табл. Word, Excel);
2) программы создания деловой графики (Power Point - презентация, Photo Snap - комп. )графика)
3) системы управления документооборотом (СУБД - MS Access - электронные архивы)
4) телеком. программы (браузер Opera, электронна почта)
Прикладные программы могут использоваться автономно или в составе электр. офисов (MS Office 95/97/2000/XP/2003/2007/2010).
Офисное ПО в будущем:
1) создание сетевых версий офисного ПО;
2) дальнейшее развитие технологий по распознаванию речи;
3) разработка технологии интеллектуальной разработки текста (т.е. внедрение в программы систем искусственного интеллекта - с-мы, кот. могли бы сами сост. документы, приглашения, текст. сообщения)
- лингвистическое ПО - программы, которые разрабатываются прграммистами совместно с лингвистами и связаны с обработкой некоторой информации, с пониманием и порождением текста и речи.
1) программы автоматического чтения текста (Fine Reader)
2) электронные словари (Lingvo)
3) системы машинного перевода (Prompt)
4) системы автоматического аннотирования и реферирования текста
5) интеллектуально-поиск. системы
6) с-мы понимания и порождения текста
7) с-мы распознавания и синтеза речи
8) автоматизир. обучающие с-мы
- экономич. ПО - ПО, к. исп. в экономических отраслях, финанс. сферах.
Наиб. популярны: бухгалтерские прог-мы (1S Галактика), финансово-эконом. и аналит. с-мы (с-мы прогнозирования), управл. пр-мы, информ.-прав. с-мы.
Домашнее ПО
-для развлечения
- для бизнеса (работа по контракту)
- для самообразования (электр. учебники, словари, прогр.-репетиторы)
Прикладные инструментальные средства - сов-сть программ, которые позволяют программистам разрабатывать ПО.
Отн.:
1) языки программирования (алгоримические языки)
2) системы проектирования приложений
Язык программирования - искусств. язык, исп. для представления алгоритма, решения задачи в виде, понятном ПК (первый - в 1961 - Бэйсик)
Система проектирования приложений - интегрированный комплекс, кот. включ. в себя некотор. язык. приложения, программу-отладчик, программу-компоновщик (позвол. объединиь модули), пр-му-компилятор (преобраз. команды в машинные коды) и большую библиотеку готовых к выполнению прог.
Классификация яз. программирования:
1) языки ассемблера предст. записанные в алгоритме действия в виде маш. кодов
2) языки сист. уровня, где действия алгоритма запис. в виде отд. слов (Pascal, Basic), ориентиров. на созд. DOS-приложений
3)языки описания сценариев (скрипт-яз.) служат для быстр. проектирования позв. связывать готовые программы в новые, более сложн., прог-мы (VisualBasic, Delphi)
Виртуальная реальность
Виртуальная реальность - комп. сист-ма, способная внушить пользователю иллюзию мира, порожд. к-м и управ. этим миром (в.р., или гиперпространство)
Для создания ВР исп. спец. ПО, кот. позволяет создавать объекты, из кот. сост., наделяют их определёнными св-вами (цвет) и програм. законы их поведения в вирт. мире.
Технологии создания ВР:
1) с-мы типа "окно в мир" - это реалист. 3-мерный вывод изображения, исп. для созерцания
2)ВР втор. лица (игры онлайн)
3) с-мы видеоналожения - с посощью видеокамеры силуэт накладыватся на 2-мерную картинку, исп. в телевидении
4) с-мы дистанционного присутствия - чувствит. датчик установлен на объекте реального мира и связан с пользователем и ПК (в нейрохирургии глаза)
5) с-мы полного погружения
Необх. 3 условия:
а) созд. и вывод изображения с углом обзора в 180 градусов)
б) 3-мерный звук
в) более полн. моделирование эффектов (осязат. ощ-е)
6) смеш. реальность - объединение систем полн. погружния и дистанц. присутствия
Аппаратные ср-ва:
1) ПК с хорошими тех. х-ками (видеоплата, доп. видеопамять)
2) координат. манипуляторы (3-мерные мыши)
3) сенсорные перчатки (для осязания)
4) устр-ва стереовидения (стереоочки, вирт. шлемы)
5) скафандр (редко)
Сферы применения ВР:
а) бизнес (вирт. магазины, вирт. торговля)
б) медицина (диагностика)
в) образование (вирт. школы, учебники)
г) воен. дело ( тушение пожаров)
д) развлечение, ведение дом. хоз-ва
13. Понятие комп. сети. Компоненты КС. Классификация КС по территориальному признаку
КС - совокупность компьютеров, которые могут осуществлять информационное взаимодействие друг с другом с помощью коммуникационного оборудования, ПО через линии связи.
Компоненты сети:
I. ПК и перифер. устр-ва
II. ср-ва электр. связи
III. коммуникац. оборудование
IV. ПО
II. Ср-ва электр. св. - совокупность устройств, осущ. передачу инф. на расстоянии
Отн.:
- линии связи
1) проводные ЛС (кабели, опто-волоконная линия связи, телефон. ЛС, кабельное телевидение, силовая электрич. линия (электрокабель)
2) Беспроводные ЛС:
а) ИК-излучние (помеха неустойчива)
б) лазерное излуч.
в) радиосвязь (Wi-Fi, Wi-Max до 50 км, моб. или сотовая связь)
г) спутниковая связь
- устр-ва для подключения к линиям связи
1) сетевая карта (адаптор - уст-во для физ. подключения ПК к лок. сети (Bluetooth))
2) модем - устр-во для обмена инф. на большие расстояния
III. коммуникац. оборудование: концентраторы, коммутаторы, мосты, маршрутизаторы - устройства, позвол. соединить сегменты локальных сетей, несколько локальных сетей, локальные и корпоративные сети с Интернетом.
IV. ПО: сетев. ОС, кот. связ. все ПК сетей,
сетев. протокол - набор правил или стандартов, используемый при передаче данных по сети (HTTP)
сетев. приложения, кот. стр. по технологии клиент-сервер.
Сервер - это ПО устанавливается на ПК сервера, хранящ. соответствующую своему ресурсу инф-ю и отвеч. за запросы клиентского ПО.
Клиент - пр-ма уст. на ПК пользователя для составления и посылки запросов соответствующему серверу, получение и отображение инф-и на ПК пользователя.
Выделяют:
1) локальные сети (ограничены небольш. территорией)
2) региональные сети (огран. тер-й города, области)
3) глобальные сети (ограничения на расстояния между ПК не существует)
Назначение локальных сетей:
1) совместное исп. данных, прикладных программ, периферийных устройств
2) обмен информацией
3) выход в Интернет
Региональная сеть предназначена для обслуживания региона
Корпоративная сеть - седь, объедин. ПК в рамках групп корпорации, предприятия, кот. нах. в разн. городах.
Назначение корпоративной сети: распределение и объединение офисов компаний; обеспечение безопасности инф-и, находящейся в сети; разделение дорогостоящих ресурсов и обеспечение совм. доступа к ним, выход в Интернет.
Глобальная сеть - сообщество, сост. из разноплановых сетей.
Особенности:
1) децентрализация информации
2) передача инф. на большие расстояния
Осн. назначение сети Инет - обесп. кажд. желающему доступ к инф., циркулирующей в сети, и дать возможность общ. друг с другом.
1989 - ARPANET
1984 - NSFNET
MILNET
1988 - присоединение Канады и т.д.
1993 - присоедин. России
1996 - присоедин. Беларуси
Основные понятия:
Сеть И-т представляет собой объедиение крупных узлов (хост-компьютеров)
для обмена инф-ей в сети И-т исп. протоколы:
1) базовые (отвеч. за физ. пересылку сообщений между ПК)
2) прикладные (соед-е на програм. уровне)
Сам. главн. трансп. протокол - Transfer Control Protocol (TCP) разбив. инф. на пакеты, нумер. их и описыв., каким путём будет устанавливаться каждый канал связи.
IP (Internet Protocol) - доб. кажд. пакету адрес отправления и получателя, обеспечив. доставку всех пакетов.
Каждый узел в Интернете имеет свой уникальный адрес (IP-адрес) - двоичное число, представл. в виде 4 десятичных чисел, разд точкой (диапазон до 255) и позв. однозначно идентифицир. к-р, подключ. к И-т
Доменный адрес - цепочка символов (доменов), разде. точкой.
nihe.unibel.by
Спец. DMS с-ма дом. имён, кот. преобраз. симв. адрес в IP-адрес, и наоборот.
Домены. стоящие в конце адреса - домены самого высокого уровня. Они идентифицируют геогр. регион сети или тип организации (.by, .net, .gov)
14. Основные ресурсы и услуги сети Интернет
Основные ресурсы делятся на:
1. ср-ва поиска инф-и и размещ. личной информации
2. ср-ва обмена инф-й
Ср-ва поиска:
1. www (world wide web) -сов-ть взаимосвяз. гипертекст. документов
2. FTP (File Transfer Protocol) - хранилище и с-ма пересылки всевозможных файлов-архивов.
3. Telnet - сервис для удалённого управления ПК.
www - самый современный мировой ресурс для предоставления иформации пользователям Интернет.
Инф. в системе www представлена в виде web-страниц - документ, к. имеет граф. интерфейс и содержимое, к. описано языком гипертекстов разметки документа (HTML)
Web-сайт - сов-ть взаимосвяз. web-страниц.
Гипер-текст - немен. непослед. текст, сост. из разного рода информации (текст, графика, звук, видео)
Исп. технология клиент-сервер.
Сервер - сервер-программа, установл. на web-сервере, позволяет хранить и пересылать web-страницы.
web-браузер - программа-клиент. предназнач. для навигации в www и пересотра web-страниц.
Opera, Internet Explorer, Mozilla
HTTP - протокол, к. исп. клиент для получения web-страниц с web-сервера.
Услуги ресурса www:
1) поиск инф-и (тематич. каталоги, поиск. машины - спец. пр-мы)
2) с-мы поиска людей и инф.
3) актив. инф. каналы - web-вещание. телевидение
4) интерактивные сервисы
5) создание почтовых ящиков и web-страниц
FTP исп. технологию клиен-сервер
FTP-сервер - программа, уст. на ПК-сервере, позв. хранить и пересыл. файл. архивы.
FTP-клиент - пр-ма на ПК клиента для поиска и отображения инф-и.
Telnet
Исп. Telnet-протокол, к. разреш. соед. пК пользователя с сервером и обеспечить работу так, как будто терминал пол-ля является терминалом сервера.
URL-адрес исп. для полн. идентиф-и любого ресурса в сети И-т, сост. из:
протокол://дом. имя сервера/имя файла
http://www.rambler.ru
ftp://ftp.open.by
средства обмена инф-й:
1. электронная почта (e-mail) - ресурс Интернета, позвол. обменив. м/у ПК посредством сети электр. прилож, сообщениями.
Преимущества:
1) скорость пересылки сообщений
2) можно вложить мультимедийные файлы
3) просто и дёшево
4) возможность шифровать информацию
5) возможность автомат. обработки писем
6) в-сть массовых рассылок
2. списки рассылки - услуга, позвол. определённому кол-ву пользователей поставлять реклам. инф-ю, период. издания
3. Usenet - глоб. распред. с-ма для дискуссий, включ. множество групп новостей, хранящихся на серверах по всему миру.
4. IRC (chat) Internet relay Chat - обмен в реальном времени текстовыми сообщениями.
5. Интернет-пейджинг - с-ма, позвол. зарегистр. в св. системе серверов и получить уникальный пейджинговый номер.
ICQ (I seek you). При каждом подключении к Интернету программа ICQ определяет текущий IP-адрес ПК и отправляет его на центр. сервер - вы можете вызв. чел., имеющ. пейдж. номер и подключ. в данный момент к Ин-ету.
6. аудиоконференции
7. видеоконференции (web-камера)
8. радиотелевещание через Интернет
9. интернет-телефония - возм-ть передачи сообщений через глобальную сеть (Skype)
Основные направления развития сети Интернет:
1. упрощение процедуры подключения к сети И-т, появление новых средств и способов доступа к И-т (выход через моб. телефоны)
2. постоян. повышение скорости доступа к сети (нов. модемов, появл. новых высокоскоростных каналов связи, внедрение беспроводной сетевой технологии)
3. увеличение кол-ва IP-адресов (введена версия протокола IP, которая поддерживает не 4-байтовое, а 16-байтовое число (128-разрядный IP-адрес)
4. предоставление пользователям всё более широких возможностей (электр. торговля, инет-телефония, интерактивное телерадиовещание, совершенствование поисковых инструментариев)
5. повышение пропуск. способности И-т, создание глобальной сети и-т-2, целью явл. создание высокоскоростной сети и разработки приложений для неё.
Главные достоинства - высокая скорость передачи данных (до 10 Тбит в секунду). Сеть стр. на базе IP-протокола-6, что позволяет подключ. сетевой адрес не только ПК, но и моб. телефонов, моб. устройств.
По И-т-2 можно почти беспрепятственно перед. потоковую видеоинформацию. Позвол. пользователю доступ в И-т, но не наоборот.
17. Назначение и возможности систем автоматического чтения текста.
Для быстр. ввода текст. инф-и в ПК широко исп. сканер, к. работает по принципу фотоаппарата, позволяя "увидеть" текст. Для того, чтобы перевести граф. изображение в текстовую форму, необходимы с-мы автоматического чтения текстов или OCR (optical character recognition)
OCR - комп. прог-ма, позвол. преобраз. текст бумажного носителя в электронный файл.
Принципы работы OCR:
1. целостность (объект опис. как целое с помощью знач. элементов и отношений между ними)
2. целенаправленность (распозн-е стр. как процесс выдвижения и целенаправл. проверки гипотез)
3. адаптивность (способность комп. с-мы к самообучению)
Fine Reader
Этапы работы системы Fine Reader:
1) сканирование - получение граф. образа документа
2) распознавание
а) анализ граф. макета страницы (выделение областей для распознавания таблиц, картинок, выделение в тексте строк и отд. символов)
б) распознавание кажд. символа на основе различных алгоритмов распознавания
3. проверка орфографии
4. сохранение
Алгоритмы распознавания (классификаторы)
1) шрифтозависимые (шаблонные) - растров. изображ. наклад. на шаблон, содержащийся в базе данных, наиболее подход. явл. шаблон, у кот. наименьшее кол-во точек отлич. от исслед. изображения.
2) признаковые - распознаванию подвергается не сам символ (оригинал), а некотор. его признаки, к. вычисл. по формулам.
Эти классификаторы не отвечают принципу целостности, т.к. теряется существенная часть информации
3) структурные - содерж. инф-ю не о точечном изображении символа, а о правилах начертания или структуре.
Стр. элементами явл. все составляющие символ линии. Раб. с векторным изображениями. Недостаток - чувствительность к дефектам изображения.
В Fine Reader работают все типы классификаторов.
Возможности системы:
1. во время сканирования автоматически подбир. яркость, фрагментируется страница, распознаются символы, можно пров. орфографию.
2. позв. распозн. печат. символы (около 200 языков), рукопечатные, рукопис. (для КПК)
3. способность самообучаться и распозн. плохопропечатанные символы и символы незнакомых языков.
4. распозн. изображения, полученные с помощью фотоаппаратов.
Развитие программ OCR сегодня идёт в направлении повышения точности распознавания текстов низкого качества, рукопис. текста, выделение текст. инф. на фоне шумов, а также интеграции OCR-систем с различными программами обработки информации.
18. Аннотация и реферат текста: основные понятия. Методы автоматического аннотирования и реферирования текста: позиционный, логико-семантический метод.
Реферат - связный текст, к. кратко выражает не только центр. тему или предмет к-либо документа, но и цель, используемые методы, осн. результаты описанного исследования или разработки.
Аннотация - краткое изложение содержания докумета, дающее общ. представление о теме этого документа.
Рефераты и анн-ции - вторич. документы чаще всего созд. к научным книгам, статьям.
Автоматич. реферирование (аннотирование) текста (сжатие, компрессия текста) - составление реферата (аннотации) текста с помощью компьютера.
Первый машинный реферат был получен американцем Генри Лунном в 1958 году.
Машинный реферат наз. квазирефератом.
Этапы построения реферата человеком:
1) подготовительный (референт опред. тематическую направленность текста и пыт. осмыслить документ в целом)
2) аналитический (р-т делит текст на фрагменты и в них выд. осн. смысл. единицы, составл. план буд. реферата)
3) этап непосредственного построения реферата (выделенные ранее смысловые единицы (их комбинации) располагаются в единый вторич. текст в соответствии с планом)
В качестве смысловых единиц реферата могут быть:
1) полное без изменнеия ключ. предложение исход. текста
2) перефразированное ключевое предложение исходного текста
3) предложения, составл. из ключ. слов или словосочетаний с использованием связующих элементов
4) предложения, обобщ. несколько предложений исходного текста (не обязательно ключевых)
Смысловыми единицами аннотации могут быть:
1) ключевые слова, словосочетания исходного текста с предшествующими им спец. словами-реляторами ("книга посвящена след. проблемам", "в статье рассмтр. след. вопросы")
2) спец. предложения исходного текста
а) содержащие оценочные элементы типа (рассматриваются !важные! проблемы, статья посвящена !актуальной! теме)
б) предложения, содержащие клише - специализированные словесные штампы, к. фиксир. внимание человека ("недостаток заключается", "ставится задача")
Компьютер должен уметь:
1. находить в тексте ключ. слова, словосочетания, предложения
2. наход. в тексте менее знач. единицы
3. составлять из текстовых единиц смысл. единицы р-та, аннотации.
4. составл. из таких единиц текст р-та
Методы:
1) статистические
2) позиционные
3) логико-семантические.
Позиционные методы:
Осн. критерии этих методов явл. место или позиция предложения в исходном тексте. Выделяется 2 метода:
а) метод заглавия (счит., что основное содержание текста выражается текстом заголовка, поэтому составляется словарь ключевых слов на основе знаменательных слов заголовка, раб. на 35-40%)
б) метод локализации (раб. на текстах ?у/й? тематики. Идея метода: в таких текстах предложения о цели, результатах исследования заним. фиксированное место в тексте; метод работает на 25-55%)
Методы, исп. комплексно и совместно, дают результат около 75%.
Логико-семантические методы:
Исслед. структуру и семантику текста.
Ключ. предложение - предложение с наибольшим функциональным весом, на величину которого влияют различные факторы (связь с левым и правым окружением, наличие в предложении семантически значимых слов)
Кажд. из 3 методов имеет свои достоинства и недостатки, поэтому естественно представл. тенденция использовния совокупности методов.
19. Методы автоматического аннотирования и реферирования текста: статистический метод.
1) В статист. методе ключевое слово - это знаменат слово текста, к. с учётом всех его синонимов встреч. в тексте наиб. число раз.
Ключевое предложение - предложение текста, к.:
а) имеет несколько ключевых слов
б) содержит ключ. слова на небольшом расстоянии друг от друга
Принадлежность слова к числу ключевых опред. спец. коэффициентом важности.
Задача: используя для выделения ключ. (опорных) слов текста один из вариантов статистич. метода, а именно:
Кважн=, где F= частота употребления слова в тексте
m = число абзацев, в которых встречется слово
N = число слов в тексте
n = число абзацев в тексте
Состав. алгоритм позволяет получить:
а) аннотацию текста в виде релятора со следующими за ними ключевыми словосочетаниями.
Ключевым словосочетанием будем считать ключ. имя существительное со стоящим перед ним определением, выраженным именем прилагательным или причастием.
б) словесный р-т текста в виде послед. цепочки ключ. предложений.
Ключевое предложение - предложение, содерж. 3 и более ключ. слов или слововсочетаний.
Словоупотребление - цепочка буквенных символов, заключённых между двумя знаками пробелов.
Слово - несколько словоформ, имеющие одинак. лексическое значение
Предложение - несколько словоупотреблений, находящихся между 2 знаками конца предложения.
Скоро придёт зима. Зимой легче дышится. Приходи, зима!
дышится 1 -> 7 словоупотреблений, 5 слов
зима 2
зимой 1
легче 1
придёт 1
приходи 1
скоро 1
Алгоритм решения задачи:
1 шаг: Компьютер по каждому абзацу составляет алфовито-частотный словарь словоформ.
2 шаг: Алфовитно-частотные словари объедин. в единый распределительный алфовитно-частотный словарь всего текста.
3 шаг: Комп. с-ма проводит чистку алфавитно-частотного словаря, сжимая его до словаря потенциально опорных словоформ:
- удал. из словаря служ. и общеупотребительной лексики
- объедин. все грам. формы одного и того же слова, объедин. синонимы
- удал. слова, которые встречаются в одном абзаце
4 шаг: Словарь потенц. ключ. слов дел. на 2 части:
а) словари главных опорных слов
б) словарь второстеп. опорных слов, что осуществляется на основе коэффициента важности.
Шаг 5: строит. аннотация, к. составл. из слов - реляторов со следущими за ними ключевыми словосочетаниями. Исп. только глав. опорные слова.
Шаг 6: Строит. реферат на базе главных и второстепенных опорных слов. Просматривая исход. текст, компьютер извл. из него предложение, содерж. три разных опорных слова и сост. из них реферат.
20. Способы перевода текста с использованием компьютера.
Перевод - вид чел. языковой деятельности, в результате которой некотор. текст на одном языке ставится в соответствие тексту на другом языке, при этом обесп. их смысловая эквивалентность.
Типы перевода по степени автоматизации:
I. традиционный (ручной) перевод, выполн. человеком.
II. автоматизированный:
1) перевод, выполненный ПК с помощью чел. (диалог)
2) перевод, выполн. человеком с помощью ПК:
а) в памяти ПК двуязыч. словарь и текст. процессор
б) ТМ (Translation Memory) программные продукты этой технологии наз. автоматизир. раб. местом
В основе этих программ лежит принцип сбора и хранения фрагментов переведённых человеком текстов на 2 языках. Они хран. в спец. накопителе переводов (памяти) и служат бесценным поспорьем при послед. переводе текстов той же тематики.
Для кажд. тематики созд. свой накопитель. Ими можно обмениваться. Программных продуктов этой технологии около 10. Лидером среди них явл. Trados.
III. машинный (автоматич.) перевод (МТ - машинный перевод) - выполн. компьютером действя по преобразованию текста на одном естеств. языке в текст на другом иностранном языке при сохранении эквив. содержания, и ???
Первый машинный перевод был продемонстрирован в 1954 в Джорджтаунском университете (с руск. на англ.) В Москве первый машинный перевод - 1955.
Специалисты утв., что такой перевод по существу невозможен. Реально авт. перевод возможен только в условиях искусственно ограниченного языка (как по словарному запасу, так и по грамматике). Поэтому человек участвует в подготовке маш. перевода и его доведения до удобочитаемого вида (предредактор и постредактор)
Если КПД человека-переводчика сост. 4-5 автор. листов (18 стр. А4) в месяц, то машина - 120 авт. листов.
Виды машинного перевода:
1) информатив. (грубый пословный перевод, достаточный для поверхностного ознакомления с содержанием текста)
2) профессиональный (кач-во перевода сравнимо с качеством чел. перевода и при небольшом редактировании явл. удовлетворительным)
3) персональный (авторский) перевод (авторы заранее избавл. тексты от неоднозначности и работают в режими диалога).
21. Структура системы МП и назначение её основных блоков
СМП явл. моделями, к. воспроизв. на ПК речевое поведение человека, переводящего текст с одного языка на другой.
Текст ИЯ
ПК: двуязычный словарь <- подсистема морф. анализа ИЯ
<- подс-ма синт. анализа ИЯ
<- подсистема синт. синтеза ПЯ <--> синтаксич. соответствия
<- подсистема морф. синтеза ПЯ
текст ПЯ
В процессе морф. анализа слов ИЯ кажд. слово получ. наборы лексико-грам. признаков, к. с-ма формир. из двуязычного автоматич. словаря.
Синт. анализ предлож. ИЯ свод. к поиску осн. членов предложения
Синт. синтез предлож. перев. языки закл.:
1) в создании предложения ПЯ опред. синт. структуры, к. с-ма выбирает из блока "синт. соответствие"
2) замена слов ИЯ на их перев. эквивалента из двуязычного словаря
Морф. синтез кажд. слова, предложения ПЯ сводит к постановке слова в нужную форму. В словаре содерж. сведения о признаках каждого слова
Успех и эффективность СМП во многом зависит от автомат. словаря и прав. выбора структуры предложения ПЯ
Автоматич. словарь исп. ПК, поэтому инф-я в нём закодирована
При создании автомат. словаря реш. след. задачи:
Задача 1. выбор типа лекс. единицы словаря (исп.:
а) в виде словоформ, когда в словарь заносятся все возможные формы каждого слова и подаются гнёздами;
б) в виде квазиосновы: блок # ..., числа, стоящие после #, условно обозначают те наборы суффиксов и окончаний, к. необходимо присоедин. к основе, чтобы получить соответств. формы слов, эти числа назыв. типами формообразования)
Выбор типа лексической единицы зависит от:
1) для рус., бел., нем., лат. целесообразно исп. квазиоснову;
2) для языков аналит. типа - словоформу
2. от объёма словаря и вычислит. ресурсов ПК
3. от типа СМП (для информат. - квзиоснова, для профессион. - словоформа)
Задача 2: отбор перевод. эквивалентов для выход. словаря.
Задача 3: создание маш. словар. статьи для лекс. статьи - лекс. единица вместе с набором значений и её всевозможн. признаков.
В словап. статье выд. 4 зоны:
1) зона морфолог. сведений
2) зона семантич. сведений:
а) принадлежность к определ. семант. подклассу
б) переводн. эквивалент
3) зона синтаксич. сведений (управл-е глагола/предлога)
4) зона лексич. сведений:
а) стилист. исп-е лексич. единицы (термин, принадлееж. к языку, или общеупотр. л.)
б) исп-е лексич. единицы как части фразеологизма
Для выбора структуры предл. ПЯ первоначально исп. прямой перевод (структура 1:1). Затем исп. язык-трансформер (внутр. язык). В последнее время стали внедр. статистич. подход, который позволил машин. переводчиком обуч. и выб. прав. структура предложений ПЯ, для чего исп. огром. базы параллельных корпусов текстов, наход. на ПК, ранее переведённых людьми.
Параллель между программными продуктами MT Prompt и TM (Trados)
МТ-программы опир. на готов. словари и готовы к работе в момент покупки. Но чтобы их исп. профессионально необходимо затратить много времени по настройке с-мы перевода для кажд. тематики. Исп-е МТ-программ даёт выйгрыш только при переводе огромн. массивов однотип. текстов.
ТМ (Trados) - базой служит накопитель, к. в момент покупки пуст. Нов. накопитель создаётся переводчиком для кажд. ематики текстов. В осн. перевода ложатся конструкции, выбранные человеком.
Для крупн. проектов, где речь идёт об оперативном переводе сотен страниц однородной документации, передставл. перспективным сочетание программ МТ и ТМ
Популярн. СМП: SYSRAN, Prompt, Сократ
плюсы исп-я СМП:
1) скорость
2) удобно при редактировании и форматировании перевода
3) имеют удобн. возможности для перевода эквивалентов (online словари)
4) ускоряют перевод. освободив. от необходимости перевода того, что было переведено ранее
5) значительно дешевле
6) можно доверить перевод конфеденциальной информации
7) упрощённый просмотр страниц в Интернете
22. Определение понятия "понимание текста компьютером". Уровни автоматического понимания письменного текста.
Широкое применение ПК во всех сферах чел. жизни привело к вырастанию объёма хранимой в них инф-и, представл. в текстовой и устно-речевой форме на естеств. языках.
Постепенно стал меняться и стиль общения человека с компьютером. Стали преобл. черты естеств. коммуникации, в основе кот. лежит письм. и устн. речь чел.
Задачи автоматического понимания и порождения текста и речи очень сложны. Для их реализации в ПК в к. с-мы нужно вложить огромный объём знаний об окружающем мире, естественных языках, а также очень сложные правила текста и речеобразования, леж. в основе речемыслительной деятельности человека.
Всё это в полном объёме будет реализ. в будущем, а пока ПК облад. возможностью обрабатыв. письм. тексты и уст. речь, имеют в своей памяти базу знаний, ограниченную конкретной предметной областью.
Комп. база знаний - определённым образом ограниченные лингвистические и нелингв. данные, а также правила их использования.
Речемыслительная деятельность чел. - очень сложный и до конца не изученный вид чел. деятельности, поэтому сегодня невозможно говорить о его полном моделировании на ПК. Существ-е в различных странах эксперименты и пром. с-мы обработки текста и речи созданы с учётом наложения ограничений на их функционирование. Такие с-мы решают не общие, а частные задачи понимания и порождения текста и речи. Важно, чтоб результаты решения такой задачи комп-ом были аналогичны результатам, полученным при решении той же задачи человеком.
Проблема понимания текста ПК ещё находится на нач. стадии изучения. Поэтому сущ. различные точки зрения на эту проблему, выд. различные уровни понимания, построены различные системы, способные понимать текст. Наиболее сложными для понимания являются тексты, описывающие взаимоотношения и поступки действующих лиц (худ. лит-ра). Более простыми являются тексты, содержащ. описание фрагментов статич. мира (науч. статьи и книги).
Понимание в таких с-х тракт. как извлечение из текста наиб. существенной инф-и с точки зрения ПК. Полученная в результате пнимания информация может пополнить базу знаний ПК или может быть передана пользователю.
Под передачей понятого пользователю имеют в виду способность ПК ответить на вопросы пользователя относительно событий, описанных в исходных текстах в виде связ. текста, а не отд. предл. или слов.
Согласно современным теориям автоматического понимания текста, к-р понял текст, если он может:
1. кратко изложить его содержание
2. ответить на вопросы к этому тексту
3. на основе текста нарисовать картинку или схему
4. привед. в тексте сведения представить в иной форме (в виде таблицы, графика)
5. на основе анализа текста, написанного на одном языке, выдать адекватную информацию на другом языке.
6. сравнить содержание двух разных текстов и выделить информацию о том, что в них общего и в чём различия.
7. путём анализа нескольких текстов извлечь такие знания, которые можно поместить в БЗ.
Уровни автоматического понимания письменного текста.
Соотнося уровни понимния текста ПК с основными уровнями языка, можно выделить следующ. уровни автоматического понимания:
1) морфологический
2) синтаксический
3) семантический
4) гиперсин-й или прогматический (связ. с выяснением семантических отношений между предложениями текста)
Морф. понимание сводит. к автомат. приписыванию каждому слову предложения его морф. характеристик. Это наиболее освоенный вид комп. понимания. В послед. годы такие операции легко реализ. в рамках автоматического лексико-грам. анализа текстов.
Суть синт. понимания текста заключ. в автомат. выделении в каждом предложении текста главных и второстепенных членов и установление между ними различных типов связи.
В процессе семантического понимания текста автоматически устанавливаются значения выделенных на синтаксическом уровне составляющих предложения. ПК определяет, выражено ли подлежащее одуш./неодуш. существительным, выражено ли сказуемое глаголом движения/чувствования; обстоятельством является обстоятельство причины и т.д. Подобные процедуры пров. с опрой на необход. окружие слова.
23. Типы автоматического поинмания текста
Комп. с-ма, поним. письм. текст, должна иметь в своей базе знаний след. инф-ю:
1. знания о языке, на котором написан текст
2. правила исп-я знаний на языке
3. знания о конкретной предметной области
4. правила исп-я знаний о предметной области
5. знание о пользователе с-мы, желающего получить от ПК некотор. понимание текста
В зависимости от этих знаний и их кол-ва различ. след. типы авт. понимания текста:
1. понимание-узнавание (при этом предпол., что комп. с-ма должна иметь знание лишь о языке; суть поним. сводится к тому, что ПК узн. морф. структуры кадого слова предложения, проводит синтаксический анализ предложения; узн. в исходном тексте ключ. слова, словосочетания и предложения)
2. понимание-уподобление (комп. с-ма должна иметь знание о языке и правила их исп-я; счит., что эта с-ма понимает текст, если она может отв. на вопросы по этому тексту; при таком понимании ПК просто находит готовые ответы в своей базе знаний, ранее занес. чел.
3. понимание-прогнозирование (эти комп. с-мы ориентир. на понимание текстов достаточно узкой предметной области; в данном случае в ПК должно быть знание о языке, правила их исп-я и знания о конкр. предм. области; счит., что с-ма поним. текст, если она может определить, какой объект или событие прелметной области соотв. отд.фрагментам текста; но одним и тем же фрагментам могут соотв. различн. фрагменты, поэтому соотнос. их можно лишь с определённой степенью вероятности)
4. понимание-объединение (БЗ содерж. 4 вида знаний: знание о языке, о предм. области и правила исп-я этих знаний; объединяя эти виды знаний, комп. с-ма должна умть делать выводы по тексту, а также объясн., почему она сформулировала тот или иной вывод, это забота экспертных систем)
5. понимание-объяснение (в БЗ содерж. все 5 видов знаний, включая знания о целях, намерениях, проф. компетенции пользователей; комп. с-ма должна уметь объяснить пользователю, каким образом она поняла текст, т.к. своё объяснение она должна давать любому конкретному пользователю с учётом его образования и навыков; в таких с-мах исп. диалог комп. - пользователь; в ходе диалога с-ма может выяснить запросы и поставл. пользователем задчи, объяснить причины принимаемой с-мой решений)
Сегодня проблема авт. понимания реализ. в след. комп. с-мах , позвол. извлекать из текста опред. инф-ию.
1. с-мы автомат. индексирования, аннотирования, реферирования текста и машинный перевод
2. инф.-поисковые с-мы
3. эксперт. с-мы (выступ-е в роли высокопроф. специалиста в к-то предметной области)
24. Автоматическое порождение письменного текста: определение, этапы, виды компьютерных систем
Проблемами порождения текста с помощью ПК исследов. заним. с начала 70-х гг. XX в. Успехи в этом направлении не так значит., как в понимании.
Сегодня не может быть создана единая теория порождения текста. Осн. причина - неоднозначн. опр-е понятия текст. Создатели диалог. систем (обуч. программы, диалог пользователя с ПК) по текстом поним. любую реплику, сост. из нескольких слов или предложений. Создатели с-м порождения метеосводок под текстом поним. некотор. таблицу. Для создающих инструкции текст - несвязная цепочка несвязанных между собой предлож., относящ. к одному объекту.
Худ тексты (стихи, реклама...0 Здесь необход. законы остроения текстов разных стилей и жанров.
Установлено, что процесс текстообразования состоит из 2 этапов: стратегич. (должно быть принято решение, что писать) и тактичесого (как написать)
Результатом выполнения 1 этапа должно стать смысловое представление будущего текста
Результатом выполнения второго этапа должен стать сам текст в язык. форме.
Виды комп. с-м автомат. порождения текста
делятся на 2 группы:
1) с-мы, раб. на основе шаблонных технологий. Они строят буд. текст, манипулируя готов. предложениями и словосочетаиями как сторит. блоками. Эти с-мы достаточно просты и надёжны, нах. шир. пром. применение (типы текстов: диалог. с-мы, с-мы, генерирующие отчёты, метеосводки; инструкции, характеристики)
Содержание порождаемого текста этими системами представляется в виде фрагментов текстов, созд. ранее людьми. Они ыгл. естественно. эти с-мы раб. с очень жест. типами текстов.
2) комп. с-мы, раб. на основе лингвист. мотивир. технологии. В этом случае для создания текста с-ме необх. знания структуры содержния генерируемого текста, а также слож. лингв. знания, к. позв. выразить это содержние языковыми средствами (примеры порождения стихов, сказок, рекламы и т.д.)
В наст. время лингв. мотив. технологии нах. на стадии исследования. Пром. с-м нет, сущ. только эксперимент. с-мы.
25. Общая структура системы породления письменного текста
В системе автоматического порождения письменного текста должно быть представлено 3 компонента:
1)оболочка
2) планировщик
3) лингв. реализатор
Оболочка опред. назначение порожд. с-мы (диалог. с-ма, с-ма генерации документов. В ней содерж. вся БЗ, к. сост. из 2 частей: нелингвистической (понятия, связи и отношения между понятиями конкретных предметных областей) и лингвист. (вкл. формализ. сведения о языке: списки морфем, словарь, синтексическая структура предл.)
Планировщик выполняет функции:
1. опред. ту инф-ю, к. должна быть представлена в тексте
2. устанавл. порядок следования абзацев в тексте и предложений в абзацах
3. осущ. языковое оформление связи предложений
4. осущ. построение синтаксической структуры предложений
5. осущ. выбор соотв. лексики.
Всё это он осуществл. с опорой на БЗ.
Лингвистический реализатор обеспечивает грамматическую правильность порождаемого текста и принимает все окончательные синтаксические и морфологические решения
26. Автоматическое распознавание устной речи
Проблемами распознаванияустной речи учёные занимаются более 80 лет. До сих пор они в полном объёме не решены.
Под распознаванием речи комп-ом в полн. объёме поним. т. распознавание, к. подобно восприятию речи чел-м в люб. условияхи при общении с люб. чел.
Механизм восприятия речи чел. обладает выс. степенью надёжности. При самых разнообразных помехах устная речь явл. самым надёжн. и универс. ср-вом коммуникации.
Решению проблемы распознавания речи в полн. объёме мешают следующие факторы:
1. в наст. время не сущ. чётких теоретич. представлений, к. бы описывали весь комплекс преобразований, осуществляемых нервной с-мой при переработке речевых сигналов.
2) слитно произнесённая речь облад. след. св-вами:
а) границы слов размыты
б) сосед. звуки влияют друг на друга
в) если знамен. слова произн. в осн. отчётливо, то функцион. слова - нечётко и даже могут исчезать.
3. в голосе говорящего человека всегда присут. экстралингвист. инф-я, свидетельств. о эмоц. сост. чел., указ. на его пол, возраст, национальность, сост-е здоровья.
4. в процессе реч. общ-я кроме слов большое значение имеют паралингвистические ср-ва коммуникации: фонация (х-ки голоса), кинетика (мимика, жесты, позы), проксемика (расстояние между людьми).
Популярные с-мы по распознаванию речи: IBM Viavoice, Горыныч
Исходя из вышеизложенного, сегодня авт. распознавание речи может существовать только приналожении опред. ограничений на процесс распознавания (распознавание изолир. произн. слов; расп-е речи с предвар. настройкой на голос конкретного пользоватля, расп-е речи с опорой на небольшой заранее определённый словарь)
Промышленно реализованные с-мы распознавания устной речи условно можно разделить на след. группы:
1) с-мы реч. управления (ПК, быт. утр-ва, телефон)
2) ср-ва диктовки, позв. голосом вводить текст. инф-ю (речь должна быть с интервалом)
3) инф. - справ. с-мы, раю. в диалоговом режиме в качестве автоответчика
4) ср-ва идентификации чел. по образцу речи (голос. пароли)
5. пр-мы-транскрипторы, к. исп. для повыш-я скорости записи протоколов совещания, лекции.
27. Синтез устной речи с помощью компьютера
Сегодня сущ. большое число синтезаторов, к. могут озвучить введённый в к-р тексты или произнести фразы, произнесённые ранее и записанные в память чел-ком.
Сущ. 3 метода авт. синтеза речи:
1) копирование реч. сигналов с их последующ. восстановлением. Это один из самых элемент. подходов к созданию говорящ. ПК.
По сущ-ву ПК служ. устр-м для записи речи как магнитофон. Слова и фразы запис. в ПК заранее и в нужн. момент воспроиз. по командам. поступ. из соответств. программы.
Возможность сказать слово или разу, к. не были заранее введены в память здесь отсутствует. Ещё один недостаток для хранения реч. сигналов в их непоср. объёме - нужна память знач. объёма, поэтому этот метод исп., когда необход. словарь не слишком велик.
2) фонет. синтез речи или акуст. моделирование голос. тракта чел. Эти синтезаторы гов. голосом робота.
ФС речи осущ. по орфогр. тексту, напис. чел-м. ПК умеет преобр. буквы в фонемы, а фонемы - в их варианты (аллофоны), опред. слов. и фраз. ударения и синтезир. непрерыв. реч. сигнал с исп-м аллофонов конкретного диктора, выб. из БД.
Этот метод перспективен, т.к. речь генерир. самим ПК и может быть овучен любой текст.
3) автом., матем. моделирование голос. тракта чел. Словарь в синтезаторах этого типа, как и в первом методе, созд. с участием гов. чел-ка. В данном случае в память запис. не слова и фразы, а произв. выдел. числ. характеристик звуков речи и интонации фраз. Такой подход позв. значительно уменьш. объём необход. памяти - глав. достоинство метода. синтезируем. речь звучит естественно. Для её генерации числ. хар-ки по спец. командам преобраз. обратно в звук. сигналы.
Наиболее перспективным является фонет. синтез речи. В наст. время специалисты работают над тем, чтобы синтезир-я комп-м речь по тексту звучала живо, естественно. Решение этой проблемы позв. создавать комп. с-мы синхрон. перевода, активнее исп. пК для изучения языка и позволит исп. людьми с наруш. зрения.
28. Базы данных: определение, модели. СУБД: определение, основные функции.
БД - совокупность определ. образом упорядоченных свдений о некоторых объектах.
Объекты - это сведения, факты, процессы, события. Объект может быть матер. (студент, машина) и нематер. (факт поступления в у-т, перевод текста).
Кажд. объект облад. св-вами или атрибутами, к. присв. определ. значения.
В БЗ атрибуты представл. просто данными, а их зн-я - зн-я данных.
Совокупность файлов, описывающих один и тот же объект, тоже назыв. БД.
Действия над данными:
1) ввод
2) редактирование
3) удаление
4) поиск инф-и
СУБД (с-мы управления базами данных) - сов-ть прогр. средств, позв. создавать базу данных, вести и произв. поиск в ней инф-и.
Осн. ф-ии СУБД:
1. обеспечить создание структуры БД, чтобы эффективно хранить и обраб. инф-ю, необх. опр., к. инф-я будет хран., к. будут исп. атрибуты и типы данных.
2. модификация инф-и, наход. в БД (добавл., удаление, редакт.)
3. поиск инф.
СУБД дел. на 2 типа:
1) настольные
2) серверные
1) настольные СУБД по степени сложности подраздел.:
а) СУБД для обработки небольш. объёмов инф-и (MS Outlook - огранайзер)
б) СУБД для пользователей (MS Excel)
в) СУБД для профессионалов (MS Access)
2) серверные СУБД исп. архитектуру улиент-сервер, т.е. происх. централизованное хранение и обработка данных (MS SQL Server)
29. Лингвистические информационные ресурсы: определение, основные составляющие, письменный лексикон
ЛИР - одна из составляющих информационных ресурсов. Инф. ресурсы - некотор. интеллект. ресурс, результ. коллектив. твор-ва.
К пассив. ыормам ИР отн. книги, журналы, словари, энцилопедии, базы и банки данных.
К активным формам - модели, алгоритмы, базы знаний.
ЛИР - мно-ство определ. образом организ. реч. и языковых данных, нах. на машин. носителях и используемых в различн. сферах практ. деят-сти (в образовании, экономике, издательстве)
В самом общем виде ЛИР - это своеобраз. лингв. БД, к. можно обновлять и в к. можно искать ту или иную информацию.
ЛИР необх. как пользователям ПК, так и различн. комп. с-мам, связанным с автомат. обработкой текста и речи:
- с-мы перевода текста
- с-мы анализа, синтеза, распознавания речи и текста
ЛИР дел. на:
1) письм. лексикон
2) письм. текстов. массивы (корпусы т-в)
3. фонетич. ресурсы
1) письм. лексикон представлен однояз. и многояз. лексиконом (словарями)
Многояз. лексикон - электр. словари для поиска перевод. эквивалентов
Однояз. лексикон:
- частотно-алфавит. словарь словоформ к-л текста
- словоуказатель, в к. кроме абсолют. частоты употребления словоформы указ.номер страниц и строк, где встреч. словоформа
- конкордансы - в них словоформа характериз. не только числ. показателем, но и некоторым контекстом, в к. она употреблена (как прав., это 3 предлож.)
- словари-энциклопедии (содержат х-ки не слова как такового, а обознач. им. предмета, факта или явления, БЗ Кирилла и Мефодия, кругосвет, Британика на англ. яз.)
- тезаурус - словарь, в кот. указ. семант. связи между определ. частью его лексич. единиц; 1852 - первый словарь-тезаурус
- терминологич. словарь (осн. единицей явл. термин - слова, словосочетание, имеющее спец. значение, выраж и формир-е проф. понятие и применяемое в процессе познания)
30. Лингвистические информационные ресурсы: определение, основные составляющие: письменные текстовые массивы, фонетические ресурсы
Письменные текстовые массивы - это совокупность текстов, являющаяся достаточной для обеспечения надёжных выводов (научн.) о некотором языке, диалекте или ином подмножестве языка.
Создание таких корпусов - новое направление в лингвистике. Суть его свод. к тому, что достовер. данные о морфол., синт. и семант. структуре языка могут быть получены из достаточно большого массива текстов.
Корпусы текстов исп.:
1. в лексикологии для составления различн. словарей, выделения терминов, определения значения многознач. слов.
2. в грамматике для определения частоты употребления грам. морфем, для выявления наиболее употребляемых типов словосочетаний и предложений, частоты употребления классов слов
3. в лингвистике для дифференир-я типов текстов, создания конкордансов; при машин. переводе для созд. прав. структуры предложений перевод. текста.
Как показ. результаты исп-я корпуса текста, многие лингв. задачи с их помощью не могут быть решены.
Во многих языках нельзя установить принадлежность слова к тому или иному грам. классу, что не позвол. определить частоту употребления грам. классов слов, прав. структуру предложения, а следовательнои употребляемость стр-ры, поэтому стали созд. тагированные корпусы текстов.
Слова т. корпуса получ. букв. и цифр. индексы, к. обознач. их грам., лексич., семант. структур. признаки.
Сущ. прог-мы, к. произв. автомат. тегирование текста.
В послед. время стали созд. параллельные тегиров. корпусы текстов на 2 языках.
фонетические ресурсы (корпусы устной речи)
Глав. трудность созд-я таких корпусов связ. с необходимостью транскрибирования устной речи.
В наст. время общепринято, что для создания машиночит-х фонетич. корпусов или транскрипция на основе орфограф. представления звуков речи с дополнит. знаками, передающими (при необходимости) просодич., паралингвистич. и другие особенности произношения.
В мире сущ. много фонет. корпусов текстов, к. широко исп. для:
1) сопоставит. изуч. устн. и письм. формы яз.
2. для изучения грам. и лекс. особенностей уст. речи.
3. для исследования фонетич. особенностей диалектов
4. для построения частот. списков фонем и их соч-й
5. для созд. комп. систем исп. с целью распознавания символов устной речи.
Напр., в США создан корпус устной речи, сост. из 255 записей психоаналитич. сеансов (9 городов)
в Герм. - записи радиопередач (222 текста).
15. Возможности современного компьютера. Перспективы развития ИТ
известно, что к-р был изобретён как средство вычисления, но постепеноо к его возможностям добавл. и др. функции.
К-р - ср-во решения тех задач, к. человек в состоянии ему поручить на данном уровне развити техники.
Проследим, как расшир. область применения к-ра по мере развития его граф., коммуникац. и интеллект. возможностей.
Комп. графика сыгр. важн. роль в развитии вычислит. тех-ки определив. десятки направлений использования ПК.
Благодаря 3D-графие, археологи смогли воссоздать древн. умерш. города, полеантологи - увидеть умерш. животных; криминалисты - созд. фотороботы людей...
Мощ. граф. серверы позв. учёным исследов. и оцен. в вирт. 3-мерной граф. среде сейсмич. данные и модели нефтян. месторождений. Комп. графика революционизир. процесс созд-я мультипликации, позв. создавать в кино вирт. декорации люб. сложности.
Приложения вирт. реальности нашли применения в индустрии развлечения. архитекторы получ. в свои руки инст-т градостроительного планирования, медики - инстр-т диагностики заболеваний чел.
В обл. лингвистики ПК автоматически созд. аннотации и рефераты текстов, пров. коррекцию орф-и и морф-и, выполн. перевод не только текстов, но и реч. сообщ-й, синтезир. научно-технич. тексты, распозн. и синтезир. чел. речь.
Внедрение сетей позв. превр. ПК из вычислительного в коммуникационное устройство. С появлением Интернета нач. след. век в эволюции человечества - век ИТ.
В наст. время ПК задейств. почти во всех отраслях науки и обороне стран.
Сегодня разраб. ПК нового поколения - это машины недал. будущего, осн. их качеством должен быть высокий интеллектуальный уровень. Это будут ПК с искусств. интеллектом. В них будет возможным ввод с голоса, голос. общение, машин. зрение и осязание.
ИТ в третьем тысячелетии
Сегодня при создании ПК приоритет отдаётся суперкомпьютерам, а также миниатюрным ПК.
Сегодня мобильность становится основной причиной выбора ПК. Очевидна тенденция перехода от наст. ПК к портатив. и смартфонам.
Для создания миниатюр. ПК разраб. новые технологии:
1. молекулярн. ПК - уст-ва, где вместо тразисторов, исп. "интеллект." молекулы, к. могут существовать в 2-х устойчивых термодинамичных состояниях с разн. св-вами.
Перев. молекулы из одного сост-я в другое с пом. света, тепла, магнит. поля, формируя двухбитную с-му.
Размеры молекул. транзистора б. в 2 порядка меньше самых миниатюрных кремниевых и эффективность - в 100 млрд раз выше, чем соврем.
2. ПК на базе молекул ДНК. Если обыч. к-р манипулир. сочетанием 0 и 1, то ДНК им. 4 баз. состояния (А, Г, Т, Ц). ДНК - логика обещает. выс. вычислит. производительность при малых объёмах аппаратного обеспечения и с низ. употребл. электроэнергии.
3. квантовые ПК - ещё более компактные устр-ва, у к. в качестве битов выступ. квантовые объекты. Вместо 0 и 1 исп. квантовый бит (кубит)
32 кубита м. обр. 4 млрд сочетаний.
4. Продолж. работы по созд-ю нейро-ПК - это многопроцессор пК, где инф-я хран. не в отд. ячейках, а в нейросетях. Идёт параллельная обработка инф-и, как в мозгу чел.
В моб. устр-вах встраив. след. ИТ:
- дисплеи, проецир. изобр-е на сетчатку глаза;
- встроен. проекторы для демонстр. изображ. на стену;
- цифр. телевидение для моб. телефона;
- моб. тел. сможет во многих случаях замен. кошелёк и банковскую карту.
В 3-м тыс-летии ПК позв. исп. все 5 чувств. Новые технологии позв. не только видеть, слышать. но и обонять, осязать и даже чувствовать вкус