Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
http://informika.ru/text/magaz/it Колин К. К. Эволюция информатики // "Информационные технологии". 2005 № 01. С.2-16.
Лекции для магистрантов
1 Эволюция информатики
Средства информатики и новые информационные технологии все более широко проникают в экономику, науку, образование, культуру, политику, а также в области обеспечения экологической и национальной безопасности, в бытовую сферу. Начался беспрецедентный в истории человечества процесс формирования глобального информационного общества, многие черты которого все более явственно проявляются уже сегодня.
И философия, и методология современной науки становятся сегодня существенно в большей степени информационно ориентированными по сравнению с тем, как это было в минувшее столетие.
+ Системы образования во многих странах мирового сообщества (США, странах Западной Европы, Японии, Китае, Канаде и России) переживают сегодня новый этап своей радикальной модернизации. Ее целью является существенное повышение качества образования, главным образом, на основе его фундаментализации и информационно-технологической ориентации. А это, в свою очередь, требует перехода в системе образования на новые принципы изучения информатики как фундаментальной науки и общеобразовательной дисциплины.
Представления о содержании предмета информатики как научной дисциплины, а также о месте информатики в системе научного знания несколько раз весьма радикально изменялись. Эволюцию этих представлений можно проследить, рассматривая историю становления информатики за последние десятилетия.
Информатика как гуманитарная наука. Термин "Информатика"появился в научной литературе в начале 60-х годов XX века. При этом он стал практически одновременно использоваться как в России, так и во Франции. Однако смысловое значение этого термина во Франции (а затем и в других странах Западной Европы) и в России было в те годы совершенно различным. Так, например, в изданном во Франции Словаре информатики [1] она определялась как наука о содержательной обработке, особенно с помощью автоматических машин, информации, которая, в свою очередь, рассматривалась как основа человеческих знаний и коммуникаций в технологической, экономической и социальной областях.
В то же время в Большой советской энциклопедии информатика определялась как теория научной информации, т. е. "область гуманитарного знания, изучающая структуру и общие свойства научной информации, а также основные закономерности процессов информационной коммуникации" [2].
Необходимо отметить, что эта точка зрения на предмет информатики как гуманитарной научной дисциплины была сформирована группой ведущих ученых ВИНИТИ [3] и сохранялась ими достаточно длительное время, что подтверждает содержание подготовленной этими учеными монографии "Инфосфера" [4], изданной в России в 1996 г.
Однако далеко не все российские ученые разделяли тогда эту точку зрения. Одним из них был профессор А. В. Соколов, который еще в 1971 г. опубликовал статью [5], где прогнозировал, что информатика в будущем должна превратиться в обобщающую научную дисциплину всего коммуникационного цикла и стать новым научным направлением, которое будет изучать не только научно-техническую информацию, но и все другие виды социальной информации и социальной коммуникации.
В 1976 г. в своем предисловии к монографии "Информатика вводный курс" А. П. Ершов ввел новый термин "информационная технология", которым он обозначил всю сферу машинной обработки информации. Было отмечено, что изучение информационных технологий является одной из важнейших задач информатики как науки.
Информатика как техническая наука. Следующий этап переосмысления содержания предмета информатики следует отнести к периоду 19781983 гг. Он был связан со стремительным развитием вычислительной техники и электроники и началом их все более широкого распространения не только в научной и оборонной сферах, но также в промышленности, экономике, в сфере административного управления и финансовой деятельности.
Академик А. П. Ершов в своей статье "Информатика: предмет и понятие" [7] специально отметил, что "термин "Информатика" уже в третий раз вводится в русский язык в новом, куда более широком значении как название фундаментальной естественной науки, изучающей процессы передачи и обработки информации.
Что же касается зарубежной науки, то в США, Канаде и многих других англоязычных странах термину "Информатика " соответствует термин "Computer science", само содержание которого подчеркивает компьютерную ориентацию данной области исследований. При этом основное внимание уделяется инструментально-техническим аспектам, а не изучению собственно информационных процессов, которыми занимается другая наука, получившая на Западе название "Information science". В России эта наука так и не сформировалась как целостное самостоятельное научное направление. В настоящее время научную проблематику этого направления изучает целый ряд различных научных дисциплин информационного цикла (семиотика, семантика, математическая лингвистика и др.).
2 Онтология предметной области
Онтологией (О) называется краткое описание структуры предметной области (ПрО), которое включает в себя термины (Т), обозначающие объекты и понятия ПрО, отношения (R) между терминами и определения (D) этих понятий и отношений:
O=<T,R,D>.
Построенная онтология предметной области будет полезна для совершенствования следующих областей деятельности:
1. Системы обучения. Действительно, для первого знакомства с предметной областью было бы очень полезно иметь в качестве «опорного сигнала» легко воспринимаемую структуру этой области. С помощью онтологии можно быстро находить ссылки на источники информации.
2. Поисковые системы. Наметившийся сейчас переход от поиска информации по ключевым словам к использованию семантически значимых фрагментов текстов существенно облегчается, если используется онтология ПрО.
3. Научные исследования. Большое значение имеет унификация терминологии ПрО. Наличие онтологии ПрО позволит автоматизировать процесс отслеживания полезных данных и знаний в потоке текущей информации.
4. Системный анализ предметной области. Онтология предоставляет структурированную и частично формализованную основу для проведения системного анализа предметной области.
5. Интегрирование данных и знаний. При объединении информационных баз онтология будет помогать устанавливать семантическую эквивалентность одинаковых фактов и понятий, сформулированных в разных терминах.
В отличие от большинства инструментов для построения онтологий [1] система OntoGrid оснащается двуязычным лингвистическим процессором для извлечения знаний из текстов на естественном языке.
Онтология только тогда будет принята научным сообществом, если в ее разработке участвовали широкие коллективы экспертов данной ПрО, географически удаленные друг от друга. Удобной технологической средой для реализации такого сотрудничества является GRID-сеть распределенная информационно-вычислительная инфраструктура, построенная на основе технологии динамической интеграции вычислительных ресурсов.
Построение семантических сетей текстовых документов
Система анализа текста в интересах построения онтологии ПрО. Под системой анализа текста обычно понимается система, для которой определены следующие элементы: формализм для представления смысла текста; база лингвистических знаний (БЛЗ); отображение, переводящее текст в выбранный формализм; набор алгоритмов решения задач анализа текстов, использующих в качестве данных полученное семантическое представление; интерфейс эксперта, если предусмотрено его участие.
Среди классических задач, на решение которых ориентированны такие системы, можно упомянуть классификацию текстов, реферирование, семантически ориентированный поиск текстов по заданным концептам и др. Достаточно широкое распространение получил подход к анализу текста, опирающийся на онтологию, как на формальную модель ПрО. При этом система анализа текста проецирует онтологию на текст, выделяет в нем объекты из объема понятий ПрО и связи между ними. Для этого необходимо, чтобы в онтологию входило описание способов реализации понятий и отношений ПрО в текстах. Основной задачей системы анализа текстов при построении онтологии видится как раз автоматизация формирования проекции онтологии на ЕЯ тексты (ПроекОнт). Исходя из этого, авторы накладывают следующие требования на БЛЗ и систему в целом.
1. На начальном этапе БЛЗ должна представлять собой зачаток ПроекОнт, необходимый для начала функционирования системы. Этот зачаток вносится экспертом.
2. В системе должны быть реализованы механизмы развития БЛЗ в ходе анализа потока текстов ПрО, а также возможность контроля этого развития экспертом. На каждом этапе развития, БЛЗ должна являться некоторым приближением к ПроекОнт, на основе которого можно решать задачи анализа текста. На некотором уровне развития, БЛЗ должна содержать в себе ПроекОнт.
3. Структура и содержание БЛЗ системы должны быть удобны как при построении семантических представлений текстов, так и при дальнейшем анализе этих представлений.
Система анализа текста САТ. В соответствии с изложенными требованиями, авторами разрабатывается и реализуется система анализа текста САТ. В качестве формализма для представления смысла текста в ней используются семантические Q-сети [8], в основе которых лежат аппарат пирамидальных сетей (ПС) Гладуна В.П. [9] и семантические представления Кузнецова И.П. [10]. Среди достоинств ПС следует упомянуть развитые ассоциативные свойства, иерархичность и, что особенно важно, в них реализованы процессы формирования связей между семантическими объектами, выделения классов объектов и ситуаций, а также процессы формирования обобщенных определений этих классов. В семантических представлениях Кузнецова И.П., в свою очередь, все части текста, соответствующие существенным единицам ПрО, вне зависимости от частоты их появления в текстах, отражены в сети соответствующими фрагментами. Принадлежность Q-сетей к обоим упомянутым классам дает возможность реализовать на них удобные алгоритмы анализа текста, предложенные Гладуном В.П. и Кузнецовым И.П..
Элементы ПрО описываются в ЕЯ текстах элементарными и составными словосочетаниями. Первые обычно состоят из двух слов (анализ данных) и являются реализациями элементарных отношений (r = свойство - объект). Вторые (интеллектуальный анализ данных) можно представить в виде комбинации элементарных словосочетаний (интеллектуальный анализ, анализ данных). Они, в свою очередь, являются реализациями составных отношений. Понятия ПрО также выражаются словосочетаниями (одним словом наименованием понятия, элементарным словосочетанием или комбинацией элементарных словосочетаний).
БЛЗ САТ представляет собой набор элементарных и составных словосочетаний предметной области. БЛЗ удобно использовать в том же виде, который имеют семантические представления текстов, т.е. в виде Q-сети, каждый фрагмент которой соответствует реализации некоторого отношения (т.е. некоторому словосочетанию). Если реализация отношения (словосочетание A) включает в свой состав реализацию другого отношения (словосочетание B), то фрагмент сети А включает в себя фрагмент сети B. Условно БЛЗ САТ можно разделить на базу реализаций элементарных отношений (БРО) и набор критичных фрагментов (НКФ), по которым можно определить, какие элементы онтологии затрагиваются в данном тексте.
Формирование БРО. Начальный объем знаний в виде реализаций элементарных отношений ПрО вносится в БРО экспертом либо в ходе интерактивного анализа текстов предметной области (рис. 1), либо отсеиванием из набора устойчивых словосочетаний предметной области, полученного статистическими методами обработки текстов [5].
Рис. Формирование БРО в ходе интерактивного анализа текста
В первом случае эксперт имеет возможность, переходя от одного предложения текста к другому, выбирать наименование элементарного отношения («Relation») и его аргументы, число которых может варьироваться («Word1»,…) в выпадающих списках. Каждое словосочетание (реализация отношения) характеризуется значениями набора признаков. В текущей версии в него кроме лексем аргументов и наименования отношения входят набор сочетаемости аргументов по морфологическим признакам (заполняется системой с помощью компоненты морфологического анализа [12]) и экспертная оценка значимости словосочетания в рамках предметной области.
Профессиональные интересы специалистов по автоматизированным системам управления в значительной мере связаны с разработкой автоматизированных информационных систем (АИС), относящихся к классу организационно- технических систем, что подразумевает наличие функций, выполняемых оператором.
Одной из важнейших причин неудовлетворительного качества управленческих решений, в том числе и проектных, является низкая эффективность существующих информационных систем.
Основной вопрос, на который должен уметь ответить специалист по АИС заключается в том, какие математические модели должны быть использованы и какой информацией они должны быть обеспечены для того, чтобы гарантировать требуемое качество функционирование конкретного объекта (производственного комплекса, системы передачи данных и т.д.). Ответ на этот вопрос подразумевает, что специалисту известна технология построения таких моделей, методы определения их параметров и интерпретации полученных результатов.
Поэтому построение математических моделей производственных процессов, а также процессов сбора и обработки информации о ходе этих процессов или о явлениях природы является основой разработки АИС.
Современная автоматизированная информационная системы представляет собой многоуровневую иерархическую конструкцию, характеризующуюся функциональной схемой, определяющей взаимодействия между технологическими объектами и соответствующими управляющими подсистемами. Поскольку автоматизируемый технологический комплекс имеет иерархическую структуру (отдельные агрегаты, технологические комплексы, производственные участки, фабрика), то и система управления этим комплексом имеет иерархическую структуру (рис.0.1)
Самый нижний уровень- Input /Output Level обеспечивает непосредственное взаимодействие автоматизированной системы с технологическими объектами с использованием датчиков, исполнительных механизмов, регулирующих органов. На более высоком уровне Control Level осуществляется сбор данных и реализуются локальные системы регулирования с использованием программируемых логических контроллеров (например, семейство SLC500 фирмы Allen Bradley) и средства программирования и переконфигурирования этих контроллеров.. На этом уровне можно отображать ход технологического процесса и производить его корректировку.
На следующем иерархическом уровне (уровне человеко- машинных интерфейсов, контроля и межпроцессорного взаимодействия) осуществляется диспетчеризация систем сбора данных и оперативное управление технологическими процессами с использованием SCADA системы (Supervisory Control and Data Acquisition операторский контроль и представление данных).Здесь используются рабочие станции оператора и функционирующие на них специализированные программные комплексы для описания и конструирования SCADA систем, таких, как Factory Suite 2000 фирмы Wonderware, RSView Rockwell Software или RTAP/ Plus Hewlett Packard.
На самом верхнем уровне создаются системы управления производством и планирования ресурсов предприятия MES (Manufacturing Execution Systems) и MRP (Manufacturing Resource Planning), ERP (Enterprise Resource Planning). На этом уровне функционируют СУБД различной архитектуры (Oracle, Sybase, Informix, IBM DB2). финансово- экономические пакеты, пакеты анализа разнородных данных. Взаимодействие третьего и четвертого уровней обеспечивает организацию общего информационного пространства, объединение промышленных сетей сбора данных и информационных систем общего назначения.
Enterprise Resource Planning
Manufacturing Resource Planning
Manufacturing Execution Systems
SCADA
Рис. 0.1 Иерархическая система управления технологическим комплексом