Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Об информационно-библиотечной культуре
Часто понятие информационной культуры подменяется понятиями компьютерной или информационной грамотности, которые входят в нее как начальные элементы. Компьютерная грамотность предполагает умение обращаться с компьютером и сетью, к которой он подключен, знание основных элементов операционной системы, прикладных программ, поисковых машин Интернета. Информационная грамотность достигается обучением поиску и использованию информации, ее защите, навыкам общения с применением средств и методов информационно-коммуникационной технологии.
Информационная культура - это, сверх всего, понимание внутренних информационных механизмов, управляющих поведением человека и развитием общества. Мы живем в такое время, когда под влиянием быстро меняющейся и внедряющейся в быт информационной техники и технологии меняется весь информационный уклад общества. Для обoзначения этих процессов употребляют много новых социологических ярлыков: информационное общество, общество, основанное на знаниях, цифровое неравенство и т.п. Однако при внимательном анализе этих и других терминов становится очевидным, что мы пока еще не осознаем в полной мере того, что уже произошло и что произойдет в ближайшем будущем.
Это можно объяснить тем, что в прошлом стабильность в информационных механизмах общества определялась медленной сменой соответствующих технологий. На осознание значения книгопечатания подвижными литерами ушло почти целое столетие. Люди интеллектуального труда, освоив информационную культуру своего времени в университете, на протяжении всей жизни пользовались неизменными навыками поиска и использования информации. Теперь студенты, не успев окончить университет, сталкиваются с новыми техническими средствами, представлениями об их приоритете и необходимостью их освоения.
Другая причина непонимания происходящих изменений в информационной культуре - стремление освоить ее на уровне кнопок, а не путем проникновения в существо дела. Это наиболее распространенный метод обучения компьютерной грамотности, но и при объяснении информационных процессов в обществе он встречается, к сожалению, нередко. Слово информация, полстолетия назад не употреблявшееся у нас в научном обиходе из-за неприятия кибернетики коммунистической идеологией, теперь стало настолько модным, что многие явления и процессы в природе, обществе и мышлении при самой отдаленной схожести с информацией называются ее именем. А это, в свою очередь, порождает много заблуждений технократического толка.
Еще одна опасность в этой сфере выявилась сравнительно недавно. Научно-техническая информация переживает не лучшие времена, поскольку общество утратило прежнее доверие к науке. Этому есть много внешних причин - социальных, экономических, политических, экологических и других. Они временные и будут меняться. Наука, ориентированная на войну, все больше заменяется наукой, заботящейся об устойчивом развитии общества.
Воспитанные на диалектическом материализме, мы убеждены в безграничности сферы познания и познаваемости законов природы, общества и мышления. Без хорошо налаженной информации о достижениях в мировой науке никакая наука нигде развиваться не может. А стремление к коммерциализации, которое поддерживают многие руководители научной деятельности, ведет к ограничению открытого доступа к научной информации.
В передовых странах инвестиции в знание превалируют над инвестициями в основные фонды. Но это обернулось для науки негативными последствиями. Правительство США, например, стало строго лицензировать результаты и методы исследований, выполненных на средства государства. Базы данных, в которых отражается информация из журналов, продаются по все возрастающим ценам. Это нарушает права на интеллектуальную собственность авторов статей и издателей журналов. Сокращение публичной сферы распространения научно-технической информации и данных признано важной проблемой международного значения, которую обсуждают национальные академии многих стран и ЮНЕСКО. Для России это особенно важно, так как мы получаем сведения о мировых научных достижениях преимущественно из научно-технических журналов.
В связи с этим уместно упомянуть и о неадекватном положении самой информатики, название которой прочно ассоциируется с обучением компьютерной и отчасти информационной грамотности. Беда не в том, что это называется информатикой, а в том, что истинные проблемы информатики мало разрабатываются в мире и особенно у нас. А ведь без понимания закономерностей научной коммуникации, структуры и общих свойств научной информации, без понимания того, что продается и покупается не информация, а только право на ее коммерческое использование, никаких социальных вопросов науки решить не удастся. Без развития подлинной информатики, т. е. науки о семантической информации, нельзя воспитать и информационную культуру, а значит, и построить информационное общество.
Информационная культура не возникает сама по себе. Ее надо воспитывать, ее элементам надо обучать, как и восприятию других проявлений культуры - различных видов искусств или разновидностей бытовой культуры. И делать это надо на всех уровнях образования, объясняя всю сложность современного этапа перехода к электронным средствам коммуникации. Понимание социальных закономерностей интеллектуальной коммуникации - одна из важных задач университетского образования.
Информация, сведения, данные, знания
Слово информация - одно из самых модных в наше время на всех языках, и особенно на русском. Это связано с тем, что нынешняя цивилизация достигла определенного материального благосостояния, позволяющего обратиться к духовной стороне жизни. Что касается русского языка, то это слово пришло в него сравнительно поздно - в языке русских классиков XIX в. его не было. В прошлом веке оно с 20-х гг. использовалось журналистами как термин, обозначающий один из новостных жанров, а с начала 50-х гг. попало в опалу коммунистической идеологии в связи с тем, что стало обозначать базовое понятие кибернетики, и в этом качестве широко вошло в научный оборот многих дисциплин.
Кибернетика, созданная Н. Винером как наука об управлении в живых организмах и машинах [1], претендовавшая и на управление человеческим обществом [2], была объявлена в СССР буржуазной лженаукой, поскольку законы развития общества являлись абсолютной прерогативой диалектического и исторического материализма. Но и коммунистическая доктрина не могла не считаться с бурным развитием информационной сферы, которая оказалась важной для обороноспособности советской страны. В 60-е гг. был провозглашен лозунг: "Кибернетику - на службу коммунизму". Вот тогда-то термин "информация", как все сначала запрещенное, стал одним из самых распространенных общенаучных русских терминов. Для того чтобы убедиться в сказанном, не нужно читать много литературы - достаточно посмотреть это слово в 18-м и 51-м томах 2-го издания "Большой советской энциклопедии", вышедших в 1953 и 1959 гг., а также в 10-м томе ее 3-го издания, вышедшем в 1972 г.
Термин информация прочно вошел в самые различные отрасли современной науки и техники, в повседневную жизнь. Однако точное и исчерпывающее его определение остается одной из труднейших научных задач. В повседневной жизни информация означает сообщение, осведомление о положении дел, сведения о чем-то. Для философов, склонных рассматривать информацию в одном ряду с такими категориальными понятиями, как материя и энергия, информация - это передача, отражение разнообразия в любых объектах и процессах живой и даже неживой природы. Математики, физики и специалисты по системам связи рассматривают информацию как фактор и меру уменьшения, снятия неопределенности в результате получения сообщения, а кибернетики - как сообщение, неразрывно связанное с управлением в единстве синтаксических, семантических и прагматических характеристик. Биологи, как и философы, довольствуются трактовкой информации как того, что отражает, ограничивает многообразие, но в отличие от философов относят это понятие только к живой природе. Для социологов важны аксиологические (т. е. связанные с ценностью, полезностью) свойства информации, а для специалистов по программированию и вычислительной технике наиболее существенным является знаковое представление информации, и т.д.
Сформировалось мнение о возможности трех подходов к пониманию феномена информации. Атрибутисты полагают, что информация является неотъемлемым атрибутом всех систем объективной реальности, функционалисты отрицают существование информации в неживой природе. По их мнению, это одна из функций жизни, основное отличие живого от неживого. Антропоцентристы определяют информацию как содержание (смысл) сигнала, полученного системой из внешнего мира. Говорить о смысле сигнала, а следовательно, об информации можно только по отношению к человеку и обществу. Оспаривать эти подходы бессмысленно - каждая наука может называть информацией те явления и процессы, которые считает удобным так называть. Но нет никаких доказательств того, что эти разные процессы и явления обладают общими свойствами и закономерностями, поэтому нет оснований считать, что существует такое единое явление или понятие, которое соответствует этому термину.
Для специалистов в области информатики, изучающей структуру и общие свойства информации, а также закономерности ее сбора, обработки, хранения, поиска, распространения и использования, неприемлемо игнорирование самого главного в информации - ее смыслового, семантического содержания. Требуется также уточнение значения и взаимосвязей терминов сведения, данные, информация и знания, которые очень часто считаются синонимами и определяются или трактуются друг через друга, в результате чего образуется порочный логический круг. Чтобы его разорвать, нужно одно из этих слов считать неопределяемым, интуитивно понятным.
Таким словом может быть сведение, которое "Словарь русского языка" С. И. Ожегова определяет как знание, представление о чем-либо, познание в какой-нибудь области, известие, сообщение. Приведем наше толкование терминов "данные" и "информация", их смысловых различий, так как они очень важны для правильного понимания рассматриваемой темы.
Данные суть факты, идеи, сведения, представленные в знаковой (символьной) форме, позволяющей производить их передачу, обработку и интерпретацию (т. е. толкование, объяснение, раскрытие смысла), а информация - это смысл, который человек приписывает данным на основании известных ему правил представления в них фактов, идей, сообщений. Такое понимание информации соответствует и этимологии обозначающего его слова (от лат. information - разъяснение, изложение). Структурированная информация, т. е. связанная причинно-следственными и иными отношениями и образующая систему, составляет знания.
Из этих толкований следует, что если данные воспринимаются и интерпретируются человеком, то они становятся для него информацией, т. е. из "информации в себе" превращаются в "информацию для нас". Данные в определенной степени подобны письменному сообщению, передающему какие-то сведения грамотному человеку и остающемуся набором непонятных знаков для неграмотного.
Таким образом, информация - это потенциальное свойство данных, которое может быть реализовано одним воспринявшим их человеком и не реализовано другим. Объектом машинной обработки являются данные, а не информация, так как никакая машина не в состоянии интерпретировать данные, т. е. преобразовать их в информацию, ибо машина не обладает, как человек, необходимым запасом знаний о мире и не может мыслить. Такова диалектичекая связь между понятиями данные и информация.
В обществе циркулируют разные виды информации. Но из них особенно важную роль играет научная информация, так как она неразрывно связана с наукой. Определение научный в термине научная информация означает, что эта информация удовлетворяет общепринятым в данное время критериям научности (т. е. она объективна, истинна, проверяема и т.п.), но не обязательно получена или используется только в сфере науки.
Если попытаться дать более четкое и полное определение понятию научная информация, то оно может иметь следующий вид: научная информация - это логическая информация, получаемая методами опытно-рационального познания объективного мира в любой сфере деятельности людей, не противоречащая господствующей системе научных представлений и используемая в общественно-исторической практике. Другими словами, мы исходно понимаем информацию как содержание, смысл сообщения, передаваемого одним человеком другому.
Лекция 2
Под научной коммуникацией мы понимаем совокупность процессов представления, передачи и получения научной информации, образующих основной механизм существования и развития науки. Во всех процессах научной коммуникации участвуют ученые и специалисты. Степень их участия различна в зависимости от каналов коммуникации, которые делят на формальные и неформальные.
К неформальным каналам относят непосредственный диалог между учеными и специалистами о проводимых ими исследованиях и разработках, посещение лабораторий коллег и научно-технических выставок, выступления перед аудиторией, обмен письмами и препринтами.
К формальным каналам относят процессы обмена научной информацией посредством литературы. В них непосредственное участие ученых и специалистов, создавших научную информацию, значительно меньше, так как эти процессы оформились в самостоятельные виды деятельности: научно-информационную, библиотечно-библиографическую, архивную, редакционно-издательскую, журналистскую.
Следует отметить, что лишь первый канал специфичен для научной коммуникации, а остальные исполняют роль общих информационных каналов для всех видов семантической информации. В этом направлении развивается и научно-информационная деятельность, методы и средства которой все шире используются во всей сфере информационной коммуникации.
В коммуникационном процессе обычно выделяют ряд этапов, которые соответствуют его основным функциям (или задачам). Прежде всего, необходимо с максимальной полнотой осуществить сбор выявленной заранее информации. Это значит, что из всей массы сведений должны быть отобраны и систематически пополняться все те и только те сведения, которые могут понадобиться для научной или практической работы по нескольким отраслям, одной отрасли, направлению или даже теме какому-либо специалисту, коллективу или учреждению.
Затем необходимо выполнить аналитико-синтетическую переработку информации. Каждую группу сведений, имеющихся в издании или документе, нужно проанализировать с точки зрения содержания, а сам документ - с точки зрения его формы.
Результаты этого анализа записываются кратко: они синтезируются в специально разработанных для этого условных обозначениях (при помощи слов естественного языка, букв и/или цифр, формул, таблиц, графиков). Переработанная таким образом информация становится удобной для ее последующего хранения и поиска, а также для использования в творческой работе.
Следующая задача - долговременное хранение информации. Ее нужно решить так, чтобы собранные сведения занимали как можно меньше места. Материальные носители, на которых они записаны, нужно сохранять как можно дольше и организовать в стройную систему, позволяющую быстро и без затруднений находить необходимые сведения.
Информационный поиск - следующий этап и одна из важнейших проблем информационной деятельности. Она представляет собой ряд логических операций, обеспечивающих нахождение необходимой информации. Решение этой задачи с помощью соответствующего процесса позволяет в любой момент найти в массе собранных сведений те и только те из них, которые являются прямым ответом на вопрос потребителя.
Поскольку результаты всех предыдущих процессов (и особенно информационного поиска) могут представлять интерес одновременно для большого числа специалистов, возникает задача распространения информации. Издания и документы (или их части) с необходимыми сведениями должны быть репродуцированы в достаточном количестве идентичных экземпляров и распределены в кратчайшие сроки между всеми заинтересованными потребителями.
Наконец, для информационной деятельности небезразлично, как применяются ее результаты, хотя использование информации с целью создания новой информации, строго говоря, в задачи этой деятельности не входит. Однако в ее задачи входит пропаганда достижений науки и техники, наиболее рациональных методов работы с документами, оценка эффективности применения этих документов и изучение того влияния, которое информационная работа оказывает на науку, технику, производство и все народное хозяйство. Ясно, что вопросы технологии создания и использования информации, входящие в сферу организации умственного труда, играют важнейшую роль для всей информационной деятельности.
Библиотеки - один из древнейших общественных институтов, который обеспечивает сбор, хранение и доступ к накопленному человечеством знанию, записанному в текстах. Древнейшие из дошедших до нас книг датируются началом 3-го тысячелетия до н.э., а библиотеки - серединой 1-го тысячелетия до н.э. До ХХ в. все элементы информационной культуры накапливались и осмыслялись в библиотечном деле. Поэтому часто говорят об этой сфере культуры как об информационно-библиотечной.
На протяжении тысячелетий библиотека развивалась, по-разному осуществляя свои главные функции - создание фондов документов (записей, книг, журналов) и обслуживание информационных потребностей своих читателей. Поначалу это были очень закрытые библиотеки - дворцовые, храмовые, монастырские, университетские. Лишь в XIX в. они начали становиться более открытыми для широкого круга читателей. В наше время библиотека как общественный институт претерпевает сильные изменения. В условиях распространения электронных информационных технологий происходит заметное перераспределение баланса между основными библиотечными функциями и самого существа этих функций. Информационное обслуживание выдвигается на первый план, а создание фондов обобществляется. Обслуживание читателей все больше ориентируется на электронные носители и использование глобальных сетей, а приобретение литературы - на кооперацию библиотек (координацию комплектования фондов, приобретение литературы, особенно журналов, консорциями библиотек).
В федеральном законе Российской Федерации о библиотечном деле (от 29 декабря 1994 г.) библиотека определяется как "информационное, культурное, образовательное учреждение, располагающее организованным фондом тиражированных документов и предоставляющее их во временное пользование физическим и юридическим лицам; библиотека может быть самостоятельным учреждением или структурным подразделением предприятия, учреждения, организации".
Типология современных библиотек сложна и составляет особый раздел библиотековедения. Общепринято деление библиотек на два типа:
Классифицировать библиотеки можно по самым разным основаниям:
Поскольку таких оснований деления может быть много, то и соответствующие им классификации можно создавать по мере необходимости. Особый тип составляют национальные библиотеки, существующие во всех развитых странах мира. Первой такой библиотекой была объявлена в 1800 г. Национальная библиотека Франции, самой крупной - Библиотека конгресса США (100 млн ед. хранения). Большинство национальных библиотек выполняет пять основных функций. Они получают на основе обязательного экземпляра и сохраняют все издания, выходящие в стране, издают национальную библиографию, являются крупнейшим в стране хранилищем иностранной литературы, обслуживают все три ветви власти (законодательную, исполнительную и судебную) и осуществляют методическое руководство библиотечным делом в стране.
В России национальными считаются три библиотеки: Российская государственная библиотека (43 млн ед. хранения, бывшая Государственная библиотека им. В.И. Ленина), Российская национальная библиотека (33 млн ед. хранения, бывшая Государственная публичная библиотека им. М.Е. Салтыкова-Щедрина) и Президентская библиотека РФ им. Б.Н. Ельцина. Ни одна из них всех перечисленных функций не выполняет, так как национальную библиографию издает Всероссийская книжная палата, у нас есть специальная Всероссийская библиотека иностранной литературы им. М.И. Рудоми-но, а все ветви власти имеют собственные библиотеки.
Согласно Федеральному закону "О библиотечном деле" (1994 г.) библиотека - "информационное, культурное, образовательное учреждение, располагающее организованным фондом тиражированных документов и представляющее их во временное пользование физическим и юридическим лицам". Из этого определения ясно, что функционально библиотека должна состоять из четырех основных блоков: библиотечного фонда (книг, журналов и других видов изданий), читателей (которые этими изданиями пользуются), библиотекарей (которые осуществляют работу библиотеки) и материально-технического обеспечения (книгохранилищ, читальных залов, компьютеров, линий связи и других технологических средств).
Основным каналом поступления книг в библиотеки является их покупка в книжных магазинах на средства, выделяемые из бюджета, журналов - подписка в агентствах печати. Другими источниками комплектования является книгообмен с другими библиотеками, дарение из частных коллекций, для наиболее крупных и национальных библиотек - обязательный экземпляр. Система обязательного экземпляра, возникшая, как было сказано, во Франции еще в XVIII в., в настоящее время используется в основном для государственной регистрации всех изданий, публикуемых на территории государства. Она служит для учета этих изданий, их отражения в государственной библиографии и ведения книжной статистики. В нашей стране эти функции выполняет Российская книжная палата.
Отдел комплектования библиотеки осуществляет эту работу в соответствии со своим профилем комплектования и инвентаризирует полученную литературу. Затем она поступает в отдел обработки, где каждый экземпляр книги подвергается аналитико-синтетической обработке, т.е. библиографическому описанию и систематизации, которые необходимы, чтобы книга была отражена в алфавитном и систематическом каталогах библиотеки. После этого она поступает в отдел хранения, где определяется ее место на полках книгохранилища в соответствии с принятой в библиотеке системой расстановки книг.
Расстановка книг на полках может осуществляться по их содержанию в соответствии с некоторой схемой классификации, по их высоте (т. н. форматная расстановка), в порядке поступления (по инвентарным номерам) или по комбинации этих признаков. Внутри каждой классификационной рубрики книги расставляются по алфавиту фамилий их авторов. Чтобы облегчить библиотекарю ежедневную работу по снятию затребованных книг с полки и их постановке на место, американский библиотекарь Чарльз Кеттер (1837-1903 гг.) придумал специальный знак, который во всем мире называется его именем, а у нас авторским знаком. Он состоит из первой буквы фамилии автора и номера, присвоенного следующему за ней двух- или трехбуквенному сочетанию. Этот знак обычно печатается на обороте титульного листа книги, входит в ее библиотечный шифр и избавляет библиотекаря от необходимости соблюдать строгий алфавитный порядок при постановке ее на место в книгохранилище.
Наряду с основным книгохранилищем многие библиотеки создают удаленное архивное хранение для малоспрашиваемой литературы и подсобные фонды вблизи от кафедры выдачи для часто спрашиваемых изданий. Крупные библиотеки, в фондах которых есть ценные редкие издания, снимают их в целях сохранности на микрофильмы - для выдачи читателям, а также потому, что микрофильм, в отличие от электронной формы хранения, проверен на долговечность по меньшей мере за последние полтораста лет.
Журналы и другие периодические издания (по аналогии с англоязычной терминологией называемые сериальными) обычно расставляются по их названиям, а внутри каждого названия - по годам и номерам. Встречается и чисто хронологическая расстановка периодики - по годам выпуска, внутри по названиям. К сериальным изданиям относят также т. н. продолжающиеся издания, выходящие нерегулярно (например, труды, ученые записки и т.п.).
Обслуживание читателей в библиотеке традиционно осуществлялось путем выдачи книг для чтения в читальном зале или же по так называемому абонементу, т.е. для чтения дома на определенный срок. Если запрашиваемой книги в библиотеке не оказывалось, ее получали из другой библиотеки по межбиблиотечному абонементу. В связи с резким удорожанием почтовых услуг теперь нужные тексты получают по электронной почте. Читатели могут за определенную плату заказывать ксерокопии, микрофильмы книг и их фрагментов, переводы текстов на иностранные языки и другие информационные услуги, например, списки литературы или библиографические обзоры по требуемой теме.
В библиотеке имеется библиографический и/или справочно-библиографический отдел, в котором сосредоточены средства информационной навигации: библиографические указатели, реферативные журналы, схемы классификации, списки предметных рубрик, тезаурусы, всевозможные картотеки, облегчающие читателю поиск необходимой информации. В современных библиотеках эти средства имеются не только в традиционном полиграфическом или карточном виде, но и в электронной форме, позволяющей вести поиск по более широкому спектру признаков. Многие библиотеки хранят электронные версии обычных книг и журналов, собственно электронные книги и журналы, не выходящие в полиграфическом исполнении, базы данных, а также звукозаписи, видеофильмы на магнитных носителях. Поскольку такие издания получили название "медиа", то и хранящие их библиотеки иногда называют медиатеками.
Возникло понятие электронной библиотеки. Оно пока еще не устоялось и включает национальные и международные проекты с государственной поддержкой ("Память мира" ЮНЕСКО, "Библиотека Универсалис", проект Gutenberg), коммерческие проекты (BookSearch-Google, Internet Archive, "Библиотека Мошкова"), а также коллекции электронных изданий в составе традиционных библиотек (Российская государственная библиотека, Библиотека конгресса США, Национальная библиотека Франции) и банки данных специальных изданий (стандарты, патенты, промышленные каталоги). Почти все электронные библиотеки создаются в первую очередь для улучшения доступа к изданиям, представляющим историческую, культурную или научную ценность.
Основной проблемой при создании электронных библиотек является неопределенность их правового статуса. Три четверти таких библиотек содержит материалы, защищенные авторским правом. При этом, по данным ЮНЕСКО, две трети из этих библиотек считают, что право на оцифровку дают законы страны, около половины, тем не менее, заключают соглашение с владельцами прав, а пятая часть не заботится о формальностях. Другие проблемы связаны с технологией их формирования. После того как произведен отбор книг для библиотеки, их надо отсканировать. Для этого нужно специальное оборудование, позволяющее автоматически сканировать страницы и не оказывающее слишком вредного воздействия на них. Затем приходится позаботиться о навигации по книге, т.е. быстром поиске нужных страниц, о том, чтобы полученные файлы имели один формат. Лишь после этих процессов можно создать базу данных с системой управления ею (СУБД), для того чтобы библиотека стала доступна читателям через Интернет.
Поиск нужной литературы в библиотеке осуществляется по каталогам - алфавитному (если читатель знает автора и заглавие нужной книги), систематическому (если он ищет литературу по определенной отрасли знания, дисциплине или их разделу), предметному (если нужна информация по некоторому предмету, т.е. вопросу или проблеме). Поскольку в отечественных библиотеках предметных каталогов обычно не бывает, их часто заменяет алфавитно-предметный указатель (ключ) к систематическому каталогу. Во многих библиотеках карточные каталоги заменяются электронными, которые позволяют вести поиск по более широкому набору признаков.
Как правило, читатель ищет литературу по своей теме, не зная конкретных авторов и заглавий. Поэтому основным инструментом для него служит систематический каталог. В нем описания книг расположены по отраслям знания, научным дисциплинам и их разделам. Состав и порядок расположения этих дисциплин определяется принятой в библиотеке схемой классификации. Массовые библиотеки в России пользуются Библиотечно-библиографической классификацией (ББК), созданной в Государственной библиотеке СССР им. В. И. Ленина полвека назад. Отечественные научные библиотеки ориентируются на Универсальную десятичную классификацию (УДК), созданную в начале прошлого века бельгийским документалистом и создателем информатики Полем Отле. Эта классификация основана на Десятичной классификации Дьюи (ДДК), созданной выдающимся американским библиотечным деятелем Мельвилем Дьюи в 70-х гг. XIX в.
Принцип этой схемы расположения наук обозначен в ее названии: весь универсум знаний разделяется на десять разделов, каждый из них - на десять подразделов и так до самых последних делений. Это удобно, потому что каждое деление обозначается легко запоминаемой десятичной дробью (без ноля и запятой), понятной говорящим на любом языке. Однако в этом принципе есть и недостаток, заключающийся в том, что уже в момент ее создания философы делили знания на значительно большее число разделов, не говоря о нашем времени. Так что эта классификация не отражает нынешнего представления о структуре науки, хотя ее разделы постоянно подвергаются пересмотру и уточнению.
Библиотечное дело изучается научной дисциплиной "библиотековедение", которая в "Номенклатуре специальностей научных работников" входит в раздел "Документальная информация" как единая специальность "Библиотековедение, библиографоведение и книговедение".
Библиография - это многозначный термин, охватывающий библиографическую деятельность, ее результаты в виде библиографических указателей, списков и баз данных и специальную научную и учебную дисциплину библиографоведение. В обыденном сознании библиография представляется просто списком литературы. Но не всякий такой список является библиографическим. Чтобы про него можно было так сказать, надо, чтобы его можно было оценить, т.е. выяснить, соответствует ли он определенным критериям: не пропущено ли в нем что-нибудь, нет ли лишних записей. А для этого должно быть оговорено, какие виды литературы в нем отражены (например, книги, журналы, статьи и т.п.), на каком языке, за какое время, по каким наукам, предметам, вопросам и т.д. Так что обычный список использованной литературы в курсовой или дипломной работе, статье или диссертации, строго говоря, библиографией не является, хотя часто так называется.
Особенно важно в наше время, что библиография является составной частью любой науки и в совокупности - органической частью всей науки в целом. Она охватывает подготовительный этап всякого научного исследования, как бы суммирует литературу по предмету этого исследования. Это тот инструмент сохранения знания, который образует ее содержательный каркас.
Библиография во всех упомянутых ее значениях, т.е. как сфера деятельности с ее методологией, экономикой, социологией и наукой, составляет важную часть необходимой современному обществу информационной культуры. Об этом свидетельствуют и справедливые нарекания в адрес Интернета, в котором усиливается беспорядок, и несовершенство многих его поисковых машин. Большинство хаотичных и случайных технологических нововведений, призванных улучшить положение дел, не учитывает уже известных закономерностей в этой области знаний, другими словами, достижений информационной культуры.
Библиографическое описание является специализированным языком, который обслуживает библиотечное дело, библиографию, науку, информационную деятельность. Суть его заключается в том, что признаки документа (будь то рукопись, произведение печати или электронный ресурс), необходимые для его идентификации и для информирования о нем читателей, располагаются в определенном порядке в виде элементов описания. Место каждого элемента, правила его заполнения и знаки перед элементами устанавливаются соответствующими стандартами [3]. Это позволяет человеку, знакомому с этим языком, более или менее однозначно описать каждый документ, опознать его в тексте и определить степень его полезности для своих задач.
Этот язык развивался на протяжении веков, становясь все более точным и отражая изменения самих документов и их потоков. Многим он представляется ненужной формалистикой, без которой вполне можно обойтись, но это не так. По этому поводу в свое время хорошо написал директор Библиотеки Британского музея сэр Антонио Паницци в письме к графу Эллесмеру, 29 января 1848 г.: "Что касается людей, которые не видят трудностей…, смеются над правилами, над методикой, над принципами, над аккуратностью, над последовательностью и над другими библиографическими глупостями, то слушать их стоит не больше чем слепого, когда он обсуждает недостатки живописи или вообще искусство колорита".
Библиографическое описание (другие названия книгоописание, описание произведений печати) - сложный процесс, для профессионального владения которым надо долго обучаться, в полном объеме доступен только профессиональным каталогизаторам, опытным библиотекарям и библиографам. Всем остальным работникам умственного труда достаточно знать упрощенные правила описания, которые соответствуют недавно принятому стандарту для библиографических ссылок. Он устанавливает, что документы, в которых указано не более трех авторов, описываются под фамилиями и инициалами этих авторов.
Тарасова В. И. Политическая история Латинской Америки: учеб. для вузов. - 2-е изд. - М.: Проспект, 2006. - 305 с.
Документы, в которых указано больше трех авторов или авторы не указаны, описываются под заглавием, т.е. названием документа, а инициалы и фамилия первого автора указываются в тексте самого описания.
История Российской книжной палаты, 1917-1935 / Р. А. Айгастов [и др.]. - М.: Рос. кн. палата, 2006. - 447 с. - ISBN 5-901202-22-8.
Составные документы, т.е. изданные в составе других документов, например, статьи в журнале или сборнике, описываются так же, как и самостоятельно изданные, но после знака две косые черты // указывается то издание, в состав которого они входят.
Адорно Т. Е. К логике социальных наук // Вопр. философии. - 1992. - № 10. - С. 76-86.
Электронные ресурсы описываются так же, как и произведения печати, но с добавлением даты их обновления (если она указана), электронного адреса и даты обращения к этому ресурсу в момент его описания.
Экономический рост // Новая Россия: [библиогр. указ.] / сост. Б.Берхина, О.Коковкина, С.Канн; Отд-ние ГПНТБ СО РАН.Новосибирск, [2003-]. Дата обновления: 6.03.2007. URL: http://http://www.prormetus.nsc.ru/ (дата обращения 22.03.2007).
Порядок следования элементов библиографического описания, который позволяет опознавать их при чтении, правила их заполнения, особенности описывания документов разных типов, как уже сказано, устанавливаются стандартом. Они подробно разобраны с примерами в отдельно изданном "Практикуме по поиску и библиографированию информационных ресурсов".
Органы научной информации и специальные библиотеки служат важнейшими вспомогательными учреждениями науки. Эти учреждения призваны выявлять и собирать информацию, анализировать и перерабатывать ее в формы, удобные для хранения и последующего поиска, обеспечивать ее хранение и распространение, включая выдачу по запросам. Однако осуществляя общие функции, они решают разные конкретные задачи, при помощи специалистов разного профиля и разными методами. Эти различия надо понимать, чтобы лучше использовать те возможности, которые предоставляют информационные службы и библиотеки. Одно из таких различий, касающееся информационных работников и библиотекарей, было удачно сформулировано несколько десятилетий назад группой ведущих американских ученых в докладе президенту США:
"Для перегруженного текущей работой специалиста гораздо важнее получить помощь от квалифицированного ученого-информатора, чем самому разбираться в огромном количестве литературы, полученной им из информационного центра. Квалифицированные ученые, работающие в информационном центре и вносящие свой вклад в науку, составляют ядро такого центра. Именно они превращают специализированный информационный центр в научно-исследовательское учреждение, а не в техническую библиотеку" [4].
Таким образом, информационный работник и библиотекарь - специалисты разного профиля. Первый из них - это специалист в определенной области, участвующий в решении проблемы и обеспечивающий свой коллектив информацией. Библиотекарь же, который тоже может иметь образование и квалификацию в одной из отраслей знания, - это специалист, владеющий методами библиографического контроля, ориентирующийся в огромном потоке книжно-журнальной продукции, понимающий психологию читателя и обладающий педагогическим мастерством руководства его чтением.
Конечные задачи информационной службы - оповещать о новых фактах и идеях, отвечать на фактографические запросы, например, что известно по данному вопросу, какими свойствами обладает данный объект, какие объекты обладают данными свойствами и т.п. Поскольку сегодня ответы на эти вопросы содержатся в научных документах и базах данных, информационные службы работают с ними и часто вынуждены вместо фактографических давать "документальные" ответы: какие сведения содержатся в тех или иных документах, в каких документах содержится необходимая информация. Следовательно, работа с научными документами - не основная деятельность информационных служб, а лишь средство для получения необходимой информации, ее интеллектуальной переработки и предоставления потребителю в удобной для использования форме.
Библиотека же - культурно-просветительное и научно-вспомогательное учреждение, организующее общественное пользование произведениями печати и письменности и призванное помогать читателю в выборе книг, руководить его чтением. Таким образом, библиотеки и информационные службы имеют разные конечные цели и задачи, хотя во многом работают с одними и теми же научными документами.
Еще одно различие касается людей, на которых направлена деятельность этих учреждений. Потребитель информации обращается к информационным работникам за конкретными сведениями. Он вправе требовать от них точного и полного ответа на узкоспециальный запрос, поскольку они обязаны следить по документальным источникам за развитием обслуживаемых ими направлений. В библиотеке тот же самый человек выступает как читатель, которому наряду с произведениями, соответствующими его сегодняшним узким интересам, нужно дать прочитать книги и статьи, расширяющие его кругозор, повышающие его квалификацию, ориентирующие его в смежных областях, удовлетворяющие его общенаучные и широкие общественные интересы.
Наконец, если рассматривать работу этих двух типов учреждений по-крупному, то нельзя не отметить, что они работают и в разных режимах. Хотя это различие не носит принципиального характера, но такова преимущественная практика, и, по-видимому, она не случайна. Большинство информационных служб работает в режиме регулярного распространения научной информации. Он соответствует режиму поступательного развития науки, периодического выхода новых публикаций, появления непубликуемых научных документов.
Органы информации стремятся к максимально полному ознакомлению с новыми документами, осуществляют их аналитико-синтетическую переработку, а затем равномерными порциями доводят их основное содержание до сведения потребителей в виде отдельных выпусков периодически издаваемых реферативных журналов, обзоров, экспресс-информации или библиографических указателей. Одновременно информационные службы стремятся обеспечить долговременное хранение документов с целью их последующего поиска и выдачи потребителям по запросу.
Библиотеки же преимущественно работают в режиме "запрос - ответ". Они накапливают произведения печати и письменности, раскрывают их содержание и организуют их хранение таким образом, чтобы выдавать затем по запросам читателей. Правда, почти каждая библиотека или группа библиотек ведет регулярное информирование читателей о своих новых поступлениях, но эта их деятельность по объему значительно уступает обслуживанию читателей по запросам.
С развитием каждой цивилизации по мере усовершенствования ее языка и письменности вырабатывались и определенные типы документов, как по форме, так и по содержанию. Самые древние из дошедших до нас документов - клинописные плитки Месопотамии - датируются четвертым тысячелетием до н. э. От шумерской культуры того времени и ассиро-вавилонской, расцвет которой приходится на второе тысячелетие до н. э., сохранились сочинения в области астрономии, географии, истории, права, торговли. Наряду с небольшими глиняными плитками высотой в 2,5 см изготовлялись плитки высотой до 40 см, содержащие до 400 строк в 4 колонки с двух сторон. Основным недостатком этих глиняных книг, в течение тысячелетий обслуживавших культурные и научные потребности человека, была их громоздкость и недостаточная емкость. Отдельные произведения занимали до 10 плиток. Собрания, насчитывавшие десятки тысяч плиток (а до нас дошли остатки подобных библиотек), требовали огромных помещений.
Папирусный свиток - более компактная форма документа, позволявшая накапливать большие собрания произведений письменности. Начиная с третьего тысячелетия до н.э., в Египте изготовлялись именно такие книги. Текст на папирусном свитке располагался перпендикулярно его длине колонками от 25 до 45 строк. Хрупкость и недолговечность папируса обусловила незначительное число дошедших до нас образцов древнеегипетских документов (древнейший из них восходит к XVIII в. до н.э.). Это, главным образом, ритуальные "книги мертвых", извлекаемые археологами из пирамид и других захоронений.
У греков и римлян на протяжении долгого времени сведения (особенно научного характера) распространялись устным путем. Известно, что лишь после Аристотеля для этих целей стали широко применяться рукописи. До середины нашего века мы не располагали ни одним оригиналом времен античных классиков, часто столетия отделяют последнюю сохранившуюся копию от возможной даты написания текста. Исключение составляют лишь найденные во время второй мировой войны кумранские рукописи ("рукописи Мертвого моря"), датируемые первым веком н. э. Сведения о греческих и римских папирусах почерпнуты из малоазиатских и позднеегипетских образцов. Средняя длина свитка не превышала 10 м, ширина - 30 см.
Пергамент, изготовлявшийся из телячьих шкур, известен как материал для письма с III в. до н.э. Он позволял писать с двух сторон, был более долговечен, чем папирус, и обусловил переход к современной блочной форме книги - кодексу. Кодексы из папируса изготовлялись еще в первые века н.э., но к V в. были вытеснены пергаментным кодексом.
Кодекс - более емкая форма книги, чем свиток, он удобнее для записи больших текстов и для наведения справок. Пергаментные кодексы вплоть до XII в. были единственной формой книги в Европе. Основным их недостатком, препятствовавшим широкому распространению письменных документов, была дороговизна. Для одного экземпляра пергаментной книги требовались шкуры целого стада телят. На смену пергаменту пришла бумага, изобретенная в 105 г. в Китае. На Ближнем Востоке ее начали изготовлять с 751 г., а в XII в. через арабских завоевателей Испании она проникла в Европу.
Бумажная книга, значительно более дешевая, чем пергаментная, стала широко использоваться в научных и образовательных целях. Опыт нескольких тысячелетий развития письменных документов показывает, что их форма менялась главным образом под влиянием потребностей общества: документы становились все более емкими, удобными для использования и дешевыми. Именно эта тенденция развития средств, служивших для закрепления информации, привела к появлению бумажного книжного блока, который до нашего времени оставался основной материальной формой документа.
В XV в. стала повсеместно ощущаться потребность в новом способе изготовления документов. Рукописная книга перестала удовлетворять культурные и научные запросы общества по двум причинам. Во-первых, она изготовлялась слишком долго и требовала значительных затрат труда. Во-вторых, переписка текстов от руки не давала возможности получить большое число экземпляров идентичного содержания, так как копии одного и того же текста отличались друг от друга из-за искажений, вносимых переписчиками.
Именно к этому времени относится историческое изобретение в 1448 г. немецким ремесленником И. Гутенбергом книгопечатания подвижными литерами. Технические средства, которые легли в основу книгопечатания, - граверная и литейная техника и винодельческий пресс, преобразованный Гутенбергом в печатный станок, - были известны еще в античные времена. Однако лишь настоятельная потребность общества в быстром и точном механическом воспроизведении текстов вызвала к жизни это изобретение, совершенству которого мы не перестаем удивляться и основными принципами которого еще пока продолжаем пользоваться для размножения документов.
Мы знаем, что теперь появились технические средства, значительно повысившие наши возможности хранения больших массивов информации с быстрым доступом к любой единице этой информации. Речь идет о компактных оптических дисках, используемых в качестве внешней памяти компьютера (CD - Compact Disc). В этой области прогресс происходит так быстро, что рискованно приводить какие-либо точные данные. Но объем одного диска измеряется гигабайтами, т. е. миллиардами страниц текста, время записи и считывания одной страницы не превышает долей секунды, а поиск и выдача информации по запросу в электронной библиотеке занимает секунды. Выведенные на экран тексты и изображения можно изменять по мере необходимости. Эти новые средства используются столь активно, что успешно конкурируют с традиционными.
Различные виды документов возникали в разное время и на протяжении последних столетий и даже десятилетий претерпевают значительную эволюцию. Книга существует уже несколько тысячелетий, описание изобретений - полтысячелетия, научный журнал -350 лет, а журнальная статья в ее настоящем виде - 100-150 лет. Типология документов также существенно меняется. До последнего времени наиболее важным считалось деление научных документов на опубликованные и непубликуемые. Еще несколько десятилетий назад идеи и факты признавались введенными в оборот только после их опубликования, означавшего широкое распространение и официальную регистрацию документов, в которых они содержались.
Для информационной деятельности это разграничение менее существенно, так как, во-первых, в неопубликованных документах содержится много ценной информации, опережающей сведения, которые появляются в публикациях, а, во-вторых, новые средства репродуцирования делают это разграничение очень условным. Такие научные документы, считающиеся обычно непубликуемыми, как отчеты, диссертации, переводы, часто распространяются в сотнях и даже тысячах экземпляров.
Информатика выдвинула на первый план деление документов на первичные и вторичные. Деление это также очень условно и приблизительно, поскольку оно главным образом относится к самой информации, а не к документам, в которых она содержится. Считается, что в первичных документах отражаются непосредственные результаты познания, а во вторичных - результаты аналитико-синтетической переработки информации, содержащейся в первичных документах. Однако исторически сложившаяся система научных документов такова, что многие из них содержат одновременно и результаты научных исследований, и переработку прежних сведений, содержавшихся в ранее опубликованных документах. Примером могут служить и статьи в научных журналах, и монографии, и учебники, и особенно - справочная литература.
Тем не менее, деление это удобно, так как позволяет характеризовать различные потоки документов в информационной деятельности. Мы придерживаемся его в информатике, считая первичными те документы и издания, в которых преимущественно содержатся новые сведения или новое осмысление известных идей и фактов, а вторичными - те документы и издания, в которых содержатся сведения о первичных документах. С учетом сделанных оговорок к первичным документам и изданиям можно отнести большинство книг (за исключением справочников), журналы, газеты и другие сериальные издания, описания изобретений, стандарты, отчеты, диссертации, переводы, а ко вторичным - справочники и энциклопедии, обзоры, реферативные журналы, библиотечные каталоги, библиографические указатели и картотеки.
Специальные исследования показали, что две трети всех информационных потребностей специалистов удовлетворяются через журналы. Журналом мы будем называть периодическое (сериальное) издание, регулярно публикуемое в течение одного года выпусками, одинаково оформленными и содержащими статьи или иные материалы научно-технического или общественно-политического содержания, а также произведения художественной литературы. В журналах содержится новейшая информация, освещаются последние достижения науки и техники. Журналы появились, как уже сказано, триста пятьдесят лет назад: точной датой этого события считается 5 января 1665 г., когда был опубликован первый номер французского еженедельника "Журнал ученых", который дал название этому виду периодических изданий.
Основным назначением этого журнала, предопределившим характер научных журналов на 150 лет вперед, стало оповещение о новых книгах по всем отраслям науки, литературы и искусства, однако с особым вниманием к естественным наукам и технике. Для раскрытия содержания книг в то время широко пользовались прямыми заимствованиями и цитатами из текста. Вначале научная хроника играла в журнале второстепенную роль, постепенно все больше места в нем стали занимать сообщения об экспериментах в области естественных наук и вновь открытых явлениях природы. Оригинальные статьи в течение всего XVIII в. публиковались в журналах редко. Обычно они принадлежали крупным ученым и имели традиционно-условную форму писем одного ученого к другому: так было принято сообщать о научных открытиях в предшествующие эпохи.
Начиная с XIX в. журнал становится основным источником научной информации. В нашем столетии установилась исключительно важная практика упоминания в каждой журнальной статье всех научных работ, которые использовались при ее написании. Однако рост числа журналов, их недостаточная профилированность, быстрое старение опубликованных в них материалов привели к тому, что уже с 30-х гг. прошлого века журнал как источник информации стал подвергаться критике ученых. Они выдвинули множество проектов замены научных журналов другими средствами распространения знаний. В их основе лежит предложение вместо издания журналов депонировать разрозненные статьи в специальных отраслевых центрах и отражать их в реферативных журналах.
С развитием информатики наступил новый этап в изучении научных публикаций, поскольку основное внимание стали уделять закономерностям, характеризующим внутреннюю связь изданий с развитием науки, количественные зависимости между числом публикаций и показателями роста науки. Закономерности эти связаны со структурой и свойствами научной информации, но проявляются несколько иначе и могут быть достаточно точно измерены.
Выяснилось, что для числа авторов, публикующих определенное количество работ в течение своей жизни, числа журналов, ежегодно публикующих определенное количество статей, числа публикаций, содержащих определенное количество ссылок на другие публикации, существует общая закономерность распределения.
"Они следуют тому же типу распределения, который характеризует соотношение миллионеров и бедняков в условиях высокоразвитой капиталистической экономики: огромная доля богатств находится в руках узкого круга богачей, а небольшой остаток - в руках несметного множества мелких производителей. Является ли точная форма распределения логарифмической, экспоненциальной, описывается ли она законом Ципфа или обратной квадратной функцией - это предмет особого рассмотрения в каждом отдельном случае" [5].
Это означает, что большинство авторов за всю жизнь публикуют лишь одну или две статьи, тогда как небольшая группа авторов отличается плодовитостью, публикуя по несколько десятков или даже сотен работ. По большей части прекращают выходить в свет периодические издания, успевшие выпустить несколько годовых комплектов, тогда как небольшое число давно выходящих изданий публикует львиную долю всех статей. Примерно половина опубликованной литературы обязана такому числу авторов или журналов, которое составляет квадратный корень общего их количества.
Рост литературы выражается в непрерывном увеличении числа новых названий вновь появляющихся изданий и публикаций. Широко распространенное представление об экспоненциальном росте основных видов литературы справедливо лишь для ее суммарного количества, причем без учета старения. Реальной моделью такого представления могут служить крупные научные библиотеки, комплектующие литературу по широкому профилю и выполняющие функции архивного хранения литературы. Но если нас интересует ежегодный прирост новой литературы, то приходится быть более осторожными в оценках.
Статистика мирового книжного рынка за последние полстолетия показывает, что число ежегодно выпускаемых на рынок книг увеличивается в арифметической прогрессии, а именно на несколько десятков тысяч названий, и достигает ныне 3 млн. Справедливость требует заметить, что это все выходящие книги - тех, которые поступают в продажу, существенно меньше. Если бы было возможно учесть заказные, бесплатные, ведомственные, учебно-методические и другие издания ограниченного распространения, то приведенные цифры были бы более точными. Следует также иметь в виду, что книги, содержащие научную информацию, составляют четверть от общего их числа.
Подсчет числа журналов значительно сложнее, так как они, в отличие от книг, все время находятся в процессе изменений. Журналы возникают, прекращаются, сливаются, дробятся, меняют название, издателей, периодичность. По мнению специалистов, на каждые три новых журнала один перестает выходить. Наиболее достоверные сведения о числе выходящих журналов можно получить из "Международной библиографии периодических изданий", выходящей под именем Констанции Ульрик. В последнем издании этого справочника зарегистрировано около 200 тыс. названий журналов, из которых около 50% падает на издания по общественным и гуманитарным наукам, 40% составляют журналы по точным, естественным и прикладным наукам и лишь 10% - литературно-художественные и общественно-политические журналы.
Старение публикаций заключается в том, что они с увеличением своего "возраста" теряют ценность как источники информации и все меньше используются специалистами. Степень этого использования можно устанавливать при помощи учета цитирования. В данном случае стареет не сама информация, а содержащие ее публикации, поскольку в свежих работах эта информация может быть "упакована" более плотно вместе с новой.
Для измерения скорости старения публикаций американские ученые Р. Бартон и Р. Кеблер предложили в 1960 г. меру, названную периодом полужизни публикаций, по аналогии с показателем скорости распада радиоактивных веществ. Период полужизни публикаций - это время, в течение которого была опубликована половина всей используемой в настоящее время литературы по какой-либо отрасли или предмету. Например, если этот период равен 5, то это значит, что 50% всех процитированных в текущем году по данному предмету работ не старше пяти лет. Ниже приводятся данные разных авторов о периодах полужизни публикаций в различных отраслях науки:
Биомедицина 3,0 |
Химия 8,1 |
Физика 4,6 |
Государство и право 8,2 |
Металлургия 4,6 |
Ботаника 10,0 |
Хим. технология 4,8 |
Математика 10,5 |
Социология 5,0 |
Геология 11,8 |
Машиностроение 5,2 |
География 16,0 |
Физиология 7,2 |
История 16,3 |
Достоверность приведенных цифр зависит от величины выборки цитирования, от типа и характера публикаций, поэтому даже в пределах одной науки данные разных авторов могут существенно расходиться. Но дело не только в этом. В 70-е и 80-е гг. прошлого века проблема старения литературы подверглась интенсивным исследованиям, в результате которых ее понимание стало сильно отличаться от концепции периода полужизни. Начало этому пересмотру положил М. Лайн, который ввел в расчет характеристики старения литературы темпы ее экспоненциального роста. Сущность того, что произошло в трактовке старения, как всегда ярко выразил Д. Прайс.
"В течение нескольких лет после публикации спрашиваемость статьи или ее относительная цитируемость уменьшается крайне медленно (по параболе, если считать по логарифмам прошедших лет). Даже через столетие возможность цитирования уменьшается только на порядок. Большинство ссылок падает на работы последних лет потому, что этих работ большинство, и очень сомнительно, чтобы это вызывалось эффектом немедленности, связанным с быстрым старением..." [6].
Этой проблеме до сих пор и у нас, и в ряде зарубежных стран посвящается много серьезных работ, которые убеждают в том, что частота использования определенной совокупности литературы одного года издания меняется очень медленно. Использование публикаций, определяемое по их цитированию или на основе запросов читателей, отражает не только старение литературы, но и ее рост.
Для теоретиков информатики и историков науки важно учитывать старение литературы в чистом виде, для информаторов и библиотекарей период полужизни служит важным практическим показателем и продолжает широко использоваться. Следует также иметь в виду, что цитируются далеко не все научные публикации. Половина статей в определенной области в текущем году, как правило, не упоминается, а еще 40 % цитируется лишь один раз (обычно самим автором). Таким образом, активный исследовательский фронт, т. е. число работ, цитируемых более одного раза в году, на порядок меньше корпуса опубликованной литературы.
Распространенная оценка продуктивности научной деятельности основывается на абсолютных показателях общего числа опубликованных научных работ и/или библиографических ссылок на них. Однако такая оценка, как правило, носит односторонний характер. Общее число статей в действительности оценивает лишь публикационную активность научного работника, но не учитывает значимости публикаций, того информационного вклада, который они вносят в науку. Общее число ссылок на работы автора не учитывает возможности большого числа ссылок только на некоторые из его работ, написанные притом в соавторстве. Этот показатель дает неоправданный приоритет цитирующим обзорным работам перед исследовательскими. В этих случаях показатель также не оценивает реального вклада ученого в науку.
Чтобы устранить указанные ограничения, можно считать только число значимых статей, установив для их значимости критерий определенного числа ссылок на них. Но такой критерий произволен и субъективен, поскольку он должен быть разным в разных науках и для разных возрастных категорий ученых. Можно было бы ограничиться подсчетом числа только наиболее цитируемых статей, но и этот абсолютный критерий обладает недостатками предыдущего. Кто и как будет устанавливать порог наибольшей цитируемости?
Индексы цитирования могут относительно адекватно отражать результативность научной деятельности, если они опираются на объективную выборку журналов. Хотя самые известные из них Science Citation Index фирмы Thomson Reuters и Scopus фирмы Elsevier претендуют на статус международных, первый из них отражает мнение и практику американских, а второй - европейских ученых.
Для оценки и сравнения результативности научной деятельности российских ученых необходимо дождаться полной готовности Национального российского индекса цитирования (РИНЦ), который разрабатывается с 2005 г. Научной электронной библиотекой (НЭБ). Основные задачи, которые решает этот проект, - создание информационно-поисковой системы по публикациям российских ученых, единого их реестра, инструментария для статистического анализа отечественной науки, эффективной системы навигации в массиве научной информации.
Названный проект является не единственной отечественной инициативой по созданию указателя библиографических ссылок. Другим подобным проектом является Указатель Российского фонда фундаментальных исследований (РФФИ). Начиная с 1992 г. РФФИ является основной организацией, финансирующей фундаментальные научные исследования на конкурентной основе. Источником данных для Указателя РФФИ является база данных, в которой содержится информация о поданных конкурсных заявках на исследовательские проекты и результатах их выполнения. В отличие от РИНЦ, в этом указателе учитываются и иноязычные публикации (около 40% от общего числа). Почти половину вводимых публикаций составляют журнальные статьи. Общее число отечественных и зарубежных журналов, в которых публикуются эти статьи, превышает 5 тыс. наименований, из которых 40% представлены в Journal Citation Report (JCR) фирмы Thomson- Reuters.
По данным, которые подсчитывают названные учреждения, вычисляют и показатели значимости (влиятельности) и быстроты отклика (оперативности) научных журналов, получивших названия Impact factor и Immediacy index. Влиятельность конкретного журнала в определенном году вычисляется как отношение числа ссылок этого года в других журналах на статьи нашего журнала, опубликованные за два предыдущих года, а оперативность - на статьи, опубликованные в том же году. По этим показателям корректируется комплектование периодики научных библиотек и ПРНД ученых, публикующих статьи в журналах.
Введенные в JCR показатели "Impact factor" и "Immediacy index" являются тонкими количественными оценками научного статуса журнала, отражающими, по сути, качество работ, публикуемых в журнале, через оценку двух аспектов журнала - продуктивности (числа опубликованных в нем работ) и цитируемости (количества ссылок на него, т.е. его используемости учеными).
Impact factor можно рассматривать как показатель влиятельности журнала (обозначим его ), который рассчитывается как отношение числа ссылок, которые получил журнал в текущем году на статьи, опубликованные в этом журнале в предшествующие два года, к числу статей, опубликованных в этом журнале в эти же два предшествующих года.
Immediacy index можно рассматривать как показатель быстроты отклика на журнал. Этот показатель равен отношению числа ссылок, полученных журналом на статьи текущего года, к числу статей, опубликованных в нем в том же году.
Любые количественные показатели при оценке научной деятельности могут служить лишь формальными данными для содержательной интерпретации, поскольку они не учитывают индивидуальных особенностей мыслительной работы ученого и национальных традиций сложившейся системы информационной коммуникации. Вместе с тем, эти данные позволяют корректировать субъективную оценку значимости отдельных ученых, научных коллективов и даже сравнивать интеллектуальную деятельность разных стран.
Еще одним важным свойством научных публикаций является их рассеяние. Закон рассеяния научных статей в журналах был открыт в 1934 г. С. Бредфордом, который в 1948 г. дал ему следующую формулировку [8]:
"Если научные журналы расположить в порядке убывания числа помещенных в них статей по какому-либо заданному предмету, то в полученном списке можно выделить ядро журналов, посвященных непосредственно этому предмету, и несколько групп или зон, каждая из которых содержит столько же статей, что и ядро. Тогда числа журналов в ядре и в последующих зонах будут относиться как ".
В соответствии с этим законом журналы по продуктивности можно сгруппировать так, чтобы они как бы образовали три зоны. Включенные в каждую такую зону журналы содержали бы одну треть публикаций по данному предмету, помещенных во всех этих журналах.
Первая, ядерная зона содержит публикации из небольшого числа самых продуктивных журналов - . Вторая зона содержит публикации из большего числа журналов средней продуктивности - , а третья зона - из еще большего числа журналов с низкой продуктивностью, . Тогда в соответствии с рассматриваемым законом
где является коэффициентом рассеяния, т. е. величиной для данного предмета и времени постоянной.
Другими словами, если совокупность всех публикаций по какому-либо вопросу принять за целое, то в специальных журналах данного профиля (число которых невелико) помещается лишь одна треть этих публикаций. Вторая треть статей по данному вопросу оказывается опубликованной в значительно большем числе тематически родственных (смежных) журналов. Последняя треть этих публикаций рассеяна в огромном числе периодических изданий, в которых появление статей данной тематики трудно предвидеть, так как эти издания имеют широкий профиль или общенаучный характер.
За годы, прошедшие со времени открытия этого закона, проведены сотни исследований с целью проверки его истинности и поиска для него строгого математического выражения. Они показали, что закон этот выполняется только при определенных условиях, когда предмет или тема четко сформулированы, учитываются все релевантные документы в полном перечне изданий и строго ограничено время выхода этих изданий.
Последнее условие имеет особый смысл, так как закон этот характеризует рассеяние в определенный момент. Он является частным случаем более общего распределения, описываемого законом Ципфа. Дж. Ципф установил, что если к достаточно большому тексту составить список всех встретившихся в нем слов и расположить их в порядке убывания частоты встречаемости в данном тексте, то для любого слова произведение его порядкового номера (ранга) на эту частоту есть постоянная величина, имеющая одинаковое численное значение в данном тексте. Этому закону подчиняется распределение не только слов во всех языках мира, но и других явлений социального характера: ученых по числу опубликованных ими работ, городов по численности населения, людей по размерам дохода и даже биологических родов по числу входящих в них видов.
Закон Бредфорда отражает одно из свойств открытой социальной системы, каковой и является научная литература по предмету, а именно - стабильность ее иерархической структуры. Некоторое отличие этого закона от ципфовского распределения объясняется спецификой периодических изданий как формы квантования научной литературы. Эти издания обладают большой инерционностью: изменения в их профилях и номенклатуре происходят значительно медленнее, чем в содержании статей, которые непосредственно отражают все процессы в науке и технике.
Закон рассеяния публикаций имеет большое практическое значение. Из него следует, что охват всех публикаций по какой-либо отрасли или предмету не может быть обеспечен, если ограничиться просмотром лишь профильных журналов и журналов по родственной тематике - для этого приходится просматривать значительную часть научно-технических журналов. Этот закон учитывается при организации национальных информационных систем. Он позволяет решить ряд практических задач информационной деятельности:
В основе этого понятия лежит представление о том, что поиск необходимой информации в любом собрании документов практически невозможен путем прочтения или даже беглого просмотра текстов всех документов данного собрания. Поэтому уже с незапамятных времен для поиска информации применяют ряд логических процедур, которые в совокупности и составляют процесс информационного поиска. Прочтение полного текста документа заменили просмотром заглавий, аннотаций, рефератов. Однако и эта процедура в многотысячных собраниях документов оказалась слишком трудоемкой. Документы пришлось систематизировать по содержанию, которое условно стали обозначать индексами, т. е. буквами и/или цифрами. Систематизация по разделам наук (классам) - один из самых первых способов раскрытия содержания научно-технических документов, моделирующий работу человеческого сознания и восходящий к глубокой древности.
По мере увеличения количества письменных и печатных документов и объема наших знаний о мире их классификация усложнялась. Эти классификации получили название иерархических. Многотомные схемы классификации конца прошлого - начала нашего века насчитывали десятки тысяч классов, подклассов, отдельных рубрик. Специалистам смежных областей знания и особенно массовому читателю библиотек стало трудно ориентироваться в схемах классификации и определять в их иерархии место той рубрики, по которой необходимо получать информацию.
Да и сами рубрики, которые строго ориентированы на узкие разделы наук, подвергающихся непрерывному процессу дифференциации, перестали удовлетворять специалистов-практиков, которым нужна была все более комплексная, предметная информация. Это привело к созданию в 70-х годах XIX в. предметной или, точнее, алфавитно-предметной классификации. На долгие годы она стала господствующей при составлении энциклопедий, вспомогательных указателей к трудам, систематически излагающим проблему или раздел науки, а в США, где она была создана, - при организации каталогов.
Стремительный рост объемов литературы значительно усложнил также задачу идентификации каждого произведения печати. Библиотеки первыми столкнулись с необходимостью создать инструмент, при помощи которого можно было бы быстро и надежно устанавливать наличие определенного произведения в их фондах. Таким инструментом стал в XIX в. авторский, именной указатель (алфавитный каталог, по библиотечной терминологии), который однозначно идентифицировал произведение по фамилиям лиц, принимавших участие в его создании или же связанных с его содержанием. Таким образом, до середины ХХ в. возможности содержательного поиска информации по справочникам или документов, содержащих нужную информацию, в библиотеках ограничивались тремя способами: систематическим, предметным и алфавитным.
Традиционной технологией реализации этих способов были списки, перечни книг и статей, содержавших необходимую информацию. С 70-х годов XIX в. эти сведения стали записываться на дискретных носителях - библиотечных карточках из плотного картона формата 75х125 мм (размер сложенной пополам американской почтовой карточки). Следует отдать должное этой традиционной технологии. Она успешно обеспечивала культурный прогресс на протяжении целого столетия вплоть до нынешнего этапа научно-технической революции, позволила накапливать и использовать многомиллионные собрания документов, обслуживать тематические потребности ученых и специалистов в необходимой им информации. На ней и сегодня еще в значительной степени зиждется деятельность всей мировой библиотечной системы - этого краеугольного камня человеческой культуры, важными составными частями которой является наука и техника.
Однако недостаточность, ограниченность этой технологии стала все более остро ощущаться уже в первой четверти ХХ в. В науке первыми почувствовали это химики из-за быстрого роста числа синтезируемых ими веществ. Обычные методы оповещения - библиографические указатели, библиотечные каталоги, справочники - начали значительно отставать по времени от успехов исследователей и перестали охватывать их результаты в полном объеме. Революции в физике и электронике, характеризующие середину прошлого столетия, усугубили трудности информационной коммуникации.
Научное сообщество осознало необходимость организационного оформления информационной деятельности, которая в течение нескольких десятилетий подспудно созревала в недрах науки и техники. Большая наука индустриального типа, пришедшая на смену "малой" науке университетского типа, выдвинула задачу создания систем научно-технической информации. Именно в это время, в конце 40-х - начале 50-х гг. прошлого века были сформулированы понятия информационного поиска, информационно-поисковой системы, информационно-поискового языка, была выдвинута задача механизации, а затем и автоматизации информационного поиска.
К этому времени стало ясно, что информационный поиск - это совокупность логических процедур, в результате которых в ответ на информационный запрос выдается либо необходимая информация, либо документы, в которых она может содержаться, либо библиографические адреса этих документов. В первом случае поиск получил название фактографического, во втором - документального, в третьем - библиографического. Эти процедуры сводятся к следующему.
Каждый вновь появляющийся документ подвергается анализу, в результате которого определяется его смысловое содержание. Затем это абстрактное представление о содержании (считается, что оно должно совпадать с авторским) выражается на некотором информационно-поисковом языке, т. е. синтезируется в виде библиографического описания и индекса.
Индекс образуется путем мысленного сопоставления основного смыслового содержания с потенциальными запросами потребителей информации. Эти запросы как бы зафиксированы в схемах классификации и обозначены индексами. Сама процедура выражения основного смыслового содержания документов и информационных запросов на информационно-поисковом языке получила название индексирования и составляет существенную часть аналитико-синтетической обработки документов. Информационный поиск, таким образом, заключается в замене содержательного прочтения полного текста документов формальным сличением (сравнением на соответствие) их поисковых образов с запросами на языке индексов.
Понятно, что такая замена значительно упрощает и убыстряет нахождение нужной информации, делает возможной автоматизацию процедуры сравнения. Но за это приходится платить неполнотой и неточностью поиска. Описанные выше логические процедуры допускают субъективизм осуществляющих их лиц, а используемые информационно-поисковые языки несовершенны и не способны адекватно передавать содержание документов и смысл запросов. Следовательно, информационные потери и шум - неизбежные условия информационного поиска. Когда говорят, что поиск осуществлен со 100-процентной полнотой, имеют в виду, что информационного поиска не производилось, а был осуществлен полный перебор всех текстов (современная технология в некоторых случаях предоставляет такую возможность).
Информационный поиск реализуется при помощи информационно-поисковой системы, которая в абстрактном виде должна состоять из информационно-поискового языка, правил перевода на этот язык и критерия смыслового соответствия, определяющего объем выдачи документов или информации (критерий выдачи). Конкретная система включает также средства реализации (перечень, картотека, механический селектор, компьютер), информационный массив и обслуживающий персонал.
Рис. 3.1. Блок-схема информационно-поисковой системы
Функционирование простейшей документальной информационно-поисковой системы можно проследить по ее блок-схеме на рис. 3.1. В системе имеется два входа (для документов и запросов) и один выход (для выдачи документов по запросам). На входах имеются преобразователи для индексирования документов и запросов. Поисковые образы документов вместе с адресами их хранения (номерами) направляются в активное запоминающее устройство (ЗУакт), а сами документы - в пассивное (ЗУпас). Индексы каждого запроса сравниваются с индексами всех документов в решающем устройстве (РУ), которое в случае их соответствия (полного или предусмотренного критерием выдачи) дает в хранилище (ЗУпас) команду на выдачу документа. Это хранилище составляет как бы второй контур системы (сами документы), которого нет у библиографических (одноконтурных) систем.
Даже названия элементов на блок-схеме говорят о компьютерной реализации информационно-поисковой системы. Однако блок-схема верно обрисовывает работу любой системы, включая и наиболее традиционные. Это легко видеть на примере библиотеки. Преобразователи на входах соответствуют отделам обработки и справочно-библиографическому, ЗУакт - каталогам, ЗУпас - фондам. Нет в библиотеке только РУ - оно моделируется интеллектом читателя, который (хотя часто он и не осознает этого) вырабатывает собственный критерий выдачи и собственную стратегию поиска.
Не случайно именно эта интеллектуальная часть функционирования информационно-поисковой системы представила наибольшие трудности для автоматизации, именно она больше всего сдерживала развитие этих систем. Камнем преткновения явились, прежде всего, традиционные информационно-поисковые языки, ограничивающие возможности содержательного поиска информации. Расхожее мнение о том, что эти языки трудно поддаются автоматизации, неверно. Но они рассчитаны на ручную реализацию, и поэтому использование их в компьютерах удорожает поиск, ограничивает число пользователей и не дает никаких выигрышей, т. е. не снимает ограничений, присущих этим языкам.
А ограничения эти стали особенно ощутимыми на нынешнем этапе научно-технической революции. Прежде всего, традиционная технология поиска рассчитана на стабильный, медленно меняющийся состав запросов. В схемах классификации и перечнях предметных рубрик уже заранее как бы скоординированы все понятия, по которым можно извлекать информацию из документов и затем производить по ним поиск (такие языки поэтому и получили название предкоординатных). Это приводит к тому, что при возникновении новой проблемы или направления исследований, по которым имеется полученная прежде информация, система не обеспечивает ее поиска. Ведь эта тематика раньше не была сформулирована и не нашла места в схемах классификации и списках предметных рубрик, а значит, и индексирование по ней не производилось.
Другими словами, традиционная технология поиска не позволяет искать информацию по любому, заранее не предвиденному сочетанию признаков. При этом субъективизм индексатора при извлечении основного содержания документа увеличивает информационный шум и потери, предопределенные характером традиционных поисковых языков. Нельзя не отметить также, что основанные на них системы ручного поиска, даже фактографические, не предназначены для манипулирования полученными из них данными. Они не имеют логического аппарата для содержательной переработки этих данных. Подобная задача всегда решалась самими потребителями без помощи информационных систем.
Новая технология пришла в информационный поиск в виде метода координатного индексирования, разработанного в США в 50-е гг. прошлого века математическим логиком М. Таубе и работником службы химической информации К. Муэрсом. Этот метод основан на предположении, что основное смысловое содержание любого документа и информационного запроса можно выразить при помощи набора терминов, по большей части содержащихся в самом индексируемом документе. Эти термины получили название ключевых слов. Если, к примеру, нужно индексировать документ, в котором говорится о защите от коррозии лопаток газовых турбин, то совокупность терминов "турбина", "газ", "лопатки", "коррозия", "защита" и будет служить поисковым образом документа. Эти ключевые слова образуют для данного документа как бы координатную сетку, по которой в дальнейшем ведется информационный поиск по соответствующему запросу.
Преимущества данного метода очевидны. Прежде всего, информационные работники и потребители информации освобождаются от жестких рамок классификационных схем и перечней предметных рубрик. Индексирование новых документов ведется без оглядки на отраженные в них потенциальные и часто уже устаревшие запросы специалистов. С другой стороны, индексирование освобождается от субъективизма - ключевые слова выбираются формально. Эту работу, в принципе, можно поручить автомату. Во многих современных информационно-поисковых системах оператор вводит в машину библиографические данные документа, его реферат (аннотацию, резюме), а иногда и наиболее информативные части текста (например, первый и последний абзацы статьи, которые содержат наибольшее число терминов, относящихся к ее содержанию). Эти элементы текста можно просто отсканировать. При помощи "запретительного" списка служебных и общезначимых слов, введенных в компьютер, осуществляется автоматический отбор ключевых слов, которые программно приводятся к нормальному виду (единственное число именительного падежа существительных и прилагательных, инфинитив глаголов). Это существенный шаг к автоматизации ввода информации в информационно-поисковую систему.
При поиске необходимой информации специалист может формулировать свой запрос в виде цепочки терминов, на пересечении которых и окажется большинство документов, содержащих необходимую информацию. При этом потребитель может произвольно менять стратегию поиска в зависимости от оценки его промежуточных результатов. Если документов по запросу мало или нет в системе, можно снять из запроса какие-либо ключевые слова (в приведенном выше примере "газ" и "защита"). Тогда система выдаст документы более широкого содержания о коррозии лопаток турбин, в которых все же может содержаться нужная информация. В случае если документов по запросу слишком много, можно добавить ключевые слова, ограничивающие поиск, например, определенным классом турбин или же конкретными методами защиты их лопаток от коррозии. В этом уже заключен важный элемент возможности диалога с системой при помощи слов естественного языка.
Основные достоинства этого принципиально нового подхода к раскрытию содержания документов и поиску информации заключаются в том, что он позволяет находить информацию по любому, заранее не предвиденному сочетанию признаков. Кроме того, при появлении совершенно новых направлений исследований можно вести поиск во всем массиве документов, ранее индексированных по этому методу. Традиционные методы таких возможностей не предоставляли.
Было бы несправедливо умолчать о том, что достоинства нового метода приходится оплачивать преодолением дополнительных трудностей. Прежде всего, поиск с использованием естественного языка ограничивает его рамками знакомых пользователю языков. Чтобы расширить этот круг, приходится прибегать к словарям. Затем, каждый естественный язык отличается богатством своего словарного состава - слова, одинаковые по написанию, могут иметь разный смысл (многозначность, омонимия), а одно и то же понятие может выражаться разными терминами (синонимия). Запросив информацию о косах, вы получите сведения не только о сельскохозяйственных орудиях, но и о географических объектах, а может быть, и о прическах. Желая получить документы о транзисторах, следует помнить, что они могут также называться полупроводниками.
Термины находятся в сложных взаимоотношениях между собой, выражают более узкие или более широкие понятия, могут быть связанными по сходству, по контрасту или по другим ассоциациям. Чтобы иметь возможность учитывать это при поиске, приходится составлять на каждом языке специальные понятийные справочники (тезаурусы). В них для каждого понятия (класса условной эквивалентности) выбирается один термин - дескриптор, а для остальных слов указывается их связь с дескриптором. Тезаурусы иногда называют дескрипторными словарями, а сам поиск с их использованием - дескрипторным. Кроме словарей, для поиска по ключевым словам и дескрипторам часто создают специальную грамматику. Необходимость в ней вызывается возникновением ложной координации терминов, ошибочным их сочетанием. В ответ на запрос
можно получить не только необходимую информацию о покрытии медных труб свинцом, но и о покрытии свинцовых труб медью.
Курьеза ради следует упомянуть, что метод координатного индексирования для поиска информации, явившийся принципиальным шагом к новой информационной технологии, на самом деле новшеством не был. В 1915 г. он был реализован на перфокартах американским орнитологом Т. Тейлором при составлении определителя птиц, а у Б. Виккери возникло предположение, что шумерские врачи еще в III тысячелетии до н. э. пользовались диагностическими устройствами, работавшими по этому принципу. На глиняных клинописных плитках записывались симптомы болезней, а под каждым из них - названия болезней, при которых эти симптомы встречаются. Совокупность симптомов составляла координатную сетку, а совпадающие для всех симптомов названия болезней - наиболее вероятные недуги больного.
Из этого понятно, что информационно-поисковые системы, основанные на принципе координатного индексирования, могут быть реализованы простейшими средствами ручного обращения. Система "унитермкарт" самого М. Таубе представляла собой особым образом организованную картотеку, позволявшую легко сличать номера документов, чтобы выявить совпадающие номера для заданных терминов ("унитермов"). Первые информационно-поисковые системы такого типа часто создавались на просветных перфокартах. Однако подлинный размах создание координатных, по большей части дескрипторных систем получило, когда они стали использовать компьютеры второго поколения. В 60-е -70-е годы на базе крупнейших в мире реферативных служб были созданы мощные автоматизированные информационные системы, которые предназначались для ускорения выпуска информационных изданий и расширения спектра информационных услуг, а затем стали основными генераторами документальных баз данных на магнитных лентах.
Принцип цитирования был использован Институтом научной информации США, основанным в 1958 г. Ю. Гарфилдом, для создания принципиально нового вида информационного обслуживания. Английское слово citation означает упоминание, ссылку и не соответствует русскому слову цитирование, означающему дословное повторение "чужого" текста. Однако в данном случае в качестве термина привилась прямая калька с английского языка, поскольку речь идет о библиографических ссылках (для цитирования в русском значении употребляется английское слово quotation).
При поиске информации Ю. Гарфилд взял в качестве индексов библиографические ссылки в документах. В выпускаемых им указателях цитированной литературы, называемых также "индексами цитирования", эти ссылки располагаются по алфавиту фамилий авторов цитированных работ с указанием сведений о документах, в которых они упоминаются. Произведения, использованные при написании статьи, составляют как бы координатную сетку для ее поиска. Если статья написана по совсем новой проблеме, не нашедшей рубрики в классификации наук, с еще не устоявшейся и малоизвестной терминологией, найти ее в потоке мировой литературы другими методами очень трудно. Указатель цитированной литературы можно представить себе как многоуровневую систему библиографических описаний документов, находящихся в обратной связи друг с другом.
Указатели цитированной литературы позволяют искать информацию по совершенно новым межотраслевым или комплексным проблемам под фамилиями пионеров и наиболее известных специалистов каждой из таких проблем. Например, для поиска литературы по цитированию достаточно знать фамилию Ю. Гарфилда, так как почти в каждой работе по этой проблеме есть упоминание о нем и его статьях. Фамилии авторов найденных работ могут, в свою очередь, служить входами в указатель, и за 1-5 таких итераций (последовательных поисков) все сведения об отраженной в указателе литературе по проблеме оказываются найденными.
Индексы цитирования предоставляют уникальную возможность проследить за всеми случаями применения какой-либо идеи или метода, за их критикой и обсуждением, оценить информационный вклад того или иного ученого или научной школы, степень и динамику популярности их работ. Известны случаи, когда по этим указателям предсказывали нобелевских лауреатов. Институт научной информации США выпускает указатели цитированной литературы по точным, естественным и прикладным наукам (с 1964 г.), по общественным наукам (с 1969 г.), по искусству и гуманитарным наукам (с 1976 г.), для чего просматривается около 10 тыс. научных журналов и ежегодно несколько тысяч названий книг. Указатели распространяется не только в обычном (бумажном), но и в машиночитаемом виде (на магнитной ленте, дискетах, оптических дисках). Нужно ли говорить о том, что осуществление принципа, положенного в основу этих изданий, стало возможным лишь благодаря компьютерам. Ведь речь идет о ежегодном библиографировании более 10 млн ссылок.
В двух статьях и , например (см. рис. 3.2) имеются библиографические ссылки, которые устанавливают прямую библиографическую связь между ними (цитирующими документами) и статьями и , которые в них упоминаются (цитируемыми документами). В указателе цитированной литературы эти ссылки, по алфавиту которых упорядочивается его массив, обозначают цитируемые документы, а под ними располагаются описания цитирующих документов.
Понимание потенциальных возможностей комплексирования документов по признаку общих ссылок и стремление максимально использовать накопленный массив в машиночитаемой форме повели к поискам новых путей применения метода цитирования. Можно считать связанными по смыслу документы, авторы которых ссылаются на одни и те же работы, а числом совпадающих ссылок - измерять степень такой связанности. Этот метод, который называется библиографическим сочетанием документов, долгое время не имел широкого практического применения, но затем был использован для создания ретроспективной поисковой системы на компакт-дисках.
Рис. 3.2. Схема цитирования, социтирования и библиографического сочетания документов
Можно также считать связанными по смыслу и тематике работы, на которые совместно ссылаются авторы нескольких документов. Этот метод, чаще всего называемый социтированием, имеет другую коммуникационную основу. В каждой исследовательской области имеется некоторый набор важных работ, отражающих познавательную основу этой области. Данные работы цитируются многими исследователями и поэтому принадлежат к числу высоко цитируемых. Больше того, они часто цитируются вместе, образуя таким образом социтирование. Другими словами, социтированием принято называть одновременное упоминание любых двух или большего числа публикаций в какой-либо последующей публикации.
Для лучшего представления разницы в этих методах приведена схема (рис. 3.2), на которой и являются цитирующими документами текущего года, а и - цитируемыми документами более ранних годов. Сплошными стрелками показаны связи по цитированию, т. е. цитирует и , а цитирует и . Тогда между цитирующими работами и образуется библиографическое сочетание, а между цитируемыми работами и - социтирование (обозначено пунктиром). Для простоты и наглядности степень связанности на схеме минимальная, хотя на практике она значительно больше (т. е. для признания библиографического сочетания между двумя работами или кластера социтирования в каждом отдельном случае устанавливается определенный минимальный порог, который тем выше, чем интенсивнее цитирование).
Между характером этих методов установления связи и областью их применения имеется существенная разница. Библиографическое сочетание - это однократно произошедший факт, поскольку и были однажды опубликованы со своими ссылками, и с ними в дальнейшем ничего уже произойти не может. Именно поэтому данный метод применяется для ретроспективного поиска документов, связанных между собой единством тематики, которая исследовалась их авторами.
Совсем по-другому обстоит дело с социтированием, так как связь между цитируемыми B и C может сохраняться (увеличиваться или уменьшаться) в последующие годы в зависимости от того, насколько часто они будут попарно цитироваться в новых работах. Частое социтирование указывает на их концептуальную близость, поскольку они используются как единый комплекс. Между этими работами как бы возникают невидимые связи, которые после наглядного их выражения образуют смысловые сгустки (кластеры). Совокупность таких кластеров ключевых работ, отражающих исследовательские области, представляет собой как бы карту определенной научной области, а совокупность карт - атлас науки на данный момент.
На большинстве европейских языков рубрикатором называли переписчика рукописей, который в скрипториях средневековья и Возрождения размечал красной краской первые буквы смысловых фрагментов текста, получивших название рубрик. Это название сохранилось и до наших дней, хотя в нынешних произведениях печати рубрики отмечаются абзацными отступами или отделяются друг от друга пробелами. В журналистике рубриками принято также называть постоянные разделы в журналах и газетах, а в библиотековедении - структурные подразделения систематического и предметного каталогов.
В 50-е годы в информатике рубрикаторами стали называть перечни рубрик реферативных журналов и других информационных изданий. В данном случае рубрика выступает как содержательный фрагмент такого издания и состоит из индекса и заголовка раздела, а также библиографических записей (с аннотациями или рефератами) произведений печати, которые по своему содержанию относятся к данной рубрике. По мере роста числа и увеличения объемов реферативных журналов их рубрикация стала усложняться. Появилась необходимость в создании такого перечня рубрик, который отвечал бы определенным требованиям и мог бы служить средством систематизации библиографических записей вместе с рефератами. Поскольку библиотечно-библиографические классификации оказались непригодными для этого, реферативные службы стали создавать собственные рубрикаторы.
Рубрикатор - это особым образом организованный перечень рубрик иерархической классификации, предназначенный для отражения сведений о текущих публикациях в информационных изданиях или системах информационного обслуживания. К его характерным особенностям относятся сравнительно небольшая глубина индексации, ориентированность на межотраслевые, междисциплинарные, комплексные проблемы, простота и линейность структуры, достаточная гибкость, частая и безболезненная изменяемость формулировки рубрик. Любой рубрикатор создается под влиянием двух противоречивых факторов, отражает два взаимосвязанных, но разных информационных потока: документального и запросов потребителей. Первый оказывает преимущественное влияние на структуру рубрикатора, второй - на формулировку заголовков рубрик, причем изменение структуры документального потока несколько отстает от быстро меняющегося характера информационных запросов.
Возникает вопрос, почему же все-таки для создания рубрикаторов не использовались существующие классификации? Можно указать на несколько обстоятельств, которые ведут к серьезным различиям в схемах иерархических классификаций, используемых для библиотечных каталогов и для построения рубрикаторов. Первые, рассчитанные, в первую очередь, на систематические каталоги и картотеки библиотек, отражают структуру универсального потока документов: книг, брошюр, периодических и продолжающихся изданий. Рубрикаторы реферативных журналов ориентированы преимущественно на журнальные статьи и другие публикации из научной периодики, которые имеют другую содержательную структуру, более дробную и гибкую. В реферативных журналах подчас приходится открывать рубрики для таких вопросов, которые в библиотечном каталоге могут стать необходимыми лишь через десять лет.Систематические каталоги библиотек ориентированы на дисциплинарную структуру, т. е. на выделение основных классов в соответствии с научной классификацией. В рубрикаторе наряду с дисциплинарными характеристиками необходимо учитывать комплексные междисциплинарные проблемы и отрасли народного хозяйства. Это нарушает строгую логику иерархической классификации, но придает рубрикатору особую гибкость. Библиотечная классификация предназначена для ретроспективного поиска, для накопления записей за много лет, это требует сложной структуры, ее стабильности, устойчивости, медлительности в изменениях. Для рубрикатора частые изменения являются правилом, формулировка заголовков рубрик, публикуемых в каждом номере издания, играет сравнительно большую роль, а форма индексов, выполняющих служебную роль, менее значима. Рубрикатор легко обозрим, имеет небольшую глубину и простой служебный аппарат (систему ссылок и вспомогательных делений, способы сочетания рубрик).
По рубрикаторам классифицируются самые мощные потоки научных публикаций - во всем мире ежегодно миллионы несовпадающих документов. Это на порядок больше, чем приходится на долю классификаций, применяемых ежегодно для описания входных потоков всеми библиотеками мира. Поэтому рубрикаторы приобрели большое значение в научно-информационной деятельности. Во многих информационных центрах избирательное распространение информации, сигнальная информация и даже справочно-библиографическое обслуживание осуществляются при помощи рубрикаторов. Чтобы они могли справиться с такими несвойственными им функциями, приходится оснащать их различными вспомогательными средствами, которые приближают их к библиотечным классификациям, но затрудняют их использование по прямому назначению. Как и во всех подобных случаях, здесь приходится прибегать к разным компромиссам, но это неизбежно там, где мы не пользуемся новой информационной технологией.
Лекция 4
Электронные издания, как и печатные, типизируются по целевому назначению, по периодичности и структуре, но, в отличие от печатных, по технологии распространения могут быть локальными и сетевыми, могут иметь печатные аналоги, быть мультимедийными и интерактивными. Основная трудность их идентификации, особенно в сетевом варианте, заложена в самом их определении, поскольку наличие редакционно-издательской обработки довольно трудно обнаружить, а выходные сведения требуют интерпретации. Документ, выставленный на сайте ученого или специалиста, является изданием или нет? Неизменность такого документа тоже трудно определима. Тем не менее, можно констатировать устойчивую тенденцию роста абсолютного числа электронных изданий, увеличение их доли в общем числе изданий и ускорение темпа этого увеличения. По всей вероятности, это, в свою очередь, ведет к другой заметной тенденции - развитию интерактивности электронных и особенно сетевых изданий.
Тенденция интерактивности электронных изданий проявляется, главным образом, в развитии практики свободного редактирования. Идея свободы коммуникации получила в последнее десятилетие новый смысл благодаря появлению и развитию социально-ориентированных сетевых технологий. Это выразилось, прежде всего, в попытке стереть границы между специалистами и любителями - создателями сайтов и их пользователями, авторами / редакторами и читателями - за счет возможности свободного взаимодействия с содержанием сайтов, получившим название мультимедийного контента. Естественным продолжением тенденций свободного обмена информацией в Интернете стало появление свободного редактирования, инструментарий которого позволяет любому желающему принять участие в исправлении замеченных ошибок, доработке контента и его авторизации. Отвергаются все регламенты, ограничивающие этот процесс, и попытки установления цензуры, а его участники превращаются в свободных и равноправных членов интернет-сообщества.
Свободное редактирование - новое явление в редакторском деле, которое активно развивается. Его востребованность подтверждается непреходящим интересом к свободной онлайн-энциклопедии "Википедия" (Wikipedia), которая успешно развивает свои многочисленные языковые версии. Ее организаторы ставят цель: создать депозитарий свободной информации и предоставить доступ к знаниям всем желающим. М. Арнисон, впервые предложивший термин "свободное редактирование" (англ. open editing), так охарактеризовал свободную публикацию: это электронная реинкарнация древнего искусства рассказывания историй; это свободное программное обеспечение (в свободной публикации используются те же принципы, что и при разработке свободного программного обеспечения, а именно: свобода информации и свобода творчества); это использование работы волонтеров.
"Википедия" - универсальная, свободно распространяемая, доступная для чтения и редактирования онлайн-энциклопедия (так характеризуют ее сами участники) - была создана в 2001 году Д. Уэйлсом, финансирующим проект, и Л. Сэнгером (организатором и главным редактором). В составлении и редактировании "Википедии" участвуют тысячи творческих людей по всему миру. Их сообщество существенно отличается от традиционного редакторского коллектива, так как работа в "Википедии" децентрализована. "Википедия" постоянно изменяется и дополняется, перманентно находясь в редакционно-издательском процессе. При этом данный процесс практически неконтролируем (доступ к публикации и правке статей в "Википедии" имеют даже анонимные пользователи), что вызывает нарекания со стороны академического сообщества. Ведь одно из самых важных требований, предъявляемых к энциклопедии, - это достоверность и научность (у "Википедии" нет научной редакции и оплачиваемых редакторов). Тем не менее, у "Википедии" есть неоспоримые преимущества перед традиционными энциклопедиями. Например, ее статьи можно сопровождать не только графическими изображениями (схемами, картами, рисунками), но и добавлять к ним звуковые файлы, а также оперативно добавлять или изменять ошибочные данные.
Развитие информационной технологии привело к созданию мультимедиа - компьютерных средств отображения не только текста, но и звука и изображения, в том числе и движущегося. Медиакультура - часть общей культуры общества: мира книг, газет и журналов, кинематографа, радио и телевидения, интернет-ресурсов. Текст, раньше всего литературный текст, стал меняться, перестав быть монополистом в передаче динамики, звуков и красок жизни. Мультимедийный текст, т. е. написанный на компьютере в современном редакторе, сразу может быть связан со звуком, изображением в цвете и движении, одним словом, со всем, что сегодня составляет вместе с ним средства мультимедиа и чему для создания полной виртуальной реальности пока недостает запахов и осязаемых предметов.
Еще одна важная тенденция развития электронных изданий заключается в том, что их содержание со все большей настойчивостью перемещается из настольных компьютеров и ноутбуков в сферу мобильной телефонии. Эта тенденция, замеченная сначала на Западе, теперь осознана и у нас. В сегодняшней конкурентной окружающей среде важно чувствовать "лицо" времени одинаково с потенциальными пользователями. Даже совсем новое информационное обслуживание, возможно, не привлечет быстро желательных пользователей, если оно не поддерживает три ключевых потребности сегодняшних пользователей - доступ к мультимедиа, ощущение сообщества и потребности в точных результатах поиска, даже когда информационный запрос не очень точно определен. А это ощущение сообщества создают мобильные средства связи между потребителями электронного контента и между ними и Интернетом.
В последние годы все более заметной тенденцией развития электронных изданий становится технологическое сращивание издательского дела и научно-информационного обслуживания, что обусловлено широким применением в них новейших средств информационной техники. Основным средством подготовки научных журналов и книг стал персональный компьютер, порождающий - в качестве побочного продукта - электронные версии этих изданий. Такие версии полностью или частично задействуются для автоматизированной подготовки реферативных баз данных, указателей цитирования литературы и других информационных продуктов.
Среди издательств, использующих электронные версии своих изданий для создания вторичных электронных изданий, в первую очередь нужно назвать такие издательские гиганты, как Elsevier (Нидерланды) и Thomson Reuters (США). В настоящее время издательская компания Elsevier является крупнейшей в мире: она выпускает более 1,8 тыс. журналов и ежегодно 2 тыс. новых книг по естественным наукам, медицине и технологии. Она приобрела ряд крупных информационных служб и в начале 2000-х годов создала ныне самую большую в мире политематическую реферативную базу данных Scopus.
Реферативная база данных Scopus. Эта база данных не содержит полных текстов первоисточников; она была введена в коммерческую эксплуатацию в ноябре 2004 г. Главной функцией информационной системы Scopus, созданной в Нидерландах, является слежение за содержанием мировой научной литературы, так как именно в ней находят отражение все достижения современной науки. В этой базе данных отражается содержание более 15 тыс. названий рецензируемых научных журналов (52% этих журналов европейские, более 260 - российские); они выпускаются четырьмя тысячами издательств мира. Тщательный подбор этих журналов обеспечивает большую полноту охвата в Scopus соответствующей научной информации при наименьших затратах. При этом важным достоинством Scopus является то, что она содержит больше информации, относящейся к стыкам наук, т.е. к областям, в которых химия граничит с биологией, физикой, медициной, экологией и другими науками.
База данных Scopus была открыта для общего пользования в 2004 г. В настоящее время она содержит более 28 млн рефератов журнальных статей, а также 250 млн гиперссылок на высококачественные веб-ресурсы (http://www.info.scorpius.com). Подготовка этой реферативной базы данных технологически увязана с подготовкой статей для научных журналов. Поэтому служба Scopus может сообщать пользователям о статьях, находящихся еще в стадии производства. В базе данных Scopus приводятся также ссылки на другие базы данных, в том числе на полнотекстовые, на материалы научных конференций, справочники, описания патентов США, Зап. Европы и Японии. Несомненным достоинством Scopus является ее большая ретроспектива (с 1966 г.), постоянное пополнение и одноразовый ввод запросов.
Другой крупной издательской корпорацией, которая в качестве главного направления своей деятельности выбрала работу преимущественно с электронной информацией, стала Thomson Reuters. (Канада - США). На основе информационных ресурсов, приобретенных этой фирмой, ею было создано три взаимосвязанных веб-комплекса, получивших названия Web of Science, Web of Knowledge и Current Contents Connect. Oрганизационным ядром для создания этих веб-комплексов послужила фирма Institute for Scientific Information (ISI), которая была переименована сначала в ISI Thomson, а затем - в Thomson Reuters. Для подготовки указателей цитирования научной литературы используется около 8,7 тыс. тщательно подобранных журналов. А всего в базах данных ISI охвачено более 16 тыс. журналов, важнейшие книги и труды научных конференций.
Web of Knowledge представляет собой значительно расширенную версию ISI Web of Science, к которой добавлен ряд важных информационных ресурсов и фирменных средств автоматизированной логической обработки данных. В компании Thomson Reuters был проведен анализ цитирования научной литературы. Этот анализ показал, что примерно в 2 тыс. журналов публикуется около 80% и цитируется 95% всех статей, что половина всех процитированных статей взята всего из 150 названий журналов и что в этих журналах содержится четверть всех опубликованных статей. Но это "ядро" журналов не является статичным - оно постоянно изменяется. Поэтому анализу и отбору наиболее продуктивных журналов в компании Thomson Reuters уделяется повышенное внимание.
Важной частью информационных ресурсов Thomson Reuters является система сигнальной информации, основанная на использовании оглавлений тщательно отобранных научных журналов. Эта система была создана президентом и владельцем (до 1992 г.) фирмы Institute for Scientific Information Ю. Гарфилдом в 1988 г. Первый бюллетень такой сигнальной информации вышел под названием Chemical, Pharmaco-Medical &Life Sciences и охватывал всего 200 журналов.
Бюллетени сигнальной информации типа Current Contents имели существенные преимущества перед другими информационными изданиями: они обеспечивали широкий охват тщательно отобранных научных журналов, подготавливались и выходили в кратчайшие сроки, позволяли заказывать и быстро получать копии релевантных статей. Эти преимущества еще более возросли в результате преобразования Current Contents в электронную форму и интеграции с другими информационными ресурсами фирмы Institute for Scientific Information. Система Current Contents, интегрированная в рамках общей компьютерной платформы Web of Knowledge, получила название Current Contents Connect.
Таким образом, даже на примере двух крупнейших издательских корпораций можно утверждать, что в сфере электронных изданий происходит технологическое и организационное сращивание издательского и информационного дела, его укрупнение и интеграция, а основной формой информационного обеспечения ученых и специалистов становится их обслуживание.
Информация как тип ресурсов имеет особенности, существенно отличающие ее от других типов ресурсов, например, природных, производственных, финансовых и т.п. Важнейшими такими отличиями являются:
Понятие информационных ресурсов целесообразно рассматривать в контексте обсуждения информатизации современного общества, которая заключается во все большем использовании информации как вида ресурсов для дополнения и замены двух других базисных ресурсов - материальных и энергетических.
Национальные информационные ресурсы складываются из государственных и негосударственных, владельцами которых являются общественные и частные организации и лица. Владельцы негосударственных информационных ресурсов сами определяют - в рамках действующих законов - условия их использования (обычно эти условия являются коммерческими).
Фонды информационных ресурсов не существуют сами по себе. Они создаются при организациях и учреждениях, которые собирают определенную информацию, хранят ее, обеспечивают поиск нужной потребителям информации, ее выдачу и распространение.
Старейшим видом таких специальных организаций являются библиотеки, появившиеся не менее трех тысяч лет назад и накопившие огромный опыт по созданию, хранению и использованию фондов информационных ресурсов. В ХХ в. н. э. для выполнения работы по сбору, обработке, хранению, поиску, выдаче и распространению информации - преимущественно относящейся к науке и технике - стали создаваться специальные информационные центры. Это было обусловлено возрастающей ролью науки и техники в развитии военного потенциала, экономики и культуры современного мира.
Важным средством повышения эффективности национальной системы (сети) органов НТИ, особенно при наличии в стране частного и государственного секторов экономики, является развитие и укрепление научных обществ, научно-исследовательских ассоциаций в отраслях промышленности и профессиональных ассоциаций. Эти общества и ассоциации обеспечивают неформальное взаимодействие между частным и государственным секторами экономики, в том числе и в области НТИ. Они решают следующие основные задачи:
Создание национальной информационной инфраструктуры может способствовать развитию информационной революции, которая навсегда изменит образ жизни людей, то, как они работают и взаимодействуют друг с другом. В ней предусматривается создание средств, позволяющих быстро передавать и получать информацию, организационно не входящих в существующие информационные структуры (например, как почта, которая лишь обеспечивает быструю доставку корреспонденции адресатам, но не создает и не использует ее сама). Поэтому, чтобы собственно информационные структуры - центры информации, библиотеки и т.п. - могли эффективно пользоваться этой инфраструктурой (т. е. сверхбыстродействующей сетью передачи данных), они должны быть оснащены новейшим информационным оборудованием, создавать новые виды информационной продукции, внедрять новые методы информационного обслуживания.
На мировом рынке информационных продуктов и услуг можно выделить следующие основные секторы, которые характерны для всех развитых стран, в том числе и для России.
Сектор деловой информации (биржевой, финансовой, коммерческой, экономической, статистической), охватывающий:
Сектор информации для специалистов (научно-технической и специальной, а также первоисточники), охватывающий:
Сектор массовой и потребительской информации (новости, услуги на основе современных средств глобальной телекоммуникации), охватывающий:
Сектор социально-политической информации, охватывающий:
Нужно отметить, что различия между выделенными здесь секторами рынка информации достаточно условны. Тем не менее, подобное разделение необходимо, так как позволяет определенным образом структурировать информационные ресурсы, прежде всего, исходя из круга пользователей в сочетании с задачами, решаемыми ими, т. е. сферой применения, на которую ориентируется каждый из секторов.
Можно рассматривать мировые информационные ресурсы с точки зрения современных каналов доступа и сфер применения этих ресурсов. Тогда можно выделить такие области, как электронные сделки, включая торговлю, глобальную коммуникацию и Интернет.
Электронные сделки включают системы банковских карт, системы резервирования билетов и мест в гостиницах, заказа товаров и услуг, а также биржевых, банковских и расчетных операций. Вплоть до середины 90-х гг. этот рынок развивался в рамках специализированных компьютерных систем транспортных и туристических компаний, крупных банков и фондовых брокеров, а также торговых компаний. Доступ к этим системам со стороны конечного потребителя был ограничен или имел экзотический характер. Интернет коренным образом изменил ситуацию, привлек в эти области массового потребителя, а также все большее число ранее замкнутых систем, которые начали использовать эту сеть для совершения электронных сделок, несмотря на все еще сохраняющиеся явно недостаточные возможности защиты информации.
Электронная глобальная коммуникация включает различные системы на основе современных средств связи и человеческого общения. К ним относятся коммерческие и публичные сети передачи данных, системы электронной почты, коммерческие диалоговые системы, объединяющие владельцев персональных компьютеров, телеконференции, электронные сетевые доски объявлений и бюллетени, клирингхаузы общественно доступного программного обеспечения и т.п. Основным их отличием от рынка стандартных услуг связи выступает ориентация на оказание услуг с добавленной стоимостью. В последние годы получили широкое распространение так называемые социальные сети.
Этот сектор выделился из услуг связи и, в отличие от стандартных услуг связи, при оказании которых основное внимание уделяется передаче информации вне зависимости от ее содержания, имеет более сильную связь с содержанием. Он выступает важным компонентом формирования спроса на информационные услуги и часто неотрывен от него, а также имеет более тесную привязку к потребностям конкретных потребителей.
Интернет стал восприниматься как мировой информационный ресурс благодаря сектору электронной глобальной коммуникации и долго существовал и развивался параллельно с другими службами связи и компьютерными сетями. В дальнейшем основная часть сектора электронных коммуникаций с добавленной стоимостью (прежде всего, направленная на межличностные и внутри- и межкорпоративные коммуникации) интегрировалась в Интернет. Однако и сегодня эта область по-прежнему существует как самостоятельная, например, в виде служб кабельного или спутникового телевидения, которые в свой пакет услуг наряду со стандартными услугами связи включают и распространение информации.
Лекция 5
Наиболее крупные изменения, произошедшие в информационном развитии общества, можно отметить пятью революционными этапами.
Первая революция. Появление речевых коммуникаций, обеспечивающее групповое поведение людей, сохранение накопленных знаний на основе устного общения.
Вторая революция. Изобретение письменности - основа наиболее важного скачка в развитии общества, появилась возможность долговременного сохранения знаний и передачи их от поколения к поколениям.
Третья революция. Изобретение книгопечатания, позволившее реализовать массовое распространение письменной информации, изменило культуру и организацию взаимной деятельности, обеспечило широкомасштабное развитие науки и образования.
Четвертая революция. Изобретение электричества и связанных с ним технологий передачи информации (телеграф, телефон, радио, телевидение), позволяющих оперативно передавать информацию, замещая непосредственное общение людей. Параллельно с этими изменениями появились средства оперативной фиксации событий (фотография и звукозапись).
Пятая революция. Появление электронно-вычислительных машин и основанных на них автоматизированных технологий. Проникновение информационных технологий во все сферы деятельности (промышленность, управление, культура и т.д.). Появление Интернета. Создание инструментальной базы для интеллектуальных систем.
Все эти преобразования не являются одномоментными событиями - как правило, это достаточно длительные эволюционные процессы. Поэтому указать временные периоды для каждого из вышеперечисленных преобразований можно достаточно условно. Даже появление книгопечатания нельзя связать только с изобретением Гуттенберга, которому почему-то приписывают изобретение печатного станка. Реальный исторический анализ показывает, что технологии оттиска были известны еще в очень ранних культурах (например, орнаменты), а оттиск на бумажный носитель, когда штамп вырезался на липовой доске, являлся базой для массового тиражирования задолго до XV века.
В настоящее время проходит очередной этап развития цивилизации - переход к информационному обществу. Понятие "информационное общество" как модификация концепций постиндустриального общества возникает во второй половине 1960-х гг. Постиндустриальное общество, которое уже характерно для большинства развитых стран мира и в экономике которого в результате научно-технической революции и существенного роста доходов населения приоритет перешел от преимущественного производства товаров к производству услуг, создает основу информационного общества. Уже для этой стадии развития производственным ресурсом стали информация и знания, научные разработки образуют главную движущую силу экономики, наиболее ценными качествами являются уровень образования, профессионализм, обучаемость и креативность работника.
Знание и информация всегда были обязательными компонентами в жизнедеятельности людей. Знания являются средством освобождения от влияния стихийных объективных сил, основой формирования личности. Но в условиях информационного общества знание приобретает новое значение, оно в определенной мере становится самостоятельной силой, центральным фактором технического и социального развития. Важнее всего, что знание может использоваться для производства нового знания. Становится возможным получать новое знание о реальности на основании имеющегося опыта. Это приводит к росту теоретических наук, прогнозу и проведению практических исследований на основании предварительных предположений. Математические методы проникают во все сферы деятельности человека.
В период перехода к информационному обществу любая организационная структура все больше использует информацию с целью повысить эффективность, стимулировать инновации, укрепить конкурентоспособность. Информация становится предметом массового потребления у населения, происходит интенсивное формирование информационного сектора экономики, который растет более быстрыми темпами, чем остальные отрасли.
Название "информационное общество" впервые появилось почти одновременно в Японии и США. Создание самого термина "информационное общество" приписывается Ю. Хаяши, профессору Токийского технологического института. Контуры информационного общества были обрисованы в отчетах, представленных японскому правительству рядом организаций.
Основной смысл концепции информационного общества, сформулированной в этих работах, может быть представлен следующими тезисами:
Это технократическое определение может вызывать определенные вопросы, однако до настоящего времени, несмотря на обилие публикаций, не существует четко сформулированных признаков перехода к информационному обществу. Достаточно правильно охарактеризовал эту ситуацию Фрэнк Уэбстер: "Читая литературу об информационном обществе, просто диву даешься, сколь велико число авторов, оперирующих неразработанными определениями предмета, о котором пишут" [9]. Сформулировать эти признаки трудно, так как мы сами являемся непосредственными участниками этого сложного, динамического, многоаспектного и, самое главное, развивающегося процесса. На необходимость осмысления происходящих изменений указывает то, что к этой работе подключаются ученые, работающие на стыке таких дисциплин, как социология, математика, философия, экономика и география.
Наиболее краткое определение, характеризующее барьер перехода к информационному обществу, сформулировано аналогично определению постиндустриального общества, в котором слово "услуги" заменено на "информационно-интеллектуальные услуги" и звучит так: Если в обществе более 50% населения занято в сфере информационно-интеллектуальных услуг, общество становится информационным. Этот социально-экономический аспект занятости населения иллюстрируют наблюдения, предложенные Порэтом в виде диаграммы, которая представлена на рис. 5.1. Уровень занятости 50% проходится дважды: первый раз при становлении новой общественной формации, второй - когда следующая волна развития покрывает общественные потребности, сформулированные на предыдущих этапах, меньшим количеством работников.
Один из основоположников идей информационного общества Кастельс характеризует эволюцию занятости следующими параметрами:
Рис. 5.1. Эволюция социальных систем (диаграмма Порэта)
В более подробных определениях информационного общества, предпринимающих попытку выделить и сформулировать основные характеристики информационного общества, традиционно исследуются следующие критерии.
Технологический: анализируются информационные технологии, которые широко применяются в производстве, учреждениях, системе образования и в быту.
Социальный: исследуются процессы, выступающие в качестве важного стимулятора изменения качества жизни.
Экономический: информация составляет ключевой фактор в экономике в качестве ресурса, услуг, товара, источника добавленной стоимости и занятости.
Политический: свобода информации, ведущая к политическому процессу, который характеризуется растущим участием и консенсусом между различными классами и социальными слоями населения.
Культурный: признание культурной ценности информации.
Наиболее четко перечень из 12-ти признаков, характеризующих информационное общество, представлен в работе Дона Тэпскотта "Электронно-цифровое общество" [10].
Как уже говорилось выше, преобразования, связанные с переходом к новым социальным, экономическим, технологическим и другим условиям, требуют от человека новых знаний, усилий по адаптации к изменениям. При этом общество старается поддержать человека в процессах адаптации, создавая специализированные образовательные структуры, формируя систему стимулов. Постоянно производится мониторинг и анализ наиболее значительных перемен в общественной жизни человека. Если происходящие изменения способствуют прогрессу общества, то оно создает благоприятную ситуацию для ускорения этих преобразований.
Комплекс мероприятий, способствующих переходу к информационному обществу, и сам процесс перехода принято называть информатизацией общества. По определению Федерального закона РФ "Об информации, информатизации и защите информации" от 25 января 1995 г. , информатизация - это "организационный социально-экономический и научно-технический процесс создания оптимальных условий для удовлетворения информационных потребностей и реализации прав граждан, органов государственной власти, органов местного самоуправления, организаций, общественных объединений на основе формирования и использования информационных ресурсов".
Как и определение понятия "информационное общество", определение информатизации имеет несколько взаимодополняющих формулировок.
Термин "информатизация" был впервые применен в докладе "Информатизация общества", подготовленном в 1978 г. группой специалистов по заказу президента Франции Валери Жискар д'Эстена. В отечественной периодической печати термин "информатизация" одним из первых, в 1987 г., применил А. И. Ракитов. В дальнейшем информатизация была определена им как процесс, в котором социальные, технологические, экономические, политические и культурные механизмы не просто связаны, а буквально сплавлены, слиты воедино. Вместе с тем, это процесс прогрессивно нарастающего использования информационных технологий для производства, переработки, хранения и распространения информации. По мнению Ракитова, процесс информатизации должен быть не столько технократичен, сколько направлен именно на решение задач социального развития, существенного повышения интеллектуального уровня общества, причем самой приоритетной из них является проблема выживания человечества [11]. Академик А. П. Ершов считал, что информатизация - это комплекс мер, направленных на обеспечение полного использования достоверного, исчерпывающего знания во всех общественно значимых видах человеческой деятельности.
Нет необходимости приводить далее многочисленные взгляды по этому вопросу отечественных и зарубежных исследователей. Однако можно выделить два основных теоретико-методологических подхода к информатизации общества.
Технократический подход сводит информатизацию общества, грубо говоря, к технико-технологическому оснащению трудовой деятельности людей в сфере производства и управления. В этом случае информационные технологии расцениваются как средство повышения производительности труда.
Социологический подход, когда информатизация рассматривается как процесс, охватывающий все сферы человеческой деятельности, воздействующий на самого человека - его знания и мораль, экономические и духовные интересы, его развитие как личности. При этом информатизация общества предстает как совокупность взаимосвязанных технических, экономических, социальных, политических и духовно-культурных факторов. Именно они обеспечивают развитие и широкомасштабное получение, обмен и применение информации в обществе в целях дальнейшего развития и совершенствования общества и его членов.
Таким образом, информатизация - это технологический, социальный и даже культурологический процесс, связанный со значительными изменениями в образе жизни населения. Такие процессы требуют серьезных усилий не только властей, но и всего сообщества пользователей информационно-коммуникационных технологий на многих направлениях, включая ликвидацию компьютерной неграмотности, формирование культуры использования новых информационных технологий и др.
Процесс информатизации включает в себя следующие взаимосвязанные технико-технологические составляющие.
Что касается автоматизации и роботизации производства, то они являются технической базой информатизации. Автоматизация и роботизация началась задолго до информатизации общества и непосредственно включать их в процесс информатизации общества не следует, они являются как бы предтечей информатизации общества, способствуя развитию электронной технологии. На базе автоматизации и электронных устройств конструируются мехатронные устройства - гибрид механической и электронной техники.
К концу 20-го столетия коммуникационные возможности человека пополнились появлением Интернета, что определило формирование еще одной составляющей информатизации общества, которую достаточно часто называют интернетализацией. Под этим термином понимают ускоренными темпами развивающуюся мировую информационную систему, техническую основу которой сейчас составляет Интернет. Эта глобальная сеть охватила практически все страны, проникла во все сферы жизнедеятельности людей, для значительного числа людей стала "средой обитания". Она оказывает огромное и все возрастающее влияние на промышленный и финансовый рынок, функционирование культуры и политику различных правительств. Именно Интернет является той реальной силой, которая стимулирует сложный и весьма противоречивый процесс глобализации.
Традиционно возникновение информатизации связывают с появлением компьютерной техники. Видимо, поэтому достаточно часто возникает мнение, что именно компьютеры стали главной причиной возникновения информатизации и информационного общества. Компьютеры и все связанные с этим направлением устройства, и даже Интернет являются лишь технической базой, средством информатизации. Именно они оказались наиболее эффективным средством для реализации задач, возникших при переходе к информационному обществу. Но если говорить об определении рубежных этапов развития информатизации, то они связаны с динамикой развития вычислительной техники и широким спектром электронных устройств, ориентированных на использование компьютеров, так как именно они формировали условия для наиболее важных преобразований.
Информатизация возникла из-за кардинального изменения роли информации во всех направлениях общественного развития. Если до середины прошлого столетия она выполняла вспомогательные, обслуживающие функции, то, начиная с 50-х гг. прошлого столетия, когда научно-техническая революция потребовала тесного сопряжения науки и промышленности, вовлечения в научные исследования широкого круга специалистов, роль информации стала изменяться. От сотрудников стали требовать работы с информацией не только в период обучения, но и в процессе производства. При этом работа не ограничивалась простым просмотром литературы, требовался поиск, анализ и другие интеллектуальные операции. Технологическое обеспечение всех вышеперечисленных процессов в большинстве случаев опиралось на традиционное библиотечное оборудование и доступные в тот период средства связи (телефон, телеграф, почту).
Уже в этот период стало понятно, что обладание большой базой структурированной информации (потенциальными знаниями) и совершенными средствами доступа к ней станет основой экономического, научного, технологического и политического успеха. Информация стала приобретать самостоятельное значение. При любом рассмотрении понятия информатизации надо четко понимать, что основой информатизации является не обилие технических средств, а наличие высококачественной, систематизированной, всесторонней информации.
Поэтому нулевым, подготовительным этапом информатизации следует считать мероприятия, предпринятые наиболее развитыми странами в 50-60-е гг. по созданию крупных информационных коллекций, технологий и организационных структур, позволяющих работать с этими массивами. В СССР наиболее крупным подобным мероприятием следует считать Государственную систему научно-технической информации (ГСНТИ). Начальные этапы ее реализации приходятся на этот период. Программа включала не только сбор и систематизацию информации, но и обеспечивала любому специалисту удобный доступ к научно-технической литературе (книги, журналы, патентная информация и др.) через организационную структуру функциональных, отраслевых, территориальных центров. В период расцвета ГСНТИ в этих подразделениях работало около миллиона информационных работников.
Другим аспектом информационной ситуации 50-60-х гг. явилось понимание невозможности освоения растущих объемов информации существующими на то время информационными технологиями. "Информационный взрыв" поставил задачу поиска новых информационных технологий, позволяющих сгладить возникающие трудности со сбором информации, ее хранением, систематизацией и доступом. Традиционные технологии себя исчерпали. Поэтому с конца 60-х гг. начинается активное использование компьютерной техники не только для сложных вычислительных работ, но и для автоматизации работ практически во всех сферах деятельности человека, включая работу с информацией. Появление магнитных носителей (магнитные ленты, магнитодисковые системы) позволило начать формирование электронных баз и банков данных. В развитых странах Запада к созданию информационных технологий с использованием компьютеров подключаются коммерческие структуры. Начинается формирование рынка информационных услуг, рынка компьютерной техники.
Компьютерная техника этого периода представлена в виде чрезвычайно дорогого, часто уникального оборудования, доступного только очень крупным структурам. Наиболее востребованной, обеспечивающей высокую доходность услугой становится предоставление доступа к вычислительным ресурсам, так называемое "машинное время". В это же время предпринимаются шаги по совершенствованию взаимодействия человека с вычислительной машиной. Перфокарты, перфоленты заменяются дисплеями, позволяющими осуществлять диалог с компьютером.
Несмотря на достигнутый прогресс, большинство работников не имели непосредственного соприкосновения с новыми технологиями и относились к ним с большим недоверием. Они получали возможность пользоваться конечными результатами через квалифицированного посредника (оператора). В качестве примеров подобных разработок направленных на широкий круг населения можно указать системы резервирования билетов и различные справочные системы.
В СССР этот этап информатизации вылился в колоссальную, очень затратную и неэффективную программу создания иерархического комплекса автоматизированных систем управления (АСУ). На каждом предприятии, в каждом более или менее крупном учреждении образуются вычислительные центры, в конкурентной борьбе распределяется вычислительная техника. Об экономической эффективности старались не говорить, программа носила идеологический характер. В школьных программах и специализациях практически всех высших учебных заведений появляются курсы программирования, ориентированные не на практическое применение, а на абстрактные математические вычисления. Именно в этот период в нашей стране происходит изменение значения термина "информатика", который изначально предполагал изучение информации, ее свойств и методов работы с ней. Теперь "информатика" - это обучение программированию, технологии работы с вычислительной машиной.
Следующий этап информатизации общества связан с появлением персональной вычислительной техники, средств индивидуальной печати и копирования, возможности передачи графических образов документов, появлением мобильной связи и Интернета. Для каждого человека появляется возможность перехода к принципиально новой технологии индивидуальной работы, доступ к широчайшему спектру информационных ресурсов, расширению спектра развлечений. Персональные компьютеры предназначаются уже не только для работы, но и для развлечения. Они приходят в дом и постепенно становятся таким же привычным устройством, как телевизор или телефон.
Персональная техника создала технико-технологическую основу информационного общества, поэтому с начала 90-х г г. наиболее развитые страны начали постепенный переход к информационному обществу, началась активная фаза информатизации. Переход к ней был сопряжен, по крайней мере, с тремя проблемами, в решении которых требуется участие государства.
Во-первых, каждый человек должен был иметь доступ к необходимым техническим средствам, которые в зависимости от ситуации будут находиться в индивидуальном или коллективном пользовании. Конечно, государство не должно непосредственно вмешиваться в организацию этого процесса. Уровень жизни, достигнутый на предыдущих этапах развития общества, должен позволить населению самостоятельную закупку соответствующего спектра оборудования, выбирать ту или иную технологию работы. Именно уровень жизни населения обуславливает неравномерность перехода к информационному обществу различными странами.
Во-вторых, массовое внедрение новых технологий требует определенных навыков и знаний не только у наиболее активной части населения, которая ориентирована на изменения, но и на рядового работника, пенсионера, человека, живущего в сельской местности. В решении этой проблемы государство обязано занимать более активную позицию. Оно должно организовывать и стимулировать создание дополнительной системы образования, оперативно помогать населению в освоении новых технологий.
И, наконец, третьей составляющей является обеспечение гарантий равноправного и регламентированного доступа к информации, находящейся в общественном доступе. И здесь законодательная роль государства должна быть определяющей. Дополнительной задачей для государства, ориентированного на создание информационного общества, становится расширение спектра информации, находящегося в открытом доступе. При рассмотрении этого этапа не следует забывать, что персональная техника является частью сложного технологического комплекса и обеспечивает только конечную работу пользователя. Ядром информатизации являются глобальная система информационных ресурсов (массивов, банков данных, каталогов и т.д.), организационные структуры, технические и технологические средства, поддерживающие эти фонды, а также транспортная информационная инфраструктура, обеспечивающая доступ к ним. В конечном виде именно они определяют уровень информатизации. В информационном обществе эта центральная, организующая часть приобретает стратегический характер.
Развитие этой "материальной" части информатизации выполняется как государственными, так и коммерческими структурами. Государство формирует ресурсы, связанные с государственным управлением, обороной, историей, статистикой. Коммерческие структуры формируют информационные ресурсы, ориентированные на обслуживание бизнеса, банковского дела, информационное обеспечение общества, развлечения.
Переход на электронную форму хранения информации. При рассмотрении этапов информатизации не всегда обращают внимание на изменение формы хранения информации. Считается очевидным, что информационные ресурсы, участвующие в процессах информатизации, имеют электронную форму, и на этом рассмотрение заканчивается. Однако реализация этого положения имеет достаточно непростую историю, когда, чтобы достичь современного уровня хранения и обработки информации, потребовалось решить ряд достаточно сложных организационных и технических задач. Требовалось создать общепринятые форматы записи, обеспечить создание широкого набора электронных носителей (магнитные ленты, диски, дискеты, CD- и DVD-диски), разработать транспортные технологии, обеспечить надежность и безопасность хранения на столь непривычном носителе, когда невозможно проверить присутствие информации без соответствующего оборудования. Но самой главной задачей является внедрение этой новой цифровой формы хранения информации в привычную деятельность человека, отказаться от ориентации на традиционные носители (бумага, фотопленка, носители, основанные на принципах аналоговой записи).
Для обыкновенного пользователя возможные трудности перехода на новый носитель компенсируются большими удобствами, реализованными в современном оборудовании. Перед приобретением оборудования он уже принял решение о переходе, готов преодолевать все сложности освоения. Требуется только грамотно организовать рекламу получаемых преимуществ, консультации и техническую поддержку.
Несколько сложнее этот переход осуществляется в производственных процессах, где он, как правило, сопряжен с разработкой специализированных, часто уникальных информационных систем. Уровень современных информационных технологий позволяет формировать электронные информационные ресурсы в процессе основной функциональной работы. Любая система имеет развитые средства накопления данных, участвующих в операциях, фиксации и архивации возникающих ситуаций на электронных носителях. Созданы технические и программные средства ведения банков данных с огромными объемами хранения. Эти разработки обеспечивают автоматическое пополнение ретроспективных баз данных текущей информацией.
Таким образом, к концу 90-х гг. основным носителем для сохранения информации становится электронный носитель. Но основной объем знаний, накопленный за многовековую историю, оставался на традиционных носителях. Подобная ситуация создавала значительные неудобства, так как некоторые виды работ предполагают использование не только текущей информации, которая уже ориентирована на современные технологии и расположена на электронных носителях, но и ретроспективы, расположенной на традиционных носителях. Возникает проблема перевода наиболее ценной информации на электронные носители.
Здесь особенно ярко проявилось отличие аналоговой записи информации от электронной. Невозможно полностью сохранить содержание аналогового документа в электронном образе. Из-за дискретности электронная запись может зафиксировать только какую-то узкую, целевую на момент выполнения преобразования часть сведений, содержащихся в аналоговом документе. В качестве одного из наиболее простых примеров рассмотрим рукописный документ. Если перевод осуществляется в виде графического образа, то точность воспроизведения зависит от разрешения сканера. При этом документ не очень пригоден для дальнейшей электронной обработки, например, с использованием текстового редактора - требуется распознать текст. Однако процесс распознавания еще более огрубляет информацию, полностью исчезает понятие "почерк", характеристики исходного материального носителя и другие тонкие характеристики. Поэтому создание электронного аналога не отменяет ценность первичного документа. Если рассматривать вышеуказанную проблему более широко, то и аналоговые документы (бумага, фотопленка и т.д.) также не являются идеальным средством фиксации информации. Скорее всего, в перспективе этому направлению будет уделено особое внимание.
Проблема совместимости актуальна не только при трансформации аналоговой информации в электронную, достаточно большое количество задач приходится решать при сопровождении уже имеющихся массивов электронной информации. Структура записи электронного документа определяется форматом, который, в свою очередь, зависит от носителя, технического средства записи-считывания, программной разработки, в рамках которой живет информация. Постоянное развитие этих составляющих требует непрерывной конверсии электронных данных. Утеря контроля над этим процессом достаточно часто влечет потерю информации. Ярким примером подобной ситуации может служить переход в нашей стране с ЕС ЭВМ на персональную вычислительную технику, который совпал с перестроечными процессами, упразднением и реорганизацией структур, владеющих ценными массивами. Поэтому значительное количество созданных баз данных, информация из которых актуальна и в настоящее время, было утеряно.
Перевод коммуникации на сетевые электронные технологии. Наиболее заметным технологическим изменением, кардинально изменившим систему коммуникаций человека, стало повсеместное использование сетевых технологий и Интернета. Внедрение этих технологий позволило реализовать функции коллективной, дистанционной работы. Изменились коммуникационные возможности человека за счет быстрого подключения к любой группе адресатов, скорости приема-передачи информации, возможности оперативного использования информации из электронных архивов и баз данных. Разработка сетевых методов и освоение необходимых технических средств начались около сорока лет назад. На начальном этапе формировались технологии, обеспечивающие коллективную работу в рамках автоматизации производственных и офисных работ в компактно расположенном комплексе зданий на базе локальных вычислительных сетей (ЛВС). Пользователи работали сначала на выносных терминалах, позднее к сети были подключены персональные компьютеры, которые совместно с серверами и кабельной сетью предприятия стали технической основой современных ЛВС. Программная часть локальных сетевых технологий основана на приложениях типа клиент-сервер, обеспечивающих корректную многопользовательскую работу с едиными данными.
Дальнейшее развитие методов работы с информацией потребовало объединить взаимодействие не только в рамках единого здания. В середине 70-х гг. появляются модемные соединения удаленных компьютеров через телефонную сеть, позволившие обмениваться короткими текстовыми сообщениями. Следует отметить, что одной из первоначальных причин объединения компьютеров (основы современного Интернета) была оптимизация загрузки уникального дорогостоящего оборудования. Повышение их производительности выполнялось за счет привлечения заданий из перегруженных вычислительных центров. Информационный обмен сообщениями, электронная почта возникли в виде инициативы энтузиастов, имеющих доступ к развитию сетевой технологии. Электронная почта, пройдя сложный процесс становления, стала одним из главных инструментов коммуникации в современном обществе.
В процессе эксплуатации выяснилось, что электронная почта имеет существенное ограничение во взаимодействии пользователей. Для передачи сообщения от одного пользователя сети по одному или нескольким кон-кретным адресам необходимо было знание этих адресов. Достаточно часто требуется публикация сообщения, чтобы оно было доступно всем пользователям сети. Поэтому следующий этап совершенствования технологий сетевого взаимодействия был посвящен реализации этой идеи, которая была реализована в 80-х гг. Появляются Bulletin Board Systems (BBS) - электронные доски объявлений, на которых размещали самую разнообразную информацию: коммерческие предложения, поиск работы, объявления о пропаже животных и т.п. С использованием BBS появилась возможность организации чата, проведение коллективных игр. Для доступа к BBS пользователю были необходимы телефонная сеть, модем и программа-терминал.
Доступ осуществлялся по принципу "точка - точка", поэтому к компьютеру подключался громоздкий шлейф модемов, требовалась масса телефонных номеров. Дозвониться до BBS было очень проблематично. Изначально эти доски объявлений содержали разнообразные фирмы, и доступ к ним был платный. Впоследствии же, в качестве хобби, их стали открывать и обычные люди. В основной своей массе доступ к частным BBS бесплатный.
Они могли быть как автономными, так и связанными с другими BBS. Связь выполнялась на основе некоммерческой сети Фидонет (коротко - Фидо, от англ. Fidonet), которая также базировалась на модемных соединениях "точка - точка". Подключаясь к сетевой BBS, пользователь имел доступ только к информационным ресурсам, хранящимся конкретно на этой BBS. Поэтому для создания интегрального ресурса BBS обмениваются информацией между собой, забивая телефонные каналы.
К концу 80-х гг. использование BBS приобрело массовый характер. В сети начали концентрироваться колоссальные объемы информации, но доступ ко всему спектру этих ресурсов ограничивался неспособностью обмена информацией между многочисленными BBS по телефонным каналам. Появилась идеология создания Всемирной паутины. Основой Всемирной паутины является специализированная сеть кабельных соединений, обеспечивающая транспорт информации, и система компьютеров, диспетчирующая потоки информации в соответствии с адресами отправителя и получателя, прикрепленными к ней. Каждый пользователь сети для входа в нее должен получить уникальный адрес и установить электрическое подсоединение к Всемирной паутине. Следует отметить, что коренное отличие Всемирной паутины от предшествующего ей Фидонета заключается не в технических решениях, а в принципах размещения информационных ресурсов. В Фидо ресурс располагается на компьютере администратора сети, он должен дать согласие на это размещение и упорядочить данные в соответствии со своей системой организации массивов. Во Всемирной паутине такого ограничения нет. Любой пользователь может зарегистрировать, договориться о подключении к провайдеру и создать собственный сайт, на котором практически бесконтрольно может публиковать любую информацию. Для внешнего подключения необходимо знать уникальный адрес компьютера, хранящего требуемую информацию. Однако такое стихийное построение создает проблему поиска необходимой информации.
Если в BBS администратор систематизирует информацию, например, по тематике и в значительной степени упрощает поиск, то во Всемирной паутине эту функцию должны выполнять поисковые системы, через набор "пауков", "ощупывающих" подключенные к сети компьютеры, автоматические информационные технологии, систематизирующие найденную информацию. Работа поисковика зависит от качества работы этих составляющих. К сожалению, на настоящий момент качество поиска далеко от идеала, часть информации отсутствует, много шума и искажений. Стремительное развитие сети предъявляет новые более жесткие требования к поиску, которые, возможно, будут выполнены при реализации идеологии Семантической паутины (Semantic Web). Идеология продвигается Консорциумом W3 (организация, разрабатывающая и внедряющая технологические стандарты развития Всемирной паутины).
Обеспечение мобильности и интеграции информационных технологий. Следующим шагом в технологическом обеспечении информатизации стало обеспечение мобильности. Начало было положено широким и очень быстрым переходом на мобильную телефонную связь. Принцип радиотелефонии был известен еще в 20-30-е гг. прошлого столетия, но только появление сотовой связи в 1978 г. вдохнуло в эту технологию возможности массового использования. Начиная с 80-х гг., постоянный рост этой услуги позволил практически любому человеку купить сотовый телефон и иметь возможность оперативного обмена информацией.
Следующей новацией стало появление мобильного компьютера, сначала в виде очень громоздкого лэптопа, затем ноутбука. Пользователь теперь имеет возможность работать с информационными ресурсами компьютера без привязки к какому-либо фиксированному месту, но он лишен уже привычной возможности сетевого общения и, что самое главное, Интернета. Модемы, как правило, входящие в стандартную комплектацию мобильных компьютеров, не смогли эффективно обеспечить эту функцию. Проблема обеспечения мобильности сетевого соединения стояла не только для переносных компьютеров. В ряде случаев построение кабельной части локальной вычислительной сети было невозможно либо нерационально в связи с постоянной реконфигурацией схемы подключений. Поэтому в конце 90-х годов были разработаны оборудование и стандарт беспроводного сетевого подключения Wi-Fi (Wireless Fidelity - "беспроводная точность").
Реальная мобильность компьютеров стала возможна после создания мобильного Интернета. С 2005 г. операторы мобильной связи использовали технологии Wi-Fi при развитии сотового покрытия территорий. Сейчас происходит бурное развитие этих технологий, идет борьба за выделенные диапазоны радиочастот, конкурентная борьба форматов связи (LTE, WiMAX).
Одним из главных направлений технико-технологического развития, способствующего еще более эффективной работе с информацией, является конвергенция технологий, комплексирование функций нескольких электронных устройств в одной мобильной конструкции (компьютер, телефон, навигация, электронная книга, Интернет и т.п.). При этом для побуждения населения к закупке более совершенных устройств, кроме агрессивной рекламы, проводится политика снижения цены на оборудование и компенсации финансовых потерь за счет расширения спектра предоставляемых услуг, например, мобильного телевидения или доступа к каким-то популярным информационным ресурсам.
Судя по вектору текущего развития информационных технологий, ближайшие десятилетия будут посвящены развитию методов виртуализации ощущений человека. Перспективные технологии позволят выполнять дистанционную работу, полностью погружаясь в виртуальную среду взаимодействия с управляемым (наблюдаемым, контролируемым) объектом.
Переход к информационному обществу совпал с острой фазой информационного кризиса - наиболее болезненной, мешающей дальнейшему развитию цивилизации проблемы. Общество столкнулось с противоречием между ограниченными возможностями человека по восприятию и переработке информации и существующими огромными потоками и массивами хранящейся информации. Необходимо согласовать информационный "голод" и информационную "лавину". Поэтому главным и наиболее ожидаемым положительным последствием информатизации должно стать преодоление этой проблемы. Одним из начальных шагов решения этой сложной задачи является разработка современных информационных технологий. Они должны позволить формулировать запрос на выполнение любых операций с информацией на языках, близких к естественному, эффективно отсекать информационный шум, доставлять нужные сведения в удобной для пользователя форме.
Другой важной задачей информатизации является реализация свободного доступа каждого человека к информационным ресурсам всей цивилизации. Сейчас этот доступ в значительной степени ограничен административными, межгосударственными и экономическими барьерами. Государство, международные организации через законодательные акты, соглашения, целевые программы должны разумно отрегулировать доступ к информации, обеспечивающей эффективное развитие цивилизации. Разумность регулирования заключается в том, что имеется опре-деленный спектр информации, закрытие которой обосновано государственными или корпоративными интересами. Процессы информатизации должны определить разумные границы доступа. Кроме этого, доступ должен быть согласован с соблюдением авторских прав. Основным принципом информационного общества должно стать утверждение: "Ограничение свободного распространения информации наносит вред государству".
Положительной стороной информатизации является переход к новым формам занятости. Появляется возможность дистанционной работы: телеработа, телекоммьютинг, (telecommuting), расширение сектора SOHO (малый и домашний офис). Для ряда специальностей теперь можно организовать гибкий график работы. При этом существенно уменьшаются затраты всех участников (офисное помещение, транспортные расходы, сокращение производственной инфраструктуры), работник может более эффективно использовать те временные интервалы, когда его организм работает максимально продуктивно, появляется возможность реализовать пожелание "жить, где хочу" и, наконец, улучшается экология. Еще одним закономерным следствием дистанционной работы является стирание граней государственных границ при наборе работников - работа по контрактам без каких-либо непосредственных контактов с работодателем.
Появление новой индустрии - индустрии информации - должно компенсировать сокращение занятости в аграрном и промышленном секторе. Новые рабочие места ориентированы на высококвалифицированных специалистов, что, в свою очередь, должно определить углубление образовательных процессов в вузовском и послевузовском образовании. Образование, навык работы со сложными электронными устройствами становится обязательным условием для самореализации в информационном обществе.
Наиболее ожидаемым явлением, к реализации которого привлекаются наиболее совершенные технологии и специалисты, является создание Е-правительства. Информатизация этого направления целиком возлагается на государство. Разработка должна повысить эффективность государственных функций во всех сферах общественного развития, снять бюрократические барьеры при взаимоотношениях с государственными и муниципальными органами управления.
Среди других положительных последствий информатизации следует отметить:
В информационном обществе изменяется не только производство, но и весь уклад жизни, система ценностей, возрастает значимость культурного досуга по отношению к материальным ценностям. Лица с ограниченными физическими возможностями, в частности, пожилые люди, смогут даже после ухода на пенсию продолжать работать, так как повысится планка работоспособного возраста.
Так как информационное общество является более комфортным, совершенным и отражает прогрессивное развитие общества, информатизация влечет в основном положительные последствия. Однако в некоторых ситуациях она может приводить к отрицательным результатам. Перечислим прогнозируемые основные отрицательные последствия информатизации.
В литературе, рассматривая прогнозируемые последствия информатизации, наиболее часто ссылаются на таблицу, представленную в книге швейцарского исследователя К. Хессига "Страх перед компьютером?" [12]. В ней отражены результаты опроса жителей Швейцарии в конце 80-х гг., собраны и систематизированы ответы респондентов. Несмотря на то, что исследование выполнено более двадцати лет назад, собранные данные можно считать весьма актуальными и для настоящего времени, так как в Швейцарии уже давно сложились практически все классические предпосылки информационного общества.
Большинство ответов выражают эмоции респондентов, и к каждому из них необходимы пояснения. Например, ответ "Снижение культурного уровня" выглядит достаточно странным, так как развитие информационной среды создает предпосылки для повышения культурного уровня (доступ по сетям к сокровищам библиотек, музеев и т.д.). Однако автоматически это не происходит. Возможно резкое увеличение числа людей, являющихся механическими потребителями предоставляемой информации, что отражает негативную тенденцию. Или ответ "Элитарное знание" - его надо понимать как опасность огромной поляризации знаний в обществе, возможном накоплении их преимущественно в узком, "верхнем" общественном слое - элите (политической, экономической и т.д.). Выхватывание этих "девизов" без расшифровки внутреннего содержания нежелательно.
Таблица 5.1. Последствия информатизации в зеркале общественности |
|
Положительные последствия |
Отрицательные последствия |
КУЛЬТУРА И ОБЩЕСТВО |
|
Свободное развитие индивида. Информационное общество. Социализация информации. Коммуникативное общество. Преодоление кризиса цивилизации |
"Автоматизация" человека. Дегуманизация жизни. Технократическое мышление. Снижение культурного уровня. Лавина информации. Элитарное знание (поляризация). Изоляция индивида |
ПОЛИТИКА |
|
Расширение свобод. Децентрализация. Выравнивание иерархии власти. Расширенное участие в общественной жизни |
Снижение свобод. Централизация. Государство-"надзиратель". Расширение государственной бюрократии. Усиление власти благодаря знаниям. Усиление манипуляции людьми |
ХОЗЯЙСТВО И ТРУД |
|
Повышение продуктивности. Рационализация. Повышение компетентности. Рост богатства. Преодоление кризиса. Экономия ресурсов. Охрана окружающей среды. Децентрализация промышленности. Новая продукция. Улучшение качества. Диверсификация |
Все возрастающая сложность жизни. Обострение промышленного кризиса. Концентрация. Подверженность кризисам. Стандартизация. Массовая безработица. Новые требования к мобильности трудящихся. Дегуманизация труда. Стрессы. Деквалификация. Исчезновение многочисленных профессий |
МЕЖДУНАРОДНЫЕ ОТНОШЕНИЯ |
|
Национальная независимость. Появляется шанс на развитие у стран "третьего мира". Улучшение обороноспособности страны |
Усиление взаимозависимости. Технологическая зависимость. Обострение отношений Юга - Запада. Уязвимость. Усиление опасности новой войны |
Государственное участие в процессах информатизации оформляется в виде специализированных программ, причем каждое государство определяет свою тактику поддержки процессов перехода к информационному обществу. Анализ национальных планов информатизации позволяет выделить ключевые факторы, определяющие различия между ними. К ним относятся:
К основным сферам информатизации общества, в которых государство занимает активную позицию, относятся:
Основными целями программ информатизации вне зависимости от выбранной конкретным государством тактики являются:
Существуют два принципиальных подхода к информатизации: западная и азиатская модель [13]. Западной моделью информатизации называют путь, по которому идут индустриально развитые страны. Однако в его рамках следует отделить путь, по которому идет континентальная Европа, от американо-английского пути. Европейский путь - это поиск некоего баланса между полным контролем со стороны государства и стихийностью рынка, динамическое сочетание правительственных и рыночных сил, с учетом того, что роль каждой из них может меняться во времени. Все страны ЕС имеют собственную программу и взгляды на информатизацию, основной идей каждой из них остается социальная направленность и государственное регулирование большинства процессов, затрагивающих преобразование общества. Однако акценты информатизации могут несколько отличаться.
Так, например, в отчете датского правительства "Информационное общество 2000" подчеркивается, что рынку нельзя позволить взять контроль над стратегией разработки инфомагистралей. В шведском правительственном отчете "ИТ - крылья человеческим возможностям" предлагается введение переходного периода, во время которого правительство берет руководство на себя и является гарантом интересов не только рынка, но и индивидуумов.
Франция наиболее жестко настаивает на централизованном развитии инфраструктуры информационного общества. Она предполагает обобщить опыт использования телеинформационной системы Минитель (разработка 70-х годов, аппарат связи выдается в почтовом отделении бесплатно, пользователь платит только за услуги), которая в 2009 г., несмотря на существование Интернета, имела не менее миллиона пользователей. Испания считает, что роль правительства заключается в обеспечении перехода от услуг для элиты к услугам для всех, и прежде всего - в отраслях телеобразования и телемедицины.
Американо-английский путь информационного развития определяется своей моделью социально-экономического развития, когда функции государства сводятся к минимуму, а частных лиц - к максимуму. Истинно американский путь - перевес частной инициативы во всех проявлениях развития: оставить все в руках частного сектора и рынка, полная либерализация рынка информационных технологий, ограничение государственного управления в сфере телекоммуникаций.
Вторым из основных факторов, по которому дифференцируются европейская и американская модели развития информационного общества, являются особенности законодательства. Континентальная Европа имеет более жесткое законодательство в области регулирования рынка труда, продуктов и услуг, чем США и Великобритания. По мнению экспертов, существующее в Европе законодательство во многом тормозит развитие информационного общества. Государственная политика США в вопросах информатизации ограничивается развитием глобальных проектов, которые частный капитал финансировать не может.
Азиатская модель информатизации основана на эффективном сотрудничестве государства и рынка, попытке установить связь между социальными трансформациями и культурными ценностями. Эта модель отражает философский принцип сосуществования и сопроцветания - альтернативный способ социально-экономического развития региона и конфронтацию с Западом. В рамках азиатской модели выделяются Япония и "азиатские тигры" (Южная Корея, Тайвань, Сингапур и Гонконг).
В Японии процессы информатизации обязаны базироваться на главной идее общества, когда каждый знает свой статус по отношению к другим и ведет себя в соответствии с целями своей группы. Японский стиль управления основан на иной, по сравнению с европейской, корпоративной культуре, когда управляющее звено обязано заботиться о подчиненных, а те должны беспрекословно выполнять директивы. Поэтому государство и бизнес совместно несут ответственность за все проблемы, возникающие при переходе к информационному обществу, и разрешают их совместными усилиями. Большие государственные расходы на научные исследования и разработки всегда были и являются до сих пор отличительными чертами Японии. Роль бизнеса состоит в развитии новых, высоких технологий и производств. При этом роль государства - создавать благоприятные условия для творчества, уменьшать риск предпринимателей, действующих в приоритетных сферах. Японское правительство считает, что для стимуляции творческой деятельности интеллектуальный капитал нации должен стать достоянием всех. Основной акцент в будущем Японии делается на повседневные нужды людей, на разработку и внедрение ИКТ, способствующих повышению качества жизни населения.
В основе развития региона Восточной и Юго-восточной Азии - "четырех тигров" - лежит японская модель. Однако процессы перехода к информационному обществу в этих странах имеют отличные от Японии стартовые условия. В значительной степени эти государства можно отнести к развивающимся странам. Экономическому успеху "тигров" в большой мере способствовали японские капиталовложения, вместе с ними они восприняли от Японии философию взаимоотношений государства и бизнеса. Взаимоотношение "государство-рынок" в этих странах остается социологическим и политическим, а не чисто экономическим.
Модели информатизации развивающихся стран. В развивающихся странах выделяют две идеологии построения информационного общества - латиноамериканскую и азиатскую, в основе которых лежат две модели реформы телекоммуникаций, технической основы информатизации.
Для развивающихся стран возможны две принципиально различные стратегии реформы - приватизация и либерализация. Приватизация - это передача государственных предприятий и видов деятельности в полное или частичное владение или контроль. Либерализация - это снижение барьеров для вхождения в рынок или его часть с помощью разрешения третьим сторонам конкурировать с известными, обычно монопольными производителями товаров и услуг. Опыт показал, что те страны, которые пытались одновременно проводить приватизацию и либерализацию, потерпели неудачу и растянули достижение реформы во времени.
Латиноамериканская модель начинается с приватизации, предназначенной быстро улучшить качество телекоммуникационных услуг ценой задержки введения на рынок конкуренции.
Азиатская модель реформы развивающихся стран характеризуется тем, что реформа начинается с внедрения конкуренции, оставляя всякую серьезную приватизацию на потом. Латиноамериканская модель более быстрая и смелая.
Отдельный путь перехода к информационному обществу выбрала Индия. Особенностью идеологии построения информационного общества в Индии является осторожность, постепенность и опора на национальные культурные корни. Ее путь можно назвать промежуточным, по размаху и глубине он ближе к латиноамериканской модели, а по скорости проведения - к азиатской. Индия не выбрала ни пути полной приватизации, ни мягкой либерализации. Своим главным капиталом на пути в глобальное информационное общество Индия считает свои человеческие ресурсы. Государственные предприятия не передаются в частный сектор, а конкуренция допускается на рынке местных услуг, при этом разрешается не более 49% иностранного присутствия. Междугородная и международная связь остаются в руках государства. В стране существует гибкое законодательство, хорошо регулирующее сферу телекоммуникаций.
Международные программы информатизации. Учитывая глобальный характер проблем перехода к информационному обществу, необходимость выравнивания условий информатизации в различных регионах и странах, формируются международные программы, определяющие главные векторы глобальной информатизации.
В июле 2000 года на Окинаве состоялся саммит "Большой восьмерки". Там впервые официально был провозглашен переход мирового сообщества к глобальному информационному обществу. Окинавская хартия (Okinawa Charter on the Global Information Society) устанавливает основные принципы вхождения государств в глобальное информационное общество и является важнейшим документом, призванным организовать и активизировать деятельность международного сообщества в области формирования глобального информационного общества.
В Хартии выделяется четыре раздела:
В Окинавской хартии были установлены следующие основные принципы вхождения государств и стран в глобальное информационное общество.
Не менее важным событием явился Всемирный саммит на высшем уровне по информационному обществу, проводившийся в два этапа: Женева, 2003 год, и Тунис, 2005 год. По итогам первого этапа была принята "Декларация принципов. Построение информационного общества - глобальная задача в новом тысячелетии", декларативный документ, определяющий основные задачи глобальной информатизации [14].
Второй этап проходил при активном участии ООН и был посвящен в значительной степени проблемам управления Интернетом. Генеральный секретарь ООН Кофи Аннан, выступая на саммите, сказал: "Нынешняя встреча на высшем уровне должна стать саммитом решений". Была сделана попытка выявить ключевые вопросы публичной политики и разработать согласованное представление о ролях и ответственностях правительств, межправительственных и международных организаций, частного сектора и организаций гражданского общества в вопросах управления Интернетом. Значительная группа стран под руководством Китая и членов так называемой Группы-20 (Бразилия, Южная Африка, Индия и другие) заняла позицию достаточно жесткого управления Интернетом, включая борьбу со спамом, незаконным контентом и т.д. Фактически эта позиция сводится к установлению цензуры в Интернете. США и страны Европейского союза при поддержке частного сектора утверждают, что регулирование Интернета должно сводиться к техническим вопросам, а его организационную основу менять не следует. Российская делегация заняла промежуточную позицию, но точка зрения Китая была ей более близка. Несмотря на жесткую дискуссию, найти согласованное решение не удалось, и Интернет до настоящего времени остается стихийной организацией, управляемой коммерческими структурами, базирующимися на территории США.
Свои программы имеют межгосударственные объединения (Евросоюз, СНГ) и международные организации (ООН, ЮНЕСКО). Первоначальный план действий Евросоюза "Европейский путь в информационное общество" (Europe's Way to the Information society. An action plan) был принят в 1994 г. Его часто называют "инициативой Бангемана", по фамилии руководителя группы высокопоставленных экспертов, которая подготовила рекомендации по активизации работ, связанных с переходом к информационному обществу. Европа к тому моменту имела серьезное отставание в процессах информатизации от США и Японии.
Дальнейшая стратегия информатизации в ЕС была определена на сессии Совета Европы в Лиссабоне в 2000 г., которую затем оформили в виде программы действий "Электронная Европа 2002" (eEurope Action Plan 2002), подготовленной Европейской комиссией. В этой программе поставлена стратегическая цель - создать к 2010 г. в Евросоюзе самую конкурентоспособную и динамичную информационную экономику в мире. Приоритетными направлениями должны стать: дешевый, быстрый, безопасный Интернет; инвестиции капитала в людей и их квалифика-цию; содействие использованию Интернета; совершенствование юридической среды информационного общества; развитие информационной инфраструктуры, распространение соответствующих услуг в пределах Евросоюза, ускорение развития электронной торговли; создание "онлайнового правительства": электронный доступ к общественным услугам; создание онлайнового здравоохранения; разработка европейского цифрового контента для глобальных сетей; создание интеллектуальных транспортных систем.
Практическая реализация стратегических целей развития Евросоюза объединяется в 5-летние рамочные программы [15]. Так, в рамках 5-ой рамочной программы было направление "Технологии информационного общества". 6-ая программа (2002-2006 гг.) в значительной степени посвящена крупнейшему политическому проекту "Электронная Европа" (eEurope), в рамках которого выполнялось множество подпрограмм как внутри стран-членов ЕС, так и на уровне Европейской комиссии. В виде примеров таких подпрограмм можно указать e-Content - программа поддержки производства, распространения и использования европейского контента и поддержки многоязычия Всемирной сети; e-Inclusion - вовлечение в жизнь общества, обеспечение компьютерного образования малоимущих, людей с различными физическими недостатками. Если какое-то государство Евросоюза хочет развивать направления, не лежащие в русле общей стратегии, оно должно обеспечивать их собственным финансированием.
Следует отметить, что система демократического распространения финансовых средств сопровождается очень жестким мониторингом достигнутых результатов. Сравниваются показатели различных государств, достигнутые при реализации общей стратегии. Все основные результаты, текущие задачи и возникающие проблемы концентрируются на сайте http://ec.europa.eu/information_society/index_en.htm.
Так как европейцы не удовлетворены состоянием дел в области научных исследований, считая их не адекватными стратегической цели построения информационного общества, базирующегося на знаниях, при мониторинге особое внимание уделяется сравнениям с аналогичными процессами в США.
Государства, входящие в Содружество Независимых Государств, также нацелены на интеграцию усилий при переходе к информационному обществу. Этому способствуют общие исторические корни, менталитет, географическое расположение. В 1996 г. была разработана и согласована "Концепция формирования информационного пространства СНГ" [16]. В ней отмечается, что "в области формирования информационного пространства СНГ существуют закономерности, общие для всех государств Содружества и специфические для каждого государства", поэтому одной из основных задач является развитие нормативно-правовой базы взаимодействия в информационной сфере. Кроме этого, в Концепции определены общие интересы государств Содружества в информационной сфере:
Кроме этого было констатировано, что имеется ряд важных конкретных задач, эффективное решение которых возможно только путем совместных усилий государств Содружества.
Однако реализация на практике декларированных положений пока вызывает значительные затруднения.
Стартом процесса информатизации в России можно считать 60-е гг., когда кибернетика окончательно перестала быть "лженаукой", была осознана роль информации как важнейшего ресурса предприятия, организации, региона, общества в целом. Начали разрабатываться автоматизированные информационные системы разного рода. В этот период было создано большое количество организаций и структур, занимающихся компьютерной техникой и информационными технологиями. Проблема обеспечения информацией управленческих работников была поставлена сразу системно, обеспечена детальными теоретическими разработками. Была разработана концепция иерархического комплекса автоматизированных систем управления (АСУ), в которой, прежде всего, выделялись системы разных уровней управления - АСУП (для уровня предприятий и организаций), ОАСУ (отраслевые), РАСУ (республиканские и региональные), и, наконец, ОГАС (общегосударственная автоматизированная система). Эти уровни составили основу концепции академика В. М. Глушкова по разработке стратифицированной структуры ОГАС. Начальный период завершился в конце 80-х гг. и совпал с экономическим кризисом, который в значительной степени размыл эффективность достигнутых результатов информатизации. Не говоря о развитии, даже поддержание достигнутого уровня требовало значительных трудовых и финансовых затрат. Стране в тот период было не до информатизации.
В виде примеров конкретных достаточно успешных разработок начального периода информатизации можно отметить:
В конце 80-х гг., в начальном периоде перестройки, когда в СССР на фоне тяжелого экономического положения и общественно-политической неразберихи правительство пыталось переломить ситуацию и мечтало о прорывных технологиях, почти все государственные программы начинались с девизов "ускорение", "интенсификация", был поднят вопрос о создании перспективного плана информатизации страны. В 1989-1990 гг. с участием государственных структур и общественности была разработана концепция информатизации общества, затем одобренная соответствующим комитетом Верховного Совета СССР. На ее основе были подготовлены проекты общесоюзной программы информатизации и республиканской программы "Информатизация России" (1990-1991 гг.). Однако в силу ряда причин (ограниченность финансовых ресурсов, несогласованность позиций министерств и ведомств) проект программы не был принят правительством.
К моменту развала СССР ситуация в области информатики приобрела катастрофический характер. Для того времени стали характерны высказывания такого вида: "Мы близки к тому, что теперь не только не сможем копировать западные прототипы, но и вообще окажемся не в состоянии даже следить за мировым уровнем развития". В течение следующего десятилетия (1991-2000 гг.) информатизация в России проводилась без активного вмешательства государства. Научные разработки проводились по инерции, реализуя накопленный ранее потенциал. Производство отечественных технических средств информатизации (компьютеры, средства связи и т.п.) практически прекратилось из-за их технического несовершенства и качества.
Однако информатизация не прекратилась, ее ведущим звеном становятся коммерческие структуры. Появляется большое количество частных, полугосударственных фирм, занимающихся информационными технологиями, импортом и продажей зарубежной техники. Формируется разветвленная сеть мобильных телефонных услуг, учреждения и наиболее продвинутая часть населения подключаются к Интернету. Приобретает широкие масштабы сборка простейших моделей персональных компьютеров из импортных комплектующих. Персональный компьютер постепенно переходит в разряд бытовой техники, служащей для учебы, развлечений, работы с текстами и простейшими расчетами (электронные таблицы).
В течение 1992-1996 гг. в стране активно проводилась работа по формированию законодательной базы информатизации. Были приняты федеральные законы "Об информации, информатизации и защите информации" (1995 г.) и "Об участии в международном информационном обмене" (1996 г.). Было также выпущено большое количество указов Президента РФ и постановлений правительства по вопросам информатизации. Учитывая традиционную для России способность "спокойного" отношения к законодательству и сложную общественно-политическую обстановку, эти законодательные акты никакого влияния на информатизацию не оказали. Это был задел на последующие периоды.
В 1995 г. была разработана концепция формирования и развития единого информационного пространства России (ЕИПР) и соответствующих государственных информационных ресурсов [17]. Единое информационное пространство России (ЕИПР) понимается в Концепции как "совокупность баз и банков данных, технологий их ведения и использования, информационно-телекоммуникационных систем и сетей, функционирующих на основе взаимосвязанных принципов и по общим правилам и стандартам, обеспечивающих информационное взаимодействие организаций и граждан, удовлетворение их потребностей в информационных услугах". На базе этого документа в 1998 г. по поручению Комитета Государственной Думы по информационной политике и связи была разработана и одобрена Концепция государственной информационной политики.
Целями государственной информационной политики объявлялись следующие положения:
"Электронная Россия". В 2002 г. Правительство РФ принимает Федеральную целевую программу "Электронная Россия". И это уже план конкретных мероприятий, обеспеченных государственным финансированием. Мероприятия программы распределены на три этапа и рассчитаны на период 2002-2010 гг.:
В долгосрочном плане мероприятий было предусмотрено 69 конкретных работ, разбитых на следующие группы.
Если сравнивать проект "Электронная Россия" с программами информатизации западных стран, то можно отметить, что российская программа, в отличие от них, отражает главным образом интересы государства и лишь опосредованно, через него, - интересы людей. Специфика российской программы состоит в укреплении государственных институтов, органов власти и механизмов взаимодействия государства с хозяйствующими субъектами, а также в содействии развитию СМИ.
К сожалению, начальный вариант программы "Электронная Россия" характеризовала определенная декларативность, общность и размытость достигаемых результатов. Скорее всего, именно по этим причинам реализация программы уже с самых начальных этапов испытывала значительные трудности. В реализации программы участвовало много конкурирующих ведомств и организаций, концентрирующих внимание только на распределении финансовых потоков. Выделение средств выполнялось только в конце отчетного периода, централизованное содержательное управление практически отсутствовало.
Государство, оценивая достигнутые результаты, несколько раз изменяло программу, пытаясь придать ей большую динамичность и конкретность планируемых результатов. Последняя корректировка произведена в конце 2009 г. Согласно этой версии, вся программа с 2002 по 2010 гг. обойдется в 21,2 млрд руб. (изначально планировалось 77,2 млрд руб.), что в значительной степени характеризует востребованность результатов. Завершающий этап целиком посвящен активизации работ по созданию "электронного правительства".
В определенной степени особое внимание к проблеме "электронное правительство" можно объяснить парадоксальной ситуацией, сложившейся в России к концу 2009 г. Государство и государственные структуры оказались наиболее слабым звеном при переходе к информационному обществу. Высокий образовательный уровень населения, достаточно благоприятная экономическая ситуация позволили значительной части населения приобрести персональные компьютеры, мобильные телефоны, сканеры, принтеры и другое современное оборудование, подключиться к Интернету, освоить наиболее простые информационные технологии. Современный россиянин считает Интернет наиболее доступным и исчерпывающим источником информации, отказываясь от других ресурсов, например, библиотек. Обыденными стали электронная почта, SMS-сообщения, чаты, форумы и т.д. Для городского населения привычной стала интернет-торговля.
Минкомсвязи представил проект долгосрочной целевой программы "Информационное общество" на 2011-2020 гг. и предлагает выделить из федерального бюджета на информатизацию 88,03 млрд руб., из которых 9,3 млрд руб. предполагается потратить до 2013 г., а остальные 78,73 млрд освоить в 2014-2020 гг. Программа должна стартовать в 2011 г., она сменит ФЦП "Электронная Россия", действие которой закончилось в 2010 г. В программу входит шесть направлений: электронное правительство, повышение качества жизни граждан и улучшение условий ведения бизнеса, преодоление цифрового неравенства, безопасность в информационном обществе, развитие рынка информационно-коммуникационных технологий и сохранение культурного наследия.
Бизнес проявляет активность в тех направлениях информатизации, где он может самостоятельно окупить затраты и получить значительную прибыль (развитие мобильной связи, Интернета, платежных систем и т.д.). Практически вся офисная работа и бухгалтерия в фирмах и учреждениях переведена на компьютеры. Созданы и подключены к Интернету значительные русскоязычные информационные банки данных. Крупные промышленные предприятия, которые полностью перестроились на работу в новых экономических условиях, были вынуждены использовать современные информационные технологии, иначе им было бы невозможно выжить в условиях открытой экономики и жесткой конкуренции с зарубежными фирмами.
Отдельным направлением государственной политики России в 2001-2010 гг. стала информатизация в сфере образования. В 2001 г. была принята Федеральная целевая программа "Развитие единой образовательной информационной среды (2001-2005 гг.)". Целью программы было создание и развитие единой образовательной информационной среды, обеспечивающей:
Эта программа была более успешной. Основные затраты шли на закупку компьютерных классов для общеобразовательных учреждений, особенно сельских школ. В ее рамках была создана система образовательных порталов:
Необычная ситуация сложилась с выполнением работ по организации электронных библиотек учебных материалов и обеспечения доступа к ним. В рамках проекта была создана Центральная библиотека образовательных ресурсов (ФГУ ЦБОР) (свыше 12 тыс. книг), в которую помещалась практически вся выходящая в России учебная литература. Учебные заведения имели доступ к ресурсам по индивидуальному паролю. Однако в работах не были учтены вопросы соблюдения авторского права, библиотеку пришлось закрыть.
2010 г. стал еще одним ключевым рубежом в информатизации России. С учетом негативных результатов программы "Электронная Россия" было принято решение о ее замене программой "Информационное общество", ориентированной на утвержденную Правительством РФ в феврале 2008 г. стратегию развития информационного общества. В ней, в частности, говорится о создании инфраструктуры широкополосного доступа на всей территории Российской Федерации, внедрении в медучреждениях дистанционного обслуживания пациентов, интеграции государственных информационных систем и ресурсов, создании условий для коммерциализации и внедрения результатов научных исследований и развитии системы библиотечных фондов на основе применения ИКТ.
Особый интерес для прогнозирования работ, предстоящих в области информатизации, представляет Приложение к Стратегии развития информационного общества в Российской Федерации, в котором определены контрольные значения показателей развития информационного общества в Российской Федерации на период до 2015 года. В документе указывается, что "к 2015 году должны быть достигнуты следующие контрольные значения показателей:
Достижение этих показателей потребует очень больших затрат и усилий.
Первопроходцами в деле построения э-правительств были США и Канада. Первый этап строительства э-правительства США начался в 2002 г., когда во время представления годового бюджета в Конгресс страны президент Буш выделил перечень основных мероприятий по созданию электронного правительства, распределенных по четырем портфелям:
Особенно была отмечена необходимость широкого использования интернет-технологий.
Особая роль Канады объясняется тем, что она относится к числу стран с наибольшим количеством пользователей Интернета. Уже в 2004-2005 гг. 72% канадцев имели доступ во Всемирную паутину с домашних ПК. Именно этим обусловлены высокие показатели спроса на онлайновые общественно-государственные услуги.
Наиболее емкое определение функционального назначения электронного правительства было сформулировано Европейской комиссией. В 2003 г. она, отмечая значение электронного правительства для будущего Европы, определила его следующим образом: "Электронное правительство является средством повышения эффективного государственного обслуживания граждан и бизнеса. Оно упрощает проведение в жизнь государственной политики и помогает госсектору справляться с противоречивыми требованиями: с одной стороны - расширять объем услуг и повышать их качество, а с другой - экономить ресурсы. Это достигается за счет внедрения информационных и телекоммуникационных технологий в государственных органах, предваряемого проведением организационных изменений и приобретением новых навыков, направленных на улучшение общественных служб и демократических процессов".
Таким образом, основой любого э-правительства является перевод системы коммуникаций государственных структур на информационные технологии с использованием компьютерной техники и телекоммуникаций (Интернета). Функциональное наполнение конкретной реализации электронного правительства зависит от большого количества параметров: государственного устройства, общественно-политических отношений внутри государства, распределения обязанностей между государственными структурами, наконец, традиций.
Создание электронного правительства в России реализуется на трех уровнях:
Типовыми услугами, предоставляемыми государственными органами власти гражданам (G2C) и в значительной степени ориентированными на Россию, являются:
Услуги, предоставляемые органами власти бизнесу (G2B):
Создание электронного правительства РФ должно перевести эти услуги в Интернет, упростить взаимоотношения граждан и бизнеса. Основу взаимоотношений государственных органов между собой должен составить электронный (безбумажный) документооборот с активным использованием электронной подписи. На эту же технологию должны быть переведены и все внутренние бумажные потоки государственных организаций.
Реальное состояние с созданием э-правительства РФ можно охарактеризовать оценкой, данной в отчете, обнародованном в марте 2009 г. Всемирным экономическим форумом об ИТ-конкурентоспособности мировых стран. В отчете содержатся оценки индекса развитости ИКТ (The Networked Readiness Index, NRI) различных держав, который измеряет готовность стран к эффективному использованию ИКТ по трем параметрам: среда для развития И Т, готовность трех основных заинтересованных сторон (граждан, бизнеса и национальных правительств) к плодотворному использованию ИКТ и оценка уровня фактического использования ИКТ. В 2009 г. в исследовании участвовало 134 страны, среди которых Россия заняла 74-е место. По сравнению с рейтингом 2007-2008 гг. показатели страны ухудшились на две позиции. При этом из бывших союзных республик Россию обошли не только Украина, поднявшаяся с 70-го на 62-е место, но и Литва (35-е), Латвия (48-е), Азербайджан (60-е место) и Казахстан (73-е место) [18].
Если смотреть только на эту оценку, то ситуация кажется катастрофической. Однако создавшееся положение объясняется далеко не техническими причинами и нежеланием населения работать с новыми технологиями. Основные причины - это бюрократия, плохая организация управления, правовые проблемы и, наконец, коррупция, которая препятствует открытости общества.
Одной из наиболее важных технических причин, сдерживающих развитие электронного правительства, является идентификация участников электронных коммуникаций. Открытость Интернета, возможность изменения содержания электронного документа создают опасность искажения первоначального содержания сведений.
Электронная цифровая подпись - реквизит электронного документа, предназначенный для защиты данного электронного документа от подделки, полученный в результате криптографического преобразования информации с использованием закрытого ключа электронной цифровой подписи и позволяющий идентифицировать владельца сертификата ключа подписи, а также установить отсутствие искажения информации в электронном документе. В январе 2002 г. принят Закон РФ "О цифровой электронной подписи". Согласно этому закону электронная подпись должна выполнять следующие юридические функции:
Для разработки инфраструктуры, поддерживающей технологии электронной подписи, в 2004 г. Постановлением Правительства РФ на Федеральное агентство по информационным технологиям возложены функции уполномоченного федерального органа исполнительной власти в области электронной цифровой подписи (ЭЦП). Согласно этому распоряжению в РФ должна быть создана система региональных удостоверяющих центров. Удостоверяющий центр Росинформтехнологии должен обладать следующими параметрами:
Несмотря на подготовленную юридическую базу поручения Правительства, электронные ключи имеют лишь редкие государственные структуры. Бизнес и тем более рядовые граждане практически ничего не знают об этой возможности. Правда, следует отметить, что применять электронный ключ пока некуда.
Лекция 6
Сообщение как материальная форма представления информации
Одно из (специфических) свойств информации заключается в том, что она существует в виде различных материальных форм. Форма представления информации может меняться в процессе ее обработки или использования. Например, информация, передаваемая по телеграфу, сначала может быть представлена в виде текста на бумаге, затем телеграфист переносит ее на магнитный носитель, где она существует в виде различным образом намагниченных участков, далее она может быть преобразована в электрические импульсы в проводнике и т.д. Информация является общим абстрактным содержанием в различных формах представления.
Различные материальные формы представления информации называются сообщениями, содержащими данную информацию. Различные сообщения могут содержать одну и ту же информацию. В качестве примера на рис.6.1 показаны различные представления числа 4: в виде разноформатных начертаний арабской цифры 4, римской цифры, слова "четыре", записи числа 4 в двоичной системе счисления.
Рис. 6.1. Различные формы представления числа 4
Еще одним подобным примером является возможность записи чисел в различных системах счисления. Следует заметить, что информация может быть облечена не только в графическую форму. Произнесенное человеком слово "четыре" также является сообщением, представляющим число 4. Нетрудно привести множество других примеров такой "многоликости" информации.
Следует заметить, что практический интерес представляют только такие материальные формы представления информации, которые могут быть восприняты человеком и другими живыми существами. Предполагается, что человек воспринимает сообщения непосредственно своими органами чувств или с использованием специальных приборов или средств. Органы чувств человека можно рассматривать как естественные (созданные природой) регистрирующие и измерительные средства (датчики).
Формы сообщений (сигналы, изображения, знаки, языковые сообщения)
Можно выделить несколько основных форм сообщений (в порядке возрастания их сложности).
Сигналы представляют собой некоторые физические величины или свойства физической среды, изменяющиеся во времени. Чаще всего такими величинами являются: напряженность электрического поля, величина электрического тока, интенсивность светового потока, давление газа и т.п.
Сигналы воспринимаются органами чувств человека или других животных, а также специально предназначенными для регистрации сигналов техническими устройствами - датчиками. Принятые сигналы, как правило, преобразуются в другую форму. Например, микрофон преобразует звуковые колебания (периодические изменения давления атмосферы) в переменный электрический ток, а световые или звуковые сигналы преобразуются органами чувств высших животных в импульсы (т. е. тоже сигналы) электрохимической природы. На рис.6.2 показан график звуковых колебаний, возникающих при произнесении слова "четыре".
Рис. 6.2. График звуковых колебаний
Чаше всего информация в виде сигналов используется в системах управления техническими объектами для описания изменения состояния объектов с течением времени. Отклонение этих сигналов от требуемых по условиям эксплуатации значений приводит к выработке системой управления сигналов, представляющих управляющую информацию. Получение, обработка и анализ сигналов о состоянии управляемого объекта и внешней среды, а также генерация управляющих сигналов рассматриваются в теории управления.
Изображения можно рассматривать как многомерные и пространственные сигналы (фотографии, карты, графики и т.п.), в которых регистрируемые параметры физической среды зависят не от времени, а от пространственного положения. Для черно-белой фотографии таким параметром является степень почернения фотоматериала (фотопленки или фотобумаги).
Физические величины, изменения которых рассматриваются как сигналы или изображения, называются параметрами сигналов. Если параметры сигналов принимают конечное число значений, то такой сигнал называется дискретным.
Некоторые повторяющиеся образцы (фрагменты) сигналов (изменяющихся во времени или в пространстве) в процессе общественной практики человека обособляются, выделяются и трактуются как некоторые новые сущности, а не просто как произвольные фрагменты сигнала. Таким образом возникают фонемы (акустические сигналы) и графемы. Эти новые сущности являются элементами, на основе которых формируется речь и письмо. Число этих элементов конечно. Графемы и фонемы являются частными случаями более общего понятия - знака. Знаком можно считать любую сущность, отличную от других сущностей. Примерами знаков являются буквы различных естественных языков, всевозможные условные обозначения на картах, схемах и других документах, дорожные знаки и многое другое. Разнообразные примеры наборов знаков приведены в 27.
Последовательность знаков, сменяющих друг друга во времени, можно рассматривать как дискретный сигнал. Например, последовательность фонем представляет собой речевое сообщение. Аналогичным образом расположение графем может восприниматься как письменное сообщение. Таким образом, представление информации в виде знаков является основой речи, письменности, а также способов хранения, передачи и обработки информации.
Условно можно выделить научные дисциплины, которые преимущественно занимаются изучением рассмотренных трех форм представления информации. Это анализ и обработка сигналов, распознавание образов и информатика. Еще раз следует подчеркнуть, что это разделение достаточно условно. Некоторые вопросы рассматриваются в нескольких дисциплинах одновременно.
Учитывая вышеизложенное, можно сказать, что информатика занимается изучением сбора (получения), хранения, поиска, обработки и выдачи информации, представленной в знаковой форме. Знаки - это всего лишь одна из материальных форм информации. Но помимо формы представления информация может характеризоваться содержанием или смыслом, который приписывается человеком.
Следует отметить, что наряду с термином "информация" используется термин "данные" (иногда как синонимы). В [28]предлагается различать эти два термина и считать, что данные суть факты, идеи, сведения, которые представлены в знаковой (символьной) форме, позволяющей производить их передачу, обработку и интерпретацию (т.е. толкование, объяснение, раскрытие смысла), а информация - это смысл, который человек приписывает данным на основании известных ему правил представления в них фактов, идей, сообщений.
Полезно сделать еще одно замечание относительно терминов "знак" и "символ". Некоторые знаки приобретают определенное значение. К примеру, буквы свидетельствуют об алфавите, в который они входят, и о языке, который использует эти буквы. Но некоторые буквы (знаки) имеет для людей более глубокий смысл. Например, знак , помимо того, что он является буквой греческого алфавита, означает для людей, знакомых с математикой, отношение длины окружности к длине ее диаметра. Поэтому символом целесообразно называть знак, который имеет специальный смысл (значение), связанный с определенной областью человеческой деятельности. Примерами символов являются следующие знаки: ©, @, $, §, ∞.
Число исходных для представления информации знаков, как правило, невелико (несколько десятков), а потребность в знаках, представляющих информацию о реальном мире, существенно превышает это количество и постоянно возрастает с развитием человечества, усложнением производственных отношений. Неограниченный запас новых языковых сообщений может быть получен из конечного множества знаков путем их комбинирования или составления из них последовательностей первичных знаков. Именно такой принцип лежит в основе большинства естественных языков. Несмотря на особенности каждого естественного языка, они имеют много общего. Для изучения общих принципов постро-ения языков разработаны формальные (математические) модели, которые так и называются - формальные языки.
Основные понятия теории формальных языков
Формальные языки являются упрощенными моделями реально существующих естественных и искусственных языков. Как и реальные языки, формальный язык состоит из множества слов, составленных из букв. Прежде чем дать точное определение формального языка, рассмотрим некоторые вспомогательные понятия.
Алфавитом называется конечное непустое множество знаков. Обычно подразумевается, что это множество линейно упорядочено. Условимся обозначать алфавиты символом . Наиболее часто используются следующие алфавиты.
Следует отметить, что алфавит содержит 10 десятичных цифр т. е. .
Слово или цепочка - это конечная последовательность знаков некоторого алфавита. Например, 01101 - это цепочка в бинарном алфавите . Цепочки 15903 и 15df10 являются цепочками в алфавите и соответственно.
Пустая цепочка - это цепочка, не содержащая ни одного символа. Эту цепочку, обозначаемую е, можно рассматривать как цепочку в любом алфавите.
Часто бывает необходимо или удобно классифицировать слова по их длине, т.е. по числу позиций, которые занимают знаки в слове. Например, слово 01101 имеет длину 5. Обычно говорят, что длина цепочки - это число знаков в ней. Это определение широко распространено, но не вполне корректно. Так, в цепочке 01101 всего 2 символа, но число позиций в ней - пять, поэтому она имеет длину 5. Все же следует иметь в виду, что часто пишут "число знаков", подразумевая "число позиций".
Длину некоторой цепочки обычно обозначают . Например, , а .
Степени алфавита. Для множества всех цепочек определенной длины, состоящих из символов некоторого алфавита , удобно использовать, по аналогии с декартовыми степенями множеств, знак степени. Обозначим через множество всех слов длины , состоящих из знаков алфавита . Данное множество с точностью до обозначений его элементов совпадает с декартовым произведением . Различие заключается в том, что элементы декартового произведения обычно заключаются в скобки, а слова из записываются без скобок.
Рассмотрим примеры такой записи независимо от алфавита , т.е. - единственное слово длины 0. Для и так далее. Отметим, что между и есть небольшое различие. Дело в том, что есть алфавит, и его элементы 0 и 1 являются символами, а является множеством слов, и его элементы - это слова 1 и 0, каждое длиной 1. Мы не будем вводить разные обозначения для этих множеств, полагая, что из контекста будет понятно, является {0,1} или подобное ему множество алфавитом или же множеством цепочек.
Множество всех слов над алфавитом принято обозначать . Так, например . По-другому это множество можно записать в виде
Множество всех непустых слов в алфавите обозначают через . Таким образом, имеют место следующие равенства:
Конкатенация слов. Пусть и - слова. Тогда обозначает их конкатенацию (соединение), т.е. слово, в котором последовательно записаны слова и . Более строго, если - слово из символов: , а - слово из символов , то - это слово длины , .
Конкатенацию можно рассматривать как алгебраическую операцию на множестве всех слов в алфавите , которая любым словам и из сопоставляет слово из . Эта операция обладает некоторыми привычными свойствами алгебраических операций. Так, конкатенация является ассоциативной операцией, то есть для любых слов справедливо равенство . Скобки в этом выражении определяют порядок выполнения операций конкатенации. Доказательство ассоциативности следует непосредственно из определения операции конкатенации. Операция конкатенации не является перестановочной (коммутативной), что следует из следующего примера.
Пусть и . Тогда , а и, следовательно, .
Для пустого слова и любого слова справедливы равенства . Таким образом, является единицей (нейтральным элементом) относительно операции конкатенации, поскольку результат ее конкатенации с любым словом дает то же самое слово (аналогично тому, как 0, нейтральный элемент относительно сложения, при сложении с любым числом дает число ). Описанные выше свойства операции конкатенации означают, что множество всех слов является (свободным) моноидом относительно операции конкатенации [29].
Если , то называется началом, или префиксом, слова , а - окончанием, или постфиксом, слова .
Множество всех слов можно представить графически в виде помеченного корневого дерева (дерева с выделенной вершиной, называемой корнем). Вершинам дерева соответствуют слова в алфавите . Поэтому это дерево можно назвать словарным деревом, а поскольку все слова представлены в этом дереве, то его также можно назвать словарным универсумом. Это дерево имеет ярусное строение. На одном ярусе располагаются все слова одинаковой длины.
На рис.6.3 изображен фрагмент словарного универсума для случая, когда алфавит состоит из двух знаков, то есть .
Рис. 6.3. Фрагмент словарного дерева (универсума) для алфавита {0, 1)
Опишем процедуру построения словарного дерева. Построение начинается с вершины, которая является корнем дерева и которая соответствует пустому слову . Эта (единственная) вершина образует нулевой ярус (уровень) дерева. Первый ярус дерева состоит из вершин ( - число букв в алфавите ), которые соединены с корнем ребрами, помеченными буквами алфавита . Вершины первого уровня соответствуют всем однобуквенным словам, которые получаются конкатенацией букв, помечающих ребра, с пустым словом.
Дальнейшее построение дерева выполняется аналогичным образом. Если -й уровень дерева сформирован, то есть в дереве уже имеется вершин, соответствующих всем словам длины , к каждой вершине -го уровня присоединяется вершин -го уровня посредством ребер, помеченных буквами алфавита . Любой вершине -го уровня соответствует слово, которое получается конкатенацией некоторого -буквенного слова и буквы, помечающей ребро между этими словами.
Таким образом, из процедуры построения дерева следует, что ребром в дереве соединяются только те вершины, которым соответствуют слова, отличающиеся по длине на 1. При этом более длинное слово является конкатенацией более короткого слова и буквы, помечающей ребро. Ясно также, что любое слово , соответствующее вершине, которая лежит на пути из корня дерева к вершине, соответствующей слову , является пре-фиксом слова , то есть , .
Рассмотренные выше понятия и примеры позволяют сформулировать точное определение формального языка. Пусть - некоторый фиксированный алфавит. Множество слов, каждое из которых принадлежит , называют формальным языком. Иными словами, если - алфавит и , то - это язык над или в . Отметим, что язык в не обязательно должен содержать цепочки, в которые входят все символы . Поэтому если известно, что является языком в , то можно утверждать, что - это язык над любым алфавитом, содержащим .
Однако оправданием использования термина "язык" для множества может служить то, что и обычные языки можно рассматривать как множества цепочек (слов). Возьмем в качестве примера русский язык, где набор всех литературных русских слов есть множество цепочек в алфавите (русских же букв). Еще один пример - язык программирования или любой другой язык программирования, в котором правильно написанные программы представляют собой подмножество множества всех возможных цепочек, а цепочки состоят из символов алфавита данного языка. Этот алфавит является подмножеством символов ASCII. Алфавиты для разных языков программирования могут быть различными, хотя обычно они состоят из прописных и строчных букв, цифр, знаков пунктуации и математических символов.
Существует, однако, множество других языков. Приведем несколько примеров.
Язык, состоящий из всех цепочек, в которых единиц следуют за нулями для некоторого .
Множество цепочек, состоящих из 0 и 1 и содержащих поровну тех и других: .
Множество двоичных записей простых чисел: .
Множество всех правильных скобочных выражений, .
- язык для любого алфавита .
- пустой язык в любом алфавите.
\{\varepsilon\} - язык, содержащий одну лишь пустую цепочку. Он также является языком в любом алфавите. Заметим, что ; первый не содержит вообще никаких цепочек, а второй состоит из одной цепочки.
Единственное существенное ограничение для множеств, которые могут быть языками, состоит в том, что все алфавиты конечны.
Некоторые из приведенных выше языков содержат конечное число слов. В этом случае язык, в принципе, может быть задан перечислением входящих в него слов.
Однако некоторые языки и могут содержать бесконечное число цепочек, но эти цепочки должны быть составлены из символов некоторого фиксированного конечного алфавита. В общем случае язык - это бесконечное множество слов. В этом заключается сложность работы с языками, в частности, их задание или описание. Несмотря на то, что язык содержит бесконечное число слов, желательно, чтобы описание такого языка было конечным. Один из подходов заключается в том, что применяется процедура (называемая грамматикой) построения слов точно определенным способом с применением правил грамматики. Другой подход использует алгоритм, который для каждого слова однозначно определяет, принадлежит ли оно языку или нет.
Модели источников сообщений. Конечный вероятностный источник сообщений
Большинство информационных процессов связано не с отдельными сообщениями, а с последовательностями (потоками) сообщений. Например, при чтении человек анализирует последовательность букв, образующих слова и текст в целом; данные, поступающие от измерительных устройств или передающиеся по каналам связи, представляют собой последовательности сообщений. Для описания (моделирования) подобных ситуаций удобно ввести формальное понятие конечного (комбинаторного) источника сообщений.
Конечным (комбинаторным) источником называется произвольное множество . Элементы множества обычно называются сообщениями. Источник может породить любое из этих сообщений.
В некоторых случаях бывает известно, что в последовательностях сообщений одни сообщения встречаются чаще, чем другие. Например, в текстах на русском языке буквы "о", "е" встречаются более чем в 10 раз чаще букв "щ", "э", "ф" [30]. В других естественных языках наблюдается аналогичная ситуация. Использование дополнительной информации о частотах появления сообщений вероятностного источника может повысить эффективность обработки данных.
Формализацией понятия частоты появления того или иного события в математике является его вероятность. Вероятность события обозначают обычно символом . Вероятность некоторого события (сообщения) можно представлять себе как долю тех случаев, в которых оно появляется, от общего числа появившихся событий (сообщений).
Так, если заданы четыре сообщения с вероятностями , то это означает, что среди, например, 10000 переданных сообщений около 5000 раз появляется сообщение , около 3750 - сообщение и примерно по 625 раз - каждое из сообщений и .
Распределение вероятностей появления отдельных сообщений в последовательности является важной ее характеристикой и существенно влияет на дальнейшие процессы обработки сообщений. Для дальнейшего удобно ввести формальное понятие конечного вероятностного источника сообщений.
Вероятностным источником назовем произвольное множество (сообщений) с вероятностями (частотами) появления каждого из них. Удобно представлять вероятностный источник в виде таблицы.
Вероятностный источник сообщений
Сообщение |
||||
Вероятность появления сообщения |
С позиций теории вероятностей вероятностный источник представляет собой дискретное распределение.
Характерной особенностью вероятностного источника является отсутствие полной определенности в поступлении очередного сообщения источника. Степень неопределенности для различных источников может значительно отличаться. Например, если рассматривать в качестве источника номера лотерейных билетов, крайне трудно определить номер оче-редного выигрышного билета. Однако если сообщениями источника считать исходы розыгрыша крупного выигрыша (автомобиля или квартиры) для конкретного билета, то сообщение такого источника предсказать не трудно. Скорее всего, на данный лотерейный билет крупного выигрыша не будет.
Для практики желательно уметь оценивать степень неопределенности различных вероятностных источников. Рассмотрим источник с равновероятными сообщениями. Понятно, что степень неопределенности такого источника зависит от . При неопределенность отсутствует, т. к. может появиться только одно единственное сообщение. При больших неопределенность больше (трудно предсказать появление какого-то определенного сообщения из возможных). Из рассмотренного примера следует, что функция, описывающая неопределенность источника, должна принимать нулевое значение в случае отсутствия неопределенности (при ), а при увеличении она должна возрастать. Можно показать [31], что, наложив ряд простых и естественных требований на функцию, которая должна характеризовать неопределенность вероятностного источника, можно определить вид такой функции.
Неопределенность вероятностного источника с множеством сообщений , вероятности появления которых равны соответственно, принято описывать функцией (величиной)
( 6.1) |
Величина называется энтропией источника сообщений . К. Шеннон предложил использовать энтропию для описания источников информации [30].
Неопределенность источника можно трактовать как его информативность. Действительно, если неопределенность источника мала или даже равна 0, то очередное сообщение не несет новой информации, т. к. легко может быть предсказано заранее. И наоборот, очередное сообщение неопределенного источника плохо предсказуемо, скорей всего оно будет новым, отличным от любого ожидаемого сообщения.
Входящее в выражение (6.1) для энтропии выражение можно рассматривать как информативность (неопределенность) -го сообщения источника, поскольку оно вполне соответствует интуитивному представлению о неопределенности. Энтропию можно рассматривать как среднюю информативность всего источника .
От вероятностного источника зависит выбор оптимального в среднем способа кодирования сообщений.
Кодирование сообщений источника и текстов. Равномерное кодирование. Дерево кода
Чаще всего информация представляется в виде языковых сообщений (цепочек знаков или слов), причем в процессе ее обработки форма представления может меняться. Например, сообщение, предназначенное для передачи по телеграфу, первоначально может быть представлено в виде рукописного текста. Телеграфист переводит это сообщение в последовательность длинных, коротких импульсов и пауз, передающихся по телеграфному каналу. А на приемном конце такая последовательность может быть преобразована в печатный текст. Рассмотренные преобразования представляют собой пример кодирования сообщений. Еще одним примером кодирования является тайнопись, когда исходное сообщение преобразуется в другую форму, скрывающую содержание исходного сообщения.
Различные задачи кодирования можно формализовать следующим образом. Пусть и алфавиты, некоторое множество слов в алфавите . Тогда функция
называется кодированием или кодом. Кодом называется также образ отображения , обозначаемый . Если существует обратная функция , то она называется декодированием. Одно и то же множество сообщений можно закодировать многими различными способами. Поэтому среди многих вариантов кодирования ищут такой, который был бы оптимальным в некотором смысле или обладал определенными полезными свойствами. Наиболее естественным требованием является возможность декодирования.
Побуквенное (алфавитное) кодирование. Обычно, кодирование множества слов производится с помощью функции кодирующей отдельные буквы алфавита . Для этого случая определение кода будет следующим.
Кодом называется отображение
( 6.2) |
сопоставляющее каждому знаку из алфавита некоторое слово, которое составлено из знаков, входящих в . Слова, входящие в , называются кодовыми словами. Отображение (6.2) может задаваться любым из известных в математике способов. Для конечного множества чаще всего используется табличный способ, задающий код (6.2) таблицей.
Кодируемая буква алфавита А |
Кодовое слово |
Такая таблица называется кодовой таблицей. В качестве примера можно привести таблицу кодирования алфавита из цифр восьмеричной системы счисления словами из упоминавшегося ранее бинарного алфавита . В данном случае отображение (6.2) имеет вид .
Кодируемый знак |
Кодовое слово |
0 |
000 |
1 |
001 |
2 |
010 |
3 |
011 |
4 |
100 |
5 |
101 |
6 |
110 |
7 |
111 |
Еще одним примером является так называемый код ASCII, фрагмент которого показан в следующей таблице.
Знак |
Кодовое слово (в десятичной системе счисления) |
Кодовое слово (в шестнадцатеричной системе счисления) |
… |
… |
|
a |
97 |
61 |
b |
98 |
62 |
c |
99 |
63 |
d |
100 |
64 |
e |
101 |
65 |
f |
102 |
66 |
g |
103 |
67 |
h |
104 |
68 |
i |
105 |
69 |
j |
106 |
6A |
… |
… |
Кодирование слов. Отображение (6.2) позволяет перейти от кодирования отдельных знаков (букв конечного алфавита) к кодированию слов. Если - слово, состоящее из знаков (полученное конкатенацией знаков) , то кодом слова (по определению) является конкатенация кодов знаков , образующих слово, т. е. . Например, с применением таблицы ASCII кода (см. последнюю таблицу) слово head будет закодировано последовательностью 10410197100 при использовании десятичной системы счисления или последовательностью 68656164 - в шестнадцатеричной.
Условие (необходимое) однозначной декодируемости заключается в инъективности отображения (6.2). Инъективность обеспечивает однозначную декодируемость отдельных знаков из алфавита . Однако однозначной декодируемости слов из это условие не обеспечивает, если коды отдельных знаков, входящих в слово, следуют один за другим и не разделяются специальным символом. Подробнее проблема однозначной декодируемости будет рассмотрена позже.
В частном случае, когда знаки из кодируются однобуквенными словами, отображение (6.2) имеет вид и представляет собой простую замену (подстановку) знаков. Однако чаще всего, в основном из-за использования в большинстве технических устройств обработки информации двоичного алфавита , каждый знак из кодируется последовательностью знаков (словом) из B.
Недостаточность количества знаков в алфавите является препятствием применения простой замены для кодирования (не обеспечивается инъективность и, следовательно, однозначность декодируемости при ). Для устранения этой проблемы используются множества новых, "составных" объектов из степеней алфавита . Множество состоит из упорядоченных последовательностей элементов из (векторов) длины . Число элементов множества равно . Например, для двоичного алфавита имеем . Таким образом, взяв достаточно большую степень , можно получить нужное количество элементов вторичного алфавита.
Если каждый знак алфавита отображается при кодировании в слово одинаковой длины , то говорят, что код является кодом постоянной длины. Такие коды широко распространены, поскольку для обработки сообщений используются вычислительные машины, коммуникацион-ные устройства и другое оборудование, имеющее регистры фиксированного размера.
Процедуру кодирования слова в алфавите можно представить следующим образом. Имеется кодовая таблица, в левом столбце которой находятся кодируемые буквы алфавита , а в правом столбце - соответствующие кодовые слова (кодовые слова могут иметь различную длину).
Рис. 6.4. Процедура кодировании слов с использованием кодовой таблицы
Для каждого знака слова , начиная с первого знака, в кодовой таблице находится строка, в которой в левом поле располагается кодируемый знак (буква), и из правого поля этой строки берется соответствующее кодовое слово в алфавите . Найденное кодовое слово приписывается слева (конкатенируется) к уже сформированной части кода слова . Кодовое слово первой буквы слова приписывается к пустому слову е. Эта процедура схематически показана на рис.6.4.
В приведенных выше примерах кодирования все кодовые слова имели одинаковую длину. Однако это не является обязательным требованием. Более того, если вероятности появления сообщений заметно отличаются друг от друга, то сообщения с большой вероятностью появления лучше кодировать короткими словами, а более длинными словами кодировать редкие сообщений. В результате кодовый текст при определенных условиях станет в среднем короче.
Показателем экономичности или эффективности неравномерного кода является не длина отдельных кодовых слов, а "средняя" их длина, определяемая равенством:
где - кодовое слово, которым закодировано сообщение , а - его длина, - вероятность сообщения ,- общее число сообщений источника . Для краткости записи формул далее могут использоваться обозначения и . Заметим, что обозначение средней длины кодирования через подчеркивает тот факт, что эта величина зависит как от источника сообщений , так и от способа кодирования .
Наиболее экономным является код с наименьшей средней длиной . Сравним на примерах экономичность различных способов кодирования одного и того же источника.
Пусть источник содержит 4 сообщения с вероятностями . Эти сообщения можно закодировать кодовыми словами постоянной длины, состоящими из двух знаков, в алфавите в соответствии с кодовой таблицей.
00 |
|
01 |
|
A_3 |
10 |
A_4 |
11 |
Очевидно, что для представления (передачи) любой последовательности в среднем потребуется 2 знака на одно сообщение. Сравним эффективность такого кодирования с описанным выше кодированием словами переменной длины. Кодовая таблица для данного случая может иметь следующий вид.
0 |
|
1 |
|
10 |
|
11 |
В этой таблице, в отличие от предыдущей, наиболее частые сообщения и кодируются одним двоичным знаком. Для последнего варианта кодирования имеем
в то время как для равномерного кода средняя длина (она совпадает с общей длиной кодовых слов). Из рассмотренного примера видно, что кодирование сообщений словами различной длины может дать суще-ственное (почти в два раза) увеличение экономичности кодирования.
При использовании неравномерных кодов появляется проблема, которую поясним на примере последней кодовой таблицы. Пусть при помощи этой таблицы кодируется последовательность сообщений , в результате чего она преобразуется в следующий двоичный текст: 010110. Первый знак исходного сообщения декодируется однозначно - это . Однако дальше начинается неопределенность: или . Это лишь некоторые из возможных вариантов декодирования исходной последовательности знаков.
Необходимо отметить, что неоднозначность декодирования слова появилась несмотря на то, что условие однозначности декодирования знаков (инъективность кодового отображения) выполняется.
Существо проблемы - в невозможности однозначного выделения кодовых слов. Для ее решения следовало бы отделить одно кодовое слово от другого. Разумеется, это можно сделать, но лишь используя либо паузу между словами, либо специальный разделительный знак, для которого необходимо особое кодовое обозначение. И тот, и другой путь, во-первых, противоречат описанному выше способу кодирования слов путем конкатенации кодов знаков , образующих слово, и, во-вторых, приведет к значительному удлинению кодового текста, сводя на нет преимущества использования кодов переменной длины.
Решение данной проблемы заключается в том, чтобы иметь возможность в любом кодовом тексте выделять отдельные кодовые слова без использования специальных разделительных знаков. Иначе говоря, необходимо, чтобы код удовлетворял следующему требованию: всякая последовательность кодовых знаков может быть единственным образом разбита на кодовые слова. Коды, для которых последнее требование выполнено, называются однозначно декодируемыми (иногда их называют кодами без запятой).
Рассмотрим код (схему алфавитного кодирования) , заданный кодовой таблицей
и различные слова, составленные из элементарных кодов.
Определение. Код называется однозначно декодируемым, если
и
то есть любое слово, составленное из элементарных кодов, единственным образом разлагается на элементарные коды.
Если таблица кодов содержит одинаковые кодовые слова, то есть если
то код заведомо не является однозначно декодируемым (схема не является разделимой). Такие коды далее не рассматриваются.
Наиболее простыми и часто используемыми кодами без специального разделителя кодовых слов являются так называемые префиксные коды [29].
Определение. Код, обладающий тем свойством, что никакое кодовое слово не является началом (префиксом) другого кодового слова, называется префиксным.
Теорема 1. Префиксный код является однозначно декодируемым.
Доказательство. Предположим противное. Тогда существует слово которое можно представить двумя разными способами , причем до номера все подслова в обоих представлениях (разложениях) совпадают, а слова и различны. Отбросив одинаковые префиксы двух равных слов (представлений), получим совпадающие окончания , начинающиеся с различных слов. Из-за равенства окончаний первые буквы слов и должны совпадать. По аналогичной причине должны совпадать и вторые буквы этих слов и т.д. Это означает, что неравенство слов и может заключаться только в том, что они имеют разную длину и, следовательно, одно из них является префиксом другого. Это противоречит префиксности кода.
Множество кодовых слов можно графически изобразить как поддерево словарного дерева (рис.6.5). Для этого из всего словарного дерева следует показать только вершины, соответствующие кодовым словам, и пути, ведущие от этих вершин к корню дерева. Такое поддерево называют деревом кода или кодовым деревом.
На рис.6.5 а) - дерево, соответствующие коду, у которого все слова имеют одинаковую длину. Кружками помечены те вершины, которые соответствуют кодовым словам. В данном случае это 4 двухбуквенных слова, составляющих второй уровень словарного дерева (универсума). Нетрудно понять, как отражается свойство префиксности или его отсутствие на кодовом дереве. Рассмотрим код, состоящий из слов (0, 10, 111). Это не полный префиксный код, так как к коду можно добавить слово 110, которое получается из слова 11 приписыванием справа 0. Эта операция показана на рис.6.5 б) пунктирным ребром. На рис.6.5 в) показано дерево полного префиксного кода. В данном случае вершины, соответствующие словам префиксного кода, как бы "разрезают" словарный универсум на две части - "верхнюю" и "нижнюю". Если попытаться добавить слово "выше" кодовых слов, то одно из кодовых слов станет префиксом добавляемого слова. Если добавлять слово "ниже" слов префиксного кода, то добавляемое слово окажется префиксом одного из кодовых слов. В обоих случаях нарушается свойство префиксности. На рис.6.5 г) представлено дерево для рассмотренного ранее кода, не обладающего свойством префиксности. Таким образом, если свойство префикса не выполняется, то некоторые промежуточные вершины дерева могут соответствовать кодовым словам.
Рис. 6.5. Деревья различных кодов
Замечание. Свойство префиксности является достаточным, но не является необходимым для однозначной декодируемости.
Пример. Код, состоящий из двоичных кодовых слов 1, 10, - не префиксный, но может быть однозначно декодирован. Появление символа 1 означает начало нового кодового слова. Последнее остается справедливым для кода, каждое слово которого есть единица с последующими нулями. Разумеется, подобные коды далеко не самые экономные.
Если код префиксный, то, читая кодовую запись подряд от начала, мы всегда сможем разобраться, где кончается одно кодовое слово и начинается следующее. Если, например, в кодовой записи встретилось кодовое обозначение 110, то разночтений быть не может, так как в силу префиксности наш код не содержит кодовых обозначений 1, 11 или, скажем, 1101. Именно так обстояло дело для рассмотренного выше кода, который очевидно является префиксным.
Для применения кода на практике желательно, чтобы кодовые слова были как можно короче. Однако чем слова короче, тем их запас меньше. В этом легко убедиться, посмотрев на изображение словарного универсума на рис.6.3. Если попытаться построить префиксный код с очень короткими длинами кодовых слов, то можно потерпеть неудачу - кода с такими длинами слов может не быть. Например, нетрудно убедиться, что не существует префиксного кода с длинами слов 1, 1, 2. При необходимости построить префиксный код с большим числом кодовых слов заданной длины проверка существования такого кода может быть достаточно сложной. К счастью, найдены необходимые и достаточные условия на длины кодовых слов для существования префиксного и любого однозначно декодируемого кода. Эти условия известны как теорема Крафта - Макмиллана. Необходимые и достаточные условия сформулируем в виде двух теорем.
Теорема (необходимые условия). Пусть - префиксный двоичный код с длинами кодовых слов . Тогда выполняется неравенство Крафта
( 6.3) |
Доказательство. Рассмотрим, сколько слов длины может быть в префиксном коде. Максимальное число таких слов равно . В этом случае все кодовых слова имеют длину .
Для каждого кодового слова длины имеется слов длины , для которых данное слово является префиксом и по этой причине не является кодовым. Это следует из структуры словарного дерева (см. рис. 6.3). Множества и слов длины , для которых кодовые слова и являются префиксами, не пересекаются, так как в противном случае более короткое из этих слов было бы префиксом более длинного. Значит, если в префиксном коде имеется слов длины слов длины слов длины 1, то число слов длины удовлетворяет неравенству
( 6.4) |
Это неравенство верно для любого , в том числе и для , равного максимальной длине кодовых слов. После деления на обеих частей неравенства (6.4) его можно преобразовать к виду
( 6.5) |
Слагаемое вида , представляющее в неравенстве (6.5) кодовых слов длины , можно записать в виде суммы
С учетом такого представления неравенство (6.5) можно переписать следующим образом:
где - общее число слов префиксного кода. Теорема доказана.
Выполнение неравенства Крафта доказано для префиксного кода. Однако в 1956 году Макмиллан доказал более общую теорему, согласно которой неравенство Крафта выполняется и для любого однозначно декодируемого кода. Доказательство теоремы изложено в [29], [31].
Можно также доказать, что если префиксный код полный, то в нестрогом неравенстве (6.3) будет выполняться равенство.
Теорема (достаточные условия). Если положительные целые числа удовлетворяют неравенству Крафта
то существует префиксный код с длинами кодовых слов
Доказательство. Если среди чисел имеется ровно чисел, равных , то неравенство Крафта можно записать в виде
где - максимальное из данных чисел. Из справедливости этого неравенства следует, что верны неравенства (6.5) для всех , а следовательно, и неравенство (6.4).
Для построения нужного префиксного кода должна быть возможность подходящим образом выбрать слов длины 1, слов длины 2, вообще слов длины или, иными словами, вершин кодового дерева на первом, - на втором, - на -м ярусе.
Из неравенства (6.4) при получаем , т. е. требуемое число не превосходит общего числа вершин первого яруса. Значит, на этом ярусе можно выбрать какие-то вершин в качестве концевых ( равно 0, 1 или 2). Если это сделано, то из общего числа вершин второго яруса (их ) для построения кода можно использовать лишь . Однако и этого числа вершин хватит, так как из неравенства (6.4) при вытекает
Аналогично, при имеем неравенство:
Правая часть его вновь совпадает с допустимым для построения префиксного кода числом вершин третьего яруса, если на первых двух ярусах уже выбраны и кодовых вершин. Значит, снова можно выбрать кодовых вершин на третьем ярусе. Продолжая этот процесс вплоть до , мы и получим требуемый код. Теорема доказана.
Докажем, что если для длин кодовых слов выполняется равен - равенство ,то код является полным. Предположим противное, то есть, что код не полный. Тогда к нему можно добавить, по крайней мере, одно кодовое слово (длины ) и получить новый префиксный код, для которого, с одной стороны, , а с другой стороны, в силу теоремы Крафта, Полученное противоречие доказывает утверждение.
Теоремы Крафта доказаны для случая, когда рассматриваются коды в алфавите . Если кодовый алфавит содержит символов, то аналогичным образом можно доказать, что необходимым и достаточным условием для существования префиксного кода с длинами слов является выполнение неравенства
Оказывается, этому неравенству обязаны удовлетворять и длины кодовых слов произвольного однозначно декодируемого кода. Поэтому, если существует однозначно декодируемый код с длинами слов , то существует и префиксный код с теми же длинами слов.
Один из методов алфавитного кодирования был предложен Фано. Схема кодирования по методу Фано заключается в следующем. Предположим, что кодируемые сообщения источника (знаки исходного алфавита) располагаются в последовательности так, что соответствующие им вероятности не возрастают, т. е. . Рассмотрим разбиения последовательности A 1, A2, …, AN на две подпоследовательности и Каждое такое разбиение определяется числом , которое определяет, сколько элементов исходной последовательности входит в первую и вторую части разбиения. Среди разбиения выберем такое, чтобы модуль разности был минимальным. Всем сообщениям из первой части разбиения в качестве первого знака кодового слова приписываем 0, а сообщениям из второй части 1. По тому же принципу каждая из полученных подпоследовательностей снова разбивается на две части, и это раз-биение определяет значение второго символа кодового слова. Процедура продолжается до тех пор, пока все множество не будет разбито на отдельные сообщения. В результате каждому из сообщений будет сопоставлено кодовое слово из нулей и единиц.
Описанную процедуру построения кода Фано на примере из пяти сообщений иллюстрирует следующая таблица.
Таблица 6.1. |
|||||
Сообщения |
Вероятности сообщений |
Знаки кодовых слов |
Кодовое слово |
||
1-й знак |
2-й знак |
3-й знак |
|||
0.4 |
0 |
0 |
00 |
||
0.15 |
1 |
01 |
|||
0.15 |
1 |
0 |
10 |
||
0.15 |
1 |
0 |
110 |
||
0.15 |
1 |
111 |
Понятно, что чем более вероятно сообщение, тем быстрее оно образует "самостоятельную" группу и тем более коротким словом оно будет закодировано. Это обстоятельство и обеспечивает высокую экономность кода Фано. Код, построенный для данного источника методом Фано, имеет среднюю длину кодового слова равную 2,3.
Код, построенный методом Фано, всегда является префиксным. Действительно, на первом шаге построения кода методом Фано множество сообщений источника разбивается на два подмножества. Все кодовые слова, соответствующие первому подмножеству, имеют однобуквенный префикс, состоящий из 0, а все слова, соответствующие второму подмножеству, имеют однобуквенный префикс, состоящий из 1 (или наоборот). Поэтому ни одно слово, соответствующее какому-нибудь из сообщений из первого подмножества, не может быть префиксом ни для какого слова, соответствующего сообщению из второго подмножества. Аналогичная процедура разбиения применяется к каждому подмножеству сообщений с одинаковыми префиксами при добавлении нового знака к формируемым кодовым словам. При этом число подмножеств, на которые разбивается исходное множество сообщений источника (блоков разбиения), увеличивается. Важным свойством разбиений является то, что для кодовых слов, соответствующих сообщениям из разных блоков разбиения, имеются различные префиксы. Построение кода завершается разбиением множества сообщений на блоки, содержащие по одному сообщению. Из-за отмеченного свойства разбиений ни одно кодовое слово не является префиксом другого кодового слова, то есть построенный методом Фано код является префиксным.
Описанный метод кодирования можно применять и в случае произвольного алфавита из символов, с той лишь разницей, что на каждом шаге следует производить разбиение на равновероятных групп.
Рассмотренные ранее примеры показывают, что использование кодов переменной длины позволяет эффективнее кодировать сообщения по сравнению с равномерным кодированием. Для получения оценки минимально достижимой средней длины кодового слова рассмотрим избыточность кодирования , представляющую собой разность между средней длиной кодового слова при кодировании источника S кодом c и энтропией. Две следующие теоремы показывают, какова нижняя граница средней длины кодирования и как близко можно приблизиться к этой границе за счет рационального выбора кодовых слов.
Для доказательства первой теоремы напомним одно свойство логарифма, которое заключается в том, что график функции лежит ниже касательной к ней в точке , и следовательно, выполняется неравенство . Это свойство иллюстрирует рис.6.6.
Теорема. Для произвольного источника и префиксного кода избыточность кодирования неотрицательна, т. е. .
Рис. 6.6. График функции log2(x) и касательной к ней в точке x=1
Доказательство.
С учетом отмеченного выше неравенства для функции каждое слагаемое можно оценить сверху следующим образом:
После суммирования получим
причем последнее неравенство следует из неравенства Крафта (6.3) для префиксного кода и равенства . Таким образом, , что доказывает утверждение теоремы.
Из доказанной теоремы следует, что энтропия источника является нижней границей средней длины кодирования. Для источников, у которых вероятности являются целыми отрицательными степенями 2, эта граница достижима. Легко проверить, что для источника с распределением вероятностей средняя длина кодирования равна 1,75 и совпадает с энтропией источника.
Для доказательства второй теоремы потребуется функция , которая называется "потолок" и определяется выражением . Необходимые для доказательства свойства этой функции легко следуют из ее графика, показанного на рис.6.7, и заключаются в выполнении неравенств .
Рис. 6.7. График функции [x]
Теорема. Для каждого источника найдется префиксный код , избыточность которого не превышает единицы, т. е. .
Пусть , где функция "потолок". Тогда
Это означает, что числа удовлетворяют неравенству Крафта. Тогда из теоремы Крафта следует, что найдется префиксное кодирование , такое что . Оценим избыточность этого кодирования
Теорема доказана.
Данная теорема гарантирует, что для любого источника найдется префиксный код со средней длиной кодирования, превышающей энтропию не более чем на 1.
Для практических целей представляет интерес нахождение для каждого источника префиксного кода с минимальной средней длиной кодирования.
Определение. Префиксное кодирование называется оптимальным для источника , если для каждого префиксного кодирования c источника справедливо неравенство .
Для каждого источника существует оптимальный код, поскольку множество префиксных кодов источника с избыточностью, меньшей либо равной 1, не пусто и конечно. Один источник может иметь несколько оптимальных кодов с разными наборами длин кодовых слов.
Пусть буквы алфавита источника имеют вероятности появления , длины кодовых слов при использовании кода равны . Рассмотрим некоторые свойства оптимального кодирования, для того чтобы, опираясь на эти свойства, сформулировать процедуру нахождения оптимального кода.
Свойство 1. Для оптимального кода из следует, что .
Для доказательства предположим противное, т. е. что для оптимального кода существуют и , такие что и . Построим новый код, поменяв местами кодовые слова рассматриваемого оптимального кода для -ой и -ой букв алфавита. Разность между средней длиной кодирования оптимальным кодом и средний длиной построенного кода имеет вид
что противоречит оптимальности рассматриваемого кода.
Свойство 2. Существует оптимальный код источника , для которого
причем два последних слова имеют максимальную длину и отличаются только в последнем знаке.
Предположим, что в оптимальном коде не существует двух слов максимальной длины. Это значит, существует только одно слово максимальной длины. Если это самое длинное слово сократить на один последний знак, а другие кодовые слова оставить неизменными, то получится новый код, который, во-первых, будет префиксным (нет второго слова, которое отличается в последнем знаке), и, во-вторых, средняя длина кодирования будет меньше. Это противоречит предположению о существовании в оптимальном коде только одного слова максимальной длины. Таким образом, в оптимальном коде существует, по крайней мере, два кодовых слова максимальной длины.
Докажем, что какие-то два слова максимальной длины отличаются только в последнем знаке. Опять предположим противное, то есть любые два слова максимальной длины отличаются не только в последнем знаке. В этой ситуации можно повторить описанную выше процедуру укорачивания одного из слов максимальной длины и получить в результате новый префиксный код с меньшей средней длиной кодирования, что противоречит оптимальности исходного кода.
Опираясь на рассмотренные свойства, можно построить оптимальный для заданного источника код с использованием двух процедур: сжатия источника и расщепления кода. Смысл первой процедуры заключается в том, что исходный источник последовательно заменяется на более простой (содержащий на 1 меньше знаков) источник. Применение процедуры сжатия заканчивается, когда будет получен простейший источник с двумя знаками, оптимальное кодирование которого очевидно. Процедура расщепления кода предназначена для построения из оптимального кода более простого источника оптимального кода того источника, из которого процедурой сжатия был получен простой источник.
Процедура сжатия источника заключается в переходе от источника с алфавитом из n знаков упорядоченных в порядке невозрастания соответствующих им вероятностей , к источнику с алфавитом из знака и вероятностями при и .
Операцию сжатия источника будем обозначать через Фактически, при сжатии первые знака остаются неизменными, а два последних, наименее вероятных знака заменяются на некоторый новый знак с вероятностью, равной сумме вероятностей двух заменяемых знаков.
Применяя сжатие к источнику , получим новый источник , применяя затем процедуру сжатия к получим . Действуя подобным образом раза, построим последовательность источников , .
Алфавит источника состоит только из двух знаков, поэтому найти оптимальный код для этого источника не составляет труда. Одно из слов кодируется знаком 0, а другое - знаком 1. Это особенно важно потому, что, используя оптимальный код для источника и последовательность кодов , можно найти оптимальный код для исходного источника .
Для построения оптимального кода источника , содержащего на один знак больше, чем источник , необходимо выполнить процедуру расщепления кода.
Пусть имеем источник
И оптимальный код
Через обозначен тот знак алфавита источника , который заменил два знака с минимальными вероятностями источника при его сжатии.
Процедура расщепления заключается в использовании оптимального кода источника для построения оптимального кода для источника . Она заключается в следующем: знакам алфавита источника , перешедшим в без изменения, назначаются кодовые слова совпадающих с ними знаков источника ; двум наименее вероятным знакам алфавита источника , замененным в процессе сжатия на знак , сопоставляют кодовые слова и .
Слово в оптимальном коде источника , содержащем знаков, "расщепляется", путем добавления (конкатенации) знаков 0 и 1, на 2 слова в кодовом множестве для источника , содержащем знаков.
Средняя длина кода источника и средняя длина кода, полученного из него расщеплением, связаны соотношением . Действительно,
Докажем, что получающийся в результате расщепления код является оптимальным для источника .
Предположим противное, т. е. что существует другой оптимальный код для того же источника со средней длиной кодирования , меньшей, чем , т. е. . В соответствии со свойством 2 оптимальный код содержит два слова максимальной длины, отличающиеся в последнем знаке и соответствующие двум наименьшим вероятностям источника . Обозначим эти два слова через и . Из этого кода для источника можно построить код для источника , в котором последнее кодовое слово получается отбрасыванием последнего знаки из слов и . Средняя длина кода связана со средней длиной кода соотношением . Из этого соотношения, из соотношения и из предположения, что , следует, что . Это противоречит оптимальности кода для источника .
Таким образом, используя процедуру расщепления, строится оптимальный код для источника, который ранее был преобразован процедурой сжатия в более простой источник. Повторяя эту процедуру необходимое количество раз, можно будет найти оптимальный код для исходного источника .
Описанный метод оптимального кодирования был предложен в 1952 г. Д. Хафменом и называется его именем. В общем случае, когда для кодирования используется алфавит из более чем двух букв, метод Хафмена рассмотрен в [32].
Рассмотрим процесс построения оптимального кода на примере источника из пяти сообщений с вероятностями . Построение кода показано на следующем рисунке.
Стрелками показаны шаги сжатия источника. В левой части каждого столбца показано распределение вероятностей источника. В правой части каждого столбца, соответствующего одному из источников, показаны кодовые слова. Построение кода начинается с простейшего источника , который кодируется двумя однобуквенными словами 0 и 1.
В данном случае средняя длина кодирования для оптимального кода, построенного методом Хафмена, составляет 2,2. Это меньше, чем средняя длина кода, построенного ранее методом Фано для того же источника.
Внимание! Если Вы увидите ошибку на нашем сайте, выделите её и нажмите Ctrl+Enter.
Лекция 7
Обработка информации в вычислительных системах невозможна без передачи сообщений между отдельными элементами (оперативной памятью и процессором, процессором и внешними устройствами). Примеры процессов передачи данных приведены в следующей таблице.
Передатчик |
Канал |
Приемник |
|
Разговор людей |
Голосовой аппарат человека |
Воздушная среда. Акустические колебания |
Слуховой аппарат человека |
Телефонный разговор |
Микрофон |
Проводник. Переменный электрический ток |
Динамик |
Передача данных в сети Интернет |
Модулятор |
Проводник. Оптоволоконный кабель. Переменный электрический ток. Оптический сигнал |
Демодулятор |
Радиотелефон, рация |
Радиопередатчик |
Эфир. Электромагнитные волны |
Радиоприемник |
В перечисленных выше процессах передачи можно усмотреть определенное сходство. Общая схема передачи информации [31], [33], [32] показана на рис.7.1.
В канале сигнал подвергается различным воздействиям, которые мешают процессу передачи. Воздействия могут быть непреднамеренными (вызванными естественными причинами) или специально организованными (созданными) с какой-то целью некоторым противником. Непреднамеренными воздействиями на процесс передачи (помехами) могут являться уличный шум, электрические разряды (в т. ч. молнии), магнитные возмущения (магнитные бури), туманы, взвеси (для оптических линий связи) и т.п.
Рис. 7.1. Общая схема передачи информации
Для изучения механизма воздействия помех на процесс передачи данных и способов защиты от них необходима некоторая модель. Процесс возникновения ошибок описывает модель под названием двоичный симметричный канал (ДСК) [32], [33], схема которой показана на рис.7.2.
Рис. 7.2. Схема двоичного симметричного канала
При передаче сообщения по ДСК в каждом бите сообщения с вероятностью может произойти ошибка, независимо от наличия ошибок в других битах. Ошибка заключается в замене знака 0 на 1 или 1 на 0.
Некоторые типы ошибок:
Чаще других встречается замена знака. Этот тип ошибок исследован наиболее полно.
Если при кодировании сообщений используются оптимальные коды, то при появлении всего лишь одной ошибки все сообщение или его значительная часть может быть искажена. Рассмотрим пример. Пусть кодирование элементарных сообщений источника осуществляется с использованием кодовой таблицы
Сообщения |
Кодовое слово |
00 |
|
01 |
|
10 |
|
110 |
|
111 |
Тогда закодированное сообщение имеет вид 011011100110. Если в первом знаке произойдет ошибка, то будет принято сообщение 111011100110, которое декодируется в слово . Полное искажение сообщения из-за одной ошибки происходит вследствие того, что одно кодовое слово переходит в другое кодовое слово в результате замены одного или нескольких знаков. Пример показывает, что оптимальное кодирование плохо защищает сообщения от воздействия ошибок.
На практике необходим компромисс между экономностью кода и защитой от ошибок.
Сначала удаляется "бесполезная" избыточность (в основном статистическая), а затем добавляется "полезная" избыточность, которая помогает обнаруживать и исправлять ошибки.
Рассмотрим некоторые методы повышения надежности передачи данных. Широко известными методами борьбы с помехами являются следующие [34]:
Рассмотрим подробней каждый из этих способов.
Общим во всех этих способах повышения надежности является введение избыточности, то есть увеличение тем или иным способом объема передаваемого сообщения для возможности его правильной расшифровки при наличии искажений.
Следует отметить, что введение избыточности уменьшает скорость передачи информации, так как только часть передаваемого сообщения представляет интерес для получателя, а избыточная его доля введена для предохранения от шума и не несет в себе полезной информации.
Естественно выбирать такие формы введения избыточности, которые позволяют при минимальном увеличении объема сообщения обеспечивать максимальную помехоустойчивость.
Способы введения избыточности, позволяющие обнаруживать и исправлять ошибки, можно разделить на два класса, один из которых соответствует блоковым кодам, а другой - сверточным кодам [33]. Обе схемы кодирования применяются на практике. При блоковом кодировании последовательность, составленная из полученных в результате коди-рования источника кодовых слов, разбивается на блоки одинаковой длины. Каждый блок перед отправкой в канал обрабатывается независимо от других. Выход устройства, выполняющего сверточное кодирование, напротив, зависит не только от обрабатываемых в данный момент знаков, но и от предыдущих знаков. Остановимся более подробно на блоковом кодировании.
Как было показано ранее, ошибка в одном лишь разряде может испортить все сообщение. Чтобы избежать таких тяжелых последствий, сообщения, закодированные каким-либо экономным кодом, перед направлением в канал делятся на блоки одинаковой длины и каждый блок передается отдельно. При этом методы, позволяющие обнаруживать и исправлять ошибки, применяются к каждому блоку. Такой прием напоминает разделение большого судна на несколько изолированных друг от друга отсеков, что позволяет при пробоине в одном отсеке сохранить судно и груз в других отсеках.
Рассмотрим схему передачи данных, показанную на рис.7.3.
С кодирующего устройства в канал поступают закодированные блоки (кодовые слова) одинаковой длины . В канале в результате действия различных помех в некоторых битах передаваемого сообщения могут происходить ошибки. Процедуру кодирования при передаче и
Рис. 7.3. Схема передачи данных
декодирования при приеме с использованием одной и той же кодовой таблицы иллюстрируем рис.7.4. Предполагается, что появление ошибок описывается моделью дискретного симметричного канала
Рис. 7.4. Использование кодовой таблицы для кодирования и декодирования
В геометрической интерпретации эти блоки можно рассматривать как точки n-мерного пространства , где . Точки этого пространства представляют собой последовательности чисел 0 и 1 длины . Пространства для можно представить в виде угловых точек единичного интервала (), вершин квадрата со стороной, равной 1 (), и вершин куба с ребрами длины 1 (). Эти пространства условно изображены на рис.7.5.
Код, используемый для обнаружения и исправления ошибок, представляет собой некоторое подмножество пространства . В качестве примера можно привести код . Кодовые слова этого кода как точки пространства изображены на рис. 7.6 белыми кружками. Если представить куб расположенным в трехмерном пространстве, то словам данного кода соответствуют вершины тетраэдра. Более полезным
Рис. 7.5. Геометрическое представление пространства Bn для n = 1, 2 и 3
с практической точки зрения является то, что каждое слово кода содержит четное число единиц. Если при передаче кодового слова через канал произойдет одна ошибка, то число единиц в слове станет нечетным. Проверяя свойство четности числа единиц в слове после получения его из канала на приемном конце, можно обнаружить одну ошибку. В данном случае для кодирования четырех знаков используется 3 двоичных разряда, хотя достаточно двух. Однако благодаря такой избыточности удается обнаружить одну ошибку.
Рис. 7.6. Код в B3, обнаруживающий одну ошибку
В соответствии с общей схемой передачи сообщений в кодирующем и декодирующем устройствах используется одна и та же кодовая таблица и, следовательно, множество кодовых слов. При передаче кодового слова через канал возможны следующие ситуации.
Передавалось и было получено некоторое кодовое слово . Эта ситуация, которая показана в верхней части рис.7.7, соответствует отсутствию ошибок при передаче.
Передавалось кодовое слово ci, а получено было сообщение, которое не является кодовым словом. При попытке декодировать это сообщение будет обнаружено, что такого слов в кодовой таблице нет. Это означает, что ошибка, произошедшая при передаче и исказившая кодовое слово, обнаружена. Эта ситуация изображена в средней части рис.7.7.
Рис. 7.7. Возможные варианты передачи кодового слова через канал
В процессе передачи кодовое слово может так исказиться из-за ошибок, что оно превратится в другое кодовое слово . В этом случае ошибка не обнаруживается, поскольку полученное сообщение также является кодовым словом, и декодирование будет выполнено неверно. Такая ситуация показана в нижней части рис.7.7.
Определение. Код обнаруживает ошибок, если ошибок в кодовом слове переводит его в слово, которое не входит в код.
Код "Тетраэдр" из предыдущего примера обнаруживает одну ошибку (меняется четность), но не обнаруживает две ошибки. Например, слово 101 в результате двух ошибок в первых двух знаках переходит в другое кодовое слово (реализуется третий вариант передачи на рис.7.7). Легко заметить, что данный код обнаруживает 3 ошибки, 5 ошибок и вообще любое нечетное число ошибок, но не обнаруживает любое четное число ошибок. Поэтому, в соответствии с приведенным определением, этот код не обнаруживает 3 или 5 ошибок, а только одну.
В пространстве вводится мера отличия двух точек этого пространства, которая называется расстоянием Хеминга [29], [33], [34].
Определение. Расстоянием , по Хемингу, между вершинами и называется число разрядов, в которых эти вершины различаются.
В виде математической формулы это можно записывать так:
где через обозначается абсолютная величина числа .
В качестве примера рассмотрим расстояние Хеминга между двумя точками (последовательностями или словами) и пространства . Эти последовательности отличаются в первой, четвертой и пятой позициях, следовательно, .
Вещественную функцию двух переменных на множестве принято называть расстоянием, если она обладает следующими свойствами:
Расстояние Хеминга обладает перечисленными выше свойствами. Два первых свойства очевидным образом следуют из определения расстояния Хеминга (или из приведенной выше формулы для расстояния Хеминга), а третье свойство вытекает из следующей последовательности равенств и неравенств
Возможности обнаруживать и исправлять ошибки с помощью кода C зависят от его характеристики, которая называется кодовым расстоянием [34].
Определение. Кодовым расстоянием кода называется минимальное расстояние между различными кодовыми словами (векторами).
С использованием расстояния Хеминга в пространстве можно определить аналоги таких геометрических понятий, как сфера и шар [34]. Эти понятия потребуются в дальнейшем для объяснения принципов обнаружения и исправления ошибок с помощью кодов.
Сферой радиуса с центром в точке является множество
Число точек в сфере определяется выражением
Шаром радиуса с центром в точке называется множество
Число точек в шаре определяется выражением
Замечание. Если имеется некоторое исходное слово , а слово получилось из в результате одной ошибки, произошедшей, например, при передаче слова по каналу, то , т. е. в смысле Хеминга расстояние между ними равно 1.
Аналогичным образом, если при передаче слова произошло ошибок и оно превратилось в слово то .
Утверждение. Код обнаруживает ошибок, если для любых кодовых слов и или .
Рассмотрим, как происходит декодирование сообщения после его передачи через канал. Если при передаче не произошло ошибок, то будет получено кодовое слово. Естественно считать это кодовое слово результатом декодирования.
Если в результате передачи получено не кодовое слово, то произошла ошибка. В этом случае целесообразно использовать декодирование в ближайшее кодовое слово. Такой подход имеет объяснение. Действительно, пусть полученное слово ближе к кодовому слову , чем к любому другому кодовому слову, т. е. для всех кодовых слов . Если сравнить различные гипотезы о том, какое исходное слово было пе-редано, то гипотеза о передаче слова при условии получения слова является наиболее вероятной. Это следует из того, что первая гипотеза (основная) соответствует меньшему числу ошибок при передаче, чем конкурирующие гипотезы.
Утверждение. Код исправляет ошибок, если для любых кодовых слов и или .
Для доказательства рассмотрим шары радиуса с центрами в кодовых словах. Из неравенства треугольника для расстояния Хеминга следует, что эти шары не пересекаются. Тогда при передаче любого кодового слова и при числе ошибок, не превышающем , полученное слово будет находиться в шаре с центром в передаваемом слове и декодироваться (по методу декодирования в ближайшее кодовое слово) в переданное слово.
Из последних двух утверждений следует, что важнейшей характеристикой кода, определяющей его корректирующие возможности, является его кодовое расстояние.
Рассмотрим, следуя [34], какие задачи требуется решать при создании кодов, с помощью которых можно эффективно обнаруживать и исправлять ошибки, возникающие при передаче сообщений. Одна из важнейших задач теории кодирования состоит в следующем. Требуется построить код, исправляющий ошибок и имеющий максимально возможное число точек. В геометрической постановке эта же задача звучит следующим образом: среди вершин единичного -мерного куба требуется выделить максимальное число таким способом, чтобы расстояние между любыми двумя выделенными вершинами было не меньше, чем . Это максимальное число обозначается обычно через .
Другая, связанная с предыдущей, задача состоит в расположении точек в вершинах так, чтобы наименьшее из попарных расстояний между ними было возможно большим. Это расстояние обозначается через .
Выражения "построить", "выделить", "расположить" нуждаются в уточнении, так как нам вовсе не безразлично, в каком виде будет задан искомый код. Самый простой способ - перечисление всех кодовых точек - является неэффективным, требует большой памяти. Поэтому нужен такой способ задания кода, который позволяет просто восстановить каждую точку кода по ее номеру. Другими словами, код должен иметь простую реализацию. С некоторыми просто реализуемыми кодами мы познакомимся ниже. С другой стороны, мы хотим иметь возможность просто восстанавливать исходное сообщение на выходе.
Таким образом, "хороший код" должен удовлетворять следующим трем естественным требованиям:
Следует отметить, что эти требования в значительной степени являются противоречивыми, так как код , исправляющий много ошибок, вовсе не обязан иметь простую реализацию и тем более простой алгоритм декодирования. Поэтому на практике применяются коды, которые обладают в достаточной мере всеми тремя перечисленными выше качествами.
- максимальное число точек кода в , расстояние между любыми двумя кодовыми словами не меньше .
Для количественной оценки свойств кода полезно знать, насколько его параметры отличаются от параметров "идеального" кода. Для этого необходимо иметь хотя бы приближенные значения важнейших параметров "идеального" кода, т. е. значения и . Следует отметить, что функции и не являются единственными параметрами, характеризующими качество кода. Не менее важными являются также такие параметры кода, как вероятность правильного декодирования и вероятность обнаружения ошибки. Имеется также еще ряд других важных критериев, применяющихся для оценки качества кодов.
Оценки верхних границ корректирующих способностей кодов
Если расстояние между любыми двумя точками кода не меньше, чем , то шары радиуса с центрами в кодовых словах не пересекаются. Поэтому общее число точек в этих шарах равно: , где - число точек (кодовых слов) в коде , а число точек в шаре радиуса . Так как число точек, попавших в шары, очевидно, не превосходит общего числа точек (двоичных слов) в , то . Это неравенство справедливо для любого множества с расстоянием между любыми двумя точками не меньше, чем , в том числе и для кода с максимальным числом слов , откуда и следует неравенство Хеминга.
Для максимального числа слов в коде, исправляющем ошибок, может быть получена оценка снизу.
Утверждение (неравенство Варшамова - Гилберта):
Чтобы доказать неравенство Варшамова - Гилберта, можно рассмотреть следующую процедуру построения кода, исправляющего ошибок.
В качестве первого кодового слова возьмем произвольное слово (вектор) из . Рассмотрим шар радиуса с центром в данном слове. Если в есть слова, не вошедшие в этот шар, то в качестве второго кодового слова выберем любое из них. В качестве третьего кодового слова выберем любое слово, не вошедшее ни в один из построенных ранее шаров. Построим шар радиуса с центром в данном слове. Продолжим эту процедуру выбора кодовых слов и построения шаров до тех пор, пока не будут исчерпаны все точки пространства . Предположим, построение кода завершилось за шагов. После завершения этой процедуры пространство будет покрыто построенными шарами, содержащими по точек каждый. Поскольку шары могут пересекаться, справедливо неравенство . Центры шаров образуют код , имеющий, как следует из способа построения, кодовое расстояние . Из того, что - это максимально возможное число точек кода с кодовым расстоянием не меньше, чем , следует, что и . Последнее неравенство эквивалентно неравенству Варшамова - Гилберта.
Одним из подходов к регулярному построению кодов является применение в качестве кодовых множеств линейных подпространств [29], [33], [34]. Одно из преимуществ такого подхода заключается в хорошо изученной структуре подпространств линейных векторных пространств.
Для построения кодов, обнаруживающих и исправляющих ошибки, используются векторные пространства над конечным полем [32]. В этом случае множество (-мерный куб) рассматривается как линейное векторное пространство над конечным полем . Точки из становятся векторами, их можно складывать и умножать на числа из поля .
Специфика некоторых понятий линейной алгебры в векторном пространстве является следствием особенностей поля . Сложение векторов из производится покоординатно с учетом особенностей операции сложения в поле .
Сложение и умножение в поле определяется следующими таблицами.
Таблица сложения |
||
0 |
1 |
|
0 |
0 |
1 |
1 |
1 |
0 |
Таблица умножения |
||
0 |
1 |
|
0 |
0 |
1 |
1 |
0 |
1 |
Сложение в поле (сложение по модулю 2) часто обозначается . Этим же знаком будем обозначать сложение векторов из . Следует отметить справедливое для всех векторов равенство , вытекающее из таблицы сложения. Оно означает, что любой вектор является противоположным себе , а также что при заданных и ( уравнение имеет решение .
Рассмотрим особенности еще некоторых понятий линейной алгебры.
Линейная комбинация в . Учитывая, что рассматривается как векторное пространство над конечным полем , содержащим только два элемента 0 и 1, линейная комбинация в превращается в сумму векторов
Линейная оболочка множества векторов из - это совокупность различных сумм этих векторов. Линейная оболочка векторов будет обозначаться через .
Линейная зависимость векторов из . Векторы линейно зависимы, если существует сумма некоторых из них, равная 0.
Векторы линейно независимы, если любая сумма некоторых из них не равна 0.
Утверждение. Если векторы независимы, то все их линейные комбинации (суммы) различны.
Доказательство. Предположим, что Удалив из левой и правой частей этого равенства одинаковые векторы и перенеся оставшиеся из правой части в левую, получим нулевую сумму векторов. Это противоречит их линейной независимости.
Всего из линейно независимых векторов можно составить
линейных комбинаций, и все они различны.
Из доказанного утверждения следует, что линейная оболочка линейно независимых векторов содержит вектора.
Рассмотрим пример. Пусть имеем два вектора
Их линейная оболочка состоит из четырех векторов На традиционном изображении в виде точек куба образуют плоскость (увеличенные светлые вершины куба на рисунке).
Подпространства в . Подпространством векторного пространства называется подмножество векторов из , замкнутое относительно операций сложения и умножения на число из поля . Линейная оболочка векторов уявляется подпространством пространства .
Например, рассмотренная в предыдущем примере линейная оболочка из четырех векторов является подпространством, а множество векторов
подпространством не является, поскольку оно не замкнуто относительно операции сложения. Например, не входит в это множество векторов.
По аналогии с подпространствами в подпространства в могут задаваться системами линейных уравнений (но над полем ). Именно таким образом далее будет задаваться линейный групповой код.
Нормой вектора называется число единичных координат этого вектора. В кодировании норму вектора называют также весом этого вектора. С помощью нормы вектора и операции сложения векторов в (операции покоординатного сложения по ) выражение для расстояния Хеминга может быть записано в виде
Кодовое расстояние линейного кода может быть вычислено проще, чем кодовое расстояние произвольного кода. Учитывая, что для слов линейного кода справедливо , выполняется следующая цепочка равенств
Определение. Пусть - матрица над полем размера и ранга . Множество решений уравнения называется линейным кодом. - проверочная матрица, - длина кода, - размерность кода. Если матрица имеет вид , где - единичная матрица порядка , то код называется систематическим.
Рассмотрим, как можно получить линейный код, зная порождающую матрицу. Для этого решим уравнение и найдем кодовые слова. В матричном виде уравнение для кодовых слов запишется в виде
( 7.1) |
Чтобы найти решение, нужно произвольно задать компонент вектора , а остальные вычислить по формуле (2.6). Таким образом, первые компонент вектора полностью его определяют
( 7.2) |
Матрица называется порождающей. Ее столбцы образуют базис пространства решений системы . Учитывая особенности поля , порождающая матрица имеет вид .
Нетрудно показать, что справедливо равенство , где - матрица из нулевых элементов, имеющая строк и столбцов.
Для того чтобы лучше понять свойства линейных кодов, полезно рассматривать произведение как линейную комбинацию столбцов матрицы с коэффициентами, являющимися компонентами вектора .
Свойства линейных кодов зависят от проверочной матрицы. Эта зависимость описывается следующей леммой [34].
Лемма. Линейный код с проверочной матрицей имеет кодовое расстояние тогда и только тогда, когда любые s столбцов матрицы линейного кода линейно независимы.
Если любые столбцов матрицы линейно независимы, то никакой вектор , имеющий или менее ненулевых (единичных) компонент, не обращает в ноль произведение . Это означает, что нормы всех кодовых слов, то есть слов , для которых справедливо , больше , и следовательно, кодовое расстояние .
Пусть теперь линейный код с проверочной матрицей имеет кодовое расстояние . Для доказательства линейной независимости любых столбцов проверочной матрицы предположим противное, то есть предположим, что существует линейно зависимых столбцов матрицы Это значит, что сумма некоторых из этих столбцов равна нулевому вектору пространства . Эту сумму можно представить как произведение , где - вектор, у которого компоненты с номерами равны 1, а остальные компоненты равны 0. Значит - кодовый вектор с нормой , что противоречит тому, что кодовое расстояние .
Рассмотрим некоторые примеры линейных кодов.
Код с разрядом для проверки на четность является линейным кодом с проверочной матрицей . Действительно, уравнение в этом случае имеет вид
или
то есть четвертый разряд (проверочный), равный сумме трех информационных, делает сумму всех разрядов кодового слова четной. Каждый столбец проверочной матрицы линейно независим, поэтому из доказанной выше леммы следует, что код имеет кодовое расстояние, равное 2, и следовательно, обнаруживает одну ошибку. Ошибка обнаруживается, если число единичных разрядов в принятом слове нечетно (сумма всех разрядов принятого слова по модулю 2 не равна 0). В этом коде 8 кодовых слов.
Код с повторением является линейным кодом с проверочной матрицей
Линейное уравнение, определяющее код, в данном случае имеет вид
а его решения описываются соотношениями . Эти равенства означают, что три проверочных разряда повторяют один информационный разряд. Любые 3 столбца проверочной матрицы являются линейно независимыми (сумма любых трех столбцов не равна нулевому столбцу), поэтому кодовое расстояние, равное 4, обеспечивает исправление одной ошибки и обнаружение трех. Код содержит всего 2 кодовых слова: и . Считается, что слово передано с ошибкой, если не все разряды в нем одинаковы. Исправление одной ошибки производится по принципу голосования. Если в полученном слове больше единичных разрядов, то, очевидно, оно ближе к кодовому слову , чем к кодовому слову , поэтому декодирование производится в слово . По аналогичной причине, когда в принятом слове больше нулевых разрядов, декодирование производится в слово .
Путь - матрица размера и ранга над полем . Эта матрица задает линейное отображение пространства в пространство по формуле . Ядро этого линейного отображения или множество решений уравнения , образующее подпространство пространства , является линейным кодом. Можно рассмотреть разбиение пространства на классы равнообразности. В один класс входят все элементы , которые при отображении переходят в один и тот же элемент пространства . Элемент пространства , в который переходят все элементы одного класса, называется синдромом. Pис.7.8 иллюстрирует разбиение пространства на классы равнообразности.
Отображение является отображением на все пространство . Для систематической матрицы H это практически очевидно. Действительно, для любого можно найти (построить) , такой, что .
Рис. 7.8. Разбиение пространства Bn на классы равнообразности
Произведение называется синдромом [29], [33]. Фактически, синдромом вектора является образ этого вектора при отображении -. Все векторы , имеющие один синдром, образуют класс. Так как синдром имеет размерность , всего существует классов (если проверочная матрица имеет ранг , в частности, если матрица имеет систематический вид). Из определения линейного кода следует, что класс, которому соответствует нулевой синдром, является кодом . Каждый класс , отличный от кода, порождается "сдвигом" кода на один из векторов класса . Действительно, если ., то есть , тогда и, следовательно, и , где - кодовое слово. Таким образом, любой некодовый вектор, имеющий синдром , можно представить в виде суммы кодового вектора и вектора, имеющего синдром . Представление такого вида не является единственным. Некодовый вектор в этой сумме можно рассматривать как вектор ошибок, произошедших в тех разрядах кодового слова , в которых соответствующие компоненты вектора равны 1. Из всех векторов ошибок, имеющих один синдром, наиболее вероятным является вектор (векторы) с минимальным весом (числом единичных компонент). Такой вектор (векторы) называется лидером класса.
Алгоритм декодирования заключается в следующем. Если получен вектор и , считаем, что ошибкам соответствует наиболее вероятный вектор из класса , то есть лидер класса . Тогда декодирование осуществляется в вектор , получающийся из принятого вектора удалением лидера.
Рассмотрим пример построения кода по заданной проверочной матрице и декодирования полученного сообщения по синдрому. Пусть дана проверочная матрица . Запишем уравнение для определения кодовых векторов (слов) для данной матрицы:
и которые можно рассматривать как информационные разряды, задаются произвольно (всего 4 варианта 00, 01, 10, 11), а проверочные разряды и определяются через и . В итоге все кодовые слова определяются из выражения
где и - информационные разряды, а - порождающая матрица, столбцами которой являются кодовые векторы.
Кодовые слова, рассматриваемые как векторы-столбцы, образуют матрицу кода
Расстояние кода равно минимальному весу ненулевого слова .
Найдем смежные классы, которые состоят из векторов пространства , имеющих одинаковый синдром, и выберем в каждом классе лидера (вектор из класса с минимальным весом).
Синдромом является любое возможное значение произведения .
В данном случае имеется 4 синдрома: .Каждому синдрому соответствует смежный класс, синдром соответствует коду. Смежные классы (столбцы матриц) для каждого синдрома и выбранные лидеры приведены в таблице.
Синдром |
||||
Класс смежности |
||||
Лидер |
В третьем смежном классе - два потенциальных лидера с весом (нормой), равным 1. Один из них выбирается в качестве лидера произвольно.
Рассмотрим на этом примере процесс декодирования полученного вектора (слова) с использованием синдромов. Пусть передавался кодовый вектор и в процессе переачи произошла ошибка в первом разряде. Это означает, что на приемном конце был получен вектор , полученный из переданного вектора в результате добавления вектора ошибки (ошибка в первом разряде). Определим синдром, вычислив произведение . В данном случае получим . Это означает, что полученный вектор водит в четвертый смежный класс (см. таблицу). Лидером этого смежного класса является вектор , соответствующий данному синдрому. Вычитая (добавляя) лидер к принятому вектору, производим декодирование В данном случае декодирование выполнено правильно.
Лекция 8
Процессам обработки, в том числе и обработке данных, присуще свойство, заключающееся в том, что обработка состоит из нескольких стадий, этапов, операций, которые могут рассматриваться как более простые процессы (подпроцессы) обработки. Стадии обработки могут быть взаимосвязаны. Выполнение тех или иных этапов обработки зависит от результатов выполнения других этапов.
Описание процессов обработки осуществляется в виде совокупности предписаний или достаточно простых действий, которые должны быть выполнены для придания объекту обработки желаемых свойств. Подобные описания, представленные в формализованном виде, обычно называются алгоритмами.
Для исследования процессов обработки данных используются различные формальные модели: конечные автоматы, сети Петри, взаимодействующие последовательные процессы Хоара, системы и сети массового обслуживания и многие другие. Они описывают различные аспекты процессов обработки. Некоторые из этих моделей рассматриваются далее.
Описание процесса обработки данных. Понятие алгоритма и его свойства. Способы формальной записи алгоритмов
В повседневной жизни часто встречаются различного рода предписания, инструкции и другие подобные документы, определяющие порядок действий, которые необходимо выполнить для достижения определенного результата. Примерами таких документов являются инструкции по использованию различных устройств (бытовых приборов, банкоматов, торговых автоматов и т.п.), правила выполнения работ в промышленности и строительстве, регламенты совершения различных действий (банковских операций, сделок на фондовых валютных и товарных биржах, проверок технического состояния оборудования и объектов и т.п.). Эти предписания могут отличаться различной степенью точности и детальности описания действий. Если предполагается, что исполнителем предпи-саний будет некоторое устройство (агрегат, станок, транспортное средство или ЭВМ), то предписание будет написано на некотором формальном языке. Типичным примером такого предписания является компьютерная программа, написанная на некотором языке программирования. Обобщением различного рода инструкций и предписаний является понятие алгоритма [27], [35].
Алгоритм - это точное, т. е. сформулированное на определенном языке, конечное описание того или иного общего метода, основанного на применении исполнимых элементарных тактов обработки.
Рассмотрим более подробно отдельные аспекты данного определения. Во-первых, в определении говорится, что описание должно быть точным. Точность описания необходима для того, чтобы обеспечить однозначность понимания действий, которые требуется выполнять, и последовательности их выполнения. В зависимости от того, для кого предназначен алгоритм, точность его описания может быть различной. Если алгоритм предназначен для выполнения человеком, то он может быть описан на естественном языке, например, на русском. В этом случае однозначному пониманию алгоритма не мешают некоторые орфографические ошибки или безобидные опечатки. Если алгоритм должен выполняться автоматическим устройством, то описание алгоритма выполняется на некотором формальном языке (см. п. 6.3), например, на языке инструкций вычислительной системы или языке программирования высокого уровня. Важно также, чтобы описание было конечным, чтобы его можно было загрузить (прочитать) за конечное время.
Во-вторых, важную роль в алгоритме играют элементарные шаги или действия, с помощью которых выполняется алгоритм. Эти действия должны быть достаточно конкретно описаны, чтобы однозначно интер-претироваться исполнителем. Алгоритм для исполнителя должен включать только те команды (элементарные действия), которые ему (исполнителю) доступны. Например, если алгоритм предназначен для выполнения на ЭВМ, то элементарные действия должны входить в систему команд ЭВМ.
В-третьих, алгоритмы, как правило, предназначены для решения не только частных задач (выполнения преобразований конкретных исходных данных), но и для решения целых классов задач. Подлежащие решению частные задачи выделяются из рассматриваемого класса выбором параметров алгоритма. Параметры играют роль исходных данных для алгоритма (процедуры преобразования исходных данных в результат). Например, может быть задан алгоритм, который осуществляет сложение любых двух натуральных чисел. Такому алгоритму нужны два натуральных числа в их десятичном представлении в качестве исходных данных, и он вырабатывает одно число в десятичном представлении как выходные данные (результат).
Алгоритмы характеризуются различными свойствами в зависимости от особенностей процесса их исполнения [26], [35]. Алгоритм называется терминистическим или завершающимся, если он всегда (для всех допустимых исходных данных) заканчивается после конечного числа шагов.
Алгоритм называется детерминистическим, если в процессе его выполнения нет никакой свободы в выборе очередного шага обработки.
Алгоритм называется детерминированным или однозначным, если результат алгоритма определен однозначно (даже если некоторые шаги алгоритма не определены однозначно).
Рассмотрим примеры алгоритмов.
Алгоритм вычисления значения дроби . Сначала вычисляются (используя алгоритмы сложения и вычитания) значения выражений и (в любой последовательности), потом находится частное от деления полученных результатов (используя алгоритм деления).
Этот пример демонстрирует иерархическую структуру алгоритмов. Алгоритм вычисления дроби основан на алгоритмах сложения, вычитания и деления чисел. Из того, что операции и могут выполняться в любой последовательности, следует, что этот алго-ритм не детерминистический, но детерминированный. Очевидно, что алгоритм завершающийся (достаточно всего трех элементарных действий: сложения, вычитания и деления).
Алгоритм вставки карточки в упорядоченную картотеку. Постановка задачи. Имеется колода карт. Пусть на каждой карте зафиксировано одно натуральное число. Требуется вставить карточку в картотеку, не нарушив упорядоченности картотеки.
В случае пустой картотеки (в картотеке нет карточек) вставка карточки тривиальна. В противном случае раскроем картотеку в произвольном месте и сравним записанное на открывшейся карточке число с числом на вставляемой карточке. В соответствии с результатом этого сравнения будем действовать тем же самым способом, вставляя карточку соответственно в переднюю или хвостовую часть картотеки. Процесс заканчивается, когда карточку нужно вставлять в пустое множество карт.
Очевидно, что этот алгоритм - завершающийся. Если все числа на карточках различны, то этот алгоритм - детерминированный. Однако из-за произвольности места, в котором раскрывается картотека, алгоритм не является детерминистическим.
Алгоритм для вычисления наибольшего общего делителя (НОД) двух натуральных чисел. Постановка задачи. Пусть даны два натуральных числа , где и ; надо найти наибольший общий делитель НОД чисел и .
Еще в III веке до нашей эры математик Евклид, известный автор первого дошедшего до нас теоретического трактата по математике "Начала", в геометрической форме изложил правило получения наибольшего общего делителя двух натуральных чисел. Идея этого правила (обоснование его корректности) заключается в том, что если НОД - наибольший общий делитель двух натуральных чисел и , то в случае равенства этих чисел он совпадает с любым из них, а в случае их неравенства разность между большим и меньшим вместе с меньшим имеет тот же самый наибольший общий делитель. Назовем число, равное тому из двух чисел , которое не меньше другого, их верхней гранью и обозначим , а второе обозначим . После вычитания одного числа из другого получим новую пару чисел и , верхняя грань которых строго меньше . Новые числа имеют тот же наибольший общий делитель НОД . Значит, мы свели задачу к нахождению наибольшего общего делителя натуральных чисел, верхняя грань которых меньше первоначальной.
Повторяя прием, мы должны, в конце концов, прийти к случаю, когда новые полученные натуральные числа между собой равны, так как безграничное число шагов уменьшения верхней грани невозможно (потому что натуральных чисел, не превосходящих числа , всего несколько).
Сам алгоритм нахождения наибольшего общего делителя НОД двух натуральных чисел и (алгоритм Евклида) можно изложить так:
Для алгоритма Евклида арифметическая операция "-" и проверка выполнения отношений "<" и "=" считаются эффективными элементарными шагами обработки. Очевидно, что данный алгоритм является завер-шающимся. Однако если в постановке задачи опустить ограничения и , то получается алгоритм, который для неравных отрицательных чисел не прерывается, то есть не является завершающимся. Кроме того, данный алгоритм является детерминистическим, то есть для каждых исходных данных последовательность отдельных шагов точно определена.
Для рассмотренных достаточно простых алгоритмов их свойства (детерминистичность, детерминированность, завершаемость) легко устанавливаются. Однако в общем случае различные свойства алгорит-мов необходимо доказывать. Доказательство свойств алгоритмов относится к проблематике теории алгоритмов. Одним из важнейших вопросов, которым занимается теория алгоритмов, является выяснение того факта, что алгоритм решает сформулированную задачу для заданного множества исходных данных. Представляет интерес также нахождение множества исходных данных, на котором алгоритм решает сформулированную задачу.
В приведенных выше примерах описаний алгоритмов все время встречались некоторые похожие друг на друга фрагменты. Так, некоторые шаги алгоритма могут выполняться лишь при определенном условии, или выполнение некоторых шагов производится неоднократно. Часто также поставленная задача решается с помощью решения той же самой задачи, но с другими исходными данными (более простыми). В этих случаях говорят о разветвлении, повторении и рекурсии.
Классические элементы, которые встречаются в описаниях алгоритмов, - это:
В примере с вычислением дроби мы имеем наиболее простой случай: количество элементарных тактов обработки постоянно и не зависит от чисел a, b. Иначе обстоит дело в других примерах: в случае алгоритма Евклида число шагов обработки зависит от величин чисел a, b, в случае алгоритма карточки число шагов зависит от размера картотеки. Хотя описание алгоритма конечно и постоянно, количество фактически выполняемых тактов - величина переменная; это часто является следствием использованию приема, сводящего общую задачу к более простой задаче того же класса. Этот прием называют рекурсией. В алгоритме Евклида и алгоритме вставки карточки в упорядоченную картотеку наличие рекурсии очевидно из алгоритма. В алгоритмах часто используется специальный случай рекурсии - чисто повторительная рекурсия. При описании алгоритма ее часто записывают в форме итерации: "Пока выполнено определенное условие, повторять...".
Наряду с рекурсией и повторением в алгоритмах встречается также анализ возможных случаев. Без анализа отдельных случаев и выявления условий завершения было бы невозможно окончание рекурсивных алгоритмов.
Способы описания алгоритмов. Алгоритмы обрабатывают определенные объекты в качестве исходных данных ("входные") и выдают другие объекты в качестве результатов. Объекты могут быть конкретными, как, например, десятичное число в случае алгоритма сложения десятичных чисел, или абстрактными, как, скажем, натуральные числа (для которых могут использоваться разнообразные эквивалентные системы предста-вления) в случае нахождения наибольшего общего делителя. Для описанного ранее алгоритма нахождения НОК совершенно не существенно, записываются числа в десятичной или двоичной системе счисления или даже римскими цифрами: свойства делимости от этого не меняются. В теоретических исследованиях предпочитают опираться на алгоритмы, которые работают, например, только с натуральными числами (Гедель) либо только с цепочками знаков (Марков). С практической точки зрения нет никакой пользы или нужды в таких ограничениях, допустимы какие угодно множества объектов, если только можно аккуратно определить их свойства. Разве лишь, поскольку приходится привлекать разбор отдельных случаев, необходимо включить в множество объектов, по крайней мере, значения истинности "истина" и "ложь". В зависимости от того, какие допускаются классы объектов (и соответствующих операций), приходят к различным классам алгоритмов.
Рассмотрим чуть более подробно специальную запись алгоритмов преобразования последовательностей знаков [27], [35]. Такая запись пред-ставляет собой один из способов уточнения понимавшегося до сих пор интуитивно понятия алгоритма.
Без сомнения, элементарной операцией над последовательностями знаков может считаться замена подслова на некоторое слово (текстовая замена). Будем исходить из множеств и слов над общим набором знаков (алфавитом) . Отдельную операцию замены, которую также называют продукцией, будем записывать в виде и понимать ее следующим образом.
Если является подсловом заданного слова , то заменить это под-слово на . В случае если подслово встречается в несколько раз, словом заменяется то из них, которое стоит в самой левой позиции.
Далее, если дано конечное множество таких продукций, перечисленных в определенном порядке, то текстовая замена должна производиться посредством применения самой первой (относительно этого порядка) из применимых продукций. Все это повторяется до тех пор, пока возможно, или же до применения особым образом отмеченной продукции ("останавливающей"). Учитывая, что одно из слов в продукции может быть пустым словом (см. 2.1.3), текстовая замена включает в себя вставку и присоединение знаков, а также вычеркивание знаков.
Такого рода алгоритмы называют алгоритмами Маркова по имени советского математика А. А. Маркова, который впервые описал их в 1951 г. Сам Марков называл их "нормальными алгоритмами". Их можно считать уточнением понятия алгоритма, достигаемым за счет использования специальной формы описания. Существуют и другие подходы к уточнению (формализации) понятия алгоритма, используемые, в основном, для теоретических исследований.
Для практических целей часто используют графические способы описания алгоритмов, которые являются более компактными и наглядными. При графическом описании каждая операция процесса обработки изображается отдельной стандартной геометрической фигурой (блоком).
Некоторые стандартные блоки, их назначение и краткое описание приведены в таблице.
Наименование |
Обозначение |
Функция |
Процесс |
Выполнение операции или группы операций, в результате которых изменяется значение, форма представления или расположение данных |
|
Решение |
Выбор направления выполнения алгоритма в зависимости от некоторых переменных условий |
|
Ввод-вывод |
Преобразование данных в форму, пригодную для обработки (ввод) или отображения результатов обработки (вывод) |
|
Предопределённый процесс |
Использование ранее созданных и отдельно написанных программ (подпрограмм) |
|
Пуск-останов |
Начало, конец, прерывание процесса обработки данных |
|
Межстраничный соединитель |
Указание связи между прерванными линиями, которые соединяют блоки, расположенные на разных листах |
Блоки соединяются линиями переходов, определяющими очередность выполнения действий. Такое графическое представление называется схемой алгоритма или блок-схемой. Набор символов, используемых в блок-схемах, и правила изображения блок-схем в настоящее время определяются ГОСТ 19.701 - 90 (ИСО 5807 - 85) "Единая система программной документации. Схемы алгоритмов, программ, данных и систем. Условные обозначения и правила выполнения".
Модель процесса обработки данных. Конечные автоматы
Важную роль в процессе обработки данных (поимо самих данных, подвергаемых обработке) играет активная составляющая процесса - некоторая сущность, выполняющая обработку. Таким обработчиком, или преобразователем данных, могут быть как люди, так и некоторые устройства. Важнейшие характеристики процесса обработки данных зависят от того, как функционирует преобразователь. Поэтому создание и исследование различных моделей обработки имеет важное теоретическое и практическое значение. Одной из таких моделей является понятие конечного автомата [32], [36]. Конечный автомат можно охарактеризовать как устройство, имеющее входной и выходной каналы; в процессе функционирования на каналы поступают дискретные порции данных (буквы алфавита). Автомат может находиться в одном из конечного числа внутренних состояний. По определенному закону (в зависимости от состояния автомата и входных данных) осуществляется преобразование входной порции данных в выходные данные и смена состояния автомата. Формально конечный автомат определяется следующим образом.
Определение. Конечным автоматом называется набор из пяти объектов , в котором:
Таким образом, конечный автомат математически описывается тремя множествами и двумя функциями. Функционирование автомата состоит в том, что он "считывает" последовательность входных символов ("программу") и затем "выпечатывает" последовательность выходных символов. Действие происходит последовательно. Конечный автомат, находящийся сначала во внутреннем состоянии , считывает первый входной символ . Функция принимает на паре значение , которое выпечатывается в качестве первого выходного символа. Функция принимает на паре значение , которое является следующим внутренним состоянием автомата. Затем автомат считывает новый входной символ, выпечатывает выходной, переходит в следующее состояние и т.д., пока не кончится программа.
На рис.8.1 дан удобный способ представления последовательных тактов работы автомата.
Будем предполагать, что программа записана на входной ленте. Автомат считывает с нее входные знаки один за другим. По прочтении каждого входного знака выпечатывается выходной знак на выходной ленте, и автомат переходит в следующее состояние прежде чем считать следующий символ программы. Позже мы введем другие способы представления: графы и таблицы состояний.
В нашем определении подразумевается, что функции и в описа-нии автомата всюду определены: каждый элемент задает их значения. Такое описание автомата является полным. Коль скоро задано начальное состояние такого автомата, он способен считывать любую программу и выдавать однозначно определенную цепочку символов. Иными словами, существует функция, которая ставит в соответствие любому начальному состоянию и любой последовательности входных символов вполне определенную последовательность выходных символов.
Рис. 8.1. Конечный автомат
Пусть - полученный на вход автомата знак на -м шаге, - состояние, в котором находился автомат на -м шаге, а - знак, который вырабатывает автомат на -м шаге в качестве выходного значения. Работа автомата, то есть переход из состояния в состояние и появление выходных знаков, с использованием функций и может быть описано выражениями
( 8.1) |
|
( 8.2) |
Поскольку множества и конечны, функции, заданные на их декартовом произведении , удобно задавать табличным способом. На рис.8.2 показан общий вид таблиц, задающих переходную функцию и выходную функцию конечного автомата.
Рассмотрим пример конечного автомата, у которого , имеется два состояния , а функции и задаются таблицами
0 |
1 |
|
0 |
1 |
|
0 |
0 |
|
1 |
1 |
Пусть на вход автомата подается последовательность знаков (слово) 1,0,0,1,1,0,1 или в более короткой записи 1001101. Проследим, как меняется состояние автомата в процессе обработки этого слова и какая после-довательность знаков формируется на выходе. Для этого рассмотрим таблицу, состоящую из трех строк. В первой строке записаны знаки, поступающие на вход автомата. Во второй строке записываются состояния, в которых оказывается автомат в процессе обработки входного слова. Наконец, в третьей строке записываются знаки, которые появляются на выходе автомата в результате его работы.
Рис. 8.2. Табличное задание переходной и выходной функций
вход |
1 |
0 |
0 |
1 |
1 |
0 |
1 |
состояния |
|||||||
выход |
0 |
1 |
0 |
0 |
1 |
1 |
0 |
Обработка входной последовательности знаков производится по шагам. На каждом шаге обрабатывается один знак. В таблице каждому шагу обработки соответствует один столбец. Пусть в момент поступления первого знака, которым является 1, автомат находился в состоянии . Тогда в на выходе появится знак 0, а в соответствии с определением функции автомат перейдет в состояние , которое записывается во вторую строку следующего (второго) столбца таблицы. При поступлении второго знака обрабатываемого слова получим (записывается в третью строку второго столбца таблицы) и (записывается во вторую строку следующего (третьего) столбца таблицы). Процесс обработки следующих знаков происходит аналогичным образом и завершает-ся после обработки последнего знака. В результате исходное слово 1001101 преобразуется в слово 0100110, которое, как можно заметить, является "сдвигом" исходного слова, то есть получается удалением последнего знака из исходного слова и добавлением знака "0" в начало исходного слова.
Помимо рассмотренного табличного способа существует еще графический способ описания (задания) конечных автоматов в виде помеченного ориентированного графа, который называется "диаграмма состояний". Вершины этого графа помечены символами, обозначающими внутренние состояния. Каждое ребро помечено парой символов , где - входной знак, который вызывает переход в следующее состояние, отвечающее этому ребру, а - выходной знак, который автомат выдает в результате обработки входного знака. Из каждой вершины диаграммы выходит столько дуг, сколько знаков имеется во входном алфавите.
Рис. 8.3. Диаграмма состояний сдвигающего автомата
Диаграмма состояний рассмотренного автомата, сдвигающего вправо на один знак входное слово, показана на рис.8.3.
Табличный и графический способы описания конечных автоматов дополняют друг друга. Использование таблиц удобнее для вычислений, а диаграммы более наглядны.
Пусть - некоторый автомат. Выделим одно состояние, которое назовем начальным и с которого будет начинаться обработка всех входящих слов. Тогда любой входной строке длины , где - знак на -м месте входной последовательности, однозначно соответствует строка внутренних состояний, , длины , где - состояние после -го шага работы, которая получается последовательным применением отображения по формуле (8.1). Аналогично выходная строка длины , где - знак на -м месте выходной последовательности, однозначно определится последовательным применением отображения у/по формуле (8.2).
Таким образом, автомат можно рассматривать как устройство, преобразующее для заданного начального состояния входную строку в строку и выходную строку и тем самым реализующее функции (преобразования) и , которые рекурсивно строятся по функциям и .
Сеть Петри как модель параллельно выполняемых процессов обработки
Различные системы, в том числе и информационные, состоят из множества взаимодействующих подсистем (элементов). Хотя работа каждой подсистемы происходит в значительной степени автономно и параллельно, общая функциональность системы обеспечивается взаимодействием ее подсистем. Как правило, различные события, связанные с взаимодействием подсистем, возможны только при выполнении некоторых условий.
Примеры: разгрузка судов в порту, сделки с недвижимостью, чтение файла с дискеты и т.д.
Взаимодействие подсистем приводит к изменению состояния подсистем, всей системы в целом и к выполнению некоторых новых условий, которые могут привести к новым событиям в системе. Для моделирования последовательностей событий, обусловленных логикой работы системы, используется аппарат сетей Петри [37], [38]. В моделях такого типа рассматриваются только события и условия.
Составные части сети. В сетях Петри события и условия представлены абстрактными символами из двух непересекающихся алфавитов, называемых соответственно множеством переходов и множеством мест . В графическом представлении сетей переходы изображаются "барьерами", а места - кружками (рис.8.4). Условия-места и события-переходы связаны отношением непосредственной зависимости (непосредственной причинно-следственной связи), которое изображается с помощью направленных дуг, ведущих из мест в переходы и из переходов в места. Места, из которых ведут дуги на данный переход, называются его входными местами. Места, на которые ведут дуги из данного перехода, называются его выходными местами.
Рис. 8.4. Переход и его входные и выходные места
Во фрагментах сети на рис.8.4 места и являются входными для перехода , а места и - выходными. В этом примере событие-переход непосредственно зависит от условий-мест и , а места и непосредственно зависят от . В сети некоторые места могут являться входным или выходными одновременно для нескольких переходов.
Разметка сети. Выполнение условия изображается разметкой соответствующего места, а именно помещением некоторого числа фишек (маркеров) в это место. Если число фишек, которые необходимо поместить в некоторое место, достаточно велико, то в это место помещают число, равное требуемому количеству фишек. Число фишек, находящихся в некотором месте , называется емкостью соответствующего условия.
Функционирование сети. Динамика поведения моделируемой системы находит свое отражение в функционировании (работе) сети Петри. Неформально работу сети можно представить как совокупность локальных действий, которые называются срабатываниями переходов. Они соответствуют реализациям событий и приводят к изменению разметки мест, т.е. к локальному изменению условий в системе.
Переход может сработать, если выполнены все условия реализации соответствующего события. Например, для так называемых ординарных сетей Петри (частный случай принятой в настоящее время версии сетей Петри, введенный им в первой работе) все входные места перехода должны содержать хотя бы по одной фишке.
Срабатывание перехода - неделимое действие, изменяющее разметку его входных и выходных мест следующим образом: из каждого входного места изымается по одной фишке, а в каждое выходное место добавляется по одной фишке. Тем самым реализация события, изображаемого переходом, изменяет состояние (емкость) непосредственно связанных с ним условий так, что емкость предусловий, вызвавших реализацию этого события, уменьшается, а емкость постусловий, на которые оно влияет, увеличивается. Переход на рис.8.5 а) может сработать, так как оба его входных места и содержат фишки, а после срабатывания разметка его входных и выходных мест изменяется так, как показано на рис.8.5 б).
Если два (и более) перехода могут сработать и они не имеют общих входных мест, то их срабатывания являются независимыми действиями, осуществляемыми в любой последовательности или параллельно.
Если несколько переходов могут сработать и имеют общее входное место (как переходы и на рис.8.5 а)), то срабатывает только один, любой из них. При этом может оказаться, что, сработав, этот переход лишит возможности сработать другие переходы (рис.8.5, б) и г)). Таким способом в сети моделируется конфликт между событиями, когда реализация одного события может исключить возможность реализации других. В сети никак не указывается, каким образом конфликт следует фактически разрешить. Считается, что решение о том, какое из конфликтующих событий следует реализовать, принимается вне формализма сети, т.е. поведение сети носит недоопределенный недетерминированный характер. Аналогичный конфликт возникает в том случае, когда несколько переходов могут сработать и они имеют общие выходные места, как переходы и (рис.8.5, б и в).
Рис. 8.5. Пример функционирования сети
В процессе функционирования сети происходит смена разметок мест как результат срабатывания ее переходов. Сеть останавливается, если ни один из ее переходов не может сработать как, например, на рис.8.5, в) и г).
Формальное определение сети Петри
Чтобы можно было использовать сети Петри для анализа процессов обработки, необходимо иметь точное определение.
Графом сети Петри будем называть тройку (), где
- непустое множество элементов сети, называемых местами,
- непустое множество элементов сети, называемых переходами,
- отношение инцидентности,
и для () выполнены следующие условия:
то есть сеть не содержит пары мест, которые инцидентны одному и тому же множеству переходов.
Графическим представлением сети служит двудольный ориентированный граф с двумя типами вершин; вершины-места изображаются кружочками, вершины-переходы - барьерами. Из вершины в вершину ведет дуга, если и только если .
На основе понятия сети, которая описывает только статическую топологию моделируемого процесса или системы, вводятся динамические сетевые структуры, в которых местам приписываются специальные разметки, моделирующие выполнение условия, и с сетью связывается понятие ее функционирования, изменяющего эти разметки (условия) в результате так называемых срабатываний переходов. К таким динамическим сетям относятся сети Петри, их различные варианты, обобщения и частные случаи.
Сеть Петри - это набор , где - конечная сеть (множество конечно), a и - две функции, называемые соответственно кратностью дуг и начальной разметкой. Первая сопоставляет каждой дуге число (кратность дуги). Если , то в графическом представлении сети число выписывается рядом с короткой чертой, пересекающей дугу. Часто такая дуга будет также заменяться пучком из дуг, соединяющих соответствующие элементы сети. Условимся никак не отмечать кратность дуг, равную 1. Такую сеть будем называть ординарной. Вторая функция сопоставляет каждому месту некоторое число (разметка места). В графическом представлении сети разметка места изображается помещением в вершину-кружок числа или, если это число невелико, соответствующего числа точек (фишек).
Разметка сети - это функция . Если предположить, что все места сети строго упорядочены каким-либо образом, т.е. , то разметку сети (в том числе начальную разметку) можно задать как вектор целых неотрицательных чисел
такой, что для любого .
На основе отношения инцидентности можно ввести функцию инцидентности , которая определяется выражением
Значения функции можно трактовать как кратность дуги между вершинами сети и . Если , то это означает, что между вершинами и дуги нет.
Если места сети упорядочены, то можно каждому переходу сопоставить два целочисленных вектора и длиной , где :
и
Функционирование сети Петри описывается формально с помощью множества последовательностей срабатываний и множества достижимых в сети разметок. Эти понятия определяются через правила срабатывания переходов сети.
Переход может сработать при некоторой разметке сети , если , то есть каждое входное место перехода имеет разметку, не меньшую, чем кратность дуги, соединяющей и . Это условие можно переписать в векторной форме следующим образом: .
Предполагается, что для векторов выражение озна-чает, что .
Из определения векторов и ясно, что вектор является столбцом матрицы , а вектор является столбцом матрицы
Векторы и могут быть представлены как произведения и матриц и на вектор вида
( 8.3) |
у которого все компоненты равны 0, кроме -й компоненты, равной 1.
Для ординарной сети Петри условие срабатывания перехода означает, что любое входное место этого перехода содержит хотя бы одну фишку, т.е. имеет ненулевую разметку.
Срабатывание перехода при разметке порождает разметку по следующему правилу:
В матричном виде изменение разметки при срабатывании перехода описывается выражением
( 8.4) |
Обозначив , получим еще более краткую запись для выражения (8.4)
( 8.5) |
Таким образом, срабатывание перехода изменяет разметку так, что разметка каждого его входного места уменьшается на , т.е. на кратность дуги, соединяющей и , а разметка каждого его выходного места увеличивается на , т.е. на кратность дуги, соединяющей и .
Элемент матрицы , находящийся в -й строке и -м столбце, представляет собой разность числа появившихся и удаленных в -м месте фишек в результате срабатывания -го перехода.
На множестве разметок можно ввести отношение непосредственного следования разметок:
Будем использовать уточняющее обозначение , если непосредственно следует после в результате срабатывания перехода . Говорят, что разметка достижима от разметки , если существует последовательность разметок и слово в алфавите , такие что
Слово в этом случае называется последовательностью срабатываний, ведущих от к . Обобщим отношения непосредственного следования до отношения " достижима от ", используя обозначение или , если уточняется последовательность срабатываний (последовательность может быть пустой, т.е. не достижима от ).
Множество разметок, достижимых в сети от разметки , обозначим через . Множество , т.е. множество всех разметок, достижимых в от начальной разметки , называют множеством достижимых разметок сети (заметим, что и ).
Множеством последовательностей срабатываний сети , или свободным языком сети , называется множество
то есть множество всех последовательностей срабатываний, ведущих от к каждой достижимой в разметке.
На рис.8.6 изображена сеть Петри, на примере которой поясним данные выше определения. В этой сети . Функция инцидентности задается с помощью следующих двух таблиц, в которых на пересечении строки и столбца стоит число :
1 |
1 |
0 |
||
0 |
0 |
1 |
||
0 |
2 |
0 |
||
1 |
0 |
0 |
||
1 |
1 |
0 |
0 |
|
0 |
2 |
0 |
0 |
|
0 |
0 |
1 |
1 |
Начальная разметка задается следующим образом: , или в векторной форме: .
При разметке могут сработать переходы и , так как . Переходы и не могут сработать, так как вектор начальной разметки не покрывает векторы , и .
Рис. 8.6. Пример сети Петри
В результате срабатывания перехода разметка сменяется на разметку (1, 3, 0), а в результате срабатывания перехода разметка сменяется на разметку (0, 0, 1) . Обе новые разметки непосредственно следуют после в рассматриваемой сети. Можно представить возможные изменения разметок сети , происходящие в результате срабатывания ее переходов, в виде графа разметок - ориентированного графа, множество вершин которого образовано множеством достижимых в разметок. Из вершины в вершину ведетa дуга, помеченная символом перехода , если и только если . На рис.8.7 показан начальный фрагмент графа разметок сети на рис.8.6. Этот граф бесконечен, так как множество достижимых разметок бесконечно для рассматриваемой сети.
Разметка называется тупиковой, если в сети не существует ни одного перехода, который может сработать при этой разметке. Для рассматриваемой сети тупиковыми являются разметки (0, 2, 0), (0, 3, 0), (0,4,0),..., (0, n, 0)...
Легко видеть, что если выделить путь по дугам графа разметок, начинающийся в вершине и заканчивающийся в вершине , и выписать подряд все встречающиеся символы переходов, то полученное слово образует последовательность срабатываний, ведущих от к . Множество всех слов, которые получены выписыванием символов переходов вдоль путей, начинающихся в , образует множество последовательностей срабатываний сети, или ее свободный язык. Так, язык рассматриваемой сети включает слова .
Основные задачи анализа процессов обработки, решаемые с использованием сетей Петри
В процессе функционирования сети Петри некоторые ее места могут накапливать неограниченное число фишек. Примером такого места может служить место в сети на рис.8.6. Если интерпретировать места как
Рис. 8.7. Граф разметок сети Петри
накопители (буферы) данных, сигналов или деталей в моделируемых системах, то естественно потребовать, чтобы при любом варианте функционирования этих систем не происходило переполнение накопителей, которые в реальных ситуациях имеют конечную, фиксированную емкость. Следующие понятия формализуют такие требования.
Определение. Место в сети Петри называется ограниченным, если существует число , такое что для любой достижимой в сети разметки справедливо неравенство . Сеть называется ограниченной сетью, если любое ее место ограничено.
Ясно, что множество достижимых разметок конечно, если и только если - ограниченная сеть. В сети на рис.8.6 места , и ограничены, так как каждое из них может содержать не более одной фишки. В то же время место не ограничено, и поэтому эта сеть не является ограниченной.
Определение. Место называется безопасным, если для всякой достижимой разметки выполняется неравенство ; соответственно, сеть безопасна, если все ее места безопасны.
Любая достижимая в безопасной сети разметка представляет собой вектор из 0 и 1. Сеть, показанная на рис.8.6, не является безопасной.
Родственным понятиям ограниченной и безопасной сети Петри является понятие консервативной, или сохраняющей, сети.
Определение. Сеть, в которой сумма фишек во всех ее местах остается постоянной в процессе работы сети, то есть
называется сохраняющей (консервативной).
Условие сохранения числа фишек в сети - это очень сильное ограничение. Например, из него немедленно следует, что число входов в каждый переход должно равняться числу выходов (с учетом кратности). Если бы это было не так, запуск перехода изменил бы число фишек в сети.
Часто фишки в сети Петри моделируют различные ресурсы. Однако взаимно однозначного соответствия между фишками и ресурсами нет. Фишка может представлять как один ресурс, так и несколько ресурсов сразу. Во втором случае фишка может использоваться для создания кратных фишек (по одной на ресурс) путем запуска перехода с большим числом выходов, чем входов. Поэтому определение свойства сохраняемости сети целесообразно сделать более общим, заменив простую сумму фишек на сумму с весами. Фишкам, не являющимся важными, можно присвоить нулевой вес; другим фишкам можно присвоить весы 1, 2, 3 или любое другое положительное число.
Определение. Сеть Петри называется сохраняющей (консервативной) по отношению к вектору весов , где - число мест в сети, если
( 8.6) |
Сохраняющая сеть Петри является сохраняющей по отношению к вектору весов . Следует исключить из рассмотрения нулевой вектор весов, поскольку все сети являются сохраняющими по отношению к нулевому вектору весов.
Переходы в сетях Петри, как правило, моделируют некоторые действия (события), которые могут совершаться в реальных процессах обработки. Поэтому вопросы, касающиеся возможности срабатывания тех или иных переходов, представляют интерес при анализе сетей Петри.
Переход в сети может сработать при определенных условиях, связанных с разметкой его входных мест. Может оказаться, что для некоторого перехода условие его срабатывания никогда не выполняется, как бы ни функционировала сеть. Такой переход - лишний в сети, его можно исключить без ущерба для работы сети. Может случиться также, что после некоторой последовательности срабатываний переходов сети и соответствующих изменений ее разметки некоторые переходы, в том числе те, которые уже срабатывали, больше никогда не сработают, какие бы варианты достижимых в сети разметок не возникали. Это означает, что в моделируемых системах могут появляться ситуации, тупиковые для некоторых событий. Например, в операционных системах подобные случаи происходят при взаимных блокировках процессов (deadlocks) при недоступности требуемых ресурсов. Таким образом, переходы в сети Петри могут обладать различной активностью, и их можно разбить на категории по уровню активности.
Уровень 0: переход обладает активностью уровня 0 и называется мертвым, если он никогда не может быть запущен.
Уровень 1: переход обладает активностью уровня 1 и называется потенциально живым, если существует такая разметка , что разрешен в . Уровень 2: переход обладает активностью уровня 2, если для всякого целого существует последовательность запусков, в которой присутствует по крайней мере раз.
Уровень 3: переход обладает активностью уровня 3, если существует бесконечная последовательность запусков, в которой присутствует неограниченно часто.
Уровень 4: переход обладает активностью уровня 4 и называется живым, если для всякой переход является потенциально живым для сети Петри с начальной маркировкой .
Сеть Петри называется живой, если все ее переходы являются живыми.
В качестве примера, иллюстрирующего уровни активности, рассмотрим сеть Петри на рис.8.8. Переход не может быть запущен никогда; он мертвый. Переход можно запустить только один раз; он обладает активностью уровня 1. Переход может быть запущен произвольное число раз, но это число зависит от числа запусков перехода . Если мы хотим запустить пять раз, мы запускаем пять раз , затем и после этого пять раз . Однако, как только запустится ( должен быть запущен до того, как будет запущен ), число возможных запусков станет фиксированным. Следовательно, обладает активностью уровня 2, но не уровня 3. С другой стороны, переход можно запускать бесконечное число раз, и поэтому он обладает активностью уровня 3, но не уровня 4, поскольку, как только запустится , переход больше запустить будет нельзя.
Рис. 8.8. Сеть Петри, иллюстрирующая различные уровни активности переходов
Многие прикладные задачи анализа систем и процессов в терминах сетей Петри могут быть сформулированы как задача о достижимости заданной разметки сети. Эта разметка может соответствовать целевому состоянию, в которое желательно перевести систему или процесс, или наоборот, описывать состояние, попадания в которое лучше избежать (аварийное, убыточное и т.п.). Важность задачи о достижимости заключается также в том, что к ней сводятся некоторые другие задачи анализа сетей Петри.
Формально задача о достижимости состоит в следующем: для сети Петри с начальной разметкой и заданной разметки установить справедливость включения . Иными словами, требуется выяснить, существует ли допустимая последовательность срабатываний переходов , переводящая сеть Петри из начальной разметки в заданную разметку , то есть .
Близкой по смыслу к задаче о достижимости является задача о покрываемости. Она заключается в том, чтобы для данной сети Петри с начальной маркировкой и заданной маркировки определить, существует ли такая достижимая маркировка , что .
Напомним, что отношение истинно, если каждый элемент маркировки не меньше соответствующего элемента маркировки .
Матричный метод анализа сетей Петри
Матричный метод основан на выражении (8.5), связывающим разметки сети, которые были до и после срабатывания некоторого перехода и матрице , описывающей работу сети.
Пусть начальная разметка сети равна . Если в сети допустима последовательность срабатывания переходов , то выполняются следующие соотношения
Обозначив ,получим
( 8.7) |
Из-за того, что вектор тявляется суммой векторов вида (8.2) он должен быть целочисленным неотрицательным вектором. Выполнение соотношения (8.6) для некоторого целочисленного неотрицательного вектора является необходимым условием достижимости разметки из началь-ной разметки .
Выражение (8.7) является системой линейных неоднородных уравнений относительно неизвестных компонент вектора . Следует заметить, что целочисленное неотрицательное решение уравнения (8.7), как правило, не определяет однозначно порядок срабатывания переходов, потому что от порядка суммирования векторов вида (8.2) сумма не зависит. Для нахождения требуемого порядка срабатывания переходов необходимо проводить дополнительные исследования.
Рис. 8.9. Сеть Петри
Рассмотрим пример решения матричным методом задачи о достижимости. Спрашивается, достижима ли разметка для сети Петри, изображенной на рис.8.9?
Если разметка достижима, то указать последовательность срабатываний переходов, приводящую к данной разметке.
Матрица для данной сети Петри имеет вид
Матричное уравнение (8.6) для определения последовательности срабатываний переходов имеет вид
Без первого уравнения, которое тривиально выполняется, имеем систему трех уравнений с тремя неизвестными
Из второго и третьего уравнений получаем , а из первого . Таким образом, в качестве решения имеем целочисленный неотрицательный вектор
Этот вектор не определяет порядок срабатывания переходов. Среди последовательностей срабатывания есть невыполнимые, например, . Среди последовательностей срабатывания переходов, удовлетворяющих вектору, необходимо искать допустимые. Допустимых после-довательностей может быть много, а может и не быть вовсе. Для данного примера допустимой последовательностью является последовательность или последовательность .
Наличие неотрицательного положительного решения у линейного уравнения для определения последовательности срабатывания является только необходимым условием и не гарантирует реального существова-ния такой последовательности. Например, решая задачу о достижимости разметки для описанной выше сети Петри, в качестве решения мы получим неотрицательный целочисленный вектор
Однако реальной последовательности, приводящей к требуемой разметке, не существует, так как для срабатывания перехода необходимо наличие в месте маркера. Но фишка, попавшая в , не может покинуть эту позицию.
Пример 2 (решение матричным методом задачи о достижимости).
Рассмотрим сеть
Рис. .
и исследуем достижимость разметки из начальной разметки
Матрица имеет вид
Матричное уравнение для определения последовательности срабатываний переходов имеет вид
Без первого уравнения, которое тривиально выполняется, имеем систему
Складывая второе и третье уравнения, получим . Из первого уравнения получаем , а из третьего -. Таким образом, в качестве решения имеем целочисленный неотрицательный вектор
Этот вектор не определяет порядок срабатывания переходов. Среди последовательностей срабатывания есть невыполнимые, например
Среди последовательностей срабатывания переходов, удовлетворяющих вектору, необходимо искать допустимые. Допустимых последовательностей может быть много, а может и не быть вовсе. Для данного примера допустимой последовательностью является последовательность .
Матричный подход может быть использован для вектора весов, относительно которого сеть Петри является сохраняющей (консервативной). Пусть - вектор-строка искомых весов. В соответствии с приведенным выше определением консервативность сети заключается в выполнении равенства (8.6). Обе части этого равенства можно рассматривать как скалярные произведения вектора на векторы любых двух достижимых разметок. Если в качестве одной из разметок взять начальную разметку , а в качестве второй - любую достижимую разметку, то из (8.6) следует, что . Из формулы (8.5) следует, что . В результате получаем, что для всех векторов , соответствующих достижимым разметкам. Равенство выполняется, если . Это матричное выражение представляет собой линейное однородное уравнение относительно весов, составляющих вектор .
Для сети, изображенной на рис.8.10, найдем матричным методом вектор весов , относительно которого она является сохраняющей. Эта сеть моделирует два взаимодействующих процесса обработки, использующих общий ресурс (описывается местом ).
Рис. 8.10. Модель двух процессов, использующих неделимый ресурс
Матрица для данной сети имеет вид
Легко заметить, что эта матрица имеет ранг 2 (третий столбец равен первому, умноженному на -1, а четвертый столбец равен второму, умноженному на -1). Поэтому система уравнений для вектора весов включает в себя только два уравнения
Существует бесконечно много решений этой системы, которые могут быть получены из выражений
при произвольном задании весов . Из этих выражений видно, что сеть не является строго сохраняющей, т. к. вектор (1, 1, 1, 1, 1) не является решением системы. В качестве вектора весов, относительно которого сеть является сохраняющей, нас интересуют только неотрицательные решения. Задавая , , получим . Вектор весов (1, 1, 1, 1, 0), являющийся решением системы, означает, что сеть сохраняет суммарное количество фишек во всех местах, за исключением места (количество фишек в месте не учитывается при подсчете обще-го числа в сети). Еще одно решение (1, 1, 2, 2, 1) соответствует случаю, когда фишки в местах и учитываются при подсчете взвешенной суммы фишек в сети с коэффициентом 2.
Лекция 9
Трансакционные системы
К трансакционным системам относятся системы управления ресурсами предприятий (ERP-системы), а также некоторые другие решения, например, автоматизированные банковские системы (АБС), биллинго-вые системы, учетные приложения и некоторые другие. Все эти системы имеют общую черту: они являются трансакционными, т.е. предназначенными для обработки отдельных операций (трансакций).
Некоторые из трансакционных систем комплексны и состоят из отдельных модулей. Например, модульная структура свойственна ERP-системам, основная задача которых - объединить различные службы предприятия в единый управленческий контур. Кроме того, такие системы всегда имеют набор финансовых и учетных функций. Поэтому трансакционные системы представляют собой источники первичной информации, используемой для последующей аналитической обработки. Данные из трансакционных источников требуется собрать, структурировать и представить в виде, удобном для принятия решений. Сами трансакционные системы тоже содержат некоторые аналитические возможности, но эти функции скорее носят вспомогательный характер и существенно уступают аналогичным возможностям аналитических систем. Тем не менее, роль трансакционных систем для решения задач бизнес-аналитики крайне важна, поскольку именно они являются поставщиками информации для систем бизнес-интеллекта и аналитических приложений.
Системы бизнес-интеллекта
Понятие систем бизнес-интеллекта (Business Intelligence, BI) является довольно емким и объединяет различные средства анализа и обработки данных масштаба предприятия. Среди BI-систем можно выделить такие составляющие, как хранилища и витрины данных, инструменты оперативной аналитической обработки (OLAP-системы), средства обнаружения знаний, а также средства формирования запросов и построения отчетов.
Важную роль среди BI-систем играют хранилища данных (data ware-house, DW), обеспечивающие сбор, упорядочение и хранение больших объемов информации, полученной из разных источников. Один из авторитетных специалистов в этой области, У. Инмон, определяет хранилища данных как "предметно-ориентированные, интегрированные, стабильные, поддерживающие хронологию наборы данных, используемые для поддержки принятия управленческих решений" [39]. Ценность хранилищ данных заключается в том, что они представляют собой крупные базы данных масштаба предприятия, которые содержат определенную информацию и обеспечивают ее оперативное представление в виде, удобном для пользователя или для дальнейшей обработки другими аналитическими системами.
Витрины данных (data marts), как и хранилища, представляют собой структурированные информационные массивы, но их отличие состоит в том, что витрины данных в еще большей степени являются предметно-ориентированными. Как правило, витрина содержит информацию, относящуюся к какому-либо определенному предметному направлению деятельности организации. Поэтому информация в витринах данных хранится в специальном виде, наиболее подходящем для решения конкретных аналитических задач или обработки запросов определенной группы аналитиков.
Что касается систем аналитической обработки данных в режиме реального времени, или OLAP-систем (On-Line Analytical Processing), то их особенность состоит в многомерности хранения данных (в отличие от реляционных таблиц), а также в предрасчете агрегированных значений. Это дает пользователю возможность строить оперативные нерегламентиро-ванные запросы к данным, используя ряд аналитических направлений. Кроме того, для OLAP-систем характерна предметная (а не техническая) структурированность информации, позволяющая пользователю оперировать привычными экономическими категориями и понятиями.
Еще одним элементом BI-платформы, который часто выделяют в отдельную категорию, являются средства обнаружения знаний (data mining). Один из ведущих экспертов в данной области, Г. Пиатецкий-Шапиро, определяет деятельность таких систем как процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности [40]. В деятельности систем обнаружения знаний используются такие методы анализа данных, как фильтрация, деревья решений, ассоциативные правила, генетические алгоритмы, нейронные сети, статистический анализ.
Наконец, к числу BI-систем относятся средства формирования запросов и построения отчетов (query and reporting tools). Такие системы обеспечивают построение запросов к информационно-аналитическим системам в пользовательских терминах, с возможной интеграцией данных из разных источников, а также просмотр информации с возможностью ее детализации и агрегирования, построение отчетов и их печать.
Аналитические приложения
Аналитические приложения (analytic applications) кардинально отличаются от трансакционных систем, поскольку они ориентированы не на обработку отдельных операций, а на анализ агрегированной информации. Для того чтобы информационная система могла считаться аналитическим приложением, она должна удовлетворять следующим критериям [41]]:
Важно не путать аналитические приложения с системами бизнес-интеллекта: их функциональность существенно отличается от BI-систем в трех аспектах - предметной специализации, сегментации рынка и структуре [42].
С точки зрения предметной специализации аналитические приложения предназначены для определенных аналитических бизнес-процессов, в то время как средства бизнес-интеллекта имеют более общие функции. С некоторой долей условности можно сказать, что с аналитическими приложениями работают конечные пользователи-аналитики, а BI-системы используются техническими специалистами в качестве инструмента для создания аналитических приложений для тех же пользователей.
С точки зрения сегментации рынок аналитических приложений может быть структурирован в зависимости от вида аналитических процессов (например, маркетинг, операционное планирование, бюджетирование, консолидация финансовой отчетности), в то время как рынок средств бизнес-интеллекта может быть сегментирован в зависимости от типа архитектуры каждой из систем (например, системы "data mining" или OLAP-системы).
С точки зрения структуры аналитические приложения помогают пользователям координировать бизнес-процессы и получать определенный результат (например, разработанный бюджет или оценку деятельности основных поставщиков), в то время как средства бизнес-интеллекта поддерживают функции, которые заранее в системе не предопределены (построение пользовательских запросов, проведение специализированного анализа и др.).
В то же время развитие аналитических приложений и систем бизнес-интеллекта тесно взаимосвязано. Аналитические приложения способствуют увеличению числа пользователей BI-систем, поскольку именно BI-технологии лежат в основе многих готовых предметно-ориентированных аналитических приложений. В то же время было бы неверным считать, что аналитические приложения могут полностью заменить BI-системы: потребность в настраиваемых программных продуктах, выполняющих специфические функции, не только существует, но и будет расти по мере возникновения новых типов задач в области анализа данных.
Лекция 10
В соответствии с определением Американской ассоциации по управлению запасами и производством (American Inventory and Production Control Society, APICS) термин "ERP-система" может употребляться в двух значениях. Во-первых, это информационная система для идентификации и планирования всех ресурсов предприятия, которые необходимы для производства, закупки, отгрузки и учета в процессе выполнения клиентских заказов. Во-вторых (в более общем контексте), это методология эффективного планирования и управления ресурсами предприятия, которые необходимы для производства, закупки, отгрузки и учета при исполнении заказов клиентов в сферах производства, дистрибуции и оказания услуг.
Практически все ERP-системы построены по модульному принципу, что дает предприятию возможность выбора и внедрения лишь тех модулей, которые ему действительно необходимы. Модули разных систем могут отличаться как по названиям, так и по содержанию. Тем не менее, есть некоторый набор функций, который может считаться типовым для всех программных продуктов класса ERP. Рассмотрим основные функции ERP-систем, условно подразделив их на функции управления запасами и производством, функции учета и управления финансами и функции управления персоналом [44].
Управление запасами и производством
К основным функциям ERP-систем в области управления запасами и производством относятся: управление спецификациями изделий и технологиями производства, планирование операций, управление продажами, управление запасами, управление закупками, управление производственными процессами.
Управление спецификациями изделий и технологиями производства
Современное промышленное производство характеризуется наличием сложных изделий, состоящих из сотен или даже тысяч составных частей - деталей, узлов, агрегатов и т.д. Структура таких изделий может быть схематично представлена в графическом виде, когда на первом (верхнем) уровне располагается само изделие, а на нижестоящих уровнях - те агрегаты, узлы и детали, из которых это изделие состоит.
Схема, отражающая состав сложного изделия, в английском языке получила название bill of material (BOM), в русском языке аналогами являются такие термины, как спецификация, состав изделия или рецептура. В такой схеме одна и та же деталь может присутствовать несколько раз, она может использоваться в составе разных узлов и агрегатов. Процедуру определения связей между различными уровнями изделия называют разузлованием (explosion). Схема разузлования позволяет представить сложное изделие как совокупность элементарных деталей, входящих в его состав. Такое представление изделия исключает дублирование одинаковых компонент, хотя при этом теряется представление о том, какие детали входят в состав отдельных узлов и агрегатов.
Функции управления спецификациями и технологиями ERP-систем позволяют организовать ведение реестра спецификаций, включая специфические характеристики продуктов и условия контроля их качества. При этом для каждой позиции может поддерживаться несколько вариантов спецификаций.
Характеристики технологий производства включают описание последовательностей производственных процессов и отдельных операций, а также всех материалов и трудозатрат, необходимых для производства той или иной продукции. Некоторые ERP-системы (например, применяемые в химической или пищевой промышленности) позволяют динамически корректировать формулы и рецептуры в зависимости от свойств и качества исходных материалов.
Спецификации позволяют определить все необходимые ресурсы, задействованные на разных стадиях производственного процесса, т.е. информацию для текущего планирования материальных потоков и загрузки производственных мощностей. Характеристики изделий и описания технологических процессов также важны и для оперативного управления производством, например, в случаях, когда требуется согласовать спецификации продуктов с особенностями тех или иных производственных линий.
Планирование операций
Функциональность ERP-систем позволяет поддерживать полную иерархию операционного планирования текущего уровня, включая формирование основного производственного плана, планирование потреб-ностей в материалах, планирование загрузки мощностей, а также формирование оперативных объемно-календарных планов.
Функции формирования основного производственного плана дают возможность разработать производственный план, соответствующий как уже имеющемуся портфелю заказов, так и прогнозируемому объему продаж, с учетом доступных ресурсов. При формировании основного производственного плана для каждого периода определяется объем конечной продукции, который необходимо произвести, с учетом ожидаемого спроса, имеющихся запасов и производственных мощностей.
Функции планирования потребностей в материалах позволяют определять, какие материалы и в каком количестве предприятию следует приобрести или произвести на основании основного производственного плана и соответствующих ему производственных заданий.
Функции обобщенного планирования загрузки мощностей предоставляют возможность формирования обобщенных планов загрузки, а также просмотра запланированных потребностей в ресурсах и сравнения их с имеющимися ограничениями. "Обобщенность" означает, что ограничения по ресурсам учитываются на уровне групп оборудования, подразделений или предприятий, и это гарантирует не превышение общего уровня загрузки.
Функции оперативного планирования загрузки мощностей позволяют учитывать динамику и реальное состояние производства. Это дает возможность приводить производственные планы в соответствие с доступными мощностями. Таким образом, средства детального планирования загрузки производственных мощностей позволяют планировать работы в соответствии с основным производственным планом в рамках заданного периода планирования, с учетом производственных и эксплуатационных заданий.
Наконец, ERP-системы позволяют формировать и контролировать исполнение детальных объемно-календарных планов, которые формируются для отдельных производственных заказов, с учетом приоритетов их исполнения.
Управление продажами
В качестве основных функций управления продажами можно выделить ведение информационной базы о клиентах, оценку возможности принятия клиентских заказов к исполнению, управление запасами готовой продукции и ее отгрузкой, расчеты цен заказов, а также обработку клиентских запросов.
Ведение информационной базы о клиентах предусматривает заведение на каждого клиента "электронной карточки", в которой регистрируется вся существенная информация. К такой информации, например, относится наименование клиента, его принадлежность к той или иной категории, контактные данные, платежные реквизиты, типовые условия поставок и оплаты за отгруженную продукцию.
Оценка клиентских заказов служит основой для принятия решения о том, следует ли принять заказ к исполнению или отклонить его. Это первый логический шаг производственного процесса, поскольку именно он предваряет формирование портфеля реальных заказов. В этой части ERP-система дает возможность как обобщенной оценки потенциального заказа, так и его детального анализа.
Формирование заказа сопровождается составлением комплектовочной ведомости, которая содержит информацию об объемах отгрузок, а также о складах, откуда будет производиться отгрузка готовой продукции. На основе таких ведомостей может быть организована автоматическая отгрузка, с автоматическим формированием всех соответствующих документов. Для международных операций документы могут формироваться на языке заказчика и в валюте, определенной для конкретного заказчика. Система также предоставляет возможность начисления различных налогов, скидок и наценок, в зависимости от заказчика или особенностей заказа.
ERP-система может полностью обеспечить процедуру ценообразования, включая определение цен и формирование прайс-листа. Также можно организовать процесс заключения договора, принятие его к исполнению и дальнейший контроль исполнения. При заключении договора определяются такие его условия, как номенклатура, размер партии, стоимость, условия и сроки поставки и оплаты. После этого договор ре-гистрируется и ставится на контроль, а на его основе формируются заявки на изготовление продукции.
Немаловажным моментом в отношениях предприятия с его клиентами является возможность быстро и четко реагировать на клиентские запросы, касающиеся конкретных заказов. Для этого в ERP-системах пре-дусматриваются специальные функции обработки клиентских запросов. Каждый раз, когда клиент интересуется состоянием своего заказа, менеджер может воспользоваться "экраном клиентских запросов", который позволяет получить оперативную информацию обо всех заказах клиента и состоянии финансовых взаиморасчетов. При этом менеджер может получить всю необходимую информацию о конкретном клиенте, отсортировать заказы по датам, клиентам, номерам и статусам заказа, просмотреть детали по любому из заказов и если необходимо - внести изменения и дополнения, просмотреть бухгалтерские проводки по счетам дебиторов для определения кредитного статуса клиента, просмотреть детали переписки и контактов с клиентом, просмотреть складские позиции и забронировать товар, просмотреть предварительные оценки заказов и сформировать заказ.
Управление запасами
ERP-системы позволяют управлять материальными потоками, синхронизируя их по времени, с учетом имеющихся запасов и их использования для производства каждого вида продукции. Соответствующие функции системы позволяют оперативно выявлять проблемы, связанные с запасами. В частности, специальные отчеты позволяют контролировать наличие материалов на складах и в производственных цехах, а также фор-мировать перечни всех материалов, необходимых для выполнения конкретных заказ-нарядов на производство, включая отсутствующие материалы, которые должны быть закуплены или произведены.
В ERP-системе каждый вид запасов подлежит описанию, которое может быть различным для разных категорий материалов. Кроме того, в зависимости от происхождения и роли в процессе производства запасы могут характеризоваться как закупаемые, производимые, перемещаемые, складируемые или нескладируемые.
В части управления складами ERP-система позволяет контролировать состояние каждого склада в режиме реального времени. При этом менеджер может видеть каждую единицу материала или товара независимо от того, где именно она находится, даже если этот тип материала складируется в нескольких местах. Одной из наиболее важных функций является синхронное управление несколькими складами одновременно. При этом на разных складах могут храниться запасы с одинаковыми кодами, а также с одинаковыми или разными наборами счетов, по которым производится учет.
Функции управления запасами ERP-систем, как правило, дополняются набором стандартных отчетов. К их числу относятся отчеты по складским операциям, отчеты о запасах по местам складирования, отчеты о транзитных запасах и другие.
Управление закупками
ERP-системы поддерживают функции, связанные с закупочной деятельностью предприятия. В частности, система позволяет инициировать закупочные операции на основе информации из разных источников. К числу документов, которые могут служить основанием для инициирования закупочных операций, относятся заказы на приобретение сырья и материалов, клиентские заказы, заказ-наряды на производство, заявки на перемещение материалов, план-график выпуска продукции. При этом система позволяет контролировать расход материально-производственных запасов и их пополнение в хронологическом порядке по каждому на-именованию.
Система позволяет контролировать преобразование заявки на закупку в заказ к поставщику, при этом заявка может иметь разные статусы, например, "заявлено", "одобрено", "отклонено", "приостановлено", "преобразовано в заказ", "архив". При преобразовании заявки в заказ все позиции должны иметь статус "одобрено" и иметь соответствующего поставщика.
После формирования заявок на закупку и одобрения заявленных позиций уполномоченным лицом формируются сводные заказы поставщикам. На базе одного заказа на закупку можно осуществить поставку одного и того же изделия по разным объектам управления - филиалам, предприятиям, складам и т.д.
Управление закупками в ERP-системах позволяет отслеживать такие данные, как состояние расчетов с поставщиками (график платежей), тарифы и возможные скидки. Каждая строка заказа на закупку может быть привязана к породившим ее операциям: заказ-наряду на производство, заказу клиента, складскому заказу, заказу на перемещение, проекту. При этом для одного и того же товара или запаса система позволяет использовать различные единицы измерения и обеспечивать их преобразование.
Управление производственными процессами
Современные промышленные предприятия должны иметь возможность применять различные методы производственного менеджмента, в зависимости от особенностей производственных процессов и форм организации производства. Поэтому функциональность производственных модулей ERP-систем включает различные методы управления, позволяющие обеспечить необходимый уровень контроля производства. К таким методам, в частности, относятся метод заказ-нарядов на производство (для управления выпуском продукции под заказ), метод производственных графиков (для управления серийным производством), метод JIT/KANBAN.
Каждая методика имеет свои преимущества, в зависимости от уровня гибкости и желаемой глубины контроля. Управление по заказ-нарядам предлагает самый детальный уровень контроля, но взамен требует боль-шого объема ввода данных. С другой стороны, метод KANBAN предполагает очень простое планирование и контроль операций, но накладывает очень жесткие требования на управление складами. В итоге, каким бы ни был выбранный метод производства, ERP-система предоставляет средства и аналитические данные, которые делают производство эффективным и гибким.
Учет и управление финансами
Сущность финансового и управленческого учета
Формирование финансовой и управленческой отчетности представляет собой одну из функций бухгалтерского учета, являющуюся системой сбора, упорядочения и представления экономической информации, ориентированную на две большие группы пользователей - внешних (инвесторов, кредиторов, органы государственной власти, фискальные органы, общественность) и внутренних (директоров и менеджеров предприятия). Соответственно, исходя из ориентации на ту или иную группу пользователей, выделяют два основных направления бухгалтерского учета - финансовый и управленческий учет.
Финансовый учет (financial accounting) ориентирован, прежде всего, на внешних пользователей экономической информации, он обязателен по закону и ведется в соответствии с официально утвержденными стандартами. Управленческий учет (management accounting) ориентирован, прежде всего, на внутренних пользователей экономической информации. Он не является обязательным, ведется по решению руководства предприятия, а принятые методы, подходы и формы управленческой отчетности определяются из соображений полезности для принятия управленческих решений.
Несмотря на объективные различия, финансовый и управленческий учет тесно связаны между собой. Многие принципы, методы и подходы с одинаковым успехом используются как для формирования внешней фи-нансовой отчетности, так и в управленческих целях.
Типовая учетная функциональность ERP-систем охватывает такие области, как ведение главной книги, расчеты с дебиторами и кредиторами, учет основных средств, учет денежных средств (банковские и кассовые операции), учет материально-производственных запасов, расчеты с персоналом, налоговый учет, формирование бухгалтерской отчетности, а также (что, пожалуй, наиболее важно с точки зрения управления) параллельный учет и аналитические возможности.
Главная книга
Главная книга
Центральное место в учетной системе занимает главная бухгалтерская книга. Ее основное назначение - регистрация всех фактов производственно-хозяйственной деятельности предприятия и создание основы для их последующего анализа.
Основным элементом главной книги является план счетов, который играет роль основного справочника для классификации активов и пассивов компании. Каждый счет определяется его номером. Логически номер счета, как правило, разбивается на главный счет и субсчет. Среди счетов можно выделить бухгалтерские и вспомогательные счета. Бухгалтерские счета соответствуют структуре рабочего плана счетов компании и используются в бухгалтерских проводках. Счета могут быть подразделены на типы в соответствии с методологией бухгалтерского учета: активы, обязательства, капитал, доходы, расходы. Вспомогательные счета служат для структурирования информации (например, в форме заголовков), а также для расчета итогов по группам счетов.
Каждый счет главной книги содержит несколько аналитических кодов, которые позволяют группировать счета и проводки для различных аналитических и управленческих целей.
Для формирования бухгалтерских проводок в ERP-системах, как правило, предусматриваются журналы, каждый из которых относится к определенной области деятельности: например, журналы расчетов с дебиторами, расчетов с кредиторами, расчетов с банком, операций с основными средствами, складских операций, расчетов по заработной плате, закупок, производственных операций, операций по проектам. Данные об операциях накапливаются в бухгалтерских журналах до тех пор, пока они не будут проверены и проведены по счетам главной книги.
Важным свойством ERP-систем является их мультивалютность, т.е. поддержка ведения счетов главной книги, выполнения бухгалтерских проводок и формирования сводной отчетности в разных валютах. Это связано с тем, что даже на относительно небольших предприятиях ведение бизнеса требует представления операций в различных валютах, а также оценки экономической эффективности этих операций с разных точек зрения.
Расчеты с дебиторами
Расчеты с дебиторами
Функции учета расчетов с дебиторами в ERP-системах тесно интегрированы с функциями клиентского обслуживания, которые служат для обработки всех операций с клиентами, в том числе выставление счетов и обработку входящих платежей. Возможности системы, в частности, включают ведение и контроль дебиторских лимитов, ведение прайс-листов и условий предоставления скидок, автоматическое и ручное выстав-ление счетов, обеспечение расчетов с применением векселей, формирование напоминаний об оплате, выставление счетов на оплату пеней и штрафов, отчетность по срокам платежей.
Расчеты с кредиторами
Расчеты с кредиторами
Функции учета расчетов с кредиторами обеспечивают обработку всех операций с поставщиками и подрядчиками, у которых предприятие приобретает товары, работы и услуги. Система предусматривает автома-тическую интеграцию бухгалтерии кредиторов с функциями снабжения и поддерживает выполнение таких операций, как формирование заказов, отражение поступающих к оплате счетов, проведение полных или частичных платежей (в т.ч. с использованием чеков и векселей), выполнение авансовых платежей, составление отчетов по срокам платежей.
Основные средства
Основные средства
Учет основных средств в ERP-системах обеспечивает отражение текущего состояния, движения и амортизации основных средств, к числу которых относятся здания, сооружения, оборудование, вычислительная техника и другие объекты. Возможности системы помогают принимать решения в отношении выбора методов амортизации, списания и замены основных средств.
При выбытии объекта основных средств система автоматически рассчитывает все заданные параметры, а также формирует все необходимые бухгалтерские проводки.
Денежные средства
Денежные средства
Функции учета денежных средств используются для проведения операций (расчетов) через банковские счета предприятия. К числу таких операций относятся формирование заявки на выполнение платежа, подготовка платежного поручения, получение подтверждения (выписки) из банка об исполнении платежа, выверка банковской выписки, формирование соответствующих бухгалтерских проводок. При этом счета, открытые в одном банке, объединяются в одну группу, что обеспечивает наглядность представления информации.
Кроме того, данный модуль предназначен для ведения кассовых операций: выполнения наличных расчетов (поступления денежных средств в кассу, выдачи денежных средств из кассы), бухгалтерского учета операций, ведения кассовой книги, печати первичных документов и соответствующих отчетов (приходных и расходных кассовых ордеров).
Материально-производственные запасы
Оценка материально-производственных запасов при отпуске в производство или ином их выбытии может производиться с применением сплошного метода, метода средней стоимости, FIFO или LIFO. На основе этих методов в ERP-системе реализуются функции производственной бухгалтерии, которые позволяют автоматизировать учет таких операций, как списание в производство сырья, материалов и полуфабрикатов, приходование собственных полуфабрикатов и отходов производства, учет потерь в пределах норм и сверх норм, отнесение расходов на электро-, тепло- и водоснабжение на основное и вспомогательное производство, учет перемещения полуфабрикатов между цехами, учет цеховых транспортных расходов, учет затрат на ремонт.
Расчеты с персоналом
Расчеты с персоналом
Как показывает практика, расчеты с персоналом (заработная плата, расчеты с подотчетными лицами) различаются в разных странах из-за законодательных требований и национальных традиций. Поэтому, несмотря на наличие соответствующей функциональности в "западных" ERP-системах, российские партнеры компаний-разработчиков вынуждены довольно существенно перерабатывать модуль расчетов с персоналом. Тем самым обеспечивается учет российских особенностей без нарушения целостности информационной системы предприятия.
Налоговый учет
Налоговый учет
Важным элементом финансовой составляющей ERP-системы является налоговый учет, позволяющий обеспечить соответствие российскому законодательству в области налогообложения. Налоговая функциональность ERP-систем позволяет автоматически рассчитывать налоги и отражать эти расчеты на соответствующих бухгалтерских счетах. Для каждого из налогов в системе создаются налоговые коды, на основе которых затем формируются налоговые группы и налоговые группы номенклатуры.
Бухгалтерская отчетность
Бухгалтерская отчетность
ERP-системы позволяют автоматически формировать бухгалтерскую отчетность (как годовую, так и промежуточную), предусмотренную соответствующими нормативными документами. В частности, система обеспечивает составление таких форм, как балансовый отчет, отчет о прибылях и убытках, отчет о движении капитала, отчет о движении денежных средств. К числу форм отчетности также относятся приложения к бухгалтерскому балансу, отчет о целевом использовании полученных средств, справка об авансовых взносах налога в бюджет, налоговые декларации, сведения о счетах в рублях и иностранной валюте, расшифровка дебитор-ской и кредиторской задолженности и другие формы отчетности.
Аналитические возможности
Аналитические возможности
Наконец, рассмотрим наиболее важную с точки зрения управленческого учета функциональность ERP-систем - аналитический учет и управленческую отчетность.
Любая ERP-система включает в себя довольно большое число так называемых стандартных отчетов. Эта своеобразная библиотека - результат опыта, накопленного при внедрении системы в разных странах. Примечательно то, что управленческие отчеты (в отличие от финансовой отчетности) не регламентируются никакими внешними нормативными документами и практически не зависят от специфики той или иной страны. Это тот редкий случай, когда функциональность западных разработок может применяться в России без какой-либо дополнительной адаптации.
Наличие стандартных отчетов позволяет любому предприятию составить нужный комплект отчетности на основе тех, которые уже заложены в систему. Но даже если потребуется составить какой-нибудь новый отчет, то это без особого труда можно сделать при помощи специальных средств, которые также встроены в систему.
Для удобства работы пользователей любой отчет можно "выгрузить" в электронную таблицу (например, Microsoft Excel) для последующего анализа и обработки.
Управление персоналом
Модули управления персоналом ERP-систем позволяют собирать, хранить и использовать на практике структурированную информацию о сотрудниках компании, их квалификации и производственном опыте. Прежде всего, обеспечиваются функции кадрового учета, многие из которых регламентируются действующим законодательством. К числу таких функций, в частности, относятся: ведение штатного расписания, ведение списка сотрудников с соответствующими анкетными данными, учет операций по приему и увольнению персонала, формирование табеля учета рабочего времени (включая отражение отпусков и отсутствия сотрудников на работе по болезни или другим причинам), оформление трудовых книжек, формирование необходимой отчетности.
Планирование повышения квалификации сотрудников и их продвижения по службе также может быть реализовано при помощи специальных функций и инструментов. В частности, можно оценивать текущий уровень квалификации и выявлять области возможных улучшений, а затем на основе этого планировать мероприятия, направленные на практическую реализацию выявленных возможностей. Кроме того, имеется возможность автоматизации управления учебными программами и тренингами, как внешними, так и внутрикорпоративными.
Ограниченность ERP-систем
Роль ERP-систем в управлении ресурсами предприятия трудно переоценить. Такие системы представляют собой важнейший элемент текущего и оперативного управления основной деятельностью (операциями) предприятия, включая материальные запасы, производственные мощности, трудовые ресурсы и, конечно же, финансы.
Тем не менее, было бы неверным считать ERP универсальным инструментом, решающим абсолютно все управленческие задачи [43]. Действительно, ERP-система имеет дело со всеми видами ресурсов, но это вовсе не означает, что она обеспечивает все виды управления. И методология, и технология ERP имеют свои рамки, в которых они исторически разрабатывались и развивались. Есть некоторый набор функций и организационных принципов, которые можно считать базовыми для всех систем этого класса. При этом отличия одних программных продуктов от других сводятся к вариациям этих базовых функций (глубине проработки и, возможно, ориентации на определенные типы производства), а также к некоторым дополнительным функциям.
В то же время есть ряд задач управления, выходящих за рамки ERP, и это признают даже сами разработчики таких систем. К таким задачам, в частности, относятся стратегическое управление, долгосрочное и среднесрочное корпоративное планирование, а также многие аналитические задачи. Характерный пример - корпоративное бюджетирование. С одной стороны, в ERP-системе имеется вся информация, необходимая для полноценного бюджетирования, - данные о продажах, закупках, запасах, финансовых вза-имоотношениях с контрагентами. Но, с другой стороны, бюджетный период, как правило, существенно превышает горизонт планирования, охватываемый планами текущей деятельности, которые формируются при помощи ERP-системы. Поэтому ERP-система может предоставить лишь некоторую часть данных для построения корпоративного бюджета, а также обеспечить учетную информацию для план-факт анализа.
В результате одного из исследований, посвященных перечисленным проблемам, были выделены несколько причин ограниченности ERP как систем управления [41].
Результаты упомянутого исследования подтверждают, что функциональность ERP-систем не может считаться достаточной ни для принятия управленческих решений на стратегическом уровне, ни для оперативного анализа информации.
Один из путей решения перечисленных задач - развитие самих ERP-систем в сторону повышения их аналитической функциональности. Это действительно дает определенный эффект, но в основном на уровне управления операциями. Однако на стратегическом уровне управления возможности ERP-систем все же оказываются ограниченными. Именно это и привело к появлению остальных уровней "аналитической пирамиды", включая системы бизнес-интеллекта и аналитические приложения.
Таким образом, в силу ряда причин ERP-системы, ориентированные на управление текущей деятельностью, не могут обеспечить решение стратегических задач. Однако они выполняют ряд важных функций, которые крайне необходимы с точки зрения информационной поддержки корпоративного управления и стратегического менеджмента.
Во-первых, ERP-системы обеспечивают процессы текущего планирования и оперативного управления деятельностью предприятий. При этом в качестве основы для текущего планирования выступают данные, сформированные системой корпоративного планирования и бюджетирования. Таким образом, обеспечивается преемственность и согласованность трех уровней управления - стратегического, тактического и оперативного, что позволяет обеспечить ориентацию текущей деятельности компании на решение стратегических задач.
Во-вторых, ERP-системы (точнее, их учетные модули) представляют собой основной источник фактической информации для системы информационной поддержки корпоративного управления и стратегического менеджмента, поскольку именно они обеспечивают регистрацию операций и обобщение трансакционных данных. Эта информация впоследствии используется на корпоративном уровне для анализа и контроля реализации стратегий.
В-третьих, именно ERP-системы формируют "индивидуальную" финансовую отчетность, т.е. отчетность отдельных предприятий. Такая отчетность представляет самостоятельную ценность, поскольку она является публичной и становится доступной для всех стейкхолдеров после ее опубликования. Кроме того, индивидуальная финансовая отчетность используется на корпоративном уровне в качестве исходной информации для формирования консолидированной финансовой отчетности, дающей пользователям экономической информации представление о группе компаний в целом.
Можно сделать вывод о необходимости интеграции ERP-систем с аналитическими системами стратегического уровня. Такая интеграция позволяет обеспечить всех заинтересованных лиц (и прежде всего - руко-водителей и менеджеров предприятия) качественной управленческой информацией для принятия обоснованных управленческих решений.
Лекция 11
Типичная ситуация, характерная для практически любой достаточно крупной организации, - наличие множества систем автоматизации для решения разных задач, разрозненное хранение данных и, как следствие, - отсутствие единого взгляда на управленческую информацию [45]. Создается парадоксальная ситуация. С одной стороны, в информационных системах предприятия имеется вся информация, необходимая для анализа. Но, с другой стороны, анализировать информацию, хранящуюся в различных трансакционных системах, базах данных и электронных таблицах, становится невозможно.
Основная причина - различия в форматах данных и разрозненность их хранения. Для того чтобы превратить такие данные в полезную информацию, аналитик должен не только понимать, в каких источниках эти данные находятся, но и знать их структуру и форматы. Кроме того, надо быть готовым к ситуациям, когда одни и те же данные дублируются в разных системах или когда между данными из разных источников имеются логические несоответствия. Ситуация еще более усложняется по мере появления новых систем и модулей, а следовательно - и новых данных. Также следует учитывать, что получение данных из трансакционных систем сопровождается повышенной нагрузкой на эти системы, а это может существенно мешать оперативной работе.
Еще одна проблема аналитической обработки информации связана с человеческим фактором. Во многих компаниях задача получения необходимого отчета автоматизируется силами двух специалистов - технического специалиста, обеспечивающего необходимые запросы к базам данных, и экономиста, пытающегося свести эти данные в единый аналитический отчет, необходимый руководству. Как показывает практика, подобная модель взаимодействия пользователя отчета (руководителя) и самих данных не только требует существенных затрат времени, но и часто приводит к эффекту "испорченного телефона". Кроме того, экономист зачастую оказывается просто не в состоянии без помощи программиста оперативно подготовить необходимую выборку и ответить на вопросы о том, каким образом были получены те или иные цифры. О том, чтобы моделировать возможные ситуации, отслеживать влияние одних показателей на другие, прогнозировать тенденции развития, проводить сравнительный анализ и отображать различные срезы данных, как правило, не идет и речи.
В 80-е годы XX века упомянутые проблемы привели к идее централизованного хранения данных, необходимых для последующего анализа. При этом было признано, что все исходные данные должны храниться в одном месте, в простой и понятной (а значит, удобной для анализа) структуре. Именно в этот период возник термин "хранилище данных". За прошедшие с тех пор четверть века идеи централизованного хранения данных получили существенное развитие, чему в немалой степени способствовали рост вычислительных мощностей, новые сетевые архитектуры и интернет-технологии.
Функциональность
Напомним определение У. Инмона: хранилища данных - это "предметно-ориентированные, интегрированные, стабильные, поддерживающие хронологию наборы данных, используемые для поддержки принятия управленческих решений" [39].
Данные в хранилище попадают из оперативных (трансакционных) систем, а также из внешних источников. По аналогии с "материальными" хранилищами, хранилища данных предусматривают такие операции, как сбор данных ("приход материалов на склад"), хранение данных ("складской запас"), перемещение в витрины данных ("отгрузка товаров в розничную сеть").
С экономической точки зрения, хранилище данных приносит долгосрочный эффект тогда, когда оно становится надежным механизмом доставки данных, существенных для анализа и принятия решений. При этом не следует забывать и о затратной части: ведь информация может считаться действительно полезной лишь тогда, когда экономические выгоды от ее использования превышают затраты, связанные с ее приобретением. Построение хранилища данных - достаточно сложный проект и обеспечить его окупаемость в краткосрочной перспективе бывает непросто [45].
В качестве основы хранилища данных, как правило, используется реляционная модель хранения данных, что существенно облегчает дальнейшее развитие такого хранилища. Впрочем, существует и другой путь - применение оптимизированных структур, например, многомерных (по этому пути пошли разработчики компании SAP в своем продукте SAP BW). Однако, по мнению ряда исследователей (например, У. Инмона [46]), такой подход имеет целый ряд недостатков, не являясь достаточно гибким и универсальным. В самом деле, если данные из хранилища поступают лишь в ограниченное количество витрин данных и аналитических приложений, то от хранилища вовсе не требуется поддерживать специализированные запросы. В этом отношении использование реляционных баз данных экономичнее (без потери функциональности), а следовательно, - предпочтительнее.
После того, как хранилище построено, встает вопрос об использовании данных конечными пользователями. При этом могут применяться различные средства (от специализированных средств создания пользовательских запросов и отчетов до электронных таблиц), в зависимости от решаемых задач, предпочтений и опыта пользователей. И все же есть целый спектр задач, которые предъявляют к информационным системам особые требования: это задачи с необходимостью оперативной (т.е. в режиме реального времени) обработки достаточно больших объемов данных, в разных аналитических разрезах. Экономический анализ, как правило, бывает многомерным: информация может быть сгруппирована и консолидирована по разным признакам, причем разные группы пользователей информации заинтересованы в разных способах группировки.
Таким образом, превращение разрозненных данных в структурированную информацию, описанную в экономических терминах и обеспечивающую поддержку принятия управленческих решений, можно считать одной из самых актуальных задач. При этом обработка данных и принятие решений должны быть настолько оперативными, насколько этого требуют интересы бизнеса. Именно для этого предназначены специальные системы аналитической обработки данных в режиме реального времени - OLAP-системы.
Функциональность
Идея обработки многомерных данных восходит к 1962 году, когда К. Айверсон опубликовал свою работу "Язык программирования" (A Programming Language, APL) [47]. APL - это математически определенный язык с многомерными переменными и изящными, но довольно абстрактными операторами. В 70-е и 80-е годы он активно использовался во многих деловых приложениях, функционально схожих с современными OLAP-системами.
В 1993 году вышла в свет статья Е. Ф. Кодда, в которой впервые было дано формальное определение OLAP-технологии [48]. Эта работа получила большой резонанс и привлекла внимание к возможностям многомерного анализа. В статье были описаны двенадцать правил OLAP, к которым чуть позже (в 1995 году) были добавлены еще несколько. Все эти правила были разделены на четыре группы и названы "характеристиками" (features).
К правилам OLAP относятся:
Универсальным критерием определения OLAP как аналитического инструмента является тест FASMI (Fast Analysis of Shared Multidimensional Information - быстрый анализ разделяемой многомерной информации). Рассмотрим детально каждую из составляющих этой аббревиатуры [49].
Fast (быстрый). Это свойство означает, что OLAP-система должна обеспечивать ответ на запрос пользователя в среднем за пять секунд, при этом большинство запросов обрабатываются в пределах одной секунды, а самые сложные запросы должны обрабатываться в пределах двадцати секунд.
Analysis (аналитический). OLAP-система должна справляться с любым логическим и статистическим анализом, характерным для бизнес-приложений, и обеспечивать сохранение результатов в виде, доступном для конечного пользователя. Средства анализа могут включать процедуры анализа временных рядов, распределения затрат, конверсии валют, моделирования изменений организационных структур и другие.
Shared (разделяемый). Система должна предоставлять широкие воз-можности разграничения доступа к данным и одновременной работы многих пользователей.
Multidimensional (многомерный). Система должна обеспечивать кон-цептуально многомерное представление данных, включая полную поддержку множественных иерархий.
Information (информация). Мощность различных программных про-дуктов характеризуется количеством обрабатываемых входных данных. Разные OLAP-системы имеют разную мощность: наиболее мощные из них могут оперировать, по крайней мере, в тысячу раз большим количеством данных по сравнению с самыми маломощными. При выборе OLAP-инструмента следует учитывать целый ряд факторов, включая дублирование данных, требуемую оперативную память, использование дискового пространства, эксплуатационные показатели, интеграцию с информационными хранилищами и т.п.
Обсуждая тему OLAP, следует упомянуть и о разновидностях многомерного хранения данных. Дело в том, что информационные массивы, логически упорядоченные по аналитическим направлениям и, таким образом, являющиеся многомерными с точки зрения конечных пользователей, не обязательно являются многомерными по их технологической реализации. Как правило, выделяют три разновидности хранения данных [45]:
Выбор способа хранения зависит от нескольких факторов, таких как объем и структура данных, скорость выполнения запросов, частота обновления OLAP-кубов.
Функциональность
Средства формирования запросов и построения отчетов обеспечивают функции построения запросов к информационно-аналитическим системам, интеграцию данных из нескольких источников, просмотр данных с возможностью их детализации и обобщения, построение и печать отчетов, в том числе презентационного качества. Некоторые из программных продуктов этого класса могут использоваться конечными пользователями, с минимальной поддержкой ИТ-департамента, другие же требуют определенного программирования и настраиваются техническими специалистами [45].
С точки зрения конечного пользователя, такие системы - удобный инструмент, позволяющий решить уже упоминавшуюся проблему "единого взгляда" на управленческую информацию. В этом плане BI-решения позволяют существенно упростить и ускорить сбор информации, унифицировать ее и представить в удобной и наглядной форме. Такая информация - надежная база для принятия управленческих решений, при этом рутинные процедуры сводятся к минимуму, а время специалистов высвобождается для решения аналитических задач.
Лекция 12
В качестве примеров аналитических приложений, расположенных на вершине "аналитической пирамиды" рассмотрим:
BSC-системы, системы корпоративного планирования и бюджетирования и системы консолидации финансовой отчетности представляют собой три основных типа аналитических приложений корпоративного уровня, входящие в состав комплексных систем управления эффективностью бизнеса (Business Performance Management, BPM). В то же время имеется довольно большое количество систем, которые по своей сути также являются аналитическими, хотя и применяются не столь масштабно - для решения отдельных, иногда специфических задач.
Сущность концепции BPM
90-е годы прошлого века ознаменовались интенсивным развитием аналитических систем, включая BI-системы и аналитические приложения. На определенном этапе была признана необходимость их интеграции - и методологической (функциональной), и технологической. Так появилось новое направление, получившее название Business Performance Management (BPM), что на русский язык обычно переводится как "управление эффективностью бизнеса" (хотя такой перевод представляется не вполне корректным). В общих чертах, BPM - это целостный, процессно-ориентированный подход к принятию управленческих решений, направленный на улучшение способности компании оценивать свое состояние и управлять эффективностью своей деятельности на всех уровнях, путем объединения собственников, менеджеров, персонала и внешних контрагентов в рамках общей интегрированной среды управления [50].
Приведем определение, разработанное группой по стандартизации BPM.
Business Performance Management (BPM) - это методология, направленная на оптимизацию реализации стратегии и состоящая из набора интегрированных циклических аналитических процессов, которые поддерживаются соответствующими технологиями и имеют отношение как к финансовой, так и к операционной информации. BPM позволяет предприятию определять, измерять и управлять эффективностью своей деятельности, направленной на достижение стратегических целей. Ключевые финансовые и операционные процессы BPM включают планирование, консолидацию и отчетность, анализ ключевых показателей эффективности и их распространение в рамках организации [51].
Заметим, что, как и в случае с термином ERP, понятие "BPM-система" может употребляться в двух значениях: как концепция управления (определенный подход к принятию управленческих решений и их практической реализации) и как информационная система (комплекс программных и технических средств, поддерживающих идеологию BPM и обеспечивающих ее практическую реализацию).
К сожалению, сложилось так, что разные организации (включая аналитиков рынка и разработчиков программного обеспечения) стали использовать разные термины для обозначения одного и того же понятия. Сегодня в литературе можно встретить, как минимум, четыре различные аббревиатуры:
Также нельзя не отметить досадное совпадение: аббревиатура BPM имеет и другую расшифровку - Business Process Management (управление бизнес-процессами). Этот термин используется, в частности, компанией IDS Scheer - одним из мировых лидеров в области управления бизнес-процессами и разработки соответствующего программного обеспечения.
Так или иначе, несмотря на некоторые терминологические проблемы, понятие BPM уже завоевало себе право на жизнь и признано как специалистами в области управления, так и ведущими компаниями - аналитиками рынка информационных технологий. По сути дела, концепция BPM превратилась в самостоятельное направление, имеющее не только определенную теоретическую идею, но и методики и технологии ее практической реализации.
Функциональность BPM-систем
В соответствии с документом, разработанным Группой по стандартизации BPM, в качестве основных процессов, охватываемых BPM-системами, можно выделить следующие [51].
В части формализации стратегии BPM-системы позволяют менеджерам разрабатывать стратегии и доводить их до подразделений компании, выявлять возможности создания стоимости и формировать системы метрик, позволяющих оценивать эффективность бизнеса и ее динамику.
В части планирования BPM-системы позволяют менеджерам всех подразделений компании устанавливать свои локальные цели, разрабатывать и моделировать сценарии планирования, разрабатывать программы и бюджеты, поддерживающие бизнес-стратегию, а также формировать целевые значения определенных показателей для различных временных периодов.
В части мониторинга и анализа BPM-системы позволяют оценивать индивидуальную и групповую эффективность с применением соответствующих ключевых показателей на всех организационных уровнях, а также предоставляют пользователям дополнительную информацию, помогающую им предпринимать те или иные действия.
В части корректирующих воздействий BPM-системы помогают менеджерам своевременно реагировать на возникающие ситуации и отклонения.
Приведенная классификация построена в соответствии с циклом стратегического управления: первые две группы процессов связаны с формированием и реализацией стратегий (целеполагание и трансформация стратегий в планы), вторые две группы - с обеспечением обратной связи (контроль, корректировка целей и планов). В этом отношении классификация достаточно детально отражает структуру функциональных областей BPM. Однако, с другой стороны, она вряд ли подходит для классификации информационных систем, обеспечивающих перечисленные функции. Дело в том, что конкретные программные продукты, как правило, реализуют не одну, а сразу несколько ключевых функций, относящихся к разным функциональным областям и используемых на разных стадиях цикла стратегического управления.
Например, информационные системы, поддерживающие разработанную Р. Капланом и Д. Нортоном методологию Balanced Scorecard [52], часто называемые BSC-системами, позволяют структурировать стратегические цели организации, формировать системы ключевых показателей (как финансовых, так и нефинансовых), декомпозировать эти показатели вплоть до нижнего уровня управленческой пирамиды, а затем - осуществлять мониторинг достижения целей и строить на этой основе корпоративную систему мотивации, обеспечивающую координацию усилий отдельных подразделений и бизнес-единиц. Таким образом, BSC-системы включают в себя все компоненты раздела "формализация стратегии". В то же время совокупность индикаторов дает менеджерам возможность оценить, насколько успешно компания продвигается в заданном направлении и насколько его текущая деятельность соответствует утвержденной стратегии. Эти функции соответствуют разделу "мониторинг и анализ". Наконец, BSC-системы позволяют создавать уведомления и поддерживают процессы корректировки целей, что соответствует разделу "корректирующие воздействия".
Аналогичные рассуждения применимы и к системам корпоративного планирования и бюджетирования. Прежде всего, такие приложения содержат всю необходимую для планирования функциональность, включая ведение аналитических направлений и классификаторов, описание финансовой структуры и принципов взаимодействия, учет трендов, анализ отклонений и т.п. Такие системы учитывают потребности крупных организаций, позволяя составлять бюджеты для каждой бизнес-единицы и для каждого из структурных подразделений, при этом консолидация информации может осуществляться на любом из уровней организационной структуры [53]. Перечисленные функции представляют раздел "планирование". Кроме того, системы планирования и бюджетирования позволяют производить план-факт анализ на основе информации из транс-акционных систем (раздел "мониторинг и анализ"), а также осуществлять корректировку планов и бюджетов (раздел "корректирующие воздействия"). Наконец, современные системы этого класса обладают развитой функциональностью в области организации бюджетного процесса, что дает возможность координировать усилия специалистов разных подразделений, обеспечивая тем самым коллегиальность стратегического управления (функциональность раздела "формализация стратегии").
В то же время существуют приложения, возможности которых относятся всего лишь к одной из функциональных компонент, приведенных в классификации. Примером могут служить системы консолидации финансовой отчетности, функциональность которых относится к одной из компонент раздела "мониторинг и анализ". Такие системы позволяют организовать сбор финансовой отчетности всех организаций, входящих в состав группы, обеспечить процедуры консолидации в соответствии с национальными или международными стандартами и в результате сформировать полный комплект консолидированной финансовой отчетности.
Таким образом, концепция управления эффективностью бизнеса может применяться для предприятий и организаций самых разных отраслей, включая организации социальной сферы. Эта концепция имеет непосредственное отношение к стратегическому менеджменту, поскольку она предусматривает целый ряд важных управленческих функций, включая формализацию стратегии и определение ключевых показателей, планирование, мониторинг и анализ, а также обеспечение необходимой обратной связи и корректирующие воздействия. С другой стороны, концепция BPM тесно связана с задачами корпоративного управления, позволяя обеспечить информационную прозрачность организации для заинтересованных лиц, в частности, путем формирования и представления корпоративной отчетности.
Balanced Scorecard и другие методики управления по ключевым показателям
Развитие теории управления привело к появлению методологии сбалансированных систем показателей (Balanced Scorecard, BSC), которую ее создатели, Р. Каплан и Д. Нортон, определяют как инструмент, позволяющий трансформировать миссию и стратегию организации в исчерпывающий набор показателей эффективности, которые служат основой для системы стратегического управления и контроля [52]. Именно эта теория на сегодняшний день получила всеобщее признание и, несмотря на наличие целого ряда аналогичных методик, все чаще воспринимается как "стандарт де-факто".
Возникновение Balanced Scorecard относится к началу 90-х годов, когда был разработан новый подход к оценке результативности деятельности компании, позволяющий преодолеть ограниченность традиционных методов. Важным новшеством стало то, что набор измеряемых показателей, по которым оценивалось предприятие, был расширен, и в него, помимо привычных финансовых показателей, были включены нефинансовые параметры - сведения о клиентах, внутренних процессах, обучении и развитии. Кроме того, вместо ретроспективных показателей в процессе анализа стали учитываться и "опережающие индикаторы", позволяющие оценивать состояние компании с учетом перспектив в будущем.
Дальнейшее развитие методологии Balanced Scorecard характеризуется переходом от простой оценки показателей эффективности к управлению стратегическим развитием компании. Для этого Капланом и Нортоном была разработана карта стратегии (strategy map), которая дает визуализированное представление стратегии в виде стратегических целей, показателей и причинно-следственных связей.
В карте стратегии Каплана и Нортона выделяются четыре аспекта (перспективы):
Связующим звеном между четырьмя перечисленными перспективами служат причинно-следственные связи (cause and effect linkages). Известно, что любая организация представляет собой сложный организм, и изменение в какой-то одной области практически неизбежно влечет за собой изменения в нескольких других областях.
Перечисленные перспективы включают в себя цели (objectives), связанные между собой причинно-следственными связями. Цели - это ориентиры, характеризующие желаемое состояние организации в будущем. Можно сказать, что именно цели определяют то, как стратегия будет трансформирована на операционный уровень. При этом различные цели и группы целей закрепляются за конкретными уровнями менеджмента, определяющими их достижение. Отметим, что для целей организации, так же как и для перспектив, характерно наличие причинно-следственных связей: действия, направленные на достижение одной цели, способствуют (а иногда и препятствуют) достижению других целей.
Наконец, необходимым элементом Balanced Scorecard являются стратегические инициативы (strategic initiatives), представляющие собой конкретные действия и/или программы действий по реализации стратегии и достижению стратегических целей. По сути дела, стратегические инициативы - это перечень усилий, которые следует предпринять для достижения стратегического результата. Иначе говоря, стратегические инициативы представляют собой не что иное, как тактические мероприятия, позволяющие реализовать стратегию.
В результате детализации и описания зависимостей определяются целевые показатели, характеризующие успехи (или неудачи) в тех или иных стратегических областях. Как правило, количество таких параметров не должно превышать двух-трех десятков, что дает возможность контролировать их взаимосвязь. При этом часто приходится констатировать конфликт целевых показателей: например, задача снижения затрат вступает в противоречие с задачей поддержания необходимого квалификационного уровня сотрудников, поскольку программы повышения квалификации не бесплатны. В таких случаях от руководителей компании требуется найти некоторую "золотую середину", не противоречащую стратегическим целям компании. В результате такого анализа и формируется Balanced Scorecard - сбалансированная система показателей.
Таким образом, при помощи набора "стратегические перспективы - цели - измерители - целевые показатели - стратегические инициативы" система Balanced Scorecard позволяет выстроить сквозную связь между стратегией и тактикой организации, в результате чего задача трансформации стратегии в реальные действия оказывается решена. Кроме того, такая система позволяет не только формализовать стратегию, но и контролировать успешность ее реализации за счет измерителей и значений целевых показателей.
Balanced Scorecard по праву можно назвать наиболее популярной среди методик стратегического управления. Но это не означает отсутствия других методов и подходов, многие из которых также получили достаточно широкое распространение и признание. Примерами таких разработок могут служить методика управления стоимостью компании (Value Based Management, VBM), а также методика tableau de bord, разработанная и получившая распространение во Франции.
Функциональность BSC-систем
На определенном этапе развитие методологии стало сопровождаться появлением информационных систем, поддерживающих функции информационной поддержки процессов управления на основе сбалансированных систем показателей. Такие системы, представляющие собой инструментальные средства для реализации методологии Balanced Scorecard, получили называние BSC-систем (что, впрочем, не исключает возможности их применения для реализации других подходов, связанных с формированием систем ключевых показателей).
В конце 90-х годов при участии Р. Каплана и Д. Нортона были разработаны стандарты функциональности BSC-систем, которые содержали минимальные требования, необходимые для формирования сбалансированных систем показателей [54]. Документация по функциональным стандартам BSC-систем включает четыре раздела:
С точки зрения построения BSC-система должна обеспечивать взгляд на стратегию с точки зрения четырех перспектив (финансы, клиенты, внутренние процессы, обучение и рост), позволять устанавливать стратегические цели для каждой перспективы, связывать цели с показателями эффективности, описывать причинно-следственные связи, устанавливать целевые значения показателей, поддерживать реестр стратегических инициатив.
С точки зрения коммуникаций система должна содержать функции, позволяющие пользователям взаимодействовать друг с другом. В частности, система должна обладать возможностями описания и документирования целей, показателей, целевых значений и стратегических инициатив.
С точки зрения практической реализации система должна позволять описывать взаимосвязь между стратегическими инициативами, используемыми для реализации стратегии, и соответствующими стратегическими целями.
С точки зрения обратной связи функциональность системы должна обеспечивать минимально возможный промежуток времени между получением информации и принятием решения. Например, графические индикаторы должны давать четкое представление о расхождениях между целевыми и фактическими результатами и помогать выявлять области бизнеса, требующие особого внимания. Но при этом система не должна требовать "механического" реагирования на те или иные сигналы: необходима свобода суждений менеджера, в том числе на основе деловой интуиции и субъективных оценок.
Таким образом, стандарты функциональности BSC-систем предусматривают как методологические функции, так и вопросы организации процессов стратегического управления.
Основы корпоративного планирования и бюджетирования
Система планов любой организации носит иерархический характер, при этом различные планы отличаются друг от друга по горизонту планирования и степени детализации. Некоторые виды планов формируются и поддерживаются трансакционными системами (например, ERP или автоматизированными банковскими системами) - это планы "нижнего уровня", которые характеризуются высокой степенью детализации и относительно небольшими горизонтами планирования. Но для того, чтобы сформировать эти планы, трансакционные системы нуждаются в информации, которая должна поступить из планов более высокого уровня - стратегического бизнес-плана, плана продаж и операций и (для производства) основного производственного плана. Эти планы, относящиеся к компетенции систем управления эффективностью бизнеса, формируются на основе агрегированной информации и охватывают более длительные интервалы планирования. Оба уровня систем управления - BPM и трансакционные системы (ERP и другие) - "смыкаются" на уровне одного из планов (для производства это - основной производственный план), который формируется в BPM-системе и затем передается в ERP-систему в качестве исходной информации, на основе которой затем строятся планы более низкого уровня.
Таким образом, следует отметить существенное отличие систем планирования корпоративного уровня (в BPM-системах) от модулей планирования ERP-систем. Это отличие заключается в том, что планирование корпоративного уровня охватывает всю компанию (или даже группу компаний), ведется в агрегированных показателях, в рамках достаточно дли-тельных плановых периодов (например, год с разбивкой по кварталам или месяцам). Что касается ERP-систем, то они обеспечивают текущее (краткосрочное) планирование, с применением более детальных показателей, в рамках отдельных подразделений и производственных участков. Таким образом, обе категории систем планирования в совокупности охватывают полный спектр планов - от стратегических до оперативных. Далее, говоря о системах планирования и бюджетирования, будем иметь в виду системы корпоративного уровня.
Построение финансового плана (бюджета) происходит по определенным правилам. Отправной точкой при этом служат разного рода прогнозы - прогноз продаж и прогноз наличия (доступности) необходимых ресурсов. После этого определяется принципиальный бюджетный фактор (часто называемый лимитирующим фактором) - то, что ограничивает деятельность предприятия и принятие соответствующих управленческих решений. Такое ограничение может быть как внешним по отношению к предприятию (емкость рынка или платежеспособный спрос), так и внутренним (ограничения по производственным мощностям и доступности других ресурсов). Для ограничений, которые желательно устранить, определяется принципиальная возможность такого устранения, а также то, с какими затратами это будет связано. Наконец, происходит построение системы планов (бюджетов), в результате чего структура корпоративного бюджета наполняется реальной информацией.
Как правило, структурирование корпоративного бюджета предусматривает наличие двух групп планов - функциональных бюджетов и основного бюджета (иногда его называют мастер-бюджетом). Типовая структура бюджета схематично может быть представлена так, как показано на рис.12.1. Приведенную структуру можно считать наиболее типичной и универсальной для предприятия промышленного производства, хотя даже организации одной отрасли, как правило, модифицируют эту схему с учетом собственной специфики.
Рис. 12.1. Типовая структура бюджета предприятия
Основной бюджет консолидирует информацию, представленную в перечисленных функциональных бюджетах, и, как правило, включает три основные составляющие:
Кроме того, основной бюджет часто дополняется таким элементом, как бюджет капитальных вложений (инвестиционный бюджет). По сути, этот бюджет представляет собой "выжимку" из вышеперечисленных частей основного бюджета в части капитальных затрат и проектов. Например, основные средства, приобретение которых относится к инвестиционному бюджету, найдут отражение в бюджетном балансе, их амортизация - и в балансе, и в бюджетном отчете о прибылях и убытках, а платежи, связанные с их приобретением - в бюджете движения денежных средств.
Еще раз подчеркнем, что приведенная схема - это лишь один (хотя и наиболее типичный) из вариантов структурирования корпоративного бюджета. Поэтому в реальной работе она должна восприниматься как основа для построения индивидуальной структуры, ориентированной на задачи конкретного предприятия и учитывающей его особенности.
Функции формирования и анализа бюджетов (как функциональных, так и основных), реализуются при помощи специализированных информационных систем планирования и бюджетирования. Рассмотрим основные функции таких систем [50], [55], [53].
Многомерное хранение информации
Для хранения управленческой информации системы планирования и бюджетирования, как правило, используют многомерные базы данных, что дает возможность воспользоваться преимуществами OLAP-технологий.
По сути дела, управленческая информация хранится в многомерном кубе, грани которого (аналитические направления) имеют конкретную экономическую интерпретацию: план счетов (бюджетные статьи), календарь планирования, валюты, объекты (центры финансовой ответственности), виды продукции, рынки и т.п. Некоторые из аналитических направлений (например, план счетов и календарь) являются обязательными, а другие определяются пользователями.
План счетов
Для систематизации и структурирования показателей планирования предусмотрен план счетов, который, по сути, является структурой плановых или бюджетных статей. План счетов может иметь иерархическую структуру и предусматривает детализацию до необходимого уровня.
Непосредственно в структуре счетов можно описывать арифметические зависимости между показателями, при этом более сложные взаимосвязи между счетами могут описываться при помощи специальных расчетных процедур - бизнес-правил.
Календарь планирования
Календарь позволяет описать горизонт планирования и его разбивку на отдельные интервалы времени. При этом обеспечивается иерархическое представление временных интервалов. Например, данные первого полугодия могут быть детализированы по месяцам, данные второго полугодия - по кварталам, а перспективные показатели, выходящие за пределы текущего года, могут относиться к соответствующему году без какой-либо детализации.
Мультивалютность
Планирование, прогнозирование и анализ финансовой информации могут производиться как в одной, так и в нескольких валютах. Для каждого из центров финансовой ответственности (ЦФО) указывается его локальная (базовая) валюта, которая, по умолчанию, считается валютой ввода финансовой информации для данного ЦФО. При необходимости валюта ввода данных может быть изменена на уровне бюджетной строки или даже отдельной ячейки. Это очень удобно для мульти-национальных корпораций и компаний, имеющих зарубежные отделения, поскольку позволяет участникам бюджетного процесса, находящимся в разных странах, использовать для планирования свои национальные валюты.
Бизнес-правила
Бюджетная модель может потребовать применения более сложных расчетов, чем арифметические действия, определяемые иерархией аналитических направлений. Для этого в системе предусмотрены специальные средства описания расчетных процедур (бизнес-правил). С их помощью можно производить сложные многошаговые вычисления, применять распределения и формулы экономических расчетов, а также использовать глобальные параметры - предпосылки и допущения, являющиеся общими для нескольких счетов.
Описание финансовой структуры предприятия
В процессе планирования взаимоотношения между сотрудниками должны выстраиваться определенным образом, в соответствии с финансовой структурой предприятия, т.е. совокупностью и иерархией центров финансовой ответственности (ЦФО). Поскольку аналитические направления допускают иерархическое представление, в системе можно описать отношения подчиненности, с учетом финансовой структуры предприятия. При этом можно указывать любую уместную информацию, например географические регионы, отделы или филиалы.
Описание пользователей
Системы корпоративного планирования и бюджетирования рассчитаны на одновременную работу большого количества пользователей в условиях централизованного процесса планирования, охватывающего все подразделения, филиалы и дочерние структуры корпорации. При этом пользователи подразделяются на следующие категории:
Сценарии и версии
В любой достаточно крупной организации планирование носит многовариантный характер. Для этого система должна позволять описывать различные вариации планов и бюджетов; при этом подразумевается, что любой из версий может соответствовать собственная процедура согласования.
Сценарии могут охватывать различные временные интервалы. При описании сценария указывается категория данных (например, "плановые", "фактические" или "прогнозируемые"), а также соответствующие данному сценарию период времени и таблица курсов валют. Когда планировщики вводят данные, соотнесенные определенному сценарию, им доступны только годы и периоды в пределах установленного для данного сценария диапазона (данные других периодов доступны только для чтения).
Когда бюджетная модель является мультивалютной, за сценарием должна быть закреплена таблица обменных курсов. Если за разными сценариями закрепить разные таблицы курсов валют, это даст возможность моделировать последствия различных допущений относительно валютных котировок.
Версии бюджета придают процессу планирования дополнительную гибкость и могут иметь различную интерпретацию по отношению к определенному плану, например: предварительный или окончательный вариант плана, оптимистическая, пессимистическая или наиболее вероятная оценка показателей, внутренние или внешние данные.
Управление процессом планирования
Важным свойством современных автоматизированных систем планирования и бюджетирования является поддержка функций управления бюджетным процессом, позволяющих организовать формирование бюджетов, их согласование, утверждение, а также последующий контроль исполнения [55].
Как показывает практика, рассмотренная функциональность автоматизированной системы корпоративного планирования и бюджетирования является достаточной для организации бюджетного процесса даже в очень крупных организациях.
Сущность консолидированной финансовой отчетности
Консолидированная финансовая отчетность занимает важное место в системе корпоративной отчетности любой крупной группы компаний [56]. Основная идея финансовой консолидации состоит в том, что она формируется для группы компаний в целом, при этом вся группа представляется так, как будто она является единым предприятием.
Понятие группы компаний - основное в теории консолидации. Группа предполагает такую форму организации бизнеса, когда отдельные направления деятельности или операции в разных регионах ведутся разными компаниями, каждая из которых является юридически самостоятельной. Но при этом, несмотря на юридическую самостоятельность, эти компании не могут считаться полностью независимыми, поскольку многие экономические решения (особенно стратегические) принимаются для всей группы в целом.
Чтобы консолидированная отчетность разных групп компаний обладала свойством сопоставимости (что необходимо для анализа), она нуждается в стандартизации. Поэтому в системе Международных стандартов финансовой отчетности (МСФО) правилам формирования консолидированной отчетности уделяется особое внимание [57].
Важно отметить, что правила консолидации применяются не только по отношению к материнским и дочерним компаниям, но и в некоторых других случаях. К таким случаям, в частности, относятся инвестиции в зависимые компании (предприятия, не являющиеся ни дочерними, ни совместными, но на деятельность которых инвестор оказывает существенное влияние) и совместная деятельность (когда несколько участников осуществляют экономическую деятельность, подлежащую совместному контролю).
В соответствии с МСФО, выделяются три метода консолидации: полная консолидация, пропорциональная консолидация и метод долевого участия.
Полная консолидация (entity method) исходит из того, что группа представляет собой единое экономическое образование. Метод используется по отношению к дочерним предприятиям, при этом консолидации подлежат все чистые активы дочерних компаний (принцип приоритета контроля над владением), а доля меньшинства отражается в пассиве кон-солидированного балансового отчета.
Пропорциональная консолидация (proportional consolidation) отличается от полной тем, что консолидации подлежат лишь те чистые активы, которыми инвестор реально владеет, при этом доля меньшинства в балансе не отражается. Метод применяется для консолидации отчетности по совместной деятельности.
Метод долевого участия (equity method) предполагает, что доля инвестора в чистых активах объекта инвестирования отражается в балансе отдельной строкой, доля меньшинства в балансе не отражается. Этот метод используется для консолидации отчетности ассоциированных компаний.
Информационные системы консолидации финансовой отчетности
Формирование консолидированной отчетности - процесс сложный, как с методологической, так и с технической точек зрения. Теоретически, консолидированная отчетность может быть сформирована вручную, но этот способ вряд ли подходит для сложных организационных структур. Поэтому решение задач консолидации тесно связано с применением информационных технологий. Системы, в которых пользователь может выполнять консолидацию, условно делятся на два класса - надстройки к бухгалтерским системам и специализированные системы консолидации [58]. В настоящее время надстройки в том или ином виде разработаны практически ко всем имеющимся на рынке бухгалтерским системам. Тем не менее, функциональность этих программных продуктов несопоставима с возможностями специализированных систем.
Специализированные системы формирования консолидированной финансовой отчетности обеспечивают сбор, обработку и представление в едином формате финансовой информации всех дочерних и зависимых компаний в сложной структуре группы компаний, позволяя применять необходимую методологию и учитывать требования международных или национальных стандартов. При этом можно организовать сбор финансовой отчетности предприятий группы, выполнить корректирующие проводки, обеспечить непосредственную консолидацию и сформировать необходимые отчеты. Такие функции, как элиминирование внутригрупповых операций, расчет перекрестных владений и доли меньшинства, а также обработка мультивалютной отчетности, выполняются автоматически. Кроме того, современные системы консолидации обладают расширенными аналитическими возможностями.
Для решения методологических задач в системах консолидации предусмотрены типовые методы, с помощью которых могут быть автоматизированы такие задачи, как определение доли меньшинства, исключение внутригрупповых расчетов, расчет гудвила. В системах также предусматриваются функции контроля расхождений, возникших при элиминировании внутригрупповых расчетов.
Рассмотрим подробнее основные функции специализированных систем формирования и анализа консолидированной финансовой отчетности [50] , [56] , [56].
Аналитические направления
Структурной основой систем консолидации является набор аналитических направлений. К таким направлениям, например, могут относиться категории, организации, организационные структуры, счета, валюты, периоды, уровни консолидации, режимы отображения данных.
Четкое структурирование данных позволяет пользователям финансовой информации просматривать данные в наиболее удобном ракурсе. При этом можно выбрать аналитические направления и их элементы, которые будут представлены соответственно в строках и столбцах отображаемых таблиц.
Сбор и структурирование исходной информации
Использование систем консолидации позволяет повысить эффективность процесса сбора и группировки исходной информации. При этом допускается несколько способов ввода данных: ручной ввод в заранее подготовленные формы, автоматический ввод из электронных таблиц, автоматический перенос из бухгалтерских программ, получение информации из хранилища данных.
Последние два способа являются весьма примечательными, поскольку автоматический перенос данных дает возможность получать информацию практически из любой учетной системы. При этом система консолидации (после выполнения соответствующих настроек) может самостоятельно импортировать информацию из формируемого бухгалтерской программой текстового файла. Дополнительным преимуществом является повышение надежности информации, так как систему распознавания настраивает специалист по консолидации, а рядовому пользователю остается только "обычная" бухгалтерская работа.
Мультивалютность
Система позволяет консолидировать и анализировать отчетность, составленную в разных валютах. Для каждой из валют, введенных в систему, помимо кода и описания, указывается масштаб, влияющий на расчет обменных курсов.
Бизнес-правила
Для автоматизации вычислений, связанных с формированием отчетности, планированием и прогнозированием, применяются бизнес-правила. Они могут быть использованы для таких задач, как расчет данных, которые не могут быть получены путем иерархического агрегирования (коэффициенты, отклонения), сложные расчеты с трансляцией валют, определение курсовых разниц и т.д. С помощью бизнес-правил могут быть настроены автоматические процессы расчета гудвила, доли меньшинства, внутригрупповой прибыли и др.
Журналы
Для осуществления ручных корректировок в системах консолидации предназначены журналы. В журнал могут быть занесены корректировочные проводки как на уровне одного предприятия, так и на уровне группы. Журналы могут быть использованы для устранения расхождений во внутригрупповых операциях, внесения показателей, рассчитанных вне системы, осуществления трансформационных проводок. Система обладает функциональностью, позволяющей создавать шаблоны для типовых журналов. В случае если журнальные проводки осуществляются по окончании каждого учетного периода, может быть создан автоматический ре-курсивный журнал. Кроме того, в системе может быть создан журнал, который автоматически будет сторнирован в следующем периоде.
Организация процесса консолидации
Организация процесса консолидации
Функции управления процессом консолидации предназначены для контроля обработки информации, в случае если процедура консолидации выполняется централизованно. Элементарный блок процесса представляет собой комбинацию сценария, года, периода, предприятия и вида значений.
В процессе согласования каждый блок проходит ряд состояний, первое из которых - "не начато". Затем следует уровень "первое чтение" и далее - до десяти уровней "в рассмотрении", на каждом из которых могут вноситься необходимые корректировки. После всех необходимых преобразований блок получает статус "готов к утверждению", после утверждения уполномоченным сотрудником переходит в состояние "утверждено", а после открытия публичного доступа к утвержденному блоку - к статусу "опубликовано".
Процедуры консолидации
Процедуры консолидации
В системах поддерживается автоматический расчет консолидированной отчетности. Процедуры консолидации запускаются после проведения всех журналов. Консолидированная отчетность может быть отдельно рассчитана для каждого субхолдинга (сегмента), при этом для ускорения процесса консолидации можно произвести расчет только тех ячеек, которые содержат данные. Кроме того, система позволяет рассчитать отдельно вклад конкретной компании в консолидированный отчет.
Отчеты
Отчеты
В информационных системах консолидации предусматриваются отчеты, отражающие внутригрупповые операции и расхождения по ним. Также можно просмотреть системные отчеты, составленные по журнальным корректировкам. Кроме того, в комплекте с системами консолидации поставляются генераторы отчетов - программные продукты, предназначенные для создания и форматирования различных отчетов, в том числе презентационного качества. Генераторы отчетов позволяют создавать как традиционные финансовые отчеты (отчет о прибылях и убытках, баланс, отчет о движении денежных средств), так и нетрадиционные формы отчетов для финансовых и аналитических данных, включающие текстовую и графическую информацию, а также данные, полученные в разных моделях.
BI-приложения
BI-приложения
Системы бизнес-интеллекта в своем "чистом" виде не являются предметно-ориентированными. В то же время они играют роль платформы, на основе которой могут быть разработаны прикладные решения для различных аналитических задач, относящихся к различным предметным областям.
Обычной практикой является использование BI-систем для проектирования и реализации прикладного решения той или иной задачи конкретного заказчика. Тем не менее, в настоящее время разработчики BI-решений предлагают готовые преднастроенные приложения, несущие в себе вполне конкретную методологическую составляющую. Эти системы содержат стандартные наборы анализируемых показателей, управленческих отчетов, панелей индикаторов. Как правило, такие приложения строятся на основе накопленного опыта и примеров "лучшей практики" и уже хотя бы по этой причине заслуживают внимания. Кроме того, внедрение готового BI-приложения требует существенно меньших затрат труда и времени.
Системы финансового моделирования
Системы финансового моделирования
Аналитические приложения этого класса весьма разнообразны, что объясняется разнообразием объектов моделирования и решаемых задач. В качестве примеров рассмотрим два программных продукта из линейки решений Oracle Hyperion
Система Oracle Hyperion Profitability and Cost Management позволяет решать ряд задач, так или иначе связанных с анализом и управлением затратами и доходами организации. К числу таких задач, в частности, относятся определение прибыльности того или иного сегмента бизнеса или принятие решений в области ценообразования.
Функциональность системы позволяет организовать распределение затрат и доходов с их последующим отнесением на соответствующие объекты. Модель распределения может строиться как для организации в целом, так и для ее части. Для многомерного представления информации в системе предусмотрен ряд аналитических направлений. К их числу относятся бизнес-направления, отражающие объекты отнесения затрат и доходов (продукты, регионы, центры ответственности, категории клиентов), направления для описания финансовых показателей, носителей затрат, баз и ставок распределения, а также направления для периодов времени и расчетных сценариев.
Другая система моделирования - Oracle Hyperion Strategic Finance - представляет собой решение для разработки финансовых моделей стратегического уровня, позволяющих оценить финансовые последствия выбора тех или иных стратегических альтернатив, включая последствия слияний и приобретений и различные варианты финансирования бизнеса.
С помощью встроенных функций моделирования и прогнозирования система позволяет формировать и анализировать различные сценарии развития внешней и внутренней среды компании, производить тестирование возможных стратегий, строить гипотетические планы стратегического развития и оценивать влияние стратегических альтернатив и соответствующих планов на общую эффективность бизнеса. В результате появляются предпосылки для снижения рисков, возникающих из-за недостаточной определенности перспективного состояния бизнес-среды и погрешностей прогнозирования.
Системы имитационного моделирования
Системы имитационного моделирования
Определения и термины
Определения и термины
Имитационная модель (simulation model, ИМ) - модель реального явления или процесса, построенная с помощью компьютерных технологий и позволяющая производить многократные имитационные эксперименты с цель получения новых знаний об исследуемом объекте. Компьютерное моделирование имеет дело с абстрактными (знаковыми, математическими) моделями. Имитация есть подражание чему-либо. следовательно, имитационным нужно называть моделирование, сохраняющее внешнее сходство с исходным процессом.
В имитационной модели изменения процессов и данных ассоциируются с событиями. "Проигрывание" модели заключается в последовательном переходе от одного события к другому. Обычно имитационные модели строятся в случае, когда другие математические модели оказываются слишком сложными.
ИМ может быть разработана или с помощью программной реализации аналитической модели поведения объекта (функциональная модель класса "вход - выход"), или с помощью системы взаимосвязанных программных блоков, каждый из которых моделирует либо часть функций объекта (модель из функциональных блоков), либо подобъект (модель объектных блоков).
Статистическим считается вид моделирования, при котором воспроизводятся аналоги массовых явлений с последующей обработкой результатов наблюдений методами математической статистики.
Имитационный процесс - проведение расчетного эксперимента с помощью имитационной модели реального объекта.
Сценарий имитационного эксперимента - это совокупность входных (исходных) параметров модели, заданных условий проведения имитационного исследования. Получая выходные данные на каждом сценарии, исследователь имеет возможность сравнить их с данными других сценариев и принять решение о необходимости внесения коррекции в те или иные условия проведения имитационного эксперимента - иначе говоря, сформировать условия нового сценария.
Имитационные модели разделяют на дискретные и непрерывные [59].
Дискретные имитационные модели представляют реальный мир и моделируемые в нем процессы как дискретные, т.е. проявляющие свои функции и свойства в определенные моменты времени. Можно предполагать, что это происходит через равные интервалы времени, но в некоторых моделях могут существовать и асинхронные объекты, которые проявляют себя в случайные моменты времени. Асинхронные дискретные модели могут быть реализованы в классе синхронных, но с более сложными функциями управления имитационным экспериментом. Интервал времени, через который происходит анализ изменения имитационной ситуации, называется шагом моделирования. Шаг моделирования определяет точность, сходимость и время имитационного эксперимента.
Непрерывные модели предполагают развитие имитационной ситуации в модели как в непрерывной (аналоговой) среде.
Практически одну и ту же систему можно представить в виде либо дискретно изменяющейся модели, либо непрерывно изменяющейся. Как правило, в имитационном моделировании время является основной независимой переменной. Другие переменные, включенные в имитационную модель, являются функциями времени, т.е. зависимыми переменными. Определение "дискретная" и "непрерывная" относятся к поведению зависимых переменных. При "дискретной" имитации зависимые переменные изменяются дискретно в определенные моменты времени, называемые моментами свершения событий.
Переменная времени в имитационной модели может быть либо непрерывной, либо дискретной в зависимости от того, могут ли дискретные изменения зависимых переменных происходить в любые моменты времени или только в определенные моменты.
При "непрерывной" имитации зависимые переменные модели изменяются непрерывно в течение имитационного времени. Непрерывный процесс может имитироваться либо непрерывной моделью, либо дискретной в зависимости от того, будут ли значения независимых переменных доступны в любой точке или только в определенные моменты времени.
В "комбинированной" имитации зависимые переменные модели могут изменяться дискретно, непрерывно или непрерывно с наложенными дискретными скачками. Наиболее важный аспект комбинированной имитации заключается в возможности взаимодействия между дискретно и непрерывно изменяющимися переменными. Компонентами таких моделей могут быть не только материальные потоки, но и люди, оборудование, заказы, состояния системы (которые представляются с помощью непрерывно изменяющихся зависимых переменных).
Имитационные модели также подразделяются на статические и динамические.
Статические модели имеют стабильную, не изменяющуюся во времени ("жесткую") модель функций и блоков исследуемого реального объекта. Обычно такие модели строятся на базе аналитической разработки, которая реализуется в виде программы. Такие модели близки по своим свойствам к расчетным моделям, а режим имитации здесь используется только для "прогона" расчетов в заданных интервалах входных параметров. Как правило, модели данного класса применяют для подтверждения гипотетических догадок о предполагаемых и аналитически выраженных свойствах исследуемого явления или объекта.
Динамические модели, как правило, имею более сложную схему реализации и проведения имитационного эксперимента. Модели данного класса предполагают, что "ядро" схемы моделирования, определяющее основные связи и свойства объект, меняется в процессе имитационного эксперимента и модифицируется в зависимости от промежуточных данных.
Здесь возможны два варианта развития: динамика изменения схемы имитационного эксперимента известна и динамика изменения модели является целью имитационного исследования.
Очевидно, что последний вариант имитационной модели является наиболее сложным случаем в практике исследований с помощью имитационных моделей, поскольку, по существу, представляет собой компьютерный инструментарий исследования нового, неизвестного свойства реального объекта. Примером таких сложных имитационных моделей с динамической структурой являются модели, исследующие ситуации катастроф, "переломных" экономико-политических ситуаций и т.п.
Области применения имитационных моделей
Области применения имитационных моделей
Имитационное моделирование является универсальным и особенно успешно может применяться в вероятностных процессах и в исследовании переходных режимов экономических явлений. Лица, ответственные за принятие решений в области создания экономических систем, могут оценить их эффективность одним из трех следующих способов.
Во-первых, есть возможность (по крайней мере, теоретическая) проводить управляемые эксперименты с экономической системой фирмы, отрасли или страны. Однако принятие неоптимальных решений может причинить ущерб экономической системе. При этом чем больше масштаб системы, тем ощутимее убытки. Даже в случае нахождения оптимальных решений, касающихся, например, управления деятельностью фирмы, при проведении реальных экспериментов трудно сохранить постоянство факторов и условий, влияющих на результат, а, следовательно, сложно обеспечить надежную оценку различных экономических решений.
Во-вторых, если есть данные о развитии экономической системы за некоторый период времени в прошлом, то можно провести мысленный эксперимент на этих данных. Однако для этого нужно знать точно, какие изменения каких входных переменных привели к наблюдаемому изменению выходных переменных, характеризующих эффективность экономической системы. Иногда причинами изменений могут оказаться случайные возмущения, или так называемый "шум". Поэтому нельзя слишком доверять оценкам.
В-третьих, можно построить математическую модель системы, связывающую входные (независимые) переменные с выходными (зависимыми) переменными, а также с экономической стратегией. Если есть основания для того, чтобы считать разработанную математическую модель адекватной рассматриваемой экономической системе, то с помощью модели можно производить расчеты или машинные эксперименты. По результатам этих экспериментов можно выработать рекомендации по повы-шению эффективности существующей или проектируемой экономической системы.
К недостаткам систем имитационного моделирования можно отнести следующие:
Существующие имитационные модели можно условно разделить на три группы.
К первой группе можно отнести модели, которые достаточно точно отражают какую-либо одну сторону определенного экономического процесса, происходящего в системе сравнительно малого масштаба. С точки зрения математики они представляют собой весьма простые соотношения между двумя-пятью переменными. Обычно это алгебраические уравнения не выше 2-й или 3-й степени, в крайнем случае, система алгебраических уравнений.
Ко vвторой группе можно отнести модели, которые описывают реальные процессы, протекающие в экономических системах малого и среднего масштаба, подверженные воздействию случайных и неопределенных факторов. Разработка таких моделей требует принятия допущений, позволяющих разрешить неопределенности. Например, требуется задать распределения случайных величин, относящихся к входным переменным. Эта искусственная операция в известной степени порождает сомнение в достоверности результатов моделирования.
Среди моделей данной группы наибольшее распространение получили модели систем массового обслуживания. Существуют две разновидности этих моделей: аналитические и алгоритмические. Аналитические модели не учитывают действие случайных факторов и поэтому могут использоваться только как модели первого приближения. С помощью алгоритмических моделей исследуемый процесс может быть описан с любой степенью точности на уровне его понимания постановщиком задачи.
К третьей группе относятся модели больших и очень больших (макроэкономических) систем: крупных торговых и промышленных предприятий и объединений, отраслей народного хозяйства и экономики страны в целом. Создание математической модели экономической системы такого масштаба представляет собой сложную научную проблему, решение которой под силу лишь крупному научно-исследовательскому учреждению.
Перечисленные выше признаки соответствуют разным типам моделей, относительно независимым. Поэтому у многих авторов имеются разногласия в определении имитационных моделей:
За рубежом появилось огромное количество современных систем имитационного моделирования (симуляторы). Коммерческие симуляторы специализированы по отраслям промышленности: eMPlant (машиностроение), DELMIA (судостроение), NETRAC (телекоммуникации и связь). Но среди них имеются и пакеты общего применения, прежде всего - специализированные языки имитационного моделирования GPSS, Simula, и программы, использующие ту же транзакт-парадигму, что и GPSS: Arena, Extend, ProMоdel, SimProcess, LabView, Crystal Ball 2000 [61].
Решение задач с преобладанием логистических аспектов может быть получено с помощью таких симуляторов, как AutoMod, AnyLogic, Proсess Model, QUEST, SIMFACTORY, Taylor ED, WITNESS, объектно-ориентированного моделирования информационных процессов Natural Engineering Workbench, имитационного моделирования бизнес-процессов ReThink [62].
Несколько особняком стоит система BPsim [63] - она опирается на аппарат динамических экспертных систем. В ней определены следующие классы объектов: операции, ресурсы, средства, процессы, источники и приемники ресурсов, перекрестки, параметры. Отдельно выделены информационные типы ресурсов: сообщения и заявки на выполнение операций. Параметры процесса задаются функцией от характеристик объектов и классифицируются на производные (свертка различного типа характеристик) и консолидированные (свертка одноименных характеристик операций процесса). Описание причинно-следственных связей задается специальными объектами.
Имитационное моделирование все шире внедряется в практику исследования производственных (в самом широком смысле слова) процессов, стратегического и оперативного управления ими. В настоящее время встал вопрос о сплошном применении цифровых моделей (Digital Factory) [64] в процессе проектирования и эксплуатации производственных систем. Люди, участвующие в такой деятельности, получают возможность наблюдать статические объекты, как правило, в виде трехмерных изображений (виртуальная реальность - VR). Наличие имитационной модели и обоснование с ее помощью выбранного варианта в западных странах являются обязательными в комплекте документов, подаваемых на рассмотрение для проектирования или модернизации нового производства либо технологического процесса.
Имитационные модели используются и для обучения персонала. Эта концепция называется e-manufacturing. Убежденными сторонниками ее выступают, в частности, ведущие автомобильные компании Daimler-Chrysler, Mercedes-Benz, BMW, Audi, Toyota. Этот подход применяется и на сборке аэробусов А-380 в Гамбурге [64].
Областями целесообразного применения компьютерных имитационных моделей в экономической политике на уровне федерального органа управления можно считать следующие:
Расчет комплекса моделей на каждой точке прогнозного периода производится последовательно, от макромодели до модели бюджета. При этом результаты расчета каждой модели либо оказывают непосредственное влияние на внутренние показатели других моделей, либо учитываются при построении значений показателей на следующих временных интервалах (если в спецификации моделей заложены лаговые зависимости).
Такой комплекс моделей дает возможность получать адекватное представление о будущем сбалансированном состоянии экономики государства.
На уровне региональных органов власти целесообразно использование комплексной имитационной модели региона, отражающей особенности развития региональной экономики. Данную модель можно представить в виде следующих структурных блоков:
В управлении финансово-хозяйственной деятельностью крупного предприятия возможно использование комплекса динамических моделей, состоящего из блоков:
Комплекс динамических моделей в управлении финансово-хозяйственной деятельностью предприятия позволяет планировать финансово-хозяйственные потоки, построить прогнозный бухгалтерский баланс, сформировать план социально-экономического развития и бюджет предприятия.
Последовательность разработки имитационных моделей
Последовательность разработки имитационных моделей
Технологическая схема разработки имитационной модели может быть представлена в виде этапов следующим образом.
Этап 1: разработка математического (или аналитического) описания моделируемого объекта и формулировка основных положений и требований к программной реализации имитационной модели. Здесь разработчик оценивает сложность модели, решает задачу выбора математических, аналитических и программных средств. Определяет основные пути проектирования имитационной модели. Этот этап называется составление концептуальной модели. Он включает следующие подэтапы:
Перед проведением расчетов на ПК должен быть составлен план проведения эксперимента с указанием комбинаций переменных и параметров, для которых должно проводиться моделирование системы. Задача заключается в разработке оптимального плана эксперимента, реализация которого позволяет при сравнительно небольшом числе испытаний модели получить достоверные данные о закономерностях функционирования системы.
Результаты моделирования могут быть представлены в виде таблиц, графиков, диаграмм, схем и т.п.
Интерпретация результатов моделирования имеет целью переход от информации, полученной в результате машинного эксперимента с моделью, к выводам, касающимся процесса функционирования объекта-оригинала.
На основании анализа результатов моделирования принимается решение о том, при каких условиях система будет функционировать с наибольшей эффективностью.
Этап 2: выбор средств описания реального объекта, методов проектирования, среды программирования.
Этап 3: разработка и создание программной реализации имитационного расчета для одного шага имитации. Определение функций изменения имитационной модели на шаге. Для динамических моделей разрабатывается алгоритм изменения расчетной модели при переходе от одного шага имитации к другому.
Этап 4: определение среды и условия проведения имитационного эксперимента. Разрабатывается программа управления имитационным процессом и выдачи промежуточных и окончательных результатов эксперимента по заданному сценарию.
Этап 5: анализ вариантов сценариев, принятие решения о путях совершенствования модели, имитационного процесса и выбор новых (или уточнение старых) путей исследования.
Компьютерная реализация имитационной модели
Компьютерная реализация имитационной модели
Как вытекает из вышесказанного, имитационный эксперимент представляет собой многократный циклический процесс, в котором исследователь при помощи компьютерной модели проходит следующие стадии: ввод исходных данных, формирование условий имитационного сценария, проведение самого расчета, который может длиться от нескольких секунд до нескольких часов, сбор и сохранение результатов имитационного моделирования, анализ вариантов сценариев. Все эти стадии реализуются с помощью большого числа разнообразных операций обработки данных, требующих контакта (взаимодействия) человека с компьютером.
Очевидно, что для эффективной работы пользователя со сложной имитационной средой требуется организация рационального диалога между человеком и компьютером, с целью снижения загрузки на человека рутинными операциями и обеспечения комфортных условий для проведения анализа результатов и принятия решения.
Для этого создается диалоговая надстройка, которая берет на себя функции обучения, навигации и помощи пользователю на всех стадиях имитационного процесса. Концептуально диалоговая имитационная модель содержит следующие компоненты:
Система Arena
Система Arena
Одним из наиболее эффективных инструментов имитационного моделирования является система Arena фирмы System Modeling Corporation.
Arena позволяет строить имитационные модели, проигрывать их и анализировать результаты для самых разных сфер деятельности - производственных технологических операций, складского учета, банковской деятельности, обслуживания клиентов и т.д.
Имитационная модель Arena включает следующие основные элементы: источники и стоки (Create и Dispose), процессы (Process) и очереди (Queue).
Источники - элементы, от которых в модель поступает информация или объекты. Скорость поступления данных или объектов от источника обычно задается статистической функцией.
Сток представляет собой устройство для приема информации или объектов.
Перед стоками могут накапливаться объекты, которые организуются двумя способами: очередь и стек.
Очередь - это место хранения данных, где они ожидают обработки. Время обработки объектов (производительность) в разных процессах может быть разным. В результате перед некоторыми процессами могут накапливаться объекты, ожидающие своей очереди. Часто целью имитационного моделирования является минимизация количества объектов в очередях. Тип очереди в имитационной модели может быть конкретизирован. Очередь работает по принципу [прим. корр.: здесь название принципа идет сразу за называемым словом, двоеточие не нужно] "первым пришел - первым обслужился" (FIFO: first-in - first-out).
Стек - пришедшие последними к стоку объекты первыми отправляются на дальнейшую обработку (LIFO: last-in - first-out). Альтернативой стеку может быть последовательная обработка в очереди.
Могут быть заданы и более сложные алгоритмы обработки очереди.
Процессы - это аналог работ в функциональной модели. В имитационной модели может быть много процессов, и для каждого задана своя производительность, временные и технологические характеристики.
Другим средством построения компьютерных имитационных моделей на рынке программных продуктов является система MATLAB в сочетании с пакетом визуального моделирования Simulink компании MathWorks [65].
Возможности пакета Simulink:
На рынке отечественных разработчиков существует универсальный пакет имитационного моделирования AnyLogic 4.1 российской компании XJ Technologies [66]. В AnyLogic представление модели является визуальным и иерархическим. Простой графический язык моделирования (основанный на UML-RT) оперирует понятиями объектов и связей между ними - дискретными (отправка сообщений произвольной структуры) и непрерывными (отслеживание показателей). Для описания сложного поведения пользователь может применять графические диаграммы переходов и состояний. Такие диаграммы позволяют визуально проектировать сложные бизнес-процессы и многошаговые действия с альтернативами.
Описание поведения объектов производится с помощью фрагментов кода на языке Java: пользователю необходимо определить действия в специальных полях свойств элементов объектов, а весь рутинный код генерируется пакетом автоматически. При разработке моделей доступны все возможности языка Java. Это касается и организации доступа к базам данных. Когда базовых возможностей AnyLogic недостаточно (в некоторых случаях нужны многомерные массивы и календари), разработчик модели может использовать язык Java для создания дополнительных классов.
Как и все выше рассмотренные пакеты, AnyLogic существенно снижает трудоемкость разработки модели по сравнению с универсальными системами разработки программного обеспечения, поскольку предоставляет в готовом виде:
Перечисленные возможности в комплексе позволяют разработчику не тратить время на базовые функции, а сосредоточиться на логике имитационной модели.
Во всех случаях создавать имитационные модели без предварительного анализа бизнес-процессов не всегда представляется возможным. Действительно, не поняв сути бизнес-процессов предприятия, бессмысленно пытаться оптимизировать конкретные технологические процессы. Поэтому функциональные и имитационные модели не заменяют, а дополняют друг друга, при этом они могут быть тесно взаимосвязаны. Имитационная модель дает больше информации для анализа системы. В свою очередь, результаты такого анализа могут стать причиной модификации модели процессов. Наиболее целесообразно сначала создать функциональную модель, а затем на ее основе построить модель имитационную. Для поддержки такой технологии инструментальное средство функционального моделирования BPwin 4.0 имеет возможность преобразования диаграмм IDEF3 в имитационную модель Arena (версии 3.6 и выше). Для преобразования диаграммы IDEF3 в модель Arena необходимо, чтобы BPwin 4.0 и Arena были запущены одновременно. В BPwin 4.0 следует открыть диаграмму IDEF3, а затем выбрать меню File/Export/Arena. Далее экспорт производится автоматически.
Поскольку имитационная модель имеет гораздо больше параметров, чем диаграмма IDEF3, в BPwin 4.0 существует возможность задать эти параметры с помощью свойств, определяемых пользователем (UDP, User Defined Properties). В поставку BPwin 4.0 входят примеры моделей с предварительно внесенными UDP для экспорта в Arena (Program Files/Computer Associates/BPwin 4.0/Samples/Arena/) и модель ArenaBEUDPs.bp1, в которой определены все необходимые для экспорта UDP и которую можно использовать в качестве шаблона для создания новых моделей.
Рассмотрим основные элементы интерфейса программы ARENA [67].
На рис.12.2. приведен вид экрана с выведенными на него сведениями о программе. Нетрудно заметить, что внешне он в наибольшей степени похож на экран программы MS Visio
Рис. 12.2. Сведения о программе
Это закономерно, поскольку обе программы выполнены с соблюдением стандартов MS Windows. Более того, если рисование в Visio представляется разработчику более легким делом, чем аналогичная работа в ARENA, то он может изобразить логику процесса в Visio, после чего перейти в Arena и импортировать созданную диаграмму. Панели, расположенные в верхней части окна на рисунке, достаточно традиционны. Заметим лишь, что на второй линии пиктографических изображений расположены инструменты для изображения линий, связывающих блоки на диаграммах.
Рассмотрим панель инструментов, расположенную вертикально в левой части окна на рис.12.3. Она называется Project Bar и размещается на экране путем установки галочки в соответствующем пункте меню группы View.
Рис. 12.3. Открытие панели инструментов
Это базовый набор модулей, необходимый для описания моделируемых систем, в первую очередь - систем массового обслуживания. Он состоит из двух групп. Модули первой группы (желтые пиктограммы) предназначены для описания логики взаимодействия элементов системы. В этом они подобны блокам IDEF-диаграмм.
Однако каждый блок имеет специфику, которая отражена не только в его названии, но и форме. Эти модули называются Flowchart modules. Как ясно из названия, речь идет о потоках - в первую очередь, заявок и обслуживания. Модули второй группы ориентированы на детальное описание параметров (данных) Flowchart modules. Они так и называются - Data modules.
Им соответствуют пиктограммы в виде таблиц. Это как бы напоминает исследователю, что MS Excel является простым и удобным инструментальным средством записи, хранения данных и обмена ими между программами, ориентированными на расчеты.
Программа ARENA имеет большое число Flowchart modules и Data modules.
Они объединены в кластеры и могут загружаться в Project Bar из группы File, как показано на рис.12.4, рис.12.5, рис.12.6.
Рис. 12.4. Открытие панели шаблонов
Рассмотрим более детально процесс загрузки новых кластеров в программу
Первый этап. Для загрузки нового кластера необходимо открыть меню File/ Template Panel/Attach. После этого появится диалоговое окно, в котором необходимо выбрать соответствующий кластер (набор инструментов).
Кластеры можно как подключать, так и отключать. Для выгрузки кластеров необходимо выбрать пункт File/ Template Panel/Detach.
Помимо этого, в меню File есть кнопки, позволяющие создавать новые модели, сохранять их или открывать уже существующие, отправлять документы на печать и прочие функции, вызвать которые можно нажатием на соответствующий пункт меню.
Второй этап: выбор необходимого кластера в диалоговом окне Attach Template Panel. Программа ARENA обладает широким набором кластеров для более удобной работы. Как можно увидеть на рис.12.5, в программе представлены около 15 шаблонов. Используя эти наборы, можно значительным образом увеличить скорость и удобство работы.
Изначально в программе открыт кластер Basic Process.
Рис. 12.5. Выбор шаблона
Все представленные в кластере элементы (Flowchart modules и Data modules) можно применять для создания диаграмм.
Рис. 12.6. Элементы для создания диаграмм
Третий этап. Загрузка завершена. Как видно на рис.12.6, в меню инструментов добавилась новая вкладка с названием "Advanced Process".
Это напоминает загрузку тематических панелей в Visio. Однако ARENA - не "рисовалка", а мощное средство имитационного моделирования.
Программа ARENA позволяет создавать диаграммы, отражающие функционирование того или иного процесса. Процесс создания диаграмм во многом схож с таковым в MS Visio. Здесь также используется технология Drag and Drop, однако для некоторых процесс "рисования" в MS Visio будет более удобным и предпочтительным.
На рис.12.7 изображена диаграмма основной деятельности системы массового обслуживания с ожиданием на примере системы обслуживания клиентов с применением офисной АТС.
Рис. 12.7. Диаграмма основной деятельности системы массового обслуживания с ожиданием
Однако после ряда настроек ARENA позволяет, помимо построения диаграмм, проводить также имитационное моделирование. В результате проведения данной операции получаем результаты, которые можно использовать для дальнейшего анализа и построения новых моделей. Пример подобных результатов представлен на рис.12.8. Программа дает возможность проводить имитационное моделирование, но уже с другими параметрами.
Данный пример иллюстрирует только системы массового обслуживания с очередью. Существуют и другие системы, например, системы массового обслуживания с отказом, когда клиент не желает ждать. Также выделяют различные СМО в зависимости от того, поступают заявки извне или от элементов самой системы. Все эти модели можно создать и "проиграть" с применением программы ARENA.
Рис. 12.8. Результаты имитационного моделирования
Экспертные системы
Экспертные системы
Под экспертной системой понимается программная система, которая моделирует рассуждения человека - эксперта в некоторой определенной предметной области, используя базу знаний, содержащую факты и правила об этой области и некоторый механизм логического вывода результата экспертизы.
Достоинство экспертных систем заключается в возможности принятия решений в уникальных ситуациях, для которых алгоритм заранее не известен и формируется по исходным данным в виде цепочки рассуждений (правил принятия решений) из базы знаний. Причем решение задач предполагается осуществлять в условиях неполноты, недостоверности, многозначности исходной информации и качественных оценок процессов.
Экспертная система является инструментом, усиливающим интеллектуальные способности эксперта, и может выполнять следующие роли:
Архитектура экспертной системы
Архитектура экспертной системы
Экспертная система (рис.12.9) включает в себя два основных компонента: базу знаний (хранилище единиц знаний) и программный инструментарий доступа и обработки знаний. Программный инструментарий состоит из механизмов вывода заключений, приобретения знаний, объяснения получаемых результатов и интеллектуального интерфейса [68].
Центральным компонентом экспертной системы является база знаний, которая выступает по отношению к другим компонентам как содержательная подсистема, составляющая основную ценность.
Рис. 12.9. Архитектура экспертной системы
База знаний - это совокупность единиц знаний, которые представляют собой формализованное с помощью некоторого метода представления знаний отражение объектов проблемной области и их взаимосвязей, действий над объектами и, возможно, неопределенностей, с которыми эти действия осуществляются [69].
В качестве методов представления знаний чаще всего используются либо правила, либо объекты (фреймы), либо их комбинация. Так, правила представляют собой конструкции:
Если < условие >
То <заключение> CF (фактор определенности) <значение>
В качестве факторов определенности (CF), как правило, выступают либо условные вероятности байесовского подхода (от 0 до 1), либо коэффициенты уверенности нечеткой логики (от 0 до 100).
Примеры правил имеют следующий вид.
Правило 1: если Коэффициент рентабельности > 0.2, то Рентабельность = "удовлетворительна" CF 100.
Правило 2: если Задолженность = "нет" и Рентабельность = "удовлетворительна", то Финансовое состояние = "удовлетворительно" CF 80.
Правило 3: если Финансовое состояние = "удовлетворительно" и Репутация = "удовлетворительна", то Надежность предприятия = "удовлетворительна" CF 90.
Объекты представляют собой совокупность атрибутов, описывающих свойства и отношения с другими объектами. В отличие от записей баз данных, каждый объект имеет уникальное имя. Часть атрибутов отражают типизированные отношения, такие как "род - вид" (super-class - sub-class), "целое - часть" и др. Вместо конкретных значений атрибутов объектов могут задаваться значения по умолчанию, присущие целым классам объектов, или присоединенные процедуры (process).
Интеллектуальный интерфейс. Обмен данными между конечным пользователем и ЭС выполняет программа интеллектуального интерфейса, которая воспринимает сообщения пользователя и преобразует их в форму представления базы знаний и, наоборот, переводит внутреннее представление результата обработки в формат пользователя и выдает сообщение на требуемый носитель.
Важнейшим требованием к организации диалога пользователя с ЭС является естественность, которая не означает буквально формулирование потребностей пользователя предложениями естественного языка, хотя это и не исключается в ряде случаев [70].
Важно, чтобы последовательность решения задачи была гибкой, соответствовала представлениям пользователя и велась в профессиональных терминах.
Механизм вывода. Этот программный инструментарий получает от интеллектуального интерфейса преобразованный во внутреннее представление запрос, формирует из базы знаний конкретный алгоритм решения задачи, выполняет алгоритм, а полученный результат предоставляется интеллектуальному интерфейсу для выдачи ответа на запрос пользователя. В основе применения любого механизма вывода лежит процесс нахождения в соответствии с поставленной целью и описанием конкретной ситуации (исходных данных), относящихся к решению единиц знаний (правил, объектов, прецедентов и т.д.) и связыванию их при необходимости в цепочку рассуждений, приводящую к определенному результату. Для представления знаний в форме правил это может быть прямая или обратная цепочка рассуждений (рис.12.10 и рис.12.11).
Рис. 12.10. Прямая цепочка рассуждений
Рис. 12.11. Обратная цепочка рассуждений
Для объектно-ориентированного представления знаний характерно применение механизма наследования атрибутов, когда значения атрибутов передаются по иерархии от вышестоящих классов к нижестоящим. Также при заполнении атрибутов фрейма необходимыми данными запускаются на выполнение присоединенные процедуры.
Механизм объяснения. В процессе или по результатам решения задачи пользователь может запросить объяснение или обоснование хода решения. С этой целью ЭС должна предоставить соответствующий механизм объяснения.
Объяснительные способности ЭС определяются возможностью механизма вывода запоминать путь решения задачи. Тогда на вопросы пользователя "Как?" и "Почему?" получено решение или запрошены те или иные данные, и система всегда может выдать цепочку рассуждений до требуемой контрольной точки, сопровождая выдачу объяснения заранее подготовленными комментариями. В случае отсутствия решения задач объяснение должно выдаваться пользователю автоматически.
Полезно иметь возможность и гипотетического объяснения решения задачи, когда система отвечает на вопросы, что будет в том или ином случае. Однако не всегда пользователя интересует полный вывод решения, содержащий множество ненужных деталей. В этом случае система должна уметь выбирать из цепочки только ключевые моменты с учетом их важности и уровня знаний пользователя. Для этого в базе знаний необходимо поддерживать модель знаний и намерений пользователя.
Если же пользователю все еще не понятен полученный ответ, то система должна быть способна в диалоге на основе поддерживаемой модели проблемных знаний обучать пользователя тем или иным фрагментам знаний, т.е. раскрывать более подробно отдельные понятия и зависимости, если даже эти детали непосредственно в выводе не использовались.
Механизм приобретения знаний. База знаний отражает знания экспертов (специалистов) в данной проблемной области о действиях в различных ситуациях или процессах решения характерных задач. Выявлением подобных знаний и последующим их представлением в базе знаний занимаются специалисты, называемые инженерами знаний. Для ввода знаний в базу и их последующего обновления ЭС должна обладать механизмом приобретения знаний. В простейшем случае используется интеллектуальный редактор, который позволяет вводить единицы знаний в базу и проводить их синтаксический и семантический контроль, например, на непротиворечивость. В более сложных случаях инженер знаний должен из-влекать знания путем специальных сценариев интервьюирования экспертов, или из вводимых примеров реальных ситуаций, как в случае индуктивного вывода, или из текстов, или из опыта работы самой интеллектуальной системы.
Классы экспертных систем
Классы экспертных систем
По степени сложности решаемых задач экспертные системы можно классифицировать следующим образом [71].
По способу формирования решения экспертные системы разделяются на два класса: аналитические и синтетические. Аналитические системы предполагают выбор решений из множества известных альтернатив (оп-ределение характеристик объектов), а синтетические системы - генерацию неизвестных решений (формирование объектов).
По способу учета временного признака экспертные системы могут быть статическими или динамическими. Статические системы решают задачи при не изменяемых в процессе решения данных и знаниях, динамические системы допускают такие изменения. Статические системы осуществляют монотонное непрерываемое решение задачи от ввода исходных данных до конечного результата, динамические системы предусматривают возможность пересмотра в процессе решения полученных ранее результатов и данных.
По видам используемых данных и знаний экспертные системы классифицируются на системы с детерминированными (четко определенными) знаниями и неопределенными знаниями. Под неопределенностью знаний понимается их неполнота, недостоверность, двусмысленность, нечеткость.
По числу используемых источников знаний экспертные системы могут быть построены с использованием одного или множества источников знаний. Источники знаний могут быть альтернативными или дополняющими друг друга
В соответствии с перечисленными признаками классификации выделяются следующие основные классы экспертных систем (табл. 12.1.).
Классифицирующие экспертные системы. Экспертные системы, решающие задачи распознавания ситуаций, называются классифицирующими, поскольку определяют принадлежность анализируемой ситуации к некоторому классу.
Таблица 12.1. Основные классы экспертных систем |
|||
Анализ |
Синтез |
||
Детерминированность знании |
Классифицирующие |
Трансформирующие |
Один источник Знании |
Неопределенность знаний |
Доопределяющие |
Многоагентные |
Множество источников знаний |
Статика |
Динамика |
В качестве основного метода формирования решений используется метод логического дедуктивного вывода от общего к частному, когда путем подстановки исходных данных в некоторую совокупность взаимосвязанных общих утверждений получается частное заключение.
Доопределяющие экспертные системы. Более сложный тип аналитических задач представляют задачи, которые решаются на основе неопределенных исходных данных и применяемых знаний. В этом случае экспертная система должна как бы доопределять недостающие знания, а в пространстве решений может получаться несколько возможных решений с различной вероятностью или уверенностью в необходимости их выполнения.
В качестве методов работы с неопределенностями могут применяться байесовский вероятностный подход и нечеткая логика.
Доопределяющие экспертные системы могут использовать для формирования решения несколько источников знаний. В этом случае могут применяться эвристические приемы выбора единиц знаний из их конфликтного набора, например, на основе использования приоритетов важности, или получаемой степени определенности результата, или значений функций предпочтений и т.д.
Для аналитических задач классифицирующего и доопределяющего типов характерны следующие проблемные области.
Трансформирующие экспертные системы. В отличие от аналитических статических экспертных систем синтезирующие динамические экспертные системы предполагают повторяющееся преобразование знаний в процессе решения задач, что связано с характером результата, который нельзя заранее предопределить, а также с динамичностью самой проблемной области.
Для синтезирующих динамических экспертных систем наиболее применимы следующие проблемные области.
Многоагентные экспертные системы. Для таких динамических систем характерна интеграция в базе знаний нескольких разнородных источников знаний, обменивающихся между собой получаемыми результатами на динамической основе, например, через "доску объявлений".
Для многоагентных систем характерны следующие особенности:
Технология создания экспертных систем
Технология создания экспертных систем
Слабая формализуемость процесса принятия решений, его альтернативность и нечеткость, качественная природа используемых знаний, динамичность изменения проблемной области - все эти характерные особенности применения экспертных систем обусловливают сложность и большую трудоемкость их разработки по сравнению с другими информационными системами.
Извлечение знаний при создании экспертной системы предполагает изучение множества источников, к которым относятся специальная литература, базы фактуальных знаний, отчеты о решении аналогичных проблем, а самое главное, опыт работы специалистов в исследуемой проблемной области.
Успех проектирования экспертной системы во многом определяется тем, насколько компетентны привлекаемые к разработке эксперты и насколько они способны передать свой опыт инженерам по знаниям. Вместе с тем, эксперты не имеют представления о возможностях и ограничениях ЭС.
Следовательно, процесс разработки ЭС должен быть организован инженерами по знаниям таким образом, чтобы в процессе их итеративного взаимодействия с экспертами последние получили весь необходимый объем знаний для решения четко очерченных проблем. Этапы проектирования экспертной системы представлены на рис.12.12.
Однако необходимо учитывать, что эксперты сами представляют собой сверхсложные системы, и их деятельность также зависит от многих внешних и внутренних условий.
Взаимодействие между экспертами может как стимулировать, так и подавлять их деятельность. Поэтому в разных случаях применяют различные методы экспертизы, отличающиеся характером взаимодействия экспертов друг с другом: анонимные и открытые опросы и анкетирования, совещания, дискуссии, деловые игры, мозговой штурм и т.д. Нередко при работе с экспертами используется метод Дельфи [73].
На начальных этапах идентификации и концептуализации, связанных с определением контуров будущей системы, инженер по знаниям выступает в роли ученика, а эксперт - в роли учителя, мастера. На заключительных этапах реализации и тестирования инженер по знаниям демонстрирует результаты разработки, адекватность которых проблемной области оценивает эксперт. На этапе тестирования это могут быть совершенно другие эксперты.
На этапе тестирования созданные экспертные системы оцениваются с позиции двух основных групп критериев: точности и полезности.
С точностью работы связаны такие характеристики, как правильность выполняемых заключений, адекватность базы знаний проблемной области, обоснованность применяемых методов решения проблемы. Поэтому конечные оценки системе ставят специалисты в проблемной области - эксперты.
Полезность же экспертной системы характеризуется степенью удовлетворения требований пользователя в части получения необходимых рекомендаций, легкости и естественности взаимодействия с системой, надежности, производительности и стоимости эксплуатации, способности обоснования решений и обучения, настройки на изменение потребностей.
Рис. 12.12. Этапы проектирования экспертной системы
Оценивание экспертной системы осуществляется по набору тестовых примеров, как из предшествующей практики экспертов, так и специально подобранных ситуаций. Результаты тестирования подлежат статистической обработке, после чего делаются выводы о степени точности работы экспертной системы.
Следующий этап жизненного цикла экспертной системы - внедрение и опытная эксплуатация в массовом порядке без непосредственного контроля со стороны разработчиков и переход от тестовых примеров к решению реальных задач.
Важнейшим критерием оценки становится соотношение стоимости системы и ее эффективности. На этом этапе осуществляется сбор критических замечаний и внесение необходимых изменений.
В результате опытной эксплуатации может потребоваться разработка новых специализированных версий, учитывающих особенности проблемных областей.
Описание приемов извлечения знаний инженерами знаний представлено в таблице 12.2.
Первые два этапа разработки экспертной системы составляют логическую стадию, не связанную с применением четко определенного инструментального средства.
Последующие этапы реализуются в рамках физического создания проекта на базе выбранного инструментального средства.
Вместе с тем, процесс создания экспертной системы как сложного программного продукта имеет смысл выполнять на основе прототипного проектирования, сущность которого сводится к постоянному наращиванию базы знаний, начиная с логической стадии.
Прототипная технология создания экспертной системы означает, что простейший прототип будущей системы реализуется с помощью любого подручного инструментального средства еще на этапах идентификации и концептуализации. В дальнейшем этот прототип детализируется, концептуальная модель уточняется, реализация выполняется в среде окончательно выбранного инструментального средства.
Таблица 12.2. Приемы извлечения знаний |
|
Приемы |
Описание |
1. Наблюдение |
Инженер наблюдает, не вмешиваясь, за тем, как эксперт решает реальную задачу |
2. Обсуждение задачи |
Инженер на представительном множестве задач неформально обсуждает с экспертом данные, знания и процедуры решения |
3. Описание задачи |
Эксперт описывает решение задач для типичных запросов |
4. Анализ решения |
Эксперт комментирует получаемые результаты решения задачи, детализируя ход рассуждений |
5. Проверка системы |
Эксперт предлагает инженеру перечень задач для решения (от простых до сложных), которые решаются разработанной системой |
6. Исследование системы |
Эксперт исследует и критикует структуру базы знаний и работу механизма вывода |
7. Оценка системы |
Инженер предлагает новым экспертам оценить решения разработанной системы |
Идентификация проблемной области. Этап идентификации проблемной области включает определение назначения и сферы применения экспертной системы, подбор экспертов и группы инженеров по знаниям, выделение ресурсов, постановку и параметризацию решаемых задач.
Начало работ по созданию экспертной системы инициируют руководители компаний (предприятий, учреждений). Обычно необходимость разработки экспертной системы в той или иной сфере деятельности связана с затруднениями лиц, принимающих решение, что сказывается на эффективности функционирования компании. Эти затруднения могут быть обусловлены недостаточным опытом работы в данной области, сложностью постоянного привлечения экспертов, нехваткой трудовых ресурсов для решения простых интеллектуальных задач, необходимостью интеграции разнообразных источников знаний. Как правило, назначение экспертной системы связано с одной из следующих областей:
Сфера применения экспертной системы характеризует тот круг задач, который подлежит формализации, например, "оценка финансового состояния предприятия", "выбор поставщика продукции", "формирование маркетинговой стратегии" и т.д.
Обычно сложность решаемых в экспертной системе проблем должна соответствовать трудоемкости работы эксперта в течение нескольких часов. Более сложные задачи имеет смысл разбивать на совокупности взаимосвязанных задач, которые подлежат разработке в рамках нескольких экспертных систем.
Ограничивающими факторами на разработку экспертной системы выступают отводимые сроки, финансовые ресурсы и программно-техническая среда. От этих ограничений зависит количественный и качественный состав групп инженеров по знаниям и экспертов, глубина прорабатываемых вопросов, адекватность и эффективность решения проблем. Обычно различают три стратегии разработки экспертных систем [74]:
После предварительного определения контуров разрабатываемой экспертной системы инженеры по знаниям совместно с экспертами определяют:
Построение концептуальной модели. На этапе построения концептуальной модели создается целостное и системное описание используемых знаний, отражающее сущность функционирования проблемной области.
От качества построения концептуальной модели проблемной области во многом зависит, насколько часто в дальнейшем по мере развития проекта будет выполняться переработка базы знаний.
Хорошая концептуальная модель может только уточняться (детализироваться или упрощаться), но не перестраиваться.
Результат построения концептуальной модели обычно представляется в виде наглядных графических схем:
Первые две модели описывают статические аспекты функционирования проблемной области, а третья модель - динамику изменения ее состояний. Естественно, что для различных классов задач могут требоваться разные виды моделей, а, следовательно, и ориентированные на них методы представления знаний.
Формализация базы знаний. На этапе формализации базы знаний осуществляется выбор метода представления знаний и осуществляется проектирование логической структуры базы знаний.
Рассмотрим классификацию методов представления знаний:
Рассмотрим применение аппарата нечеткой логики на примере оценки надежности поставщика, в котором кроме фактора финансового состояния учитывается и фактор формы собственности (рис.12.13).
Рис. 12.13. Применение нечеткой логики
Пусть государственное предприятие не имеет задолженности с уверенностью 60% и предполагается, что его рентабельность удовлетворительна с уверенностью 80%. Фрагмент множества правил имеет следующий вид.
Правило 1: если Задолженность = "нет" и Рентабельность = "удовлетворительна", то Финансовое состояние = "удовлетвори-тельно" cf 100.
Правило 2: если Финансовое состояние = "удовлетворительно", то Надежность = "есть" cf 90.
Правило 3: если Предприятие = "государственное", то Надежность = "есть" cf 50.
Результат выполнения первого правила:
Результат выполнения второго правила:
Результат выполнения третьего правила:
Для динамических моделей важны:
Целям построения таких гибких механизмов вывода служит применение технологии "доски объявлений", через которую в результате осуществления событий источники знаний обмениваются сообщениями.
В целях динамического реагирования на события некоторые продукционные модели используют специальные правила-демоны, которые формулируются следующим образом: "Всякий раз, как происходит некоторое событие, выполнить некоторое действие". Например: всякий раз, как становится известным значение переменной "Поставщик", выполнить набор правил "Финансовый анализ предприятия".
В программном средстве GURU подобное правило будет записано следующим образом:
IF: KNOWN ("Поставщик") = true THEN: CONSULT FIN_AN
Для динамических экспертных систем характерна также обработка времени как самостоятельного атрибута аргументации логического вывода: если в течение дня уровень запаса понизился больше, чем на 50%, то выполнить набор правил "Выбор поставщика для поставки".
Общим недостатком всех моделей представления знаний, основанных на правилах, является недостаточно глубокое отражение семантики проблемной области, что может сказываться на гибкости формулирования запросов пользователей к экспертным системам. Этот недостаток снимается в объектно-ориентированных методах представления знаний.
Рекомендации по выбору экспертной системы
Рекомендации по выбору экспертной системы
На этапе реализации экспертной системы происходит физическое наполнение базы знаний и настройка всех программных механизмов в рамках выбранного инструментального средства, а при необходимости - и программирование специализированных модулей.
Особенности реализации экспертной системы во многом определяются характером инструментального средства, в качестве которого могут выступать программные оболочки (shells), генераторы (интегрированные среды), языки представления знаний (языки программирования).
Оболочки имеют реализованные механизмы вывода, накопления, объяснения знаний, диалоговый компонент, что, с одной стороны, упрощает разработку программной части экспертной системы, поскольку не требуется программирование, а с другой стороны, усложняет разработку базы знаний вследствие возможного несоответствия системы требованиям структуры.
Использование языков представления знаний, таких как язык логического программирования PROLOG, язык функционального программирования LISP, язык объектно-ориентированного программирования SmallTalk, язык продукционных правил ОPS5 и другие, повышает гибкость разрабатываемой системы и одновременно увеличивает трудоемкость разработки.
Скелетные оболочки. Наиболее распространенными инструментальными средствами для создания экспертных систем являются генераторы или интегрированные среды разработки, например, G2 (фирма Gensym, дистрибьютор фирма ArgusSoft), ART-Enterprise (фирма Inference, дистрибьютор фирма "Метатехнология"), GURU (фирма MDBS, дистрибьютор фирма "ЦПС", Тверь).
Указанные среды позволяют настраивать программные средства на особенности проблемных областей. При необходимости предоставляют возможность программировать на встроенных языках и осуществлять эффективный экспорт/импорт данных с другими инструментальными средствами.
Проблемно- и предметно-ориентированные системы. Преимущество предметно-ориентированных систем заключается в более простой адаптации к конкретной предметной области, а следовательно, и в сокращении затрат на разработку. Например, интеллектуальная система для разработки финансовых приложений Cogensys Judgment Software (Cogensys Corp) стоит 200 тыс. долл.
Экспертные системы реального времени. Среди специализированных инструментальных средств интеллектуальных систем основной удельный вес занимают экспертные системы реального времени, позволяющие динамически управлять непрерывными процессами (70% рынка).
Бесспорным лидером в разработке экспертных систем реального времени является фирма Gensym с инструментальным средством G2 (дистрибьютор в России - фирма ArgusSoft), имеющая внедрения в таких компаниях, как IBM, NASA, General Electric, Nissan и др.
На базе G2, в свою очередь, созданы такие проблемно-ориентированные комплексы, как GDA для решения задач диагностики, разработки, ReThink для моделирования бизнес-процессов (бизнес-реинжиниринга), NeurOnline для поддержки нейронной сети, IPS для решения задач динамического планирования, FaultExpert для управления телекоммуникациями и др.
Например, G2 (фирма Gensym, дистрибьютор фирма ArgusSoft), ART-Enterprise (фирма Inference, дистрибьютор фирма "Метатехноло-гия"), GURU (фирма MDBS, дистрибьютор фирма "ЦПС", Тверь), которые позволяют настраивать программные средства на особенности проблемных областей, при необходимости предоставляют возможность программировать на встроенных языках и осуществлять эффективный экспорт/импорт данных с другими инструментальными средствами.
Отечественные экспертные системы. Среди отечественных разработок следует отметить экспертную оболочку ЭКО (ArgusSoft) и программный комплекс SIMER-MIRAGE (Исследовательский центр искусственного интеллекта ИПС РАН), который предоставляет инструментальные средства как автоматизации разработки, так и поддержки экспертных систем.
В процессе жизненного цикла разработки экспертной системы инструментальные средства могут сменять друг друга по мере расширения базы знаний. Так, на этапе проектирования прототипа требуется его быстрая разработка в ущерб производительности, в то время как на этапе разработки промышленной версии на первый план выходит обеспечение эффективности функционирования.
На выбор инструментальных средств экспертной системы, в основе которых лежит определенный метод представления знаний, ос-новное влияние оказывает класс решаемых задач (проблемных областей). И прежде всего, характер полученной концептуальной модели, определяющий множество требований в части отображения объектов, действий над объектами, методов обработки неопределенностей, механизмов вывода.
Инструментальные средства, в свою очередь, характеризуются определенными возможностями по реализации этих требований.
Сущность алгоритма выбора инструментальных средств сводится к наложению требований проблемной области на возможности инструментальных средств и определению наилучших по заданным ограничениям (таблица 12.2).
В таблице 12.3. оценки инструментальных средств для решения различных классов задач заданы в рангах.
Таблица 12.3. Рекомендации по выбору инструментальных средств |
||||||
Классы решаемых задач |
Программные инструментальные средства |
|||||
Название |
ЭКО |
GURU |
Nexpert Object |
LEVEL |
ART Enterprise |
G2 |
Интерпретация |
3 |
1 |
1 |
1 |
2 |
3 |
Диагностика |
1 |
2 |
2 |
2 |
3 |
2 |
Прогнозирование |
2 |
3 |
4 |
3 |
4 |
3 |
Проектирование |
- |
- |
3 |
5 |
1 |
5 |
Планирование |
5 |
4 |
5 |
1 |
В качестве других критериев, по которым можно судить о возможности создания экспертной системы, следует отметить следующие:
Системы поддержки принятия решений
Системы поддержки принятия решений
Определение систем поддержки принятия решений
Определение систем поддержки принятия решений
Большинство авторов под системами поддержки принятия решений (СППР) понимают интерактивные компьютерные системы, которые помогают лицу, принимающему решение (ЛПР), использовать информацию и модели для решения слабо структурированных или трудно формализуемых задач
Результат внедрения СППР заключается в повышении эффективности принимаемых решений. Значимость для менеджеров - создание инструмента, находящегося под их полным контролем, который не пытается предопределить цели или навязать свое решение.
Выделим специфические особенности СППР:
Характеристика различных систем поддержки принятия решений
Характеристика различных систем поддержки принятия решений
Представим характеристику существующих систем поддержки принятия решений в виде таблицы 12.4.
Таблица 12.4. Сводная таблица систем поддержки принятия решений |
||
Наименование СППР |
Официальный сайт системы |
Характеристика |
Экспертная система Поддержки принятия Решений (ЭСППР) |
http://82.179.249.12/ edss/ |
Система ориентирована на автоматизацию процедуры анализа проблемных ситуаций и выбора эффективных решений. Относится к классу информационных систем, сочетающих преимущества экспертных систем и систем поддержки принятия решений |
Expert Choice |
http://www. expertchoice.com |
Коммерческий программный продукт, разработанный на основе метода анализа иерархий для поддержки принятия решений различным организациям. Система имеет три варианта поставки: Comparion Core™, Expert Choice 11.5™ и Expert Choice Inside |
Super Decisions |
http://www. superdecisions.com |
Программный продукт, разработанный на основе метода аналитических сетей (Analytic Network Process) |
Decision Lens (Decision Lens Web) |
http://www. decisionlens.com |
Коммерческий программный продукт для поддержки принятия решений организациями, обладающий следующими методологи-ческими особенностями: - теоретические основы системы - методы анализа иерархий и аналитических сетей; - наличие веб-интерфейса; - возможность групповой работы |
Imaginatik Idea Central |
http://www. imaginatik.com |
Коммерческая система, являющаяся веб-приложением для обработки мнений экспертов |
UTA PLUS |
http://www. lamsade. dauphine.fr/enlish/ software. html |
Реализует метод UTA, который может быть использован для решения задач многокритериального анализа. Программа имеет на-глядный графический интерфейс |
ELECTRE IS |
http://www. lamsade. dauphine.fr/ enlish/ software. html |
Система, основанная на многокритериальном методе из семейства ELECTRE, который позволяет использовать псевдокритерии и пороговые значения при принятии решений. В процессе вычислений система строит граф. Искомый набор альтернатив - это ядро этого графа |
ELECTRE III-IV |
http://www. lamsade. dauphine.fr/english/ software. html |
Система, реализующая метод из семейства ELECTRE для критериев, которые не имеют оценок относительной значимости. Ме-тод, лежащий в основе системы, позволяет ранжировать альтернативы |
ELECTRE TRI |
http://www. lamsade. dauphine.fr/enlish/ software. html |
Система, реализующая метод из семейства ELECTRE для решения проблем, которые требуют сегментации. Процесс сегментации основан на оценке внутренней стоимости альтернатив. В системе существует модуль, способный самообучаться на тестовых ситуаци-ях, определяя параметры модели. ELECTRE TRI успешно применяется в задачах с большим количеством альтернатив |
IRIS |
http://www4.fe.uc.pt/ lmcdias/ iris.htm |
Система реализует задачу сортировки альтернатив в многокритериальных задачах принятия решений. Допускает задание порого-вых ограничений пользователем для критериев (признаков). Способна оценивать точность вычислений. Выводит результат вычис-лений в виде отчета |
Император 3.1 |
http://www. neirosplav.com |
Возможности программы позволяют решать задачи рейтингования, выбора альтернатив, распределения ресурсов, прогнозирова-ния, планирования, учета предпочтений, моделирования ситуаций. В основу системы поддержки принятия решения "Император" положен метод анализа иерархий |
СППР "Эксперт" |
http://lab12.geosys.ru/pageslab/lab12_expert.htm |
Система основана на методе анализа иерархий (МАИ) Т. Саати. Особенности системы: поддержка как числовых значений, так и субъективных вербальных предпочтений пользователя. Возможность анализа данных на предмет согласованности и достоверности, исправление несогласованности. Удобный графический интерфейс, инструменты для формализации проблемы, анализа результатов. Подробные печатные отчеты. Наличие библиотеки типовых иерархий для решения задач прогнозирования и управления в различных сферах деятельности. Наличие библиотеки решений типовых задач в области финансов, экономики, управлении персоналом, предприятием и т.п. |
OPTIMUM |
http://www. tomakechoice. com/paper/ Odessa2009p.pdf |
Система поддержки принятия решений основана на методе анализа иерархий (МАИ). В программе реализована возможность настройки пользовательского интерфейса. Каждый пользователь может создать для себя удобное рабочее место в данной программе. Справочная система содержит описание всех инструментов приложения |
СППР "Выбор" 5.3 |
http://www.cirtas.ru/ product. php? id=10 |
Система является простым и удобным средством, которое поможет структурировать проблему; построить набор альтернатив; выделить характеризующие их факторы; задать значимость этих факторов; оценить альтернативы по каждому из факторов; найти неточности и противоречия в суждениях лица, принимающего решение (ЛПР)/эксперта; проранжировать альтернативы; провести анализ решения и обосновать полученные результаты. Может использоваться при решении следующих типовых задач: оценка качества организационных, проектных и конструкторских решений; определение политики инвестиций в различных областях; задачи размещения (выбор места расположения вредных и опасных производств, пунктов обслуживания); распределение ресурсов; проведение анализа проблемы по методу "стоимость-эффективность"; стратегическое планирование; проектирование и выбор оборудования, товаров |
MPRIORITY |
http://www.tomake choice.com/ mpriority.html |
Система базируется на методе анализа иерархий. Систему "MPRIORITY" от ее аналогов отличает диалоговый интерфейс, адаптированный под особенности МАИ и восприятие пользователя. Программа содержит диалоговые средства, позволяющие получать наиболее полную информацию о проведенных попарных сравнениях и устранять возможные несогласованности в матрицах попарных сравнений. Использование присутствующего в программной системе механизма шаблонов (шаблон - готовая иерархия для одной из задач принятия решений) позволяет пользователю адаптировать программную систему под область своей деятельности |
WinEXP+ |
http://www. teleform.ru/pages/ 0002/0006/0001/ 0002.html |
В основе системы - метод анализа иерархий (МАИ). Функциональные возможности системы: создание сложных и разветвленных иерархий, вычисление приоритетов альтернативных решений. Достоинства системы: дружественный интерфейс, включающий интерактивную справку. Гибкие цветовые настройки системы. Возможность расширения системы. Универсальность системы в отношении ее применения в различных областях деятельности. Простота и доступность при обучении пользователей |
Выделение признаков классификации СППР
Выделение признаков классификации СППР
Сформулируем признаки, с помощью которых целесообразно описывать/классифицировать СППР, а также поясним отдельные признаки на примере различных СППР.
В отдельных системах реализован анализ чувствительности результатов, позволяющий проследить, как изменение весов критериев влияет на результат решения задачи.
Особенности Экспертной системы поддержки принятия решений
Особенности Экспертной системы поддержки принятия решений
Информационная система "Экспертная система поддержки принятия решений (ЭСППР)" ориентирована на автоматизацию процедур анализа проблемных ситуаций и выбора эффективных решений.
Выделим особенности ЭСППР:
Архитектура ЭСППР
Архитектура ЭСППР
ЭСППР включает в себя: модуль интерактивного общения с пользователем; модуль выбора метода принятия решения; модуль принятия решений; модуль оперативного анализа и генерации отчетности, модуль извлечения знаний (рис.12.14).
Назначением модуля интерактивного общения с пользователем является обеспечение средствами авторизации доступа; графического ввода/вывода информации; одновременного доступа нескольких пользователей к ЭСППР через веб-браузер.
Рис. 12.14. Архитектура Экспертной системы поддержки принятия решений
Данный модуль позволяет создавать собственные задачи; редактировать задачи; находить задачу по ключевым словам; вводить экспертные оценки, необходимые для решения задачи; посылать приглашение экспертам; присваивать статус эксперта; отбирать статус эксперта; генерировать отчет; назначать права доступа к задаче.
Назначением модуля выбора метода является обеспечение поиска конкретного метода, исходя из особенностей поставленной задачи, используя информационно-справочные функции, предоставляемые системой.
Данный модуль позволяет выявить информацию об элементах решаемой задачи посредством выбора пользователем одного из возможных ответов на вопросы, задаваемые системой. Исключает противоречия в следовании отдельных вопросов, когда каждый следующий вопрос рассматривается как отклик на предыдущие ответы пользователя. Осуществляет загрузку и передачу управления модулю, реализующему этап принятия решения.
Назначением модуля принятия решений является обеспечение нахождения эффективного варианта решения на основе выбранного метода; возможности многовариантного решения поставленной задачи с использованием различных экономико-математических методов; участия экспертов в оценке альтернатив.
Модуль оперативного анализа и генерации отчетности направлен на формирование отчетности по задачам и аналитической отчетности.
Аналитические отчеты на основе многомерной базы данных основываются на введении набора показателей по различным аналитическим направлениям: количество пользователей в системе; количество экспертов, количество задач; количество вариантов решения задач; количество просмотров задачи пользователями; время, затраченное на получения ответа по варианту решения.
Назначением модуля извлечения знаний является нахождение схожей задачи для использования в качестве аналога для самостоятельной постановки.
Реализация выбора метода принятия решения в ЭСППР
Реализация выбора метода принятия решения в ЭСППР
ЭСППР допускает два варианта выбора метода принятия решения: путем ответа на задаваемые системой вопросы и в явном виде (по названию метода).
При выборе метода путем ответа на вопросы пользователю предлагается цепочка вопросов с несколькими вариантами ответов на каждый вопрос. Выбранный ответ приводит к тому, что из полного списка методов система постепенно удаляет те методы, которые не удовлетворяют выбранным ответам. В итоге остается единственный метод, с помощью которого будет решаться задача.
Выбор метода в явном виде применяется в том случае, когда пользователь знает, какой из методов должен использоваться для решения задачи.
Рис. 12.15.
Страница выбора метода принятия решений в ЭСППР содержит несколько рабочих областей (рис. 12.15.).
Область вопросов. В этой области отображаются вопросы, ответы на которые приводят к выбору метода принятия решения. Каждый вопрос содержит информацию об одном из элементов задачи принятия решения.
Область подсказок к вопросам. Эта область позволяет получить более подробную информацию (развернутое пояснение) о содержании того или иного вопроса. Подсказка выводится на экран автоматически при появлении очередного вопроса.
Область вариантов ответов. В данной области располагаются допустимые варианты ответов на текущий вопрос. Варианты ответов отображаются в виде списка, из которого пользователь может выбрать только один элемент.
Область подсказок к вариантам ответов. Эта область позволяет получить более подробную информацию (развернутое пояснение) о содержании того или иного варианта ответа. Для вывода подсказки на экран следует отметить тот или иной вариант ответа путем активизации соответствующего переключателя.
Область истории ответов. В этой области отображается содержание тех ответов, которые были выбраны пользователем в ходе проведения опроса. Ответы располагаются в хронологической последовательности, т.е. в том порядке, в котором пользователь отвечал на вопросы. При каждом новом сеансе выбора метода принятия решения история ответов очищается.
Область допустимых методов принятия решения. В данной области отображается список допустимых методов, т.е. удовлетворяющих всем требованиям, которые были заданы ранее ответами пользователя на вопросы. При этом в начале опроса в списке присутствуют все методы, включенные в систему, а по мере продвижения вдоль цепочки вопросов и ответов их количество постепенно уменьшается, что в итоге позволяет сократить круг допустимых методов до единственного метода.
Область подсказок к методам принятия решения. Эта область позволяет получить более подробную информацию (развернутое пояснение) об условиях применения того или иного метода приятия решения. Для вывода подсказки на экран следует отметить соответствующий метод (в области допустимых методов) путем активизации соответствующего переключателя.
Выбор метода принятия решения является необходимым условием для перехода к описанию параметров решения задачи и далее - к вводу исходных данных задачи и запуску процедуры ее решения.
Характеристика ЭСППР по выделенным признакам
Характеристика ЭСППР по выделенным признакам
Приведем характерные особенности ЭСППР по выделенным выше признакам.
Таблица 12.5. Особенности ЭСППР по выделенным признакам |
|
1. Технические спецификации |
|
1.1. Наименование системы |
ЭСППР |
1.2. Тип пользователя |
Лицо, принимающее решения |
IT-составляющая (перечень используемых информационных технологий) |
Программное обеспечение ЭСППР разработано на языке программирования MS Visual C# в среде Microsoft Visual Studio 2005. База данных системы разработана и функционирует в РСУБД Microsoft SQL Server 2005. Аналитическая отчетность системы реализо-вана и функционирует в ProСlarity Analytics Server. Многомерные витрины данных для аналитической отчетности реализованы и функционируют в Microsoft SQL Server 2005 Analysis Services |
1.4. Совместимость с другими программными продуктами |
В текущей версии системы совместимость не реализована |
2. Особенности интерфейса |
Обеспечивает доступ конечных пользователей к системе с применением технологии "Тонкий клиент" (через интернет-браузер и веб-сервер) |
3. Методы принятия решений, используемые в СППР |
Текущая версия системы содержит около 50-ти математических методов принятия решений |
4. Особенности ввода исходных данных |
Входные данные задаются пользователем вручную либо копируются из существующих в системе вариантов решения задачи |
5. Особенности представления результата решения задачи |
Выходные данные формируются в виде отчета, содержащего результаты решения задачи с использованием различных математических методов. В ЭСППР реализован модуль аналитической отчетности, характеризующий эффективность использования системы |
6. Наличие базы знаний |
База знаний содержит набор правил выбора соответствующих моделей и методов принятия решений для обоснования альтернатив в зависимости от конкретной реализации элементов поставленной задачи |
7. Наличие базы данных |
База данных содержит информацию, необходимую для проведения расчетов; описания задач и методов принятия решений; формирования отчетов; поддержки многоязычного интерфейса, добавления новых методов принятия решений без изменения программного кода системы |
8. Оценка альтернатив |
|
8.1. Способы задания множества альтернатив |
Множество альтернатив может быть конечным или представлено в виде подмножества n-мерного пространства |
8.2. Способы задания предпочтений на множестве альтернатив |
Могут быть заданы количественные оценки или порядковые оценки альтернатив по каждому критерию (признаку) |
8.3. Принципы согласования оценок альтернатив по различным признакам |
Принципы большинства; Парето; последовательного рассмотрения критериев. Возможно решение задачи в два этапа: на первом этапе для согласования оценок альтернатив с позиций различных критериев (признаков) применяется принцип Парето, на втором этапе - принцип большинства |
8.4. Способы задания относительной значимости признаков (критериев) |
Экспертно в 10- или 100-балльной шкале |
8.5. Проверка согласованности оценок альтернатив по отдельным признакам |
отсутствует |
9. Возможность согласования оценок альтернатив в различных проблемных ситуациях |
|
9.1. Принципы согласования оценок альтернатив в различных проблемных ситуациях в условиях неопределенности |
Принципы Парето; пессимизма; оптимизма; Гурвица; антагонистического игрока; Сэвиджа; Лапласа |
9.2. Принципы согласования оценок альтернатив в различных проблемных ситуациях с учетом вероятности их появления |
Принципы большинства; Байеса |
10. Организация работы с экспертами |
|
10.1. Возможность привлечения экспертов |
Работа с экспертами реализована во всех методах принятия групповых решений |
10.2. Учет коэффициентов компетентности экспертов |
Коэффициенты компетентности экспертов вводятся в 10- или 100-балльной шкале |
10.3. Принципы согласования оценок экспертов |
Принципы большинства и Парето. Возможно решение задачи в два этапа. На первом этапе для согласования оценок альтернатив с позиций различных экспертов применяется принцип Парето, на втором этапе - принцип большинства |
10.4. Оценка согласованности мнений экспертов |
отсутствует |
Специализированные аналитические приложения
Специализированные аналитические приложения
Перечисленные выше классы аналитических приложений носят общий характер и в той или иной мере могут быть использованы организациями различной отраслевой принадлежности (хотя конкретные модели, конечно же, будут учитывать как особенности отрасли, так и индивидуальные особенности отдельных организаций). Тем не менее, нельзя забывать и о том, что отраслевая специфика может порождать специфические классы аналитических задач, свойственных тем или иным предметным областям. Информатизацию таких задач осуществляют специализированные аналитические приложения для конкретных предметных областей. Примерами таких решений могут служить системы инвестиционного анализа и системы анализа рынка ценных бумаг.
Системы инвестиционного анализа помогают произвести экономическую оценку инвестиционных проектов с учетом предполагаемых инвестиций и ожидаемых результатов на основе довольно широкого набора методов и моделей. Примерами таких систем могут служить отечественные разработки Project Expert и Prime Expert.
Системы анализа рынка ценных бумаг позволяют анализировать сведения, поступающие из различных источников информации о фондовом рынке, включая открытые базы данных и системы биржевой торговли. Примерами таких систем могут служить системы технического анализа Omega Research ProSuite и MetaStock. Кроме того, среди аналитических приложений этого класса присутствуют системы, реализующие другие методы, например, методы фундаментального анализа ценных бумаг, статистические или нейросетевые методы.
Можно отметить, что круг информационных систем, относящихся к аналитическим приложениям, весьма широк. Впрочем, это не удивительно, учитывая емкость понятия "экономический анализ", разнообразие аналитических задач и применяемых для их решения методов и моделей. Также отметим, что хотя большинство аналитических систем так или иначе основаны на обработке количественной информации, это не исключает возможности использования экспертных оценок, применяемых для поддержки принятия решений в случаях, когда по тем или иным причинам количественные оценки не представляются возможными.
Лекция 13
История и тенденции развития вычислительной техники
В 1946 году появилась первая электронная вычислительная машина (компьютер), что явилось громадным достижением человечества. В реализации проекта принимали активное участие такие крупные ученые, как К. Шеннон, Н. Виннер, Дж. фон Нейман и др. С этого момента началась эра вычислительной техники. За прошедшее время вычислительная техника, микроэлектроника и вся индустрия информатики стали одной из основных составляющих мирового научно-технического прогресса. Их развитие осуществлялось темпами, которых не знала ни одна отрасль де-ятельности человека. Влияние вычислительной техники на все сферы деятельности человека продолжает расширяться. В настоящее время компьютеры используются не только для автоматизации сложных расчетов, но и в управлении производственными процессами, в образовании, здравоохранении, экологии и т.п.
Математические основы автоматических вычислений были уже разработаны ранее (Г. Лейбниц, Дж. Буль, A. Тьюринг и др.), но появление компьютеров стало возможным только благодаря развитию электронной техники. Многократные попытки создания разного рода автоматических вычислительных устройств (от простейших счетов до механических и электромеханических вычислителей) не привели к созданию надежных и экономически эффективных машин.
Появление электронных схем сделало возможным построение электронных вычислительных машин.
Электронная вычислительная машина (ЭВМ), или компьютер, - это комплекс аппаратных и программных средств, предназначенный для автоматизации подготовки и решения задач пользователей. Следует отметить, что в настоящее время термин "электронная вычислительная машина" практически не используется, уступив место термину "компьютер".
Под пользователем понимают человека, в интересах которого проводится обработка данных. В качестве пользователя могут выступать заказчики вычислительных работ, программисты, операторы.
Компьютеры являются универсальными техническими средствами автоматизации вычислительных работ, то есть они способны решать любые задачи, связанные с преобразованием информации. Однако подготовка задач к решению была и остается до настоящего времени достаточно трудоемким процессом, требующим от пользователей во многих случаях специальных знаний и навыков. Как правило, время подготовки задач во много раз превышает время их решения.
Для снижения трудоемкости подготовки задач к решению, более эффективного использования отдельных технических, программных средств и компьютера в целом, а также облегчения их эксплуатации создается специальный комплекс программных средств. Обычно аппаратные и программные средства взаимосвязаны и объединяются в одну структуру.
Структура представляет собой совокупность элементов и их связей. В зависимости от контекста различают структуры технических, программных, аппаратно-программных и информационных средств.
Часть программных средств обеспечивает взаимодействие пользователей с компьютером и является своеобразным "посредником" между ними. Она получила название "операционная система" и является ядром программного обеспечения.
Под программным обеспечением понимают комплекс программных средств регулярного применения, создающий необходимый сервис для работы пользователей.
Программное обеспечение (ПО) отдельных компьютеров и вычислительных систем (ВС), созданных на их основе, может сильно различаться составом используемых программ, который определяется классом используемой вычислительной техники, режимами ее применения, содержанием вычислительных работ пользователей и т.п. Развитие ПО в значительной степени носит эволюционный и эмпирический характер, но можно выделить закономерности в его построении.
В общем случае процесс подготовки и решения задач предусматривает обязательное выполнение следующей последовательности этапов: формулировка проблемы и математическая постановка задачи; выбор метода и разработка алгоритма решения; программирование (запись алгоритма) с использованием некоторого алгоритмического языка; планирование и организация вычислительного процесса - порядка и последовательности использования ресурсов компьютеров и вычислительных систем (ВС); формирование "машинной программы", то есть программы, которую непосредственно будет выполнять компьютер; собственно решение задачи - выполнение вычислений по готовой программе.
По мере развития вычислительной техники автоматизация этих этапов идет снизу вверх. На пути развития электронной вычислительной техники обычно выделяют четыре поколения компьютеров, отличающихся элементной базой, функционально-логической организацией, конструктивно-технологическим исполнением, программным обеспечением, техническими и эксплуатационными характеристиками, степенью доступа к ресурсам со стороны пользователей.
Смене поколений сопутствует изменение основных технико-эксплуатационных и технико-экономических показателей компьютеров и в первую очередь таких, как быстродействие, емкость памяти, надежность и стоимость. При этом одной из основных тенденций развития было и остается стремление уменьшить трудоемкость подготовки программ решаемых задач, облегчить связь пользователей с компьютерами, повысить эффективность использования последних. Это диктовалось и диктуется постоянным ростом сложности и трудоемкости задач, решение которых возлагается на компьютеры в различных сферах их применения.
Возможности улучшения технико-эксплуатационных показателей компьютеров в значительной степени зависят от элементов, используемых для построения их электронных схем. Поэтому при рассмотрении этапов развития компьютеров каждое поколение в первую очередь характеризуется используемой элементной базой.
Основным активным элементом компьютеров первого поколения являлась электронная лампа, остальные компоненты электронной аппаратуры - это обычные резисторы, конденсаторы, трансформаторы. Для построения оперативной памяти уже с середины 50-х годов начали применяться специально разработанные для этой цели элементы - ферритовые сердечники с прямоугольной петлей гистерезиса. В качестве устройства ввода-вывода сначала использовалась стандартная телеграфная аппаратура (телетайпы, ленточные перфораторы, трансмиттеры, аппаратура счетно-перфорационных машин), а затем специально были разработаны электромеханические запоминающие устройства на магнитных лентах, барабанах, дисках и быстродействующие печатающие устройства.
Компьютеры этого поколения имели значительные размеры, потребляли большую мощность. Быстродействие этих машин составляло от нескольких сотен до нескольких тысяч операций в секунду, емкость памяти - несколько тысяч машинных слов, надежность исчислялась несколькими часами работы.
В этих ЭВМ автоматизации подлежал этап выполнения вычислений, так как у них практически отсутствовало какое-либо программное обеспечение. Все этапы подготовки пользователь должен был готовить вручную самостоятельно, вплоть до получения машинных кодов программ. Трудоемкий и рутинный характер этих работ был источником большого количества ошибок в заданиях. Поэтому в компьютерах следующих поколений появились сначала блоки программ, а затем целые программные системы, облегчающие процесс подготовки задач к решению.
На смену лампам пришли транзисторы в машинах второго поколения (начало 60-х годов). Применение постоянно совершенствуемых транзисторов позволило преобразовать окружающий человека мир (радио, телевидение, бытовая аппаратура, системы связи и т.п.). Компьютеры стали обладать большими быстродействием, емкостью оперативной памяти, надежностью. Все основные характеристики постоянно улучшались. Существенно были уменьшены размеры, масса и потребляемая мощность.
В компьютерах этого поколения появились методы и приемы программирования, высшей ступенью которых явилось появление систем автоматизации программирования, значительно облегчающих труд математиков-программистов. Большое развитие и применение получили алгоритмические языки, существенно упрощающие процесс подготовки задач к решению. Это привело к созданию библиотек стандартных программ, что позволило строить машинные программы блоками, используя накопленный и приобретенный программистами опыт.
Третье поколение компьютеров (в конце 60-х - начале 70-х годов) характеризуется широким применением интегральных схем. Интегральная схема представляет собой законченный логический и функциональный блок, соответствующий достаточно сложной транзисторной схеме. Благодаря использованию интегральных схем удалось еще более улучшить технические и эксплуатационные характеристики машин. Вычислитель-ная техника стала иметь широкую номенклатуру устройств, которые позволили строить разнообразные системы обработки данных, ориентированные на различные применения.
Отличительной особенностью развития программных средств этого поколения является появление ярко выраженного программного обеспечения и развитие его ядра - операционных систем, отвечающих за организацию и управление вычислительным процессом. Стоимость программного обеспечения стала расти и в настоящее время намного опережает стоимость аппаратуры (рис.13.1). Наибольшая крутизна графика соответствует времени появления операционных систем - началу 80-х годов.
ОС планирует последовательность распределения и использования ресурсов вычислительной системы, а также обеспечивает их согласованную работу. Под ресурсами обычно понимают те средства, которые применяются для вычислений: машинное время отдельных процессоров или компьютеров, входящих в систему; объемы оперативной и внешней памяти; отдельные устройства, информационные массивы; библиотеки программ; отдельные программы, как общего, так и специального применения, и т.п. Интересно, что наиболее употребительные функции ОС в части обработки внештатных ситуаций (защита программ от взаимных помех, системы прерываний и приоритетов, служба времени, сопряжение с каналами связи и т.д.) были полностью или частично реализованы аппаратно. Одновременно были реализованы более сложные режимы работы: коллективный доступ к ресурсам, мультипрограммные режимы. Часть этих решений стала своеобразным стандартом и начала использоваться повсеместно в компьютерах различных классов.
Рис. 13.1. Динамика изменения стоимости аппаратурных и программных средств
Здесь были существенно расширены возможности доступа к ним со стороны абонентов, находящихся на различных, в том числе и значительных (десятки и сотни километров) расстояниях. Удобство общения абонента с компьютером достигалось за счет развитой сети абонентских пунктов, связанных с ним информационными каналами связи, и соответствующего программного обеспечения.
Для компьютеров четвертого поколения (80-е годы) характерно применение больших интегральных схем (БИС). Высокая степень интеграции способствовала увеличению плотности компоновки электронной аппаратуры, усложнению ее функций, повышению надежности и быстродействия, снижению стоимости. Это, в свою очередь, оказало существенное воздействие на логическую структуру компьютера и его программное обеспечение
В четвертом поколении с появлением микропроцессоров (1971 г.) возник новый класс вычислительных машин - микроЭВМ, на смену которым пришли персональные компьютеры (ПК, начало 80-х годов). В этом классе наряду с БИС стали использоваться сверхбольшие интегральные схемы (СБИС) 32-, а затем 64-разрядности.
Появление ПК - наиболее яркое событие в области вычислительной техники, до последнего времени самый динамично развивающийся сектор отрасли. С их внедрением решение задач информатизации общества было поставлено на реальную основу.
Применение ПК позволило сделать труд специалистов творческим, интересным, эффективным. Коренным образом были преобразованы сферы делопроизводства, торговли, складского учета и т.п. Компьютеры стали использоваться в различных системах управления технологическими процессами, производствами, фирмами, организациями и т.д.
Применение ПК позволило применять новые информационные технологии и создавать системы распределенной обработки данных. Высшей стадией систем распределенной обработки данных являются компьютерные (вычислительные) сети различных уровней - от локальных до глобальных.
В своем развитии компьютеры первых четырех поколений не выходили за рамки классической структуры, ориентированной на последовательные вычисления по программе. Но в начале нового тысячелетия (2005-2006 гг.) в связи с успехами микроэлектроники появились, а затем стали доминировать многоядерные микропроцессоры. Это позволило пе-рейти к параллельным вычислениям даже внутри отдельного компьютера. Де-факто возникли качественно новые по построению и своим возможностям компьютеры следующего поколения. Однако еще в 1980 году появился японский проект создания компьютеров пятого поколения, отличительной особенностью которых должен быть встроенный искусст-венный интеллект. Видимо, несовпадение признаков классификации не позволяет сейчас узаконить переход на компьютеры нового поколения.
В новых компьютерах продолжается усложнение технических и программных структур (иерархия управления средствами, увеличение их количества, параллелизм в работе). Следует указать на заметный рост уровня "интеллектуальности" систем, создаваемых на их основе. Подобные тенденции будут сохраняться и впредь. Так, по мнению исследователей [46], новые компьютеры наращивают и совершенствуют встроенный в них "искусственный интеллект", что позволяет пользователям обращаться к ним на естественном языке, вводить и обрабатывать тексты, документы, иллюстрации, создавать системы обработки знаний и т.д. Аппаратная часть компьютеров постоянно усложняется, для них приходится создавать сложное многоэшелонное иерархическое программное обеспечение.
Основные характеристики и классификация компьютеров
Эффективное применение вычислительной техники предполагает, что каждый вид вычислений требует использования компьютера с определенными характеристиками.
Важнейшими из них служат быстродействие и производительность. Эти характеристики достаточно близки, но их не следует смешивать.
Быстродействие характеризуется числом определенного типа команд, выполняемых за одну секунду. Производительность - это объем работ (например, число стандартных программ), выполняемый в единицу времени.
Определение характеристик быстродействия и производительности представляет собой очень сложную инженерную и научную задачу, до настоящего времени не имеющую единых подходов и методов решения. Обычно вместо получения конкретных значений этих характеристик указывают результаты сравнения данных, полученных при испытаниях (тестированиях) различных образцов.
Другой важнейшей характеристикой компьютера является емкость запоминающих устройств. Емкость памяти измеряется количеством структурных единиц информации, которое может одновременно находиться в памяти. Этот показатель позволяет определить, какой набор программ и данных может быть одновременно размещен в памяти.
Наименьшей структурной единицей информации является бит - одна двоичная цифра. Как правило, емкость памяти оценивается в более крупных единицах измерения - байтах (байт равен 8 битам). Следующими единицами измерения служат .
Обычно отдельно характеризуют емкости оперативной и внешней памяти. В настоящее время персональные компьютеры имеют емкость оперативной памяти, равную 512Мбайт, 1Гбайт и даже больше. Этот показатель очень важен для определения, какие программные пакеты и их приложения могут одновременно обрабатываться в машине.
Емкость внешней памяти зависит от типа носителя. Так, практически исчезли из обращения дискеты как накопители и средства переноса и хранения данных. На смену им пришла флэш-память, емкость которой может быть от нескольких Гбайт до Тб. Пока сохраняют свое значение и традиционные накопители. Емкость дисков DVD достигает нескольких десятков Гбайтов, емкость компакт-диска (CD-ROM) - 640 Мб и выше, жестких дисков - сотни Гбайт и т.д. Емкость внешней памяти характеризует объем программного обеспечения и отдельных программных продуктов, которые могут устанавливаться. Например, для установки операционной среды Windows 7 в зависимости от версии требуется объем памяти жесткого диска 160Гб-1Тб и оперативной памяти 1-3Гб.
Надежность - это способность компьютера при определенных условиях выполнять требуемые функции в течение заданного периода времени (стандарт ISO - 2382/14-78).
Высокая надежность компьютера закладывается в процессе его производства. Переход на новую элементную базу - сверхбольшие интегральные схемы (микропроцессоры и схемы памяти) резко сокращает число используемых интегральных схем, а значит, и число их соединений друг с другом.
Точность - возможность различать почти равные значения (стандарт ISO 2382/2-76). Точность получения результатов обработки в основном определяется разрядностью компьютера, а также используемыми структурными единицами представления информации (байтом, словом, двойным словом).
Современные компьютеры, включая ПК, имеют возможность работы с 32- и даже с 64-разрядными машинными словами. С помощью языков программирования этот диапазон может быть увеличен в несколько раз, что позволяет достигать очень высокой точности.
Достоверность - свойство информации быть правильно воспринятой. Достоверность характеризуется вероятностью получения безошибочных результатов. Заданный уровень достоверности обеспечивается аппаратно-программными средствами контроля. Возможны методы контроля достоверности путем решения эталонных задач и повторных расчетов. В особо ответственных случаях проводятся контрольные решения на других компьютерах и сравнение результатов.
Усложнение схем компьютеров приводит к увеличению энергопотребления, что порождает целый ряд проблем. Поэтому для микропроцессоров введена характеристика, отражающая класс мощности (энерго-потребление, TDP - Thermal Design Power, тепловой пакет).
В настоящее время в мире произведены, работают и продолжают выпускаться миллионы вычислительных машин, относящиеся к различным поколениям, типам, классам и отличающиеся своими областями применения, техническими характеристиками и вычислительными возможностями.
Основные черты рынка современных компьютеров - разнообразие и динамизм. Практически каждые полтора десятилетия меняется поколение машин, каждые два года _ основные типы микропроцессоров, СБИС, определяющих характеристики новых вычислителей. Такие темпы сохраняются уже многие годы.
Рынок компьютеров постоянно имеет широкую градацию классов и моделей. Существует большое количество классификационных признаков, по которым все это множество разделяют на группы: по уровням специализации (универсальные и специализированные), по типоразмерам (настольные, портативные, карманные), по совместимости, по типам используемых микропроцессоров и количеству их ядер, по возможностям и назначению и др. [44]. Разделение компьютеров по поколениям, изложенное в п. 13.1, также является одним из видов классификации. Наиболее часто используют классификацию компьютеров по возможностям и назначению, а в последнее время - и по роли компьютеров в сетях.
По возможностям и назначению компьютеры подразделяют:
С развитием науки и техники постоянно выдвигаются новые крупномасштабные задачи, требующие выполнения больших объемов вычислений. Особенно эффективно применение суперЭВМ при решении задач проектирования, в которых натурные эксперименты оказываются дорогостоящими, недоступными или практически неосуществимыми. СуперЭВМ по сравнению с другими типами машин позволяют точнее, быстрее и качественнее решать крупные задачи, обеспечивая необходимый приоритет в научных разработках, в том числе и в перспективной вычислительной технике.
Неудивительно, что мощные компьютеры являются особым достоянием любого государства. В Интернете отслеживается список пятисот самых мощных компьютеров мира (top500.org). Их разработка возведена в ранг государственной политики ведущих в экономическом отношении стран и является одним из важнейших направлений развития науки и техники. Список top500 сейчас возглавляют китайский компьютер Tianhe-1A и компьютер Cray XT5-HE Jaguar, с быстродействием соответственно 2,67 и 1,759 PFLOP (1 петафлоп= оп/с). В списке top500 имеются суперкомпьютеры, используемые в России. Их число возросло до одиннадцати штук, и Россия вышла на 7-ое место. Пятьдесят самых мощных компьютеров России отслеживаются на отечественном сайте http//supercomputers.ru (список top50);
Появлению новых устройств способствуют следующие факторы:
Рассмотрим упрощенную градацию подобных устройств.
Ноутбуки (Notebooks). Совершенствование микропроцессоров привело к созданию мощных, дружественных и малогабаритных компьютеров, вполне способных обеспечить создание мобильного офиса различного класса с ориентацией на электронную почту, передачу факсов, доступ в Интернет. Интересно, что кризис IT-рынка почти не затронул сектор ноутбуков. Их производство устойчиво и вытесняет обычные ПК. Конфигурации ноутбуков обеспечивают широкие возможности. Ценовой диапазон - от 0,5 до 3-4 тысяч долларов. Миниатюрные ноутбуки позволяют решать практически все задачи, присущие настольным ПК, они обладают теперь достаточной мощностью, расширяемостью и гибкостью. Но пока они еще достаточно дороги, и время их автономной работы огра-ничено несколькими часами.
Младшей разновидностью ноутбуков следует считать UMPC (ultra-mobile PC, ультрамобильный ПК). Если UMPC достаточно дороги, то проект OLPC (One Laptop per Child - "По ноутбуку каждому ребенку") имеет целью развитие инфраструктуры беднейших стран мира. Согласно ему небольшие компьютеры, стоимостью менее 100$, должны в массовом количестве поставляться в беднейшие страны Африки, Азии и Латинской Аме-рики. Пока не удается снизить стоимость компьютеров ниже 150-200$.
Конкурентом младших моделей ноутбуков следует считать нетбуки (netbooks), ориентированные на работу с сетевыми ресурсами Интернета. Они появились 2-3 года назад, но по числу продаж уже сравнялись с ноутбуками. Их производство набирает силу.
Карманные персональные компьютеры (КПК). Эти компьютеры ориентированы на выполнение в основном информационных функций. Они имеют очень широкую номенклатуру и градацию. Центральной функцией этих устройств являлось обеспечение мобильной связи. Еще 5-7 лет назад компьютеры этого типа рассматривали как конкурентов ноутбуков, однако реальность показывает, что они должны в ближайшем будущем уступить место коммуникаторам, смартфонам и специализированным устройствам (для навигации или специального применения). В настоящее время границу между различными типами этих устройств тяжело провести. Коммуникатор - это упрощенный КПК, дополненный функциональностью мобильного телефона. От мобильного телефона он отличается на-личием установленной развитой операционной системы. Обычно особенности управления телефонами изготовителями не разглашаются.
Широкое распространение получили устройства, называемые смартфонами. Смартфоны (умные телефоны), обрастая новыми функциями, способны заменить целый класс специализированных устройств и являются их киллерами.
В настоящее время почти 50% населения Земли имеет мобильные телефоны. Современный телефон стоимостью в 100$ оснащен цветным экраном, встроенным фотоаппаратом с разрешением 5-7 Мпикселов, ауди-оплеером. Некоторые из них способны вести видеосъемки, просматривать видеофильмы, иметь игротеки. Некоторые способны заменить библиотеку, компьютер с доступом в Интернет и E-mail.
Встраиваемые микропроцессоры, осуществляющие автоматизацию управления отдельными устройствами и механизмами. Успехи микроэлектроники позволяют создавать миниатюрные вычислительные устройства, вплоть до однокристальных ЭВМ. Эти устройства, универсальные по характеру применения, могут встраиваться в отдельные машины, объекты, системы. Они находят все большее применение в бытовой технике (теле-фонах, телевизорах, электронных часах, микроволновых печах и т.д.), в городском хозяйстве (энерго-, тепло-, водоснабжении, регулировке движения транспорта и т.д.), на производстве (робототехнике, управлении технологическими процессами). Постепенно они входят в нашу жизнь, все больше изменяя среду обитания человека.
Высокие скорости вычислений позволяют перерабатывать и выдавать все большее количество информации, что, в свою очередь, порождает потребности в создании связей между отдельно используемыми вычислителями. Поэтому все современные компьютеры в настоящее время имеют средства подключения к сетям связи и объединения в системы. С развитием сетевых технологий все больше начинает использоваться другой классификационный признак, отражающий их место и роль в сети. Согласно ему предыдущая классификация отражается на сетевой среде:
Мощные машины и системы предназначаются для обслуживания крупных сетевых банков данных и банков знаний. По характеристикам их можно отнести к классу суперЭВМ, но в отличие от них они являются более специализированными и ориентированными на обслуживание мощных потоков информации.
Кластерные структуры представляют собой многомашинные распределенные вычислительные системы, объединяющие под единым управлением несколько серверов. Это позволяет гибко управлять ресурсами сети, обеспечивая необходимую производительность, надежность, готовность и другие характеристики.
Серверы - это вычислительные машины и системы, управляющие определенным видом ресурсов сети. Различают файл-серверы, серверы приложений, факс-серверы, почтовые, коммуникационные, веб-серверы и др.
Термин "рабочая станция" отражает факт наличия в сетях абонентских пунктов, ориентированных на работу профессиональных пользователей с сетевыми ресурсами. Этот термин как бы отделяет их от ПК, которые обеспечивают работу основной массы непрофессиональных пользователей, работающих обычно в автономном режиме.
Сетевые компьютеры. На базе существующих стандартных микропроцессоров появляется новый класс устройств, получивший это название. Само название говорит о том, что они предназначаются для использования в компьютерных сетях. В зависимости от выполняемых функций и от контекста под этим термином понимают совершенно различные устройства, от простейшего компьютера-наладонника до специализированных сетевых устройств типа "маршрутизатор", "шлюз", "коммутатор" и т.п.
Число приведенных типов компьютеров в индустриально развитых странах образует некое подобие пирамиды с определенным соотношением численности каждого слоя. Распределение вычислительных возможностей по слоям должно быть сбалансировано.
Принципы построения компьютера
Основным принципом построения всех современных компьютеров является программное управление. В его основе лежит представление алгоритма решения любой задачи в виде программы вычислений.
Все вычисления, предписанные алгоритмом решения задачи, должны быть представлены в виде программы, состоящей из последовательности управляющих слов _ команд. Каждая команда содержит указания на конкретную выполняемую операцию, места нахождения (адреса) операндов и ряд служебных признаков. Операнды _ переменные, значения которых участвуют в операциях преобразования данных. Программы и обрабатываемые ими данные должны совместно храниться в памяти компьютера.
Для доступа к программам, командам и операндам используются их адреса. В качестве адресов выступают номера ячеек памяти компьютера, предназначенных для хранения объектов. Информация (командная и данные: числовая, текстовая, графическая и другая информация) кодируется двоичным кодом (цифрами 0 и 1). Поэтому различные типы информации, размещенные в памяти, практически неразличимы, идентификация их возможна лишь при выполнении программы, согласно ее логике, по контексту.
Выполнение каждой команды программы предполагает многократное обращение к памяти (выборка команд, выборка операндов, отсылка результатов и т.п.). В первых структурах ЭВМ использовалось централизованное управление, при котором одна и та же аппаратура выполняла и основные, и вспомогательные действия. Это было оправдано для первых дорогих машин, но не позволяло выполнять параллельные работы. Эволюция вычислительной техники потребовала децентрализации.
Децентрализация построения и управления вызвала к жизни такие элементы, которые являются общим стандартом структур современных компьютеров:
Модульность построения предполагает выделение в структуре компьютера автономных, функционально, логически и конструктивно законченных устройств: процессор, модуль памяти, накопитель на магнитном диске, дисплей и т.п.
Модульная конструкция компьютера делает его открытой системой, способной к адаптации и совершенствованию. К нему можно подключать дополнительные устройства, улучшая его технические и экономические показатели. Появляется возможность наращивания вычислительной мощи, улучшения структуры путем замены отдельных устройств на более совершенные, изменения и управления конфигурацией системы, приспособления ее к конкретным условиям применения в соответствии с требованиями пользователей.
В качестве основных средств подключения и объединения модулей в систему используются магистрали, или шины. Стандартная система сопряжения (интерфейс) обеспечивает возможность формирования требуемой конфигурации, гибкость структуры и адаптацию к изменяющимся условиям функционирования.
В современных вычислителях принцип децентрализации и параллельной работы распространен как на периферийные устройства, так и на сами компьютеры, их процессоры. Появились вычислительные системы, которые содержат несколько вычислителей, работающих согласованно и параллельно. Внутри самого компьютера произошло еще более резкое разделение функций между средствами обработки. Появились отдельные специализированные процессоры, например, сопроцессоры, выполняющие обработку чисел с плавающей точкой, матричные процессоры и др.
Модульность структуры потребовала стандартизации и унификации оборудования, номенклатуры технических и программных средств, средств сопряжения - интерфейсов, конструктивных решений, унификации типовых элементов замены, элементной базы и нормативно-технической документации. Все это способствовало улучшению технических и эксплуатационных характеристик компьютеров, росту технологичности их производства.
Децентрализация управления предполагает иерархическую организацию структуры компьютера. Главный или центральный модуль системы определяет последовательность работ подчиненных модулей и их инициализацию, после чего они продолжают работу по собственным программам управления. Результаты выполнения требуемых операций представляются ими "вверх по иерархии" для правильной координации всех работ. Подключаемые модули могут, в свою очередь, использовать специальные шины, или магистрали, для обмена управляющими сигналами, адресами и данными.
Иерархический принцип построения и управления характерен не только для структуры компьютера в целом, но и для отдельных его подсистем. Например, по этому же принципу строится система памяти.
Децентрализация управления и структуры компьютера позволила перейти к более сложным многопрограммным (мультипрограммным) режимам. При этом в компьютере одновременно могут обрабатываться несколько программ пользователей.
Структурные схемы и взаимодействие устройств компьютера
Классическая схема компьютера, отвечающая программному принципу управления, логично вытекает из последовательного характера преобразований, выполняемых человеком по некоторому алгоритму (программе). Обобщенная структурная схема ЭВМ первых поколений представлена на рис.13.2.
В любом компьютере имеются устройства ввода информации (УВв), с помощью которых пользователи вводят программы решаемых задач и данные. Введенная информация сначала полностью или частично запоминается в оперативном запоминающем устройстве (ОЗУ), а затем переносится во внешнее запоминающее устройство (ВЗУ), предназначенное для длительного хранения информации, где преобразуется в специальный информационный объект - файл.
Рис. 13.2. Структурная схема первых компьютеров
При использовании файла в вычислительном процессе его содержимое переносится в ОЗУ. Затем программная информация команда за командой считывается в устройство управления.
Устройство управления (УУ) предназначается для автоматического выполнения программ путем принудительной координации всех остальных устройств. Цепи сигналов управления показаны на рис.13.2 штриховыми линиями. Вызываемые из ОЗУ команды дешифрируются устройством управления: определяют код операции, которую необходимо выполнить следующей, и адреса операндов, принимающих участие в данной операции.
Арифметико-логическое устройство (АЛУ) выполняет арифметические и логические операции над данными. Основной частью АЛУ является операционный автомат, в состав которого входят сумматоры, счетчики, регистры, логические преобразователи и др. Он каждый раз перестраивается на выполнение очередной операции. Результаты выполнения отдельных операций сохраняются для последующего использования на одном из регистров АЛУ или записываются в память. Отдельные признаки результатов r ( и др.) устройство управления использует для изменения порядка выполнения команд программы. Результаты, полученные после выполнения всей программы вычислений, передаются на устройство вывода информации (УВыв). В качестве УВыв могут использоваться экран дисплея, принтер, графопостроитель и др.
Классическая структура компьютера представляла собой "удивительно изящное инженерное решение", хорошо отвечающее тогдашнему уровню развития промышленных технологий. Она стала фактическим стандартом (de facto), которому стали следовать производители вычислительной техники.
В персональных компьютерах, относящихся к компьютерам четвертого поколения, произошло дальнейшее изменение структуры (рис.13.3). Соединение всех устройств в единую машину обеспечивается с помощью общей шины, представляющей собой линии передачи данных, адресов, сигналов управления и питания. Единая система аппаратурных соединений значительно упростила структуру, сделав ее децентрализованной. Все передачи данных по шине осуществляются под управлением сервисных программ.
Рис. 13.3. Структура ПК
Ядро ПК образуют процессор, основная память (ОП), состоящая из оперативной памяти и постоянного запоминающего устройства (ПЗУ), и видеопамять. ПЗУ предназначается для записи и постоянного хранения наиболее часто используемых программ управления.
Подключение всех внешних устройств (ВнУ), дисплея, клавиатуры, внешних ЗУ и др. обеспечивается через соответствующие адаптеры - согласователи скоростей работы сопрягаемых устройств, или контроллеры - специальные устройства управления периферийной аппаратурой. Контроллеры в ПК играют роль каналов ввода-вывода. В качестве особых устройств следует выделить таймер - устройство измерения времени, и контроллер прямого доступа к памяти (КПД) - устройство, обеспечивающее доступ к ОП, минуя процессор.
Организацию согласованной работы шин и устройств выполняют микросхемы системной логики, называемые чипсетом (Chipset). Большинство наборов микросхем системной логики имеют ярко выраженную иерархическую структуру построения, отвечающую уровням высокоскоростных и ввода-вывода данных. Уровень высокоскоростных устройств образуют процессоры, видеопамять, оперативная память; уровень низко-скоростных устройств образуют любые внешние устройства.
Компьютерные системы
Полувековая история развития вычислительной техники была связана с совершенствованием классической структуры компьютера, имеющей следующие отличительные признаки:
Классическая структура компьютера уже сослужила добрую службу человечеству. В ходе эволюции она была дополнена целым рядом частных доработок, позволяющих ликвидировать наиболее "узкие места" и обеспечить максимальную производительность в рамках достигнутых технологий. Однако, несмотря на все успехи, классическая структура уже не обеспечивает возможностей дальнейшего наращивания производительности. Теория и практика построения компьютеров подошли к рубежам микроэлектроники, за которыми стоят множество практически неразре-шимых проблем в областях системотехники, дальнейшего наращивания частоты работы микросхем, программирования, компиляции и т.д.
Дальнейшее поступательное развитие вычислительной техники напрямую связано с переходом к параллельным вычислениям, с идеями построения многопроцессорных систем и сетей, объединяющих большое количество отдельных процессоров и (или) ЭВМ. Здесь появляются огромные возможности совершенствования средств вычислительной техники. Но следует отметить, что при несомненных практических достижениях в области параллельных вычислений до настоящего времени отсутствует их единая теоретическая база.
С появлением в начале нового тысячелетия многоядерных микропроцессоров эра компьютеров классической структуры и связанных с ними последовательных вычислений заканчивается. На смену идут новые параллельные структуры с новыми принципами их построения. Они становятся экономически более выгодными. Будущее вычислительной техники - именно за этими системами.
Под вычислительной (компьютерной) системой (ВС) понимают совокупность взаимосвязанных и взаимодействующих процессоров или ЭВМ, периферийного оборудования и программного обеспечения, предназначенную для сбора, хранения, обработки и распределения информации. Отличительной особенностью ВС по отношению к ЭВМ является наличие в них нескольких вычислителей, реализующих параллельную обработку. Создание ВС преследует следующие основные цели: повышение производительности системы за счет ускорения процессов обработки данных, повышение надежности и достоверности вычислений, предоставление пользователям дополнительных сервисных услуг и т.д.
Основные принципы построения, закладываемые при создании ВС:
Существует большое количество признаков, по которым классифицируют вычислительные системы: по целевому назначению и выполняемым функциям, по типам и числу ЭВМ или процессоров, по архитектуре системы, режимам работы, методам управления элементами системы, степени разобщенности элементов вычислительной системы и др. Однако основными из них являются признаки структурной и функциональной организации вычислительной системы.
Большое разнообразие структур ВС затрудняет их изучение. Поэтому их классифицируют с учетом их обобщенных характеристик. С этой целью вводится понятие "архитектура системы".
Архитектура ВС - совокупность характеристик и параметров, определяющих функционально-логическую и структурную организацию системы и затрагивающих в основном уровень параллельно работающих вычислителей. Понятие архитектуры охватывает общие принципы построения и функционирования, наиболее существенные для пользователей, которых больше интересуют возможности систем, а не детали их технического исполнения. Поскольку ВС появились как системы параллельной обработки, рассмотрим классификацию архитектур именно c этой точки зрения.
Классификация архитектур была предложена М. Флинном (M. Flynn) в начале 60-хгг. В ее основу заложено два возможных вида параллелизма: независимость потоков заданий (команд), существующих в системе, и независимость (несвязанность) данных, обрабатываемых в каждом потоке. Классификация до настоящего времени еще не потеряла своего значения. Однако подчеркнем, что, как и любая классификация, она носит временный и условный характер. Своим долголетием она обязана тому, что оказалась справедливой для ВС, в которых вычислительные модули построены на принципах классической структуры ЭВМ. С появлением систем, ориентированных на потоки данных и использование ассоциативной обработки, эта классификация может быть некорректной.
Согласно данной классификации существует четыре основных архитектуры ВС, представленных на рис.13.4:
Коротко рассмотрим отличительные особенности каждой из архитектур.
Архитектура ОКОД охватывает все однопроцессорные и одномашинные варианты систем, то есть варианты с одним вычислителем. Все ЭВМ классической структуры попадают в этот класс. Здесь параллелизм вычислений обеспечивается путем совмещения выполнения операций отдельными блоками АЛУ, а также параллельной работой устройств ввода-вывода информации и процессора. Закономерности организации вы-числительного процесса в этих структурах достаточно хорошо изучены.
Архитектура ОКМД предполагает создание структур векторной или матричной обработки. Системы этого типа обычно строятся как однородные, т.е. процессорные элементы, входящие в систему, идентичны и все они управляются одной и той же последовательностью команд. Однако каждый процессор обрабатывает свой поток данных. Под эту схему хорошо подходят задачи обработки матриц или векторов (массивов), задачи решения систем линейных и нелинейных, алгебраических и дифференциальных уравнений, задачи теории поля и др. В структурах данной архитектуры желательно обеспечивать соединения между процессорами, соответствующие реализуемым математическим зависимостям. Как правило, эти связи напоминают матрицу, в которой каждый процессорный элемент связан с соседними.
Рис. 13.4. Архитектуры вычислительных систем: а) ОКОД (SISD) - архитектура; б) ОКМД (SIMD) - архитектура; в) МКОД (MISD) - архитектура; г) МКМД (MIMD) - архитектура
Эту схему использовали и используют все суперЭВМ без исключения, начиная с таких известных систем, как Cyber-205 и Gray различных модификаций. Узким местом подобных систем является необходимость изменения коммутации между процессорами, когда связь между ними отличается от матричной. Кроме того, задачи, допускающие широкий матричный параллелизм, составляют достаточно узкий класс задач. Структуры ВС этого типа по существу являются структурами специализированных суперЭВМ.
Архитектура МКОД предполагает построение своеобразного процессорного конвейера, в котором результаты обработки передаются от одного процессора к другому по цепочке. Выгоды такого вида обработки понятны. Прототипом таких вычислений может служить схема любого производственного конвейера. В современных ЭВМ по этому принципу реализована схема совмещения операций, в которой различные функциональные блоки работают параллельно, и каждый из них делает свою часть в общем цикле обработки команды.
В ВС этого типа конвейер должны образовывать группы процессоров. Однако при переходе на системный уровень очень трудно выявить подобный регулярный характер в универсальных вычислениях. Кроме того, на практике нельзя обеспечить и "большую длину" такого конвейера, при которой достигается наивысший эффект. Вместе с тем конвейерная схема нашла применение в так называемых скалярных процессорах суперЭВМ - они применяются как специальные процессоры для поддержки векторной обработки.
Архитектура МКМД предполагает, что все процессоры системы работают с различными программами и с индивидуальным набором данных. В простейшем случае они могут быть автономны и независимы. Такая схема использования ВС часто применяется во многих крупных вычислительных центрах для увеличения пропускной способности центра.
Наибольший интерес представляет организация согласованной работы процессоров системы, когда каждый элемент делает часть общей программы. Общая теоретическая база такого вида работ пока только создается. Но можно привести примеры большой эффективности этой модели вычислений. Подобные системы могут быть многомашинными и многопроцессорными. Переход на многоядерные микропроцессоры позволяет создавать мощные центры параллельной обработки, имеющие в своем составе тысячи процессоров. Проектировщики компьютерных систем сосредотачивают свои усилия на разработках разноплановых структур ВС (сосредоточенных и распределенных систем) именно в архитектуре МКМД.
Лекция 14
Системой счисления называется способ изображения чисел с помощью ограниченного набора символов, имеющих определенные количественные значения. Систему счисления образует совокупность правил и приемов представления чисел с помощью набора знаков (цифр).
Различают позиционные и непозиционные системы счисления. В позиционных системах каждая цифра числа имеет определенный вес, который зависит от позиции цифры в последовательности, изображающей число. Позиция цифры называется разрядом. В позиционной системе счисления любое число можно представить в виде:
( 14.1) |
где - -я цифра числа;
- количество цифр в дробной части числа;
- количество цифр в целой части числа;
- основание системы счисления.
Основание системы счисления показывает, во сколько раз "вес" -го разряда больше () разряда. Целая часть числа отделяется от дробной части точкой (запятой).
Пример 14.1. .
В соответствии с формулой (14.1) это число формируется из цифр с весами разрядов:
Теоретически наиболее экономичной системой счисления для представления значения числа цифрами является система с основанием , находящимся между числами 2 и 3.
Во всех современных ЭВМ для представления числовой информации применяется двоичная система счисления. Это обусловлено:
При число различных цифр, используемых для записи чисел, ограничено множеством из двух цифр (нуль и единица). Кроме двоичной системы счисления, широкое распространение получили и производные системы:
Восьмеричная и шестнадцатеричная системы счисления являются производными от двоичной, так как и . Они применяются в основном для более компактного изображения двоичной информации, так как запись значения чисел производится существенно меньшим числом знаков
Пример 14.2. Число в двоичной, восьмеричной и шестнадцатеричной системах счисления имеют следующее представление:
В табл. 14.1 приведено сравнительное представление чисел в различных системах счисления: десятичной (10 с/с), двоичной (2 с/с), восьмеричной (8 с/с) и шестнадцатеричной (16 с/с).
По данным этой таблицы можно выявить целый ряд закономерностей:
Таблица 14.1. Представление чисел в различных системах счисления |
|||||||
10c/c |
2c/c |
8c/c |
16c/c |
10c/c |
2c/c |
8c/c |
16c/c |
Целые числа |
Целые числа |
||||||
0 |
00000 |
0 |
0 |
10 |
01010 |
12 |
A |
1 |
00001 |
1 |
1 |
11 |
01011 |
13 |
B |
2 |
00010 |
2 |
2 |
12 |
01100 |
14 |
C |
3 |
00011 |
3 |
3 |
13 |
-1101 |
15 |
D |
4 |
00100 |
4 |
4 |
14 |
01110 |
16 |
E |
5 |
00101 |
5 |
5 |
15 |
01111 |
17 |
F |
6 |
00110 |
6 |
6 |
16 |
10000 |
20 |
10 |
7 |
00111 |
7 |
7 |
17 |
10001 |
21 |
11 |
8 |
01000 |
10 |
8 |
18 |
10010 |
22 |
12 |
9 |
01001 |
11 |
9 |
и.т.д. |
|||
Дробные числа |
Дробные числа |
||||||
0.5 |
0.1 |
0.4 |
0.8 |
0.0625 |
0.0001 |
0.04 |
0.1 |
0.25 |
0.01 |
0.2 |
0.4 |
0.03125 |
0.00001 |
0.02 |
0.08 |
0.125 |
0.001 |
0.1 |
0.2 |
и т.д. |
В ЭВМ перевод из одной системы в другую осуществляется автоматически, по специальным программам. Правила перевода целых и дробных чисел отличаются.
Необходимо сделать несколько замечаний. В общем случае перевод любого числа с дробью из одной системы счисления в другую может привести к появлению иррациональных чисел, имеющих бесконечное количество разрядов в дробной части чисел. Естественно, что любое техническое устройство, например компьютер, может оперировать только с конечным числом цифр, являющихся старшими, наиболее значимыми разрядами.
Игнорирование, отбрасывание младших разрядов чисел приводит к их округлению. При этом разница между округляемым и полученным числами называется ошибкой округления. Следует учитывать, что округление результатов вычислений по любому неслучайному правилу приводит к ошибкам с ненулевым смещением [83].
Целое число с основанием переводится в систему счисления с основанием путем последовательного деления числа на основание , записанного в виде числа с основанием , до получения остатка. Полученное частное следует вновь делить на основание , и этот процесс надо повторять до тех пор, пока частное не станет меньше делителя.
Полученные остатки от деления и последнее частное записываются в порядке, обратном полученному при делении. Сформированное число и будет являться числом с основанием .
Пример 14.3.
Дробное число с основанием переводится в систему счисления с основанием путем последовательного умножения <<Eqn010.eps>> на основание , записанное в виде числа с основанием . При каждом умножении целая часть произведения берется в виде очередной цифры соответствующего разряда, а оставшаяся дробная часть принимается за новое множимое. Число умножений определяет разрядность полученного результата, представляющего число в системе счисления .
Пример 14.4.
Так как двоичная, восьмеричная и шестнадцатеричная системы связаны через степени числа 2, то преобразования между ними можно вы-полнять другим, более простым способом. Для перевода из шестнадцатеричной (восьмеричной) системы счисления в двоичную достаточно двоичным кодом записать шестнадцатеричные коды цифр тетрадами (по 4 двоичных разряда) и триадами (по 3 двоичных разряда) - для восьмеричных цифр. Обратный перевод из двоичного кода производится в обратном порядке: двоичное число разбивается влево и вправо от границы целой и дробной частей на тетрады - для последующей записи цифр в шестнадцатеричном представлении, на триады - для записи их значений восьмеричными цифрами.
Представление числовой информации в компьютере
В компьютерах используются три вида чисел: с фиксированной точкой (запятой), с плавающей точкой (запятой) и двоично-десятичное представление. Точка (запятая) - это подразумеваемая граница целой и дробной частей числа, разряды и формулы (4.1).
Все современные компьютеры имеют центральный процессор или центральное процессорное устройство - CPU (Central Processing Unit), предназначенное для обработки чисел с фиксированной точкой. Одной из важнейших его характеристик является разрядность - количество двоичных разрядов, представляющих значение числа. Основным достоинством CPU служит простота алгоритмов выполнения операций и, соответственно, высокая скорость операций.
У чисел с фиксированной точкой в двоичном формате предполагается строго определенное место точки (запятой). Обычно это место определяется или перед первой цифрой числа, или после последней цифры числа. Если точка фиксируется перед первой значащей цифрой, то это означает, что число по модулю меньше единицы. Диапазон изменения значений чисел определяется неравенством:
Если точка фиксируется после последней цифры, то это означает, что -разрядные двоичные числа являются целыми. Диапазон изменения их значений составляет:
Перед самым старшим из возможных цифровых разрядов двоичного числа фиксируется его знак. Положительные числа имеют нулевое значение знакового разряда, отрицательные - единичные. Каждая цифра двоичного числа занимает один бит соответствующего -разрядного формата.
Существенным недостатком представления чисел с фиксированной точкой служит тот факт, что аппроксимация малых чисел связана с большой относительной ошибкой. Для чисел же, приближающихся по величине к максимально возможным (), относительная ошибка уменьшается. Абсолютная же ошибка представления чисел с фиксированной точкой всегда лежит в одних и тех же пределах независимо от величины чисел.
Другой формой представления чисел является представление их в виде чисел с плавающей точкой (запятой). Представление чисел с плавающей точкой необходимо использовать, когда обрабатываемые числа имеют очень большой диапазон изменения. Эта ситуация типична для научно-технических расчетов (тригонометрические, экспоненты, логарифмы). Поэтому все современные микропроцессоры в качестве дополнения к CPU имеют математические сопроцессоры. Их обычно называют блоками или устройствами с плавающей точкой - FPU (Floating Point Unit), или числовым расширением процессора - NPX (Numeric Processor eXtension). Сочетание параллельно работающих CPU и FPU позволяет добиться большей скорости и большей точности вычислений.
Числа с плавающей точкой представляются в виде мантиссы и порядка , иногда это представление называют полулогарифмической формой числа. Например, число можно представить в виде , при этом , основание системы счисления подразумевается фиксированным и равным десяти. Для двоичных чисел в этом представлении также формируется и порядок при основании системы счисления, равном двум.
что соответствует записи
Детализация двоичного представления чисел с плавающей точкой и двоично-десятичная форма чисел подробно освещены в [88]. Поскольку их представление и обработка базируются на двоичной арифметике, рассмотрим правила сложения двоичных цифр.
Все современные ЭВМ имеют достаточно развитую систему команд, включающую десятки и сотни машинных операций. Однако выполнение любой операции основано на использовании простейших микроопераций типа сложения и сдвига. Это позволяет иметь единое арифметико-логическое устройство для выполнения любых операций, связанных с обработкой информации. Сложение двоичных цифр двух чисел и иллюстрируется табл. 14.2.
Таблица 14.2. Правила сложения двоичных цифр |
||||
Значения двоичных чисел А и В |
Разряд суммы |
Перенос в следующий разряд |
||
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |
0 |
0 |
1 |
0 |
1 |
0 |
0 |
1 |
1 |
0 |
1 |
1 |
0 |
0 |
1 |
0 |
1 |
0 |
1 |
0 |
1 |
1 |
1 |
0 |
0 |
1 |
1 |
1 |
1 |
1 |
1 |
Здесь показаны правила сложения двоичных цифр , одноименных разрядов с учетом возможных переносов из предыдущего разряда .
Подобные таблицы можно было бы построить для любой другой арифметической и логической операции (вычитание, умножение и т.д.), но именно данные этой таблицы положены в основу выполнения любой операции ЭВМ. Под знак чисел отводится специальный знаковый разряд. Знак "+" кодируется двоичным нулем, а знак "-" - единицей. Действия над прямыми кодами двоичных чисел при выполнении операций создают большие трудности, связанные с необходимостью учета значений знаковых разрядов:
Во всех ЭВМ без исключения все операции выполняются над числами, представленными специальными машинными кодами. Их использование позволяет обрабатывать знаковые разряды чисел так же, как и цифровые разряды, а также заменять операцию вычитания операцией сложения.
Различают прямой код (П), обратный код (ОК) и дополнительный код (ДК) двоичных чисел.
Машинные коды
Прямой код двоичного числа образуется из абсолютного значения этого числа и кода знака (нуль или единица) перед его старшим числовым разрядом.
Пример 14.5.
Точечной вертикальной линией здесь отмечена условная граница, отделяющая знак от цифровых разрядов.
Обратный код двоичного числа образуется по следующему правилу. Обратный код положительных чисел совпадает с их прямым кодом. Обратный код отрицательного числа содержит единицу в знаковом разряде числа, а значащие разряды числа заменяются инверсными, т.е. нули заменяются единицами, а единицы - нулями.
Пример 14.6.
Свое название обратный код чисел получил потому, что коды цифр отрицательного числа заменены инверсными. Укажем наиболее важные свойства обратного кода чисел:
Дополнительный код положительных чисел совпадает с их прямым кодом. Дополнительный код отрицательного числа представляет собой результат суммирования обратного кода числа с единицей младшего разряда (- для целых чисел, - для дробных).
Пример 14.7.
Укажем основные свойства дополнительного кода.
т. е. число 10 (два) в знаковых разрядах числа.
Модифицированные обратные и дополнительные коды двоичных чисел отличаются соответственно от обратных и дополнительных кодов удвоением значений знаковых разрядов. Знак "+" в этих кодах кодируется двумя нулевыми знаковыми разрядами, а "-" - двумя единичными разрядами.
Пример 14.8.
Целью введения модифицированных кодов является фиксация и обнаружение случаев получения неправильного результата, когда значение результата превышает максимально возможный результат в отведенной разрядной сетке машины. В этом случае перенос из значащего разряда может исказить значение младшего знакового разряда. Значение знаковых разрядов "01" свидетельствует о положительном переполнении разрядной сетки, а "10" - об отрицательном переполнении. В настоящее время практически во всех моделях ЭВМ, в том числе во всех ПК, роль удвоенных разрядов для фиксации переполнения разрядной сетки играют переносы, идущие в знаковый и из знакового разряда.
Арифметические операции над числами с фиксированной точкой
Сложение (вычитание). Операция вычитания приводится к операции сложения путем преобразования чисел в обратный (ОК) или дополнительный (ДК) код. Пусть числа и , тогда операция алгебраического сложения выполняется в соответствии с табл. 14.3.
Таблица 14.3. Таблица преобразования кодов при алгебраическом сложении |
|
Требуемая операция |
Необходимое преобразование |
Зависимости, представленные в правой части таблицы, указывают на замену операции вычитания операцией сложения с обратным или дополнительным кодом соответствующего числа. Сложение двоичных чисел осуществляется последовательно, поразрядно в соответствии с табл. 14.2. При выполнении сложения цифр необходимо соблюдать следующие правила.
Пример 14.9. Сложить два числа .
Исходные числа имеют различную разрядность, и необходимо провести выравнивание разрядной сетки:
Сложение в обратном или дополнительном кодах дает один и тот же результат:
Обратим внимание, что при сложении цифр отсутствуют переносы в знаковый разряд и из знакового разряда, что свидетельствует о получении правильного результата.
Пример 14.10. Сложить два числа в ОК и ДК. В соответствии с табл. 14.3 должна быть реализована зависимость , в которой второй член преобразуется с учетом знака
При сложении чисел в ОК и ДК были получены переносы в знаковый разряд и из знакового разряда. В случае ОК перенос из знакового разряда требует дополнительного прибавления единицы младшего разряда (см. п. 4. правил). В случае ДК этот перенос игнорируется.
Умножение. Умножение двоичных чисел наиболее просто реализуется в прямом коде. Рассмотрим, каким образом оно приводится к операциям сложения и сдвигам.
Пример 14.11. Умножить два числа . Перемножим эти числа, представленные прямыми двоичными кодами, так же, как это делается в десятичной системе.
Нетрудно видеть, что произведение получается путем сложения частных произведений, которые представляют собой разряды множимого, сдвинутые влево в соответствии с позициями разрядов множителя. Частные произведения, полученные умножением на нуль, игнорируются. Важной особенностью операции умножения n-разрядных сомножителей является увеличение разрядности произведения до . Знак произведения формируется путем сложения знаковых разрядов сомножителей. Возможные переносы из знакового разряда игнорируются.
Деление. Операция деления, как и в десятичной арифметике, является обратной операции умножения. Покажем, что и эта операция приводится к последовательности операций сложения и сдвига.
Пример 14.12. Разделить два числа .
Деление произведено так же, как это делается обычно в десятичной системе. Сначала проверяется, можно ли вычесть значение делителя из старших разрядов делимого. Если возможно, то в разряде частного записывается единица и определяется частная разница. В противном случае в частное записывается нуль, и разряды делителя сдвигаются вправо на один разряд по отношению к разрядам делимого. К полученной предыдущей разнице сносится очередная цифра делимого, и данный процесс повторяется, пока не будет получена необходимая точность. Если учесть, что все вычитания в ЭВМ заменяются сложением в ОК или в ДК (см. табл. 14.3), то действительно, операция деления приводится к операциям сложения и сдвигам вправо разрядов делителя относительно разрядов делимого. Отметим, что делимое перед операцией деления должно быть приведено к -разрядной сетке. Только в этом случае при делении на -разрядный делитель получается -разрядное частное.
Знак частного формируется также путем сложения знаковых разрядов делимого и делителя, как это делалось при умножении.
Основные сведения из алгебры логики
Теоретической основой построения ЭВМ служат специальные математические дисциплины. Одной из них является алгебра логики, или булева алгебра (Дж. Буль - английский математик XIX в., основоположник этой дисциплины). Ее аппарат широко используют для описания схем ЭВМ, их проектирования и оптимизации.
Вся информация в ЭВМ представляется в двоичной системе счисления. Поставим в соответствие входным сигналам отдельных устройств ЭВМ соответствующие значения , а выходным сигналам - значения функций ) (рис.14.1).
В этом случае зависимостями
( 14.2) |
где -- й вход;
- число входов;
--й выход;
- число выходов в устройстве, можно описывать алгоритм работы любого устройства ЭВМ. Каждая такая зависимость является "булевой функцией, у которой число возможных состояний и каждой ее независимой переменной равно двум" (стандарт ISO 2382/2-76), т.е. функцией алгебры логики, а ее аргументы определены на множестве . Алгебра логики устанавливает основные законы формирования и преобразования логических функций. Она позволяет представить любую сложную функцию в виде композиции простейших функций. Рассмотрим наиболее часто употребляемые из них.
Рис. 14.1. Входные и выходные сигналы в схемах компьютера
Известно, что количество всевозможных функций от аргументов выражается зависимостью:
( 14.3) |
При можно определить две основные функции (), не зависящие от каких-либо переменных: , тождественно равную нулю (), и , тождественно равную единице (). Технической интерпретацией функции может быть генератор импульсов. При отсутствии входных сигналов на выходе этого устройства всегда имеются импульсы (единицы). Функция может быть интерпретирована как отключенная схема, сигналы от которой не поступают ни к каким устройствам.
При зависимость (14.3) дает . Представим зависимость значений этих функций от значения аргумента в виде специальной таблицы истинности (табл. 14.4).
Таблица 14.4. Таблица функций от одной переменной |
|||||
0 |
0 |
1 |
0 |
0 |
|
1 |
0 |
1 |
1 |
0 |
Таблицы истинности получили такое название, потому что они определяют значение функции в зависимости от комбинации входных сиг-налов. В этой таблице, как и ранее, и . Функция , а функция (инверсия ).
Этим функциям соответствуют определенные технические аналоги. Схема, реализующая зависимость , называется повторителем, а схема - инвертором.
При , т.е. от двух переменных можно построить шестнадцать различных функций. В табл. 14.5 представлена часть из них, имеющая фундаментальное значение при построении основных схем ЭВМ.
Таблица 14.5. Таблица функций от двух переменных |
|||||||||||||
00 |
0 |
1 |
0 |
1 |
0 |
1 |
0 |
1 |
1 |
0 |
|||
01 |
0 |
1 |
0 |
1 |
… |
1 |
0 |
0 |
1 |
0 |
1 |
… |
|
10 |
0 |
1 |
1 |
0 |
1 |
0 |
0 |
1 |
0 |
1 |
|||
11 |
0 |
1 |
1 |
0 |
1 |
0 |
1 |
0 |
1 |
0 |
В левой части таблицы перечислены все возможные комбинации входных переменных (наборы значений), а в правой - возможные реак-ции выходных сигналов. В табл. 14.5 представлены функции , полностью соответствующие функциям табл. 14.4, а также новые, часто используемые и интересные функции . При этом местоположение функций и их нумерация в таблице особого значения не имеют. По данной таблице нетрудно составить аналитическое выражение (зависимость) для каждой функции от двух аргументов вида (14.2). Для этого наборы переменных, на которых функция принимает значение единицы, записываются как конъюнкции (логическое умножение) и связываются знаками логического сложения. Такие формы функций получили название дизъюнктивных нормальных форм (ДНФ). Если в этих функциях конъюнкции содержат все без исключения переменные в прямом или инверсном значениях, то такая форма функций называется совершенной.
Функция представляет собой функцию логического сложения, дизъюнкцию. Она принимает значение единицы, если значение единицы имеет хотя бы одна переменная или :
Тождественность приведенных аналитических зависимостей можно установить, пользуясь законами алгебры логики, приведенными ниже.
Функция является инверсной функцией по отношению к :
Она имеет название отрицание дизъюнкции. Иногда в литературе встречается ее специальное название "стрелка Пирса", по имени математика, исследовавшего ее свойства.
Функция является функцией логического умножения, конъюнкцией. Она очень похожа на операцию обычного умножения и принимает значение единицы в тех случаях, когда все ее переменные равны единице:
Функция является инверсной функцией по отношению :
Она называется отрицание конъюнкции или "штрих Шеффера".
Функция называется логической равнозначностью, она принимает значение единицы, если все ее переменные имеют одинаковое значение (или 0 или 1):
Функция является инверсной по отношению и называется не-равнозначностью:
Она принимает значение единицы, если ее переменные имеют противоположные значения. Функции и являются основой для построения сумматоров, так как они соответствуют правилам формирования цифр двоичных чисел при сложении и вычитании (табл. 14.2).
Из перечисленных функций двух переменных можно строить сколь угодно сложные зависимости, отражающие алгоритмы преобразования информации, которая представлена в двоичной системе счисления. Алгебра логики устанавливает правила формирования логически полного базиса простейших функций, из которых могут строиться любые более сложные. Наиболее привычным базисом является набор трех функций {инверсия - , дизъюнкция - , конъюнкция - или &}. Работа с функциями, представленными в этом базисе, очень похожа на использование операций обычной алгебры.
Алгебра логики устанавливает, что существуют и другие комбинации простейших логических функций, обладающих свойством логической полноты. Например, наборы логических функций {инверсия, дизъюнкция} и {инверсия, конъюнкция} также являются логически полными. Наиболее интересны минимальные базисы, включающие по одной операции {"отрицание дизъюнкции ()", {"отрицание конъюнкции ()"}или (&). Однако работа с функциями, представленными в указанных базисах, требует от специалистов по проектированию ЭВМ определенных навыков.
Законы алгебры логики
Из определения вышеприведенных функций можно установить целый ряд простейших свойств:
В алгебре логики установлен целый ряд законов, с помощью которых возможно преобразование логических функций (ЛФ):
Эти законы полностью идентичны законам обычной алгебры;
где - логическая функция общего вида, не зависящая от переменной ;
Убедиться в тождественности приведенных зависимостей можно путем аналитических преобразований выражений, находящихся в левой и правой частях, или путем построения таблицы истинности для ЛФ.
Используя данные законы, можно преобразовывать исходные выражения в более простые (минимизировать их). По упрощенным выражениям можно построить техническое устройство, имеющее минимальные аппаратурные затраты.
Техническая интерпретация логических функций
По логическим выражениям проектируются схемы ЭВМ. При этом следует придерживаться следующей последовательности действий.
Покажем взаимосвязь перечисленных этапов на примере.
Пример 14.13. Спроектировать схему, фиксирующую появление "неправильной" тетрады в двоично-десятичном представлении чисел.
Рис. 14.2. Таблица истинности функции F
Для представления этой же схемы в другом полном базисе, например, , воспользуемся правилом де Моргана:
Рис. 14.3. Схема фиксации неправильных тетрад
Информация - это сведения об окружающем мире и протекающих в нем процессах, воспринимаемые человеком или специализированным устройством, например, в компьютере, для обеспечения целенаправленной деятельности.
Информация может быть по своей физической природе числовой, текстовой, графической, звуковой, видео и др. Она также может быть постоянной (не меняющейся), переменной, случайной, вероятностной. Наибольший интерес представляет переменная информация, так как она позволяет выявлять причинно-следственные связи в процессах и явлениях. Существуют различные способы оценки количества информации. Классическим является подход, использующий формулу К. Шеннона. Эта формула учитывает возможную неодинаковую вероятность состояний (сообщений) в наборе
где - количество информации;
- вероятность того, что именно i-е состояние (сообщение) выделено в наборе из состояний. Применительно к равновероятным исходам она имеет вид (формула Р. Хартли):
где - количество информации, несущей представление о состоянии, в котором находится объект;
- количество равновероятных альтернативных состояний объекта.
Любая информация, обрабатываемая в компьютере, должна быть представлена двоичными цифрами {0,1}, т.е. должна быть закодирована комбинацией этих цифр. Код - это набор условных обозначений для представления информации, а процесс представления информации с использованием элементов кода называется кодированием. Различные виды информации (числа, тексты, графика, звук) имеют свои правила кодирования. Коды отдельных значений, относящиеся к различным видам информации, могут совпадать. Поэтому расшифровка кодированных данных осуществляется по контексту при выполнении команд программы. Ранее были показаны особенности представления и кодирования числовых данных. Рассмотрим особенности представления в компьютерах других видов информации.
Кодирование нечисловой информации
До последнего времени практически все системы связи России, системы передачи аудио- и видеоинформации, включая центральное радио и телевидение, строились на принципах передачи аналоговой информации. Это подразумевало выполнение процедур модуляции (преобразования данных в высокочастотные сигналы при передаче) и демодуляции для обратного преобразования и воспроизведения принятых данных.
С развитием микроэлектроники и компьютерных технологий все большее распространение получают цифровые системы передачи дан-ных. В их основу положены процедуры квантования аналоговой информации по времени и величине. Значения функции измеряются с большой точностью в моменты времени . Эта последовательность дискретных измерений пересылается абоненту, у которого по ним воссоздается значение функции. Качество воспроизведения функции при может быть очень высоким.
По скорости изменения обрабатываемых цифровых данных информацию можно разделить на два вида: статический и динамический. Например, числовая, логическая и символьная информация является статической - ее значение не связано со временем. В отличие от перечисленных типов вся аудиоинформация имеет динамический характер. Она существует только в режиме реального времени, ее нельзя остановить для более подробного изучения. Если изменить масштаб времени (увеличить или уменьшить), аудиоинформация искажается. Это свойство иногда используется для получения звуковых эффектов.
Видеоинформация может быть как статической, так и динамической. Статическая видеоинформация включает текст, рисунки, графики, чертежи, таблицы и др. Рисунки делятся также на плоские - двумерные, и объемные - трехмерные.
Динамическая видеоинформация - это видео-, мульт- и слайдфильмы. В их основе лежит последовательное экспонирование на экране в реальном масштабе времени отдельных кадров в соответствии со сценарием.
Динамическая видеоинформация применяется либо для передачи движущихся изображений (анимация), либо для последовательной де-монстрации отдельных кадров вывода (слайдфильмы).
Для демонстрации анимационных и слайдфильмов используются различные принципы. Анимационные фильмы демонстрируются так, чтобы зрительный аппарат человека не мог зафиксировать отдельные кадры.
При демонстрации слайдфильмов каждый кадр экспонируется на экране столько времени, сколько необходимо для восприятия его человеком (обычно от 30 с. до 1 мин.). Слайдфильмы можно отнести к статической видеоинформации.
По способу формирования видеоизображения бывают растровые, матричные и векторные.
Растровые видеоизображения используются в телевидении, а в компьютерах практически не применяются.
Матричные изображения получили в ЭВМ наиболее широкое распространение. Изображение на экране рисуется электронным лучом в виде точек.
Информация представляется в виде характеристик значений каждой точки - пиксела (picture element), рассматриваемой как наименьшая структурная единица изображения. Количество высвечиваемых одновременно пикселов на экране дисплея определяется его разрешающей способностью. В качестве характеристик графической информации выступают: координаты точки (пиксела) на экране, цвет пиксела, цвет фона (градация яркости). Вся эта информация хранится в видеопамяти дисплея. При выводе графической информации на печать изображение также воспроизводится по точкам.
Изображение может быть и в векторной форме. Тогда оно составляется из отрезков линий (в простейшем случае - прямых), для которых задаются: начальные координаты, угол наклона и длина отрезка (может указываться и код используемой линии). Векторный способ имеет ряд преимуществ перед матричным: изображение легко масштабируется с сохранением формы, является "прозрачным", может быть наложено на любой фон и т.д.
Интенсивное развитие информационных технологий предполагает объединение самых различных систем (компьютерных, сетевых, систем связи, информационных и т.п.) для решения задач формирования, хранения, обработки и преобразования данных. Способы представления информации в отдельных согласованно работающих устройствах, кодирование и преобразование в них кодов зависят от типов данных, принятых стандартов, принципов действия отдельных устройств.
Кодирование текстовой информации
При формировании любого текстового (символьного) документа характерно последовательное использование нескольких видов кодировок и их преобразований. Например, при вводе информации с клавиатуры каждое нажатие клавиши, на которой изображен требуемый символ, вызывает появление так называемого scan -кода, который представляет собой двоичное число, равное порядковому номеру клавиши.
Сам номер нажатой клавиши никак не связан с формой символа, нанесенного на клавише. Опознание символа по его scan-коду и присвоение ему внутреннего кода компьютера производится специальной программой - кодировщиком (драйвером). Соответствие scan-кодов клавиш и кодов представления символов внутри компьютера образует так называемую кодовую таблицу символов. Внутреннее представление символьных данных в компьютере полностью определяется особенностями построения этих кодовых таблиц.
Бурное развитие сетевых технологий, в частности, Интернета, привело к интеграции многих технических, программных и информацион-ных систем с большим количеством стандартов, использующих совершенно разные коды, а соответственно, и разные таблицы кодировок.
Только для русских текстов широко применялись кодировки: KOI-7 и KOI-8r, ASCII, ANSI, Win1251, ISO-8859, кодировка ГОСТ - альтернативная (СР866) и др.
Стандарты КОИ-7 (код обмена информацией, 7-ми битовый) и KOI-8r (восьмибитовый) используются, в основном, в почтовых сообщениях, в E-mail. Они были широко распространены и продолжают применяться на постсоветском пространстве.
До недавнего времени, когда удельный вес приложений MS DOS был определяющим, наиболее часто использовался стандарт ASCII (American Standard Code for Information Interchange) - американский стандартный код передачи информации.
Появление операционной среды Windows с графическим интерфейсом потребовало изменения стандарта и введения другой кодовой таблицы - таблицы ANSI (American National Standard Institute - Американский институт национальных стандартов). Графический интерфейс Windows реализует векторный принцип отображения данных на экране дисплея, что позволяет использовать масштабируемые шрифты True Type. По сравнению с таблицей ASCII в ANSI изменилось размещение символов и отсутствуют символы псевдографики, так как в графическом интерфейсе они не нужны. С учетом успехов фирмы Microsoft в продажах на российском рынке своего программного обеспечения, фирмой была разработана русская кодовая страница CP-1251 (Windows-1251), получившая широкое признание и ставшая стандартом de facto.
Кодировка ISO-8859 (кодировка фирмы Sun), хотя и принята в качестве стандарта ГОСТа, но практически в стандартных приложениях не применяется.
Обилие кодовых страниц привело к трудностям адекватного воспроизведения текстовой информации, разработке различных программ-перекодировщиков. Сообщество фирм Unicode предложило новую систему кодирования, основанную на 16-разрядном кодировании символов. В двухбайтовом представлении отпадает необходимость в использовании отдельных кодовых таблиц и их перекодировок. Таблица Unicode позволяет дать уникальный номер любому символу всех национальных алфавитов ( символов). Для компенсации возрастающих объемов памяти под программные продукты, представленные в Unicode, при хранении и пересылках файлов применяются процедуры "сжатия" (архивации) данных. Этот стандарт приобретает все большую популярность.
Кодирование графических данных
Методы кодирования графики и цвета во многом определяются способами передачи цвета и его оттенков (полутонов). Для формирования цвета отдельных пикселов применяется его декомпозиция на составляющие цвета. Имеется несколько подобных систем:
Если для передачи оттенков (полутонов) каждого из основных цветов задействовать один байт (28=256 градаций), то появится возможность формировать различных цветов, более цветов для первых двух систем и более для полиграфической системы. Такой режим представления графики называется полноцветным - .
Статические кадры с графикой служат основой для создания анимационных систем. В современных высококачественных мониторах и в телевизорах с цифровым управлением электронно-лучевой трубкой цветные кадры с графикой сменяются 70 и более раз в секунду, что позволяет высококачественно передавать движение объектов.
Высокое качество передачи графических образов и видеоинформации сопряжено с повышенным потреблением ресурсов памяти. Поэтому разработан ряд стандартов, создающих файлы в форматах *.bmp, *.jpg, *.png и др. Различие всех этих стандартов и файлов заключается в качестве (точности) передачи образов и объемах создаваемых файлов.
Кодирование звуковой информации
Кодирование аудиоинформации - процесс более сложный. Изначально аудиоинформация является аналоговой. Для преобразования ее в цифровую форму используют аппаратные средства - аналого-цифровые преобразователи (АЦП), в результате работы которых аналоговый сигнал оцифровывается, т.е. представляется в виде числовой последовательности. Для вывода оцифрованного звука на аудиоустройства необходимо проводить обратное преобразование, которое осуществляется с помощью цифро-аналоговых преобразователей (ЦАП).
Одним из самых популярных стандартов для передачи и воспроизведения звука был и остается MP3, обеспечивающий компактность MP3-файлов, высокое качество звука и простоту применения. Однако держатели патентов корпорация Thomson и Frauenhofer Institut ввели новый платный порядок использования стандарта, что немедленно вызвало разработку альтернативных бесплатных стандартов.
Лекция 15
Комплекс технических средств, реализующих функцию памяти, называется запоминающим устройством (ЗУ). ЗУ необходимы для размещения в них команд и данных. Они обеспечивают центральному процессору доступ к программам и информации.
Запоминающие устройства делятся на основную или оперативную память (ОП), сверхоперативную память (СОЗУ), ассоциативную память (память с выборкой по содержанию) и внешние запоминающие устройства (ВЗУ).
Основная память
Основная память включает в себя два типа устройств: оперативное запоминающее устройство - ОЗУ (RAM - Random Access Memory) и постоянное запоминающее устройство - ПЗУ (ROM - Read Only Memory).
ОЗУ предназначено для хранения переменной информации. Оно допускает изменение своего содержимого в ходе выполнения процессором вычислительных операций с данными и может работать в режимах записи, чтения, хранения.
ПЗУ содержит информацию, которая не должна изменяться в ходе выполнения процессором вычислительных операций, - например, стандартные программы и константы. Эта информация заносится в ПЗУ перед установкой микросхемы в ЭВМ. Основными операциями, которые может выполнять ПЗУ, являются чтение и хранение.
Функциональные возможности ОЗУ шире, чем ПЗУ. Но ПЗУ сохраняет информацию при отключении питания (т.е. является энергонезависимой памятью).
В современных ЭВМ микросхемы памяти изготавливают из кремния по полупроводниковой технологии с высокой степенью интеграции элементов на кристалле.
Основной составной частью микросхемы является массив элементов памяти (ЭП), объединенных в матрицу накопителя.
Каждый элемент памяти может хранить 1 бит информации и имеет свой адрес. ЗУ, позволяющие обращаться по адресу к любому ЭП в произвольном порядке, называются запоминающими устройствами с произвольным доступом. При матричной организации памяти реализуется координатный принцип адресации ЭП, в связи с чем адрес делится на две части (две координаты) - и . На пересечении этих координат находится элемент памяти, чья информация должна быть прочитана или изменена.
Рис. 15.1. Структурная схема ОЗУ
По шине управления передается сигнал, определяющий, какую операцию необходимо выполнить.
По шине данных передается информация, записываемая в память или считываемая из нее.
По шине адреса передается адрес участвующих в обмене элементов памяти (поскольку данные передаются машинными словами, а один ЭП может воспринять только один бит информации, блок элементов памяти состоит из матриц ЭП, где - количество разрядов в машинном слове).
Максимальная емкость памяти определяется количеством линий в шине адреса системной магистрали: если количество линий обозначить , то емкость памяти (т. е. количество элементов памяти, имеющих уни-кальные адреса) определяется как . Так, в IBM PC XT шина адреса СМ содержала 20 линий. Поэтому максимальный объем ОП в этих машинах равен Мбайт. В IBM PC AT (с микропроцессором i80286) СМ содержит 24 линии, поэтому объем ОП мог быть увеличен до 16 Мбайт. Начиная с МП i80386, шина адреса содержит 32 линии. Максимальный объем ОП увеличился до Гб.
Микросхемы памяти могут строиться на статических (Static Random Access - SRAM) и динамических (Dynamic Random Access - DRAM) ЭП. В качестве статического ЭП чаще всего выступает статический триггер. В качестве динамического ЭП может использоваться электрический конденсатор, сформированный внутри кремниевого кристалла.
Статические ЭП способны сохранять свое состояние (0 или 1) неограниченно долго (при включенном питании). Динамические ЭП с течением времени записанную в них информацию теряют (например, из-за саморазряда конденсатора), поэтому они нуждаются в периодическом восстановлении записанной в них информации - в регенерации.
Микросхемы элементов памяти динамических ОЗУ отличаются от аналогичных ЭП статических ОЗУ меньшим числом компонентов в одном элементе памяти, в связи с чем имеют меньшие размеры и могут быть более плотно упакованы в кристалле. Однако из-за необходимости регенерации информации динамические ОЗУ имеют более сложные схемы управления.
Микросхемы ПЗУ так же построены по принципу матричной структуры накопителя. Функции элементов памяти в них выполняют перемычки в виде проводников, полупроводниковых диодов или транзисторов. В такой матрице наличие перемычки может означать "1", а ее отсутствие - "0". Занесение информации в микросхему ПЗУ называется ее программированием, а устройство, с помощью которого заносится информация, - программатором. Программирование ПЗУ заключается в устранении (прожигании) перемычек по тем адресам, где должен храниться "0".
Обычно схемы ПЗУ допускают только одно программирование, но специальные микросхемы - репрограммируемые ПЗУ (РПЗУ) - допускают их многократное стирание и занесение новой информации. Этот вид микросхем также относится к энергонезависимым, т.е. может длительное время сохранять информацию при выключенном питании (стирание микросхемы происходит либо за счет подачи специального стирающего напряжения либо за счет воздействия на кристалл ультрафиолетового излучения, для этого в корпусе микросхемы оставляется прозрачное окно).
Сверхоперативная память
Сверхоперативные ЗУ (СОЗУ) используются для хранения небольших объемов информации и имеют значительно меньшее время (в 2-10 раз) считывания/записи, чем основная память. СОЗУ обычно строятся на регистрах и регистровых структурах.
Регистр представляет собой электронное устройство, способное хранить занесенное в него число неограниченно долго (при включенном питании). Наибольшее распространение получили регистры на статических триггерах.
Регистры могут быть объединены в единую структуру. Возможности такой структуры определяются способом доступа и адресации регистров.
Если к любому регистру можно обратиться для записи/чтения по его адресу, такая регистровая структура образует СОЗУ с произвольным доступом.
Безадресные регистровые структуры могут образовывать два вида устройств памяти: магазинного типа и память с выборкой по содержанию (ассоциативные ЗУ).
Память магазинного типа образуется из последовательно соединенных регистров (рис.15.2).
Рис. 15.2.
Если запись в регистровую структуру (рис.15.2a) производится через один регистр, а считывание - через другой, то такая память является аналогом линии задержки и работает по принципу "первым вошел - первым вышел" (FIFO - first input, first output).
Если же запись и чтение осуществляются через один и тот же регистр (рис.15.2б), такое устройство называется стековой памятью, работающей по принципу "первым вошел - последним вышел" (FILO - first input, last output). При записи числа в стековую память сначала содержимое стека сдвигается в сторону последнего, К-го регистра (если стек был полностью заполнен, то число из К-го регистра теряется), а затем число заносится в вершину стека - регистр 1. Чтение осуществляется тоже через вершину стека, после того, как число из вершины прочитано, стек сдвигается в сторону регистра 1.
Стековая память получила широкое распространение. Для ее реализации в ЭВМ разработаны специальные микросхемы. Но часто работа стековой памяти эмулируется в основной памяти ЭВМ: с помощью программ операционной системы выделяется часть памяти под стек (в IBM PC для этой цели выделяется 64 Кбайта). Специальный регистр микро-процессора (указатель стека) постоянно хранит адрес ячейки ОП, выполняющей функции вершины стека. Чтение числа всегда производится из вершины стека, после чего указатель стека изменяется и указывает на очередную ячейку стековой памяти (т.е. фактически стек остается неподвижным, а перемещается вершина стека). При записи числа в стек сначала номер ячейки в указателе стека модифицируется так, чтобы он указывал на очередную свободную ячейку, после чего производится запись числа по этому адресу. Такая работа указателя стека позволяет реализовать принцип "первым вошел - последним вышел".
В стек может быть загружен в определенной последовательности ряд данных, которые впоследствии считываются из стека уже в обратном порядке. На этом свойстве построена система арифметических преобразований информации, известная под названием "логики Лукашевича".
Ассоциативная память
Память с выборкой по содержанию является безадресной. Обращение к ней осуществляется по специальной маске, которая содержит поисковый образ. Информация считывается из памяти, если часть ее соответствует поисковому образу, зафиксированному в маске. Например, если в такую память записана информация о людях, содержащая данные о месте жительства (включая город), и необходимо найти сведения о жителях определенного города, то название этого города помещается в маску и дается команда "чтение" - из памяти выбираются все записи, относящиеся к заданному городу.
В микропроцессорах ассоциативные ЗУ используются в составе кэш-памяти для хранения адресной части команд и операндов исполняемой программы. При этом нет необходимости обращаться к ОП за следующей командой или требуемым операндом: достаточно поместить в маску необходимый адрес, и если искомая информация имеется в СОЗУ, то она будет сразу выдана. Обращение к ОП будет необходимо лишь при отсутствии требуемой информации в СОЗУ. За счет такого использования СОЗУ сокращается число обращений к ОП, а это позволяет экономить время.
Кэш-память может быть размещена в кристалле процессора (так называемая "кэш-память I уровня") либо выполнена в виде отдельной микросхемы или модуля, содержащего несколько микросхем (внешняя кэшпамять, или кэш-память II уровня).
Встроенная кэш-память (I уровня) в процессорах Pentium имеет объем 16-32 Кбайт. Внешняя кэш-память (II уровня) имеет объем до 1Гбайта и работает с 64-битными словами.
Центральный процессор ЭВМ
Основу центрального процессора ПЭВМ составляет микропроцессор (МП) - обрабатывающее устройство, служащее для арифметических и логических преобразований данных, для организации обращения к ОП и ВНУ и для управления ходом вычислительного процесса. В настоящее время существует большое число разновидностей микропроцессоров, различающихся назначением, функциональными возможностями, структурой, исполнением. Наиболее существенными классификационными различиями между ними чаще всего выступают:
Обобщенная структурная схема 32-разрядного микропроцессора x86 (серии Pentium) приведена на рис.15.3.
Условно микропроцессор можно разделить на три части: исполнительный блок (Execution Unit - EU), устройство сопряжения с системной магистралью (Bus Interface Unit - BIU) и блок управления микропроцессором (Control Unit - CU).
В исполнительном блоке находятся: арифметический блок (кэш данных - DATE CACHE, микросхемы арифметико-логического устройства - АЛУ, регистр флагов), регистры общего назначения (РОН) EAX, EBX, ECX, EDX; общие регистры ESI, EDI, ESP, EBP.
В регистре флагов каждый разряд имеет строго определенное назначение. Обычно разряды регистра флагов устанавливаются аппаратно при выполнении очередной операции в зависимости от получаемого в АЛУ результата. При этом фиксируются такие свойства получаемого результата, как нулевой результат, отрицательное число, переполнение разрядной сетки АЛУ и т.д.
Регистры общего назначения EAX, EBX, ECX, EDX имеют длину по 32 бита. Каждый из них делится на два 16-битных регистра, младший из которых имеет свое имя (что обеспечивает совместимость с 16-разрядными версиями микропроцессоров). Так, в регистре EAX содержится 16-битный регистр AX, в регистре EBX содержится регистр BX, в ECX - регистр CX, в EDX - регистр DX. Каждый из 16-битных регистров, в свою очередь, состоит из двух 8-битных регистров, имеющих свои имена. Например, АХ (аккумулятор) делится на AH и AL, регистр базы (Base Register) - BX, делится на BH и BL. Счетчик (Count Register) CX включает регистры CH и CL. Регистр данных (Data Register) DX содержит регистры DH и DL. Каждый из коротких регистров может использоваться самостоятельно или в составе регистровой пары. Условные названия (аккумулятор, регистр базы, счетчик, регистр данных) не ограничивают применения этих регистров - эти названия говорят о наиболее частом их использовании или об особенности применения того или иного регистра в той или иной команде. Буква "Н" в имени 8-битного регистра означает верхний (или старший) регистр, буква "L" - младший (т.е. младший байт 16-битного регистра или младший однобайтный регистр двухбайтного регистра).
Рис. 15.3. Обобщенная структурная схема 32-разрядного микропроцессора
Эти регистры используются для операций с данными, такими как сравнение, математические операции или запись данных в память. Регистр СХ чаще всего применяется как счетчик циклов.
Общие регистры - ESP, EBP, ESI, EDI также 32-битные, младшая половина которых доступна как регистры S P, B P, SI, DI.
Регистр ESP указывает на адрес вершины стека (адрес, куда будет заноситься следующая переменная командой PUSH).
Регистр ЕВР содержит адрес базы, который может использоваться при работе со стеком.
Регистр ESI - адрес источника, обычно содержит адрес начала блока информации для операций типа "переместить блок", а регистр EDI - адрес приемника (назначения) в этой операции.
Блок управления микропроцессором содержит сегментные регистры, системные регистры и блок выработки управляющих сигналов микропроцессора.
Сегментные регистры CS, DS, ES, FS, GS, SS имеют длину по 16 бит и используются для формирования физических адресов команд и данных в основной памяти.
CS - сегмент кода исполняемой в данный момент программы.
DS - сегмент данных исполняемой программы, т.е. константы, строковые ссылки и т.д.
SS - сегмент стека исполняемой программы.
ES, FS, GS - дополнительные сегменты, которые в некоторых программах могут не использоваться.
Системные регистры GDTR и LDTR являются регистрами глобальной и локальной дескрипторных таблиц. GDTR имеет длину 48 бит, LDTR - 16 бит (точнее, 16 бит - это только "видимая" часть этого регистра).
Регистр IDTR (таблицы дескрипторов прерываний - DTR) имеет длину 48 бит, 32 из которых являются базовым адресом таблицы дескрипторов прерываний (IDT), а 16 - смещением этого адреса (пределом).
Регистр TR является регистром состояния задачи. "Видимая" его часть имеет длину 16 бит и содержит селектор дескриптора. "Скрытая" часть регистра содержит загружаемые автоматически базовый адрес точки входа, предел и атрибуты задачи.
Структурная схема блока выработки управляющих сигналов микропроцессора приведена на рис.15.4.
Основу его составляют счетчик команд, АЛУ, конвейер команд и группа управляющих, отладочных и тестовых регистров.
Регистр EIP является указателем адреса команды (Instruction Pointer), которая будет выбираться в конвейер команд в качестве очередной команды (в отечественной литературе такое устройство называется счетчик команд).
Рис. 15.4. Структурная схема блока выработки управляющих сигналов
Конвейер команд МП хранит несколько команд, что позволяет при выполнении линейных программ совместить подготовку очередной команды с выполнением текущей. Команды в конвейер команд поступают с внутренней магистрали микропроцессора и накапливаются в кэше команд. Блок предвыборки и прогнозирования переходов осуществляет трансляцию команд x86 в RISС-команды, прогнозирует последовательность исполнения команд и направляет полученные последовательности команд в соответствующие ветви конвейера команд (U,V,…). Каждый конвейер команд имеет свой буфер (память магазинного типа FIFO), из которого команды поступают в соответствующий регистр команд для исполнения.
АЛУ команд используется для вычисления физических адресов необходимых для работы микропроцессора команд и данных.
Управляющие регистры - CR0, CR1, CR2, CR3, - имеют длину по 32 бита. Эти регистры устанавливают режим работы процессора (нормальный, защищенный и т.д.), контролируют постраничное распределение памяти, и т.д. Они доступны только для привилегированных программ. Младшая часть регистра CR0 используется как слово состояния машины.
Отладочные регистры - DR0-DR7 - содержат адреса восьми точек прерывания и устанавливают, что должно произойти при достижении программой соответствующей точки прерывания. Эти регистры используются при отладке программы с помощью таких отладочных средств, как debug.exe (для реального режима) или ntsd.exe (для защищенного режима). Тестовые (контрольные) регистры TRj используются для контроля постраничной системы распределения памяти, реализуемой операционной системой.
Система команд микропроцессора
Один из основных принципов построения ЭВМ был сформулирован американским ученым Дж. фон Нейманом: работой ЭВМ управляет программа, состоящая из отдельных команд. Программа размещается вместе с данными в основной памяти ЭВМ. Каждая команда хранится в отдельной ячейке памяти (или группе смежных ячеек) и имеет свой адрес. Все команды имеют одинаковую структуру. Они состоят из двух частей: кода операции и адресной части. Код операции определяет, какую команду нужно выполнить. Адресная часть определяет, где хранятся операнды, т.е. обрабатываемые данные, и куда необходимо поместить результат операции.
В зависимости от количества используемых в команде операндов различаются одно-, двух-, трех-, четырехадресные и безадресные команды.
В одноадресных командах указывается, где находится один из двух обрабатываемых операндов. Второй операнд должен быть помещен заранее в арифметическое устройство (для этого в систему команд вводятся специальные команды пересылки данных между устройствами).
В двухадресных командах оба операнда перед выполнением операции находятся в памяти, поэтому их адреса указываются в команде. После выполнения команды в один из этих адресов засылается результат, а находившийся там операнд теряется.
В трехадресных командах два адреса указывают, где находятся исходные операнды, а третий - куда необходимо поместить результат.
В четырехадресных командах три адреса используются для указания исходных операндов и результата, а четвертый - для указания адреса следующей команды.
В безадресных командах обычно обрабатывается один операнд, который до и после операции находится в арифметическом устройстве (в память не пересылается). Кроме того, безадресные команды используются для выполнения служебных операций (очистить экран, заблокировать клавиатуру, снять блокировку и др.).
Все команды программы выполняются последовательно, команда за командой, в том порядке, как они записаны в памяти ЭВМ (естественный порядок следования команд). Этот порядок характерен для линейных программ, т.е. программ, не содержащих разветвлений.
Для организации разветвлений (циклического выполнения участков программы) есть команды, нарушающие естественный порядок. К ним относятся: безусловная передача управления ("безусловный переход"), условная передача управления (т.е. переход, если выполняется заданное условие), обращение к подпрограмме ("переход с возвратом"), циклические операции. Кроме того, естественный порядок следования команд не соблюдается в машинах, использующих четырехадресные команды - в этом случае некоторые из команд передачи управления упраздняются.
При явном указании адреса следующей команды реализуется "принудительный" порядок следования команд. Он возможен, только если программа размещается в доступной процессору части основной памяти. Поскольку при этом команды (с точки зрения процессора) ничем не отличаются от данных, в процессе выполнения программы ее команды можно изменять (модифицировать), что повышает гибкость программирования и универсальность ЭВМ.
Семейство микропроцессоров фирмы Intel, начиная от 8086 и вплоть до Pentium последних моделей, имеет базовую систему команд, в состав которой входят следующие группы:
Каждая команда имеет большое число модификаций, чаще всего определяемых режимом адресации данных (операндов).
Взаимодействие элементов при работе микропроцессора
Работой МП управляет программа, записанная в ОП ЭВМ. Адрес очередной команды хранится в счетчике команд EIP (Instruction Pointer) и в одном из сегментных регистров, чаще всего - в CS. Каждый из них в реальном режиме имеет длину 16 бит, тогда как физический адрес ОП должен иметь длину 20 бит. Несогласованность длины машинного слова (16 бит) и длины физического адреса ОП (20 бит) приводит к тому, что в командах невозможно указать физический адрес ОП - его приходится формировать, собирать из разных регистров МП в процессе работы.
В защищенном режиме базовые адреса сегментов хранятся в дескрипторных таблицах и имеют длину 24 или 32 бита (в зависимости от типа МП). В сегментных же регистрах хранится селектор, содержащий номер дескрипторной таблицы и дескрипторное смещение, т.е. порядковый номер дескриптора (в котором и хранится базовый адрес сегмента) в данной дескрипторной таблице (рис.15.5).
Рис. 15.5. Формирование адреса в защищенном режиме
Физический адрес очередной команды через внутреннюю магистраль МП и интерфейс памяти поступает на шину адреса системной магистрали. Одновременно из устройства управления (УУ) исполнительного блока на шину управления выдается команда (управляющий сигнал) в ОП, предписывающая выбрать число, находящееся по адресу, указанному в системной магистрали. Выбранное число, являющееся очередной командой, поступает из ОП через шину данных системной магистрали, интерфейс памяти, внутреннюю магистраль МП в конвейер команд (в блок Instruction Cashe). После обработки полученной команды и преобразования ее в последовательность RISC-команд (операций) очередная операция поступает в регистр команд.
Из операции в регистре команд выделяется код операции, который поступает в УУ исполнительного блока для выработки управляющих сигналов, настраивающих микропроцессор на выполнение требуемой операции.
В зависимости от используемого в команде режима адресации организуется выборка необходимых исходных данных.
Системы визуального отображения информации (видеосистемы)
Видеосистемы предназначены для оперативного отображения информации, доведения ее до сведения оператора ЭВМ. Обычно они состоят из двух частей: монитора и адаптера. Монитор служит для визуализации изображения, адаптер - для связи монитора с микропроцессорным комплектом [88].
Классификацию мониторов можно провести по используемым физическим эффектам, по принципу формирования изображения на экране, по способу управления, по длительности хранения информации на экране, по цветности.
По принципу формирования изображения мониторы делятся на плазменные, электролюминесцентные, жидкокристаллические, дисплеи с эмиссией полем, гелиодисплеи, и электронно-лучевые.
Плазменные, электролюминесцентные, жидкокристаллические мониторы и дисплеи с эмиссией полем относятся к дисплеям с плоским экраном. Для них характерно, что экран имеет малые физические размеры и не мерцает. Мониторы этого вида имеют малый вес и незначительное потребление энергии, большую механическую прочность и длительный срок службы.
Плазменные, электролюминесцентные мониторы и дисплеи с эмиссией полем являются активными, излучающими свет. Для работы с ними не нужен посторонний источник света.
Жидкокристаллические - пассивные мониторы. Они работают только при наличии постороннего источника света и способны работать либо в отраженном, либо в проходящем свете. Жидкокристаллические мониторы используют способность жидких кристаллов изменять свою оптическую плотность или отражающую способность под воздействием электрических сигналов.
В плазменной панели элемент изображения образуется в результате газового разряда, который сопровождается излучением света. Конструктивно панель состоит из трех стеклянных пластин, на двух из которых нанесены тонкие прозрачные проводники. На одной пластине проводники расположены горизонтально, на другой - вертикально. Между ними находится третья стеклянная пластина, в которой в местах пересечения проводников имеются сквозные отверстия. Эти отверстия при сборке панели заполняются инертным газом. Вертикально и горизонтально расположенные проводники образуют координатную сетку; на пересечении проводников находятся элементы изображения - пикселы (от "picture ele-ment").
Электролюминесцентные мониторы работают на принципе люминесценции вещества при воздействии на него электрического поля. Люминесцентное вещество распыляется на внутренней поверхности одной из пластин с координатной сеткой. Напряжение на координатные шины подается такое, чтобы на пересечении координатных шин создавалось электрическое поле, достаточное для возбуждения люминофора.
Дисплеи с эмиссией полем (Field Emission Display, FED) - это плоские дисплеи, по принципу работы подобны обычным ЭЛТ. Электроны в них излучаются из холодных катодов, имеющих форму очень острых ми-кроигл, количество которых на каждый пиксел может составлять до нескольких тысяч. Этот вид мониторов характеризуется хорошим воспроизведением цветов, так как используется такой же люминофор, как в электронно-лучевых трубках, и высокой скоростью работы (как и в ЭЛТ).
В 2005 году инженеры компании IO2 Technology создали необычное проекционное устройство, получившее название "гелиодисплей" (Heliodisplay). Этому необычному проектору не нужен экран: при помощи лазерных лучей прибор формирует цветное изображение непосредственно в атмосферном воздухе.
По утверждению разработчиков, в гелиодисплее используется совершенно новый принцип формирования изображения, основанный на ряде как уже запатентованных, так и только ожидающих патентов технических решений.
В 2005 году IO2 Technology представила три модели готовых к серийному производству изделий: М1, М1а и Мх.
Представленные модели гелиодисплеев являются интерактивными. При работе с ПК "прикосновения" к проецируемому изображению можно использовать для управления элементами пользовательского интерфейса (управляющие команды, эмулирующие работу манипулятора, передаются в ПК по интерфейсу USB).
Максимальное количество строк на экране и количество точек в строке образуют разрешающую способность монитора:
Разрешающая способность оказывает значительное влияние на качество изображения на экране, но качество изображения зависит и от других характеристик: физических размеров элементов изображения (пиксел, или точек), размеров экрана, частоты развертки, цветовых характеристик и др.
Одна из моделей цветообразования цветных ЖК-дисплеев, в настоящее время наиболее распространенная, является конструкцией, аналогичной конструкции цветных дисплеев на ЭЛТ. В качестве источника света в цветном ЖК-дисплее используется люминесцентная лампа подсветки, излучающая свет белого цвета. Пикселы такого дисплея состоят каждый из трех частей - ячеек. Перед каждой ячейкой расположен светофильтр, пропускающий свет одного из цветов модели RGB (красного, зеленого и голубого). Благодаря наличию светофильтра каждый элемент пиксела участвует в генерации определенного цвета, а поскольку размеры элементов малы, цвета каждой триады элементов сливаются в один, воспринимаемый глазом человека.
Другая модель вместо люминесцентной лампы использует светодиодные модули подсветки или массив углеродных нанотрубок (carbon nan-otube, CNT), которые с высокой частотой последовательно меняют цвет излучаемого света (красный - зеленый - голубой - красный и т.д.) и позволяют отказаться от использования светофильтров.
В мониторах со светодиодной подсветкой применяется светодиодная матрица - каждый пиксел изображения освещается отдельным диодом. Благодаря этому достигается равномерная яркость изображения, увеличиваются углы обзора, а главное - значительно улучшается цветопередача. Кроме того, средний срок службы светодиодной подсветки намного больше времени службы ламп с холодным катодом и оценивается не менее чем в 100 тыс. часов работы.
Во многих портативных устройствах дисплеи используются не только для отображения, но и для ввода информации. Такие дисплеи называются сенсорными. В них экран обладает чувствительностью к прикосновению.
В настоящее время сенсорные дисплеи применяются во многих моделях карманных и планшетных ПК, а также смартфонов и коммуникаторов. В 2005 году начался серийный выпуск цифрового фотоаппарата, оснащенного 3-дюймовым сенсорным ЖК-дисплеем, - Sony Cyber-shot DSC-N1.
Связь ЭВМ с монитором осуществляется с помощью адаптера - устройства, которое должно обеспечивать совместимость различных мониторов с микропроцессорным комплектом ЭВМ. В начальный период существования персональных компьютеров адаптеры старались стандартизировать, чтобы в полной мере обеспечить совместимость различных по конструкции мониторов с ЭВМ. Было разработано пять стандартов:
Кроме них существовали и другие адаптеры, например, Геркулес, PGA, SVGA, и др. Но они не поддерживали некоторые общепринятые режимы работы мониторов и вследствие неполной совместимости не позволяли реализовать любое программное обеспечение.
В последнее время наибольшее распространение получили адаптеры SVGA. Этот адаптер не стандартизован, вследствие чего каждая фирма, выпускающая мониторы, обязательно снабжает их драйверами, позволя-ющими работать с различными адаптерами.
Широкое распространение режима Plag&Play привело к тому, что в состав операционных систем фирмы Microsoft включено огромное количество постоянно обновляемых фирмой драйверов.
Исторически сложилось, что дисплеи могут работать в одном из двух режимов: символьном или графическом.
В символьном режиме на экран может выводиться ограниченный состав символов, имеющих четко определенный графический образ: буквы, цифры, знаки пунктуации, математические знаки и знаки псевдографики. Состав этих символов определен системой кодирования, применяемой в данной ЭВМ, в IBM PC - кодом ASCII, который в последнее время вытесняется кодом UNICOD.
Для вывода символа на экран дисплея сначала определяется позиция, в которой должен появиться символ (номер символа в строке и порядковый номер строки), а затем по коду символа определяется его форма, которая и высвечивается на экране. Предельное количество символов, одновременно размещаемых на экране, называется информационной емкос-тью экрана. В символьном режиме на экране монитора IBM PC может быть высвечено 40, 80 или 132 (VESA BIOS EXTENTION) символа в строке. Всего на экране помещается 25, 50 или 60 строк.
Форма выводимого символа определяется знакогенератором дисплея, в котором хранятся коды формы всех символов ASCII или UNICODE.
В графическом режиме изображение на экране формируется из отдельных точек (пиксел), имеющих свои адреса (номер пиксела в строке * номер пиксельной строки). В простейшем случае каждому пикселу экрана соответствует один пиксел видеопамяти, который и определяет, светлым или темным должна быть соответствующая точка на экране. Если кроме этого необходимо указывать цвет пиксела, то количество битов видеопамяти, характеризующих каждый пиксел, приходится увеличивать. Поэтому для графического режима требуется большая память, чем для символьного при той же разрешающей способности экрана.
Основу адаптера любого типа составляет видеопамять.
Начиная с адаптера EGA, видеопамять имеет плоскостную структуру: вся память делится на битовые плоскости. В каждой битовой плоскости одному пикселу выделяется один бит. Длина битовой плоскости определяет разрешающую способность экрана. Количество битовых плоскостей (в каждой из которых выделено по одному биту для соответствующего пиксела) определяет, сколько бит отводится для хранения атрибутивного признака пиксела. Если видеопамять имеет одну битовую плоскость, то такой дисплей может работать только в монохромном режиме (пиксел может быть либо ярким, либо темным). При наличии двух битовых плоскостей в видеопамяти может храниться значения, определяющих, как должен выглядеть пиксел на экране (при цветном мониторе - четыре цвета, один из которых, с кодом 00 - черный. Т.е. фактически с помощью двух битовых плоскостей можно управлять RGB-монитором). При 8-битовых плоскостях атрибут пиксела обеспечивает кодирование цветов - такой адаптер эффективно применять только для аналоговых RGB-мониторов, в которых между видеопамятью и управляющими цветом электродами ЭЛТ ставится цифро-аналоговый преобразователь (Digital to Analog Converter - DAC). В DAC из видеопамяти подается код цвета. Из DAC в ЭЛТ выдается аналоговый сигнал (код цвета преобразуется в величину напряжения на управляющем электроде).
Физически видеопамять может иметь линейную структуру. Разбиение ее на видеоплоскости в этом случае может осуществляться программным путем - с помощью драйвера дисплея. Поэтому есть возможность одну и ту же видеопамять использовать для различной разрешающей способности экрана (изменяя длину битовой плоскости) и для различного количества воспроизводимых на экране цветов (изменяя количество битовых плоскостей). Следовательно, при фиксированном объеме памяти можно увеличить разрешающую способность (но при этом сократится количество воспроизводимых цветов) или увеличить количество воспроизводимых цветов (снизив соответственно разрешающую способность экрана). Если же видеоплоскости реализованы аппаратно, переключение режимов (мод экрана) может в ограниченных пределах эмулироваться драйвером дисплея.
Для воспроизведения динамических (движущихся, анимационных) изображений видеопамять приходится делить на страницы, которые поочередно выводятся на экран при каждой регенерации (пока одна страница выводится на экран, вторая заполняется очередным кадром).
Во всех адаптерах часть видеопамяти отводится под знакогенератор, в котором записаны коды формы выводимых на экран символов. В некоторых случаях в видеопамяти приходится хранить несколько знакогенераторов, например, с национальными шрифтами.
Кроме видеопамяти, в состав адаптера входят блок сопряжения с монитором, блок управления, различные ускорители (графический, Windows-ускоритель, 3D-ускоритель, и др.), которые предназначены для выполнения вычислительных операций без обращения к МП ЭВМ.
Все видеоустройства имеют плоский экран. Естественным для такого экрана является двумерное (плоское) изображение. В то же время для человека более естественным является объемное (трехмерное) изображение. Поэтому разрабатываются устройства и способы создания если не трехмерного изображения, то хотя бы имитирующего его.
Один из способов создания эффекта глубины изображения заключается в использовании декартовой системы координат и нанесения на рисунок только видимых линий.
Другой способ - "перспективу" - используют художники: все параллельные линии, уходящие вглубь экрана, сходятся в одной точке на линии горизонта (условной линии, расположенной в верхней части экрана).
Более сложный метод создания объемного изображения основан на явлении стереоэффекта. Стереоизображение состоит из двух, выполненных для правого и для левого глаза. Но каждое из них должен видеть только тот глаз, для которого оно предназначено. Один из способов достижения этого - выполнение изображений в разных цветах (например, одно - в красном, а другое - в зеленом). Наблюдатель одевает очки, которые содержат стекла разного цвета (одно - красное, второе - зеленое). Через красный светофильтр видно зеленое изображение, а через зеленый - красное. Другой способ разделить изображения - применить не цветные, а поляризационные фильтры.
Еще более сложным способом создания объемного изображения является голография. Голографический метод формирования изображения известен с конца 40-х гг. В начале 60-х гг. Ю. Н. Денисюк изобрел метод формирования голограмм в трехмерных средах при использовании для записи встречных пучков. Этот метод позволял избавиться от фантомов - так назывались сопутствующие основному, лишние (дополнительные) изображения. На основе этого метода разработана цифровая голография, которую можно реализовать с помощью ЭВМ, без задействования дополнительной аппаратуры.
Голография по Денисюку предусматривает наличие когерентного источника света, который излучает свет в виде лучей, выходящих из источника в одной и той же фазе. Это точечный источник света, имеющий достаточно малые размеры. Если на пути световых лучей поставить линзу, лучи преломляются и далее следуют параллельно друг другу. На их пути устанавливается прозрачная стеклянная фотопластинка. Лучи света проходят через нее и освещают какой-либо объемный предмет. Отражаясь от этого предмета, лучи снова попадают на фотопластинку. Но если при движении к объекту лучи проходили сквозь пластинку, находясь в одной и той же фазе и имея одинаковую интенсивность, то возвращаются назад они после отражения от объекта в разных фазах и с разной интенсивностью. Фазы у них разные, так как расстояние от фотопластинки до различных частей отражающего объекта различно, а интенсивность изменилась по сравнению с начальной, поскольку отражающая способность разных частей объекта различна. На фотопластинке прямой и обратный лучи суммируются. Степень засвечивания фотослоя зависит от яркости, которая определяется полученной суммой. На пластинке образуется интерференционная картина. Если пластинку проявить, интерференционная картина становится видимой. При рассматривании ее невооруженным глазом в рассеянном свете видны только темные и светлые пятна различной формы, даже отдаленно не напоминающие объект, который фотографировался. Если теперь в эту установку поместить проявленную пластинку и убрать объект, то при включении когерентного источника света на месте, где раньше находился объект, появится его объемное изображение.
Стеклянная пластинка имеет следующее свойство: если пластинку разбить, то каждый ее кусочек несет полную картину изображения, правда, не такого яркого, как целая пластинка.
Цифровая голография позволяет получать интерференционную картину без использования когерентного источника света и фотопластинок по трем плоским изображениям объекта, сделанным в трех разных взаимно перпендикулярных плоскостях. Интерференционная картина вычисляется на ЭВМ. Если ее вывести на принтер, сфотографировать, а затем полученную фотопластинку поместить в установку Денисюка и осветить когерентным источником света, то появится объемное изображение исходного объекта.
Впоследствии оказалось, что если снятую с принтера распечатку разглядывать, фокусируя по-разному зрение, можно увидеть объемное изображение объекта и без использования дополнительной аппаратуры.
Клавиатура
Клавиатура - это одно из основных устройств ввода информации в ЭВМ, позволяющее вводить различные виды информации. Вид вводимой информации определяется программой, интерпретирующей нажатые или отпущенные клавиши. С помощью клавиатуры можно вводить любые символы: от букв и цифр до иероглифов и знаков музыкальной нотации. Клавиатура позволяет управлять курсором на экране дисплея - устанавливать его в нужную точку экрана, перемещать по экрану, "прокручивать" экран в режиме скроллинга, отправлять содержимое экрана на принтер, производить выбор при наличии альтернативных вариантов, и т.д.
В последнее время наблюдаются тенденции отказа от клавиатуры в пользу альтернативных устройств: мыши, речевого ввода, сканеров. Но полностью эти устройства клавиатуру не заменяют.
Стандартная клавиатура IBM PC имеет несколько групп клавиш.
Если клавиша 1-й, 4-й, а иногда и 5-й группы оказывается нажатой дольше, чем 0,5 сек., начинает генерироваться последовательность ее основных кодов с частотой около 10 раз в сек., что имитирует серию очень быстрых нажатий этой клавиши.
Конструктивно клавиатуры могут быть реализованы по-разному. Есть плоские клавиатуры, на которых руки быстро устают при длительной работе. Есть специальное исполнение клавиатуры - эргономическое, у которых положение рук для работы требуется такое, при котором меньше напряжены мышцы кистей рук. Это снижает утомляемость при длительной работе на клавиатуре. Но работать на такой клавиатуре можно только "вслепую", так как поверхность клавиш не видна.
Фирма IBM зарегистрировала патент на клавиатуру, чувствительную к силе нажатия клавиши.
Выпускаемые разными производителями клавиатуры различаются так же по расстоянию между клавишами, числу специальных клавиш, способу переключения на цифровой регистр для быстрого ввода числовых данных, углу наклона, форме и текстуре поверхности клавиш, усилию нажима и величине хода клавиш, расположению часто используемых клавиш, способу соединения с ЭВМ (инфракрасная связь, радиоклавиатура), и др.
Принтеры
Принтеры - это внешние устройства ЭВМ, предназначенные для вывода информации на твердый носитель в символьном или графическом виде.
Классификация принтеров может быть проведена по следующим критериям: по способу вывода, по принципу формирования изображения, по способу регистрации, и по принципу управления процессом печати.
По способу вывода изображения принтеры делятся на две группы: символьные и графические. Символьные принтеры могут выводить информацию в виде отдельных символов по мере их поступления в печатающее устройство (ПУ). При этом за один цикл печати формируется один знак (посимвольные ПУ). В построчных ПУ вывод на печать осуществляется только после заполнения буферного ЗУ, которое по емкости равно одной строке. Постраничные ПУ за один цикл печати формируют и распечатывают целую страницу.
Графические ПУ выводят информацию не целыми символами, а отдельными точками или линиями. Количество точек на единицу длины определяет разрешающую способность принтера, которая имеет разную величину в зависимости от направления: по горизонтали и по вертикали. В принтерах этого типа каждая точка имеет свои координаты, которые являются адресом этой точки.
По способу регистрации изображения ПУ делятся на ударные и безударные.
ПУ ударного действия формируют изображение на бумаге, сжимая с помощью удара на короткий промежуток времени рельефное изображение символа или его части, красящей ленты и бумаги. Иногда краска наносится на поверхность литеры, красящая лента в этом случае отсутствует.
Существуют принтеры, использующие ударочувствительную бумагу, цвет которой изменяется за счет механического воздействия на нее без дополнительного нанесения краски.
ПУ безударного действия характеризуются тем, что изображение на бумагу наносится через промежуточный носитель, чувствительный к электрическому воздействию, к электростатическому полю, к магнитному полю, и др. Обычно промежуточный носитель исполняется в виде барабана. Изображение на него наносится лазерным лучом, с помощью магнитных головок, и др. Затем изображение на промежуточном носителе проявляется - на поверхность барабана наносится смесь сухого красителя с порошком, "прилипающим" к зафиксированному на барабане изображению (например, если изображение наносилось на барабан магнитным полем, в качестве порошка используются мелкие металлические опилки). После этого к барабану "прикатывается" чистый лист бумаги, на который переносится краситель с барабана. Лист с накатанным на него красителем подвергается термообработке - нагревается до расплавления красителя, который в жидком виде проникает в поры бумаги и хорошо закрепляется на ней. После расплавления красителя отдельные точки сливаются в единое целое, поэтому качество изображения получается высоким. Разрешающая способность таких принтеров очень высока.
К ПУ безударного действия относятся струйные принтеры, у которых жидкий краситель (чернила) находится в печатающей головке. Головка имеет отверстия, через которые краситель вылиться не может из-за сил поверхностного натяжения. Внутри головки находится терморезистор, который при подаче на него импульса тока разогревает краситель, увеличивая его испарение. Пары красителя проникают через отверстие в головке и попадают на бумагу в виде капли. Благодаря тому, что головка может работать с несколькими красителями, выпускаются и цветные струйные принтеры. Длительностью нагрева терморезистора можно регулировать количество выбрасываемых чернил, а следовательно - размеры и яркость точки. Печатающая головка струйного принтера может содержать до нескольких сот отверстий (сопел).
Несмотря на большое разнообразие типов принтеров, различия принципов управления печатью касаются, в основном, способов знакогенерации.
Внешние запоминающие устройства (ВЗУ)
В качестве внешней памяти ПЭВМ используются накопители на магнитных дисках (НМД), накопители на магнитных лентах (НМЛ), или стриммеры, и оптические ЗУ.
НМД бывают двух типов: НГМД - на гибком магнитном диске (с носителем-дискетой) и НМД - на жестком магнитном диске.
НМД имеют значительно больший объем внешней памяти и высокое (почти на порядок) быстродействие, чем НГМД. Но у НГМД есть съемные магнитные носители - дискеты (компактные, на которых легче организовать архивное хранение данных и программ).
НМЛ обычно бывают кассетного типа и используют либо компакт-кассеты для бытовых магнитофонов, либо видеокассеты (для стриммеров) с многодорожечной записью. Емкость их измеряется в гигабайтах.
ВЗУ связываются с МП через системную магистраль при помощи устройства управления (контроллера).
Контроллер необходим для двух целей:
НМД и оптические ЗУ представляют собой устройства с циклическим доступом к информации. НМЛ представляют собой устройства с последовательным доступом.
Время доступа к информации в ВЗУ намного превосходит время обращения к ОП. ВЗУ являются относительно медленными устройствами электромеханического типа.
Накопитель на жестком магнитном диске
В накопителе на жестком магнитном диске (НМД) магнитный носитель информации является несъемным и может состоять из нескольких пластин, закрепленных на общей оси и образующих пакет магнитных носителей.
Каждую рабочую поверхность такой конструкции обслуживает своя магнитная головка. В НМД головки во время работы находятся на небольшом расстоянии от поверхности (десятые доли микрона) и во время чтения-записи неподвижны.
Магнитное покрытие каждой поверхности диска во время чтения-записи перемещается относительно головки. Магнитный "след" на поверхности диска, образовавшийся при работе головки на запись, образует кольцевую траекторию - дорожку (trek). Дорожки, расположенные друг под другом на всех рабочих поверхностях магнитного носителя, называются цилиндром (cylinder).
В жестких МД различных фирм используются разные материалы для магнитного покрытия: диски ранних конструкций имели оксидное покрытие (окись железа), более поздние диски - кобальтовое покрытие.
Кобальтовое покрытие наносится на поверхность диска методом напыления. При этом образуется тонкая магнитная пленка, на которую легко воздействовать для образования магнитных следов. Размеры магнитных следов по сравнению с оксидным покрытием уменьшились, что позволило увеличить продольную и поперечную плотности записи. Увеличение продольной плотности записи позволило увеличить емкость дорожки, а увеличение поперечной плотности записи - количество дорожек на поверхности диска.
Стандарт на физическое размещение информации на жестком магнитном диске мягче, чем для НГМД, так как гибкие диски должны читаться одинаково на дисководах разных фирм, в то время как жесткий магнитный диск имеет встроенную в него систему управления. При работе с жестким магнитным диском встроенная система управления решает вопросы физического размещения информации и зачастую недоступна для внешнего вмешательства. Например, наружные и внутренние дорожки магнитного диска имеют разную длину. Если их сделать одинаковой емкости и писать информацию с одинаковой плотностью записи, то на наружных дорожках остается много свободного места. Некоторые фирмы при изготовлении жестких дисков делают дорожки различной емкости. Но для того, чтобы стандартные операционные системы могли работать с такими дисками, встроенный в них контроллер осуществляет пересчет адресов; при этом физически на диске имеется меньшее количество дорожек, чем кажется операционной системе (так как операционная система настроена на работу с дорожками одинаковой емкости).
Количество дисков, каждый из которых имеет по две рабочих поверхности, в накопителе может быть от 1 до 10 и более. В некоторых накопителях две крайние поверхности пакета (верхняя и нижняя) не являются рабочими - при этом сокращается размер дисковода (и емкость тоже). Иногда эти поверхности используются для размещения служебной информации.
Магнитные головки при работе НМД могут перемещаться, настраиваясь на требуемую дорожку.
Перед началом эксплуатации пакет магнитных дисков форматируется: на нем размечаются дорожки (ставится маркер начала дорожки и записывается ее номер), наносятся служебные зоны секторов на дорожках. Для записи-чтения информации контроллеру НМД передается адрес: номер цилиндра, номер рабочей поверхности цилиндра, номер сектора на выбранной дорожке. На основании этого магнитные головки перемещаются к нужному цилиндру, ожидают появления маркера начала дорожки, ожидают появления требуемого сектора, после чего записывают или читают информацию из него. Несмотря на то, что все магнитные головки установлены на требуемый цилиндр, работает в каждый данный момент только одна головка.
Основной характеристикой НМД является их емкость, которая в наибольшей степени зависит от плотности записи, в свою очередь, в значительной степени зависящей от уровня развития технологии.
Оптические запоминающие устройства
Классификация оптических накопителей информации приведена на рис.15.6.
Компакт-диск CD-ROM (Compact Disk - Read Only Memory). Диск имеет прозрачную поликарбонатную основу толщиной 1,2 мм и диаметром 8 или 12 см. На одном дюйме по радиусу умещается 16000 дорожек (тогда как на одном дюйме флоппи-диска - всего 96). Емкость компакт-диска составляет 650-700 Мбайт.
Рис. 15.6. Классификация оптических накопителей информации
Первые экземпляры содержали информацию только в цифровом виде. Конструкция была аналогична самой простой пластинке - Laservision. Работал такой компакт-диск по принципу CLV - считывания с постоянной линейной скоростью, угловая скорость изменялась от 200 до 500 об/мин.
Впоследствии дисководы для CD-ROM стали выпускаться на двойную (х2), четырехкратную (х4), …, тридцатидвухкратную (х32) и т.д. скорость чтения. Кратность определялась относительно продолжительности воспроизведения звукозаписи с аналогичного аналогового диска.
Компакт-диски CD-WO (в современном представлении - CD-R и CD-RW) позволяют дозаписывать информацию за несколько сеансов. После каждой дозаписи создается оглавление диска. Компакт-диски CD-WO (CD-R, CD-RW) могут изготовляться по различным технологиям: диск может быть покрыт чувствительным фотолаком, в котором лазер прожигает отверстия, испаряя лак; на подложку диска могут быть нанесены два слоя - один из искусственных полимеров (имеющих малую теплоту плавления), другой - металлический. При нагревании металла лазерным лучом находящийся под ним слой полимера испаряется, что приводит к образованию пузырька в металлическом слое, и как следствие - к нетиповому отражению считывающего луча в этом месте; поверхность диска может быть покрыта слоем галий-сурьмы или индий-сурьмы, которые при воздействии на них лазерного луча расплавляются и переходят из кристаллического в аморфное состояние, что сопровождается изменением условий отражения и может быть зафиксировано считывающим лазерным лучом.
DVD - это универсальный диск с высокой плотностью записи информации. По сравнению с обычными компакт-дисками CD и видеодисками VideoCD плотность записи DVD увеличена в 7 раз. На DVD-диске за счет более мелкого микрорельефа информационной дорожки и использования многоуровневой записи удалось значительно увеличить количество записываемой информации по сравнению с VideoCD.
Лекция 16
Все устройства ЭВМ делятся на центральные и периферийные. Центральные устройства - полностью электронные, периферийные устройства могут быть либо электронными, либо электромеханическими с электронным управлением.
В центральных устройствах основным узлом, связывающим микропроцессорный комплект в единое целое, является системная магистраль. Она состоит из трех узлов, называемых шинами: шина данных (ШД), шина адреса (ША), шина управления (ШУ). В состав системной магистрали входят регистры защелки, в которых запоминается передаваемая инфор-мация, шинные формирователи, шинные арбитры, определяющие очередность доступа к системной магистрали, и др.
Логика работы системной магистрали, количество разрядов (линий) в шинах данных, адреса и управления, порядок разрешения конфликтных ситуаций, возникающих при одновременном обращении различных устройств ЭВМ к системной магистрали, образуют интерфейс системной шины.
В состав центральных устройств ЭВМ входят: центральный процессор, основная память и ряд дополнительных узлов, выполняющих служебные функции.
Периферийные устройства делятся на два вида: внешние ЗУ (НМД, НГМД, НМЛ) и устройства ввода-вывода (УВВ): клавиатура, дисплей, принтер, мышь, адаптер каналов связи (КС) и др.
Организация функционирования ЭВМ с магистральной архитектурой
Управляющая работой ЭВМ программа перед началом выполнения загружается операционной системой в основную память. Адрес первой выполняемой команды передается микропроцессору и запоминается в счетчике команд. Начало работы процессора заключается в том, что адрес из счетчика команд (в котором всегда хранится адрес очередной команды) выставляется на шину адреса системной магистрали. Одновременно на шину управления выдается команда: выборка из ОП, которая воспринимается основной памятью. Получив с шины управления системной магистрали команду, основная память считывает адрес с шины адреса, находит ячейку с этим номером и ее содержимое выставляет на шину данных, а на шину управления выставляет сигнал о выполнении команды. Процессор, получив по шине управления сигнал об окончании работы ОП, вводит число с шины данных на внутреннюю магистраль МП и через нее пересылает введенную информацию в регистр команд.
В регистре команд полученная команда разделяется на кодовую и адресную части. Код команды поступает в блок управления для выработки сигналов, настраивающих МП на выполнение заданной операции, и для определения адреса следующей команды (который сразу заносится в счетчик команд). Адресная часть команды выставляется на шину адреса системной магистрали (СМ) и сопровождается сигналом выборки из ОП на шине управления. Выбранная из ОП информация через шину данных поступает на внутреннюю магистраль МП, с которой вводится в арифметико-логическое устройство (АЛУ). На этом заканчивается подготовка МП к выполнению операции и начинается ее выполнение в АЛУ.
Результат выполнения операции выставляется микропроцессором на шину данных, на шину адреса ставится адрес ОП, по которому этот результат необходимо записать, а на шину управления - команда запись в ОП. Получив с шины управления команду, ОП считывает адрес и данные с системной магистрали, организует запись данных по указанному адресу и после выполнения команды выставляет на шину управления сигнал, обозначающий, что число записано. Процессор, получив этот сигнал, начинает выборку очередной команды: выставляет адрес из счетчика команд на шину адреса, формирует команду выборка из ОП на шине управления и т.д.
В каждом цикле, получив команду в регистр команд и выделив код операции, процессор определяет, к какому устройству она относится. Если команда должна выполняться процессором, организуется ее выполнение по описанному циклу. Если же команда предназначена для выполнения в другом устройстве ЭВМ, центральный процессор (ЦП) передает ее соответствующему устройству. Процесс передачи команды другому устройству предусматривает следующие действия: ЦП выставляет на шину адреса СМ адрес интересующего его устройства. По шинам управления передается сигнал поиска устройства. Все устройства, подключенные к системной магистрали, получив этот сигнал, читают номер устройства с шины адреса и сравнивают его со своим номером. Устройства, для которых эти номера не совпадают, на эту команду не реагируют. Устройство с совпавшим номером вырабатывает сигнал отклика по шине управления.
ЦП, получив сигнал отклика, в простейшем случае выставляет имеющуюся у него команду на шину данных и сопровождает ее по шине управления сигналом "передаю команду". Получив сигнал о приеме команды, ЦП переходит к выполнению очередной своей команды, выставляя на шину адреса содержимое счетчика команд.
В более сложных случаях, получив сигнал, что устройство откликнулось, прежде чем передавать команду, ЦП запрашивает устройство о его состоянии. Текущее состояние устройства закодировано в байте состояния, который откликнувшееся устройство передает процессору через ШД системной магистрали. Если устройство включено и готово к работе, то байт состояния - нулевой. Наличие в нем единиц свидетельствует о нештатной ситуации, которую ЦП пытается проанализировать и в необходимых случаях извещает оператора о сложившейся ситуации.
Взаимодействие МП с внешними устройствами предусматривает выполнение логической последовательности действий, связанных с поиском устройства, определением его технического состояния, обменом командами и информацией. Эта логическая последовательность действий вместе с устройствами, реализующими ее, получила название "интерфейс ввода-вывода".
Для различных устройств могут использоваться разные логические последовательности действий, поэтому интерфейсов ввода-вывода может в одной и той же ЭВМ использоваться несколько. Если их удается свести к одному, универсальному, то такой интерфейс называется стандартным. В IBM PC есть три стандартных интерфейса для связи ЦП с внешними устройствами: параллельный (типа Centronics) и два последовательных (типа RS-232 и USB).
Интерфейсы постоянно совершенствуются, поэтому с появлением новых ЭВМ, новых внешних устройств и даже нового программного обеспечения появляются и новые интерфейсы. Так, в программном обеспечении, разработанном ведущими фирмами (в том числе фирмой Microsoft) все шире используется новый интерфейс "Plug and Play" ("Включи и играй"), который предназначен для облегчения системной настройки ЭВМ при подключении новых устройств к машине. Этот интерфейс позволяет подключить с помощью кабеля новое устройство, а после включения ЭВМ ее программное обеспечение автоматически определяет состав подключенных устройств, их типы и настраивает машину на работу с ними без вмешательства системного оператора.
Если при обращении ЦП к внешнему устройству продолжение выполнения основной программы ЦП возможно только после завершения операции ввода-вывода, то ЦП, запустив внешнее устройство, переходит в состояние ожидания и находится в нем до тех пор, пока внешнее устройство не сообщит ему об окончании обмена данными. Это приводит к простою большинства устройств ЭВМ, так как в каждый момент времени может работать только одно из них. Такой режим работы получил название однопрограммного - в каждый момент времени все устройства находятся в состоянии ожидания, и только одно устройство выполняет основную (и единственную) программу.
Для ликвидации таких простоев и повышения эффективности работы оборудования внешние устройства сделаны автономными: получив от ЦП необходимую информацию, они самостоятельно организуют свою работу по обмену данными. Процессор же, запустив внешнее устройство, пытается продолжить выполнение программы. При необходимости (если встретятся соответствующие команды) он может запустить в работу несколько других устройств (так как внешние устройства работают значительно медленнее процессора). Если же ему приходится переходить в режим ожидания, то, пользуясь тем, что в ОП может одновременно находиться не одна, а несколько программ, ЦП переходит к выполнению очередной программы. При этом создается ситуация, когда в один и тот же момент времени различные устройства ЭВМ выполняют либо разные программы, либо разные части одной и той же программы. Такой режим работы ЭВМ называется многопрограммным.
Организация работы ЭВМ при выполнении задания пользователя
Организация процессов ввода, преобразования и отображения результатов в ЭВМ относится к сфере системного программного обеспечения. Это сложные процессы, которые чаще всего делаются "прозрачными", т.е. незаметными для пользователя. Один из них - реализация задания пользователя: профессиональный пользователь (программист) пишет задание для ЭВМ в виде программы на алгоритмическом языке. Написанное задание (программа) представляет собой исходный модуль, сопровождаемый управляющими предложениями, указывающими операционной системе ЭВМ, на каком языке написана программа и что с ней надо делать. Если программа пишется на алгоритмическом языке, то управляющие предложения - на языке управления операционной системой (в Windows всех версий это скрипты, оформляемые в виде командных файлов).
Исходный модуль перед исполнением должен быть переведен на внутренний язык машины. Эта операция выполняется специальной программой - транслятором. В качестве транслятора может выступать компилятор, или интерпретатор (рис.16.1).
Рис. 16.1. Реализация задания пользователя
Результат работы компилятора может быть записан в библиотеку объектных модулей (БОМ) или передан другим программам для дальнейшей обработки, поскольку полученная машинная программа не готова к исполнению по двум причинам. Во-первых, она содержит неразрешенные внешние ссылки (т.е. обращение к программам, которые не содержатся в исходном модуле, но необходимы для работы основной программы - например, к стандартным программам алгоритмического языка, таким как извлечение корня квадратного, вычисление тригонометрических функций и т.д.). Во-вторых, объектный модуль представляет собой машинную программу в условных адресах: каждый объектный модуль начинается с адреса 0h, тогда как для исполнения программа должна быть "привязана" к конкретным физическим адресам основной памяти.
Недостающие программы должны быть взяты из библиотек компилятора (которые могут быть написаны в виде исходных либо в виде объектных модулей) и добавлены к основной программе. Эту операцию выполняет редактор связей. В результате работы редактора связей образуется загрузочный модуль (ЗМ), который помещается в соответствующую библиотеку программ - библиотеку загрузочных модулей (БЗМ). В загрузочном модуле все ссылки разрешены, т.е. он содержит все необходимые стандартные программы, но привязки к памяти у загрузочного модуля нет.
Привязка к памяти загрузочного модуля производится программой выборки, которая переносит загрузочный модуль из библиотеки загрузочных модулей (обычно хранящейся на магнитном носителе) в основную память и во время этого переноса корректирует адреса, учитывая, с какого адреса основной памяти размещается загрузочный модуль. После перемещения загрузочного модуля в основную память программа выборки инициирует ее выполнение.
Представление машинной программы в виде исходных, объектных и загрузочных модулей позволяет реализовать наиболее эффективные программные комплексы. Например, если по одной и той же программе необходимо много раз производить расчеты, то неэффективно тратить каждый раз время на трансляцию и редактирование программы - ее нужно оформить в виде загрузочного модуля и хранить в соответствующей библиотеке. При обращении к такой программе сразу будет вызываться программа выборки для загрузки соответствующего модуля (а этапы компиляции и редактирования связей будут опускаться), и время на выполнение программы существенно сократится.
Если же программа только отлаживается или после каждого просчета ее нужно будет модернизировать, то получение загрузочного модуля и обращение к программе выборки будут лишними операциями. Для их обхода вместо редактора связей может быть применен загрузчик - программа, сочетающая в себе функции редактирования связей и загрузки полученной машинной программы в основную память для исполнения. Но при использовании загрузчика многократные просчеты по программе проводить невыгодно, так как каждый раз приходится выполнять лишние операции редактирования связей.
Особенности управления основной памятью ЭВМ
Алгоритмы распределения, использования, освобождения ресурсов и представления к ним доступа предназначены для наиболее эффективной организации работы всего комплекса устройств ЭВМ. Рассмотрим их на примере управления основной памятью.
Для выполнения программы при ее загрузке в основную память ей выделяется часть машинных ресурсов - они необходимы для размещения команд, данных, управляющих таблиц и областей ввода-вывода, т. е. производится трансляция адресного пространства откомпилированной программы в местоположение в реальной памяти.
Выделение ресурсов может быть осуществлено самим программистом (особенно если он работает на языке, близком машинному), но может производиться и операционной системой.
Если выделение ресурсов производится перед выполнением программы, такой процесс называется статическим перемещением, в результате которого программа "привязывается" к определенному месту в памяти вычислительной машины. Если же ресурсы выделяются в процессе выполнения программы, это называется динамическим перемещением, в этом случае программа не привязана к определенному месту в реальной памяти. Динамический режим можно реализовать только с помощью операционной системы.
При статическом перемещении могут встретиться два случая.
Реальная память больше требуемого адресного пространства программы (рис.16.2):
Рис. 16.2. Загрузка программы в реальную память
В этом случае загрузка программы в реальную память производится, начиная с нулевого адреса.
Загружаемая программа А является абсолютной программой, так как никакого изменения адресов в адресном пространстве, подготовленном компилятором, при загрузке в основную память не происходит - программа располагается с адреса реальной памяти 0h.
Реальная память меньше требуемого адресного пространства программы (рис.16.3):
Рис. 16.3. Загрузка при реальной памяти меньше требуемого адресного пространства
В этом случае программист (или операционная система) вынужден решать проблему, как организовать выполнение программы. Методов решения проблемы существует несколько: можно создать оверлейную структуру (т. е. разбить программу на части, вызываемые в ОП по мере необходимости), сделать модули программы реентерабельными (т.е. допускающими одновременную работу модуля по нескольким обращениям из разных частей программы или из различных программ) и так далее.
В некоторых операционных системах адреса откомпилированной (с адреса 0h) программы могут быть преобразованы в адреса реальной памяти, отличные от 0h. При этом создается абсолютный модуль, который требует размещения его в памяти всегда с одного и того же адреса.
Тогда, при мультипрограммном режиме, если имеем программы А, В и С, для которых известно, что программа А выполняется при размещении в памяти с адреса 60 Кбайт до 90 Кбайт, В - с 60 Кбайт до 90 Кбайт, С - с 50 Кбайт до 120 Кбайт, организовать их совместное выполнение невозможно, так как им необходим один и тот же участок реальной памяти. Эти программы будут ждать друг друга, либо их нужно заново редактировать с другого адреса.
При работе в мультипрограммном режиме может сложиться ситуация, когда между программами образуются незанятые участки памяти. Такое состояние называется фрагментацией реальной памяти. Оно характерно для систем со статическим перемещением (рис.16.4).
Рис. 16.4. Фрагментация памяти
В системах с динамическим перемещением программ перемещающий загрузчик размещает программу в свободной части памяти и допускает использование несмежных ее участков (рис.16.5).
Рис. 16.5. Динамическое перемещение программ
В этом случае имеется больше возможностей для организации мультипрограммной работы, а следовательно, и для более эффективного использования временных ресурсов ЭВМ.
При больших размерах реализуемых программ возникают некоторые противоречия в организации мультипрограммного режима работы и трудности динамического распределения ресурсов.
В настоящее время разработано несколько способов решения этих противоречий. Например, для борьбы с фрагментацией основной памяти адресное пространство программы может быть разбито на отдельные сегменты, слабо связанные между собой. Тогда программа, которая имеет длину, превышающую размеры свободных участков памяти, может быть представлена в виде ряда сегментов, загружаемых в различные области ОП. Это позволяет использовать реальную память, теряемую из-за фрагментации.
Адреса в каждом сегменте начинаются с 0h. При статическом перемещении программы в процессе загрузки ее в основную память адреса должны быть привязаны к конкретному месту в памяти, на это уходит много времени, отвлекаются вычислительные ресурсы. Более эффективной является динамическая трансляция адресов (ДТА), которая заключается в том, что сегменты загружаются в основную память без трансляции адресного пространства (т.е. без изменения адресов в программе с учетом физического размещения в памяти команд и данных), а трансляция адресов каждой команды производится в процессе ее выполнения. Этот тип трансляции называется динамическим перемещением и осуществляется специальными аппаратными средствами ДТА (рис.16.6).
Для динамической трансляции адресов (т.е. при определении абсолютных адресов по известным относительным, содержащим номер сегмента и смещение) операционная система строит специальные таблицы, устанавливающие соответствие между сегментируемым адресным пространством программы и действительными адресами сегментов в реальной памяти (рис.16.7).
Рис. 16.6. Динамическое перемещение программ
Рис. 16.7. Динамическая трансляция адресов
Каждая строка таблицы сегментов содержит адрес начала сегмента в реальной памяти. Для каждого сегмента имеется одна строка таблицы.
Таблицу сегментов содержит каждая выполняемая программа.
В дополнение к таблице сегментов для динамической трансляции адреса применяется специальный управляющий регистр, называемый регистром начала таблицы сегментов (РНТС, или STOR (segment table origin register)). В этот регистр занесен адрес таблицы сегментов выполняемой в данный момент программы. В МП Pentium в качестве РНТС используются 3 регистра: GDTR, LDTR и IDTR.
Использованием сегментации программ достигается уменьшение фрагментации основной памяти, но полностью фрагментация не устраняется - остаются фрагменты, длина которых меньше длины сегментов программы.
Если сегменты разделить на одну или несколько единиц, называемых страницами, которые имеют фиксированный размер, то, поскольку размер страницы достаточно мал по сравнению с обычным размером сегментов, неиспользуемые фрагменты ОП значительно сокращаются в объеме, будет происходить так называемая фрагментация внутри страниц. Следовательно, потери все-таки останутся, но они будут существенно меньше. Такая организация использования ресурсов называется сегментно-страничной.
Формирование сегментно-страничной структуры выполняется автоматически с помощью операционной системы.
Все преимущества динамического перемещения с применением сегментации и страничной организации достигаются благодаря аппаратуре и программному обеспечению, а не пользователям системы. Специальные программы во время загрузки разбивают адресное пространство программы на сегменты и страницы, строят таблицы сегментов и страниц. Средства ДТА автоматически транслируют адрес в процессе выполнения программы.
Система прерываний ЭВМ
Современная ЭВМ представляет собой комплекс автономных устройств, каждое из которых выполняет свои функции под управлением местного устройства управления независимо от других устройств машины. Включает устройство в работу центральный процессор (ЦП). Он передает устройству команду и все необходимые для ее исполнения параметры. После начала работы устройства центральный процессор отключается от него и переходит к обслуживанию других устройств или к выполнению других функций.
Можно считать, что центральный процессор переключает свое внимание с устройства на устройство и с функции на функцию. На что именно обращено внимание ЦП в каждый данный момент, определяется выполняемой им программой. Во время работы в ЦП поступает (и вырабатывается в нем самом) большое количество различных сигналов. Сигналы, которые выполняемая в ЦП программа способна воспринять, обработать и учесть, составляют поле зрения ЦП или, другими словами, входят в зону его внимания.
Например, если процессором исполняется программа сложения двух двойных слов, которая анализирует регистр флагов ЦП, то в "поле ее зрения" находятся флаги микропроцессора, определяющие знаки исходных данных и результата, наличие переноса из тетрады или байта, переполнения разрядной сетки и др. Такая программа готова реагировать на любой из сигналов, находящихся в ее зоне внимания (а поскольку именно программа управляет работой ЦП, она определяет и "зону внимания" центрального процессора). Но если во время выполнения такой программы нажать какую-либо клавишу, то эта программа "не заметит" сигнала от этой клавиши, так как он не входит в ее "поле зрения".
Для того чтобы ЦП, выполняя свою работу, имел возможность реагировать на события, которые происходят вне его зоны внимания и наступления которых он "не ожидает", существует система прерываний ЭВМ. При отсутствии системы прерываний все заслуживающие внимания события должны находиться в поле зрения процессора, что сильно усложняет программы и требует большой их избыточности. Кроме того, поскольку момент наступления события заранее не известен, процессор в ожидании какого-либо события может находиться длительное время, и чтобы не пропустить его появления, ЦП не может "отвлекаться" на выполнение какой-либо другой работы. Такой режим работы (режим сканирования ожидаемого события) связан с большими потерями времени ЦП на ожидание.
Кроме сокращения потерь на ожидание, режим прерываний позволяет организовать выполнение такой работы, которую без него реализовать просто невозможно. Например, при появлении неисправностей, нештатных ситуаций режим прерываний позволяет организовать работу по диагностике и автоматическому восстановлению в момент возникновения нештатной ситуации, прервав выполнение основной работы таким образом, чтобы сохранить полученные к этому времени правильные результаты, тогда как без режима прерываний обратить внимание на наличие неисправности система могла только после окончания выполняемой работы (или ее этапа) и получения неправильного результата.
Таким образом, система прерываний позволяет микропроцессору выполнять основную работу, не отвлекаясь на проверку состояния сложных систем при отсутствии такой необходимости, или прервать выполняемую работу и переключиться на анализ возникшей ситуации сразу после ее появления.
Помимо требующих внимания нештатных ситуаций, которые могут возникнуть при работе микропроцессорной системы, процессору полезно уметь "переключать внимание" и на различные виды работ, одновременно выполняемые в системе. Поскольку управление работой системы осуществляется программой, этот вид прерываний должен формироваться программным путем.
В зависимости от места нахождения источника прерываний они могут быть разделены на: внутренние (программные и аппаратные) и внешние прерывания (поступающие в ЭВМ от внешних источников, например, от клавиатуры или модема).
Принцип действия системы прерываний заключается в следующем: при выполнении программы после каждого рабочего такта микропроцессора изменяется содержимое регистров, счетчиков, состояние отдельных управляющих триггеров, т. е. изменяется состояние процессора. Информация о состоянии процессора лежит в основе многих процедур управления вычислительным процессом. Не вся информация одинаково актуальна, есть существенные элементы, без которых невозможно продолжение работы. Эта информация должна сохраняться при каждом "переключении внимания процессора".
Совокупность значений наиболее существенных информационных элементов называется вектором состояния или словом состояния процессора (в некоторых случаях оно называется словом состояния программы).
Вектор состояния в каждый момент времени должен содержать информацию, достаточную для продолжения выполнения программы или повторного пуска ее с точки, которая соответствует моменту формирования данного вектора.
Вектор состояния формируется в соответствующем регистре процессора или в группе регистров, которые могут использоваться и для других целей.
Наборы информационных элементов, образующих векторы состояния, отличаются у ЭВМ разных типов. В IBM PC вектор состояния включает содержимое счетчика команд, сегментных регистров, регистра флагов и аккумулятора (регистра АХ). В более поздних версиях основу вектора состояния образуют такие регистры, как слово состояния машины (Mashine status word - MSW), регистр состояния задачи (TR) и др.
При возникновении события, требующего немедленной реакции со стороны машины, ЦП прекращает обработку текущей программы и переходит к выполнению другой программы, специально предназначенной для данного события, по завершению которой возвращается к выполнению отложенной программы. Такой режим работы называется прерыва-нием.
Каждое событие, требующее прерывания, сопровождается специальным сигналом, который называется запросом прерывания. Программа, затребованная запросом прерывания, называется обработчиком прерывания.
Запросы на прерывание могут возникать из-за сбоев в аппаратуре (зафиксированных схемами контроля), переполнения разрядной сетки, деления на ноль, выхода за установленные для данной программы области памяти, затребования периферийным устройством операции ввода-вывода, завершения этой операции ввода-вывода или возникновения при этой операции особых условий и т.д.
Некоторые из этих запросов порождаются самой программой, но время их возникновения невозможно предсказать заранее.
При наличии нескольких источников запросов прерывания часть из них может поступать одновременно. Поэтому в ЭВМ устанавливается определенный порядок (дисциплина) обслуживания поступающих запросов. Кроме того, в ЭВМ предусматривается возможность разрешать или запрещать прерывания определенных видов.
Программы - обработчики прерываний могут находиться в различных частях основной памяти (место их расположения в разных версиях операционных систем может быть различным). Для обеспечения совместимости программ под разными версиями операционной системы обращение к обработчикам прерываний осуществляется по их номерам.
В реальном режиме связь между номером прерывания и адресом основной памяти, соответствующим точке входа в обработчик прерывания, осуществляется через таблицу векторов прерываний, занимающую 1Кбайт сегмента 0 основной памяти.
В 32-битных микропроцессорах число n в команде INTn определяет номер индекса вызываемого прерывания в таблице дескрипторов прерываний IDT. Таблица IDT в режиме реальной адресации является массивом четырехбайтных дальних указателей. Линейный базовый адрес таблицы IDT определяется содержимым регистра IDTR. При переходе в режим реальных адресов первоначальное значение IDTR равно нулю (т.е. начало таблицы DTR совпадает с началом вектора прерываний IBM PC).
Параллельные вычисления
Вычислительный процесс - это последовательность целенаправленных действий по обработке информации, приводящих к достижению поставленной цели.
Вычислительный процесс характеризуется тремя параметрами:
Графически вычислительный процесс может изображаться трассой, временной диаграммой, ярусно-параллельным графом, и др.
Трасса представляется в виде упорядоченного множества событий , имевших место в моменты времени , причем
Трасса характеризует динамику процесса, т.е. развитие его во времени. Обычно она изображается в виде последовательности событий, нанесенных в масштабе на ось времени.
Развитие процесса в пространстве и во времени характеризуется временной диаграммой. Временная диаграмма обычно изображается на нескольких осях времени, причем каждая ось содержит трассу, которая характеризует загрузку одного из устройств, выделенных процессу.
Ярусно-параллельный граф характеризует параллельность (одновременность, параллелизм) выполнения действий, составляющих процесс.
Простейший вид параллелизма реализован в мультипрограммных системах - этот вид параллелизма называется "совмещение во времени различных этапов разных задач".
Мультипрограммная обработка возможна и в однопроцессорной системе, так как реализует совмещение во времени выполнение различных частей разных задач. Для такого совмещения лишь необходимо, чтобы однопроцессорная система состояла из относительно независимых, автономных частей, каждая из которых может выполнять свою работу одновременно с работой других. При этом каждая задача все-таки будет решаться последовательно, но разные части вычислительной системы будут одновременно работать над разными задачами, не мешая друг другу.
В вычислительных системах, содержащих несколько обрабатывающих устройств, возможен другой тип параллелизма: одновременное решение различных задач или одновременное решение независимых ветвей одной задачи.
Если в систему поступает непрерывный поток не связанных между собой задач (т. е. таких задач, для которых характерно, что решение любой задачи не зависит от результатов решения других задач), использование нескольких обрабатывающих устройств позволяет совместить решение этих задач во времени. Это - "естественный параллелизм независимых задач".
При решении большой задачи в ней так же могут быть выделены отдельные независимые части - ветви, которые при наличии нескольких обрабатывающих устройств могут выполняться параллельно и независимо друг от друга. Это - "параллелизм независимых ветвей".
Для естественного параллелизма независимых задач и параллелизма независимых ветвей наиболее наглядной формой графического представления является ярусно-параллельная.
Ярусно-параллельный граф представляет вычислительный процесс в виде совокупности ветвей, расположенных в нескольких уровнях (ярусах). Ветви обозначаются кружками с цифрами внутри. Длина ветви характеризуется цифрой, стоящей около кружка. Стрелками показаны входные данные и результаты обработки. Входные данные обозначаются символами "x", выходные - символами "y". Индексы при "y" есть нижние и верхние. Верхние индексы соответствуют номеру ветви, при выполнении которой получен данный результат. Нижний индекс обозначает порядковый номер результата, полученного при реализации данной ветви программы.
Ветви каждого яруса не связаны друг с другом, т.е. результаты решения какой-нибудь ветви данного яруса не являются входными данными для другой ветви этого же яруса.
На примере ярусно-параллельных графов можно выявить преимущества вычислительных систем, имеющих несколько обрабатывающих устройств, и проблемы, возникающие в таких системах.
Рассмотрим возможности ярусно-параллельного графа на примере параллелизма независимых ветвей одной задачи. Пусть необходимо в параллельной системе произвести вычисление по формуле:
и определить продолжительность вычислений по сравнению с однопроцессорной системой. Будем считать, что сложение и вычитание выполняются за 100 единиц времени, умножение - за 600, деление - за 1000.
В однопроцессорной системе последовательность действий может быть такая:
№ |
Действие |
Время |
1 |
600 |
|
2 |
100 |
|
3 |
100 |
|
4 |
1000 |
|
5 |
600 |
|
6 |
600 |
|
7 |
100 |
|
Итого: |
3100 |
Время на выполнение такой последовательности действий составляет 3100 единиц.
При наличии нескольких процессоров последовательность действий может измениться (рис.16.8):
Рис. 16.8. Пример 1 ярусно-параллельного графа
Здесь цифры обозначают ярусы.
Продолжительность операции на 1 ярусе - 600 единиц, на втором - тоже 600 (сложение и вычитание закончатся раньше, но критическим для яруса является умножение), на третьем ярусе - 1000 единиц, на четвертом - 600, и на пятом - 100. Итого t1 = 2900 единиц.
Можно самую длинную операцию 2 яруса перенести на 3 ярус. Тогда граф изменится (рис.16.9), ветвь 4 со 2-го яруса переместится на 3.
Рис. 16.9. Пример 2 ярусно-параллельного графа
В этом случае продолжительность 2 яруса станет 100, т.е. уменьшится на 500 единиц, и общее время вычислений станет равным 2400 единиц.
В случае естественного параллелизма независимых задач и большом числе задач ярусно-параллельный граф становится значительно сложнее и допускает значительно большее количество вариантов, как например, на рис.16.10.
Для такого графа характерно, что выигрыш во времени может существенно колебаться в зависимости от последовательности выполнения ветвей каждым обрабатывающим блоком (процессором), поэтому каждый процессор должен выбирать новую ветвь с учетом этого обстоятельства. Перед началом выполнения очередной ветви каждый процессор должен иметь информацию о готовности данных для этого.
Рис. 16.10. Пример 3 ярусно-параллельного графа
Таким образом, чтобы с помощью нескольких обрабатывающих устройств решить задачи, имеющие независимые параллельные ветви, необходима соответствующая организация вычислительного процесса, которая будет определять пути решения задач и вырабатывать необходимую информацию о готовности каждой ветви.
При этом возникают следующие трудности:
Однако при решении многих сложных задач одно только программирование с выделением независимых ветвей уже позволяет существенно сократить время решения.
Хорошо поддаются параллельной обработке такого типа задачи матричной алгебры (в том числе - и компьютерной графики), линейного программирования, спектральной обработки сигналов, преобразования Фурье, задачи кластерного анализа, математической статистики, автоматической классификации, и т.д.
Лекция 17
Локальная компьютерная сеть представляет собой систему обмена информацией и распределенной обработки данных, охватывающую небольшую территорию (этаж, здание, несколько соседних зданий) внутри предприятий и организаций, т.е. это система взаимосвязанных и распределенных на фиксированной территории средств передачи, хранения и обработки информации, ориентированных на коллективное использование общесетевых ресурсов - аппаратных, программных, информационных. Такую сеть можно рассматривать как коммуникационную систему, которая поддерживает в пределах некоторой ограниченной территории один или несколько высокоскоростных каналов передачи информации, предоставляемых подключенным абонентским системам для кратковременного использования.
В обобщенной структуре ЛКС выделяются совокупность абонентских систем (АС), серверов и коммуникационная подсеть (КП). Основными компонентами ЛКС являются кабели с оконечным приемопередающим оборудованием, рабочие станции (РС), серверы, сетевые адаптеры, модемы, концентраторы, коммутаторы, маршрутизаторы, мосты (их назначение указано ниже).
Рабочие станции формируются на базе персональных компьютеров (ПК) и используются для решения прикладных задач, выдачи запросов в сеть на обслуживание, приема результатов удовлетворения запросов, обмена информацией с другими РС.
Серверы сети - это аппаратно-программные системы, выполняющие функции управления сетевыми ресурсами общего доступа; они могут работать и как обычные АС. Сервер создается на базе более мощного ПК, чем для РС. В ЛКС может быть несколько различных серверов для управления сетевыми ресурсами, однако всегда имеется один (или несколько) для управления внешними ЗУ общего доступа и организации распределенных баз данных (РБД).
Рабочие станции и серверы соединяются с кабелем коммуникационной подсети с помощью интерфейсных плат (сетевых адаптеров - СА), основные функции которых- организация приема-передачи данных из (в) РС, согласование скорости приема-передачи информации (буферизация), формирование пакета данных, параллельно-последовательное пре-образование кодов (конвертирование), кодирование/декодирование данных, проверка правильности передачи, установление соединения с требуемым абонентом сети, организация собственно обмена данными. В ряде случаев перечень функций СА существенно увеличивается, и тогда они строятся на основе микропроцессоров.
К основным характеристикам ЛКС относятся следующие:
К числу наиболее типичных областей применения ЛКС относятся следующие [87].
Обработка текстов - одна из наиболее распространенных функций средств обработки информации, используемых в ЛКС. Передача и обработка информации в сети, развернутой на предприятии (в организации, вузе и т.д.), обеспечивает реальный переход к "безбумажной" технологии, вытесняя полностью или частично пишущие машинки.
Организация собственных информационных систем, содержащих автоматизированные базы данных - индивидуальные и общие, сосредоточенные и распределенные. Такие БД могут быть в каждой организации или фирме.
Обмен информацией между АС сети - важное средство сокращения до минимума бумажного документооборота.
Обеспечение распределенной обработки данных, связанное с объединением АРМ всех специалистов данной организации в сеть.
Поддержка принятия управленческих решений, предоставляющая руководителям и управленческому персоналу организации достоверную и оперативную информацию, которая необходима для оценки ситуации и принятия правильных решений.
Организация электронной почты - одного из видов услуг ЛКС, которые позволяют руководителям и всем сотрудникам предприятия оперативно получать всевозможные сведения, необходимые в его производственно-хозяйственной, коммерческой и торговой деятельности.
Коллективное использование дорогостоящих ресурсов необходимое условие снижения стоимости работ, выполняемых в порядке реализации вышеуказанных применений ЛКС.
Для деления ЛКС на группы используются определенные классификационные признаки [87].
По назначению ЛКС делятся на информационные (информационно-поисковые), управляющие (технологическими, административными, организационными и другими процессами), информационно-расчетные и другие.
По типам используемых в сети ЭВМ их можно разделить на неоднородные, где применяются различные классы (микро-, мини-, большие) и модели (внутри классов) ЭВМ, а также различное абонентское оборудование, и однородные, содержащие одинаковые модели ЭВМ и однотипный состав абонентских средств.
По организации управления однородные ЛКС разделяются на сети с централизованным и децентрализованным управлением.
В сетях с централизованным управлением выделяются одна или несколько машин (центральных систем или органов), управляющих работой сети. Диски выделенных машин, называемых файл-серверами или серверами баз данных, доступны всем другим компьютерам (рабочим станциям) сети. На серверах работает сетевая ОС. Каждая РС имеет доступ к дискам серверов и совместно используемым принтерам, но, как правило, не может работать непосредственно с дисками других РС. Серверы могут быть выделенными, и тогда они выполняют только задачи управления сетью и не используются как РС, или невыделенными, когда параллельно с задачей управления сетью выполняют пользовательские программы (при этом снижается производительность сервера и надежность работы всей сети из-за возможной ошибки в пользовательской программе, которая может привести к остановке работы сети). Такие сети отличаются простотой обеспечения функций взаимодействия между АС. В сетях с централизованным управлением большая часть информационно-вычислительных ресурсов сосредоточена в центральной системе.
Если информационно-вычислительные ресурсы ЛКС равномерно распределены по большому числу АС, централизованное управление мало эффективно из-за резкого увеличения служебной (управляющей) информации. В этом случае эффективными оказываются сети с децентрализованным (распределенным) управлением, или одноранговые. В таких сетях нет выделенных серверов, функции управления сетью передаются по очереди от одной РС к другой. Рабочие станции имеют доступ к дискам и принтерам других РС. Это облегчает совместную работу групп пользователей, но производительность сети несколько понижается. По скорости передачи данных в общем канале различают:
По топологии, т.е. конфигурации элементов в сети, ЛКС бывают с шинной топологией, кольцевой, звездообразной, смешанной (звездно-кольцевой, сегментированной).
Отметим основные особенности ЛКС и их отличия от глобальных сетей. Они заключаются в следующем [84], [85].
Заметим, что указанные особенности ЛКС и их отличия от глобальных сетей характерны для сетей конца 80-х и начала 90-х годов ХХ века. В последние годы наметилась устойчивая тенденция сближения ЛКС и ГКС, приведшая к значительному взаимопроникновению их технологий. Одним из проявлений этой тенденции является появление корпоратив-ных и городских сетей, занимающих промежуточное положение между локальными и глобальными сетями. В таких сетях даже при больших расстояниях между узлами прокладываются качественные линии связи, обеспечивающие высокие скорости передачи данных. Используются оптоволоконные линии связи, упрощаются процедуры обеспечения корректности передачи информации, как это имеет место в сети Frame Relay. Режим работы on-line стал обычным и в ГКС, например, в гипертекстовой информационной службе WWW (World Wide Web), интерактивные возможности которой перенесены в ЛКС.
Процесс переноса служб и технологий из глобальных сетей в локальные и корпоративные сети приобрел практически массовый характер. В связи с этим появился даже специальный термин - Intranet-технологии (Intra - внутренний), обозначающий применение служб внешних (глобальных) сетей во внутренних (локальных, корпоративных). В ЛКС стали обращать такое же большое внимание на обеспечение безопасности ин-формации, как и в глобальных, т. е. используются те же методы защиты информации от несанкционированного доступа. Появляются новые технологии, предназначенные для использования в ГКС и ЛКС. Это прежде всего технология АТМ, объединяющая все существующие виды трафика в одной транспортной сети.
В локальных сетях основная роль в организации взаимодействия узлов принадлежит протоколу канального уровня, который ориентирован на вполне определенную топологию ЛКС. Так, самый популярный протокол этого уровня - Ethernet - рассчитан на топологию "общая шина", когда все узлы сети параллельно подключаются к общей для них шине, а протокол Token Ring - на топологию "звезда". При этом применяются простые структуры кабельных соединений между РС сети, а для упрощения и удешевления аппаратных и программных решений реализовано совместное использование кабелей всеми РС в режиме разделения времени. Такие простые решения, характерные для разработчиков первых ЛКС во второй половине 70-х годов ХХ века, наряду с положительными имели и отрицательные последствия, главные из которых - ограничения по производительности и надежности.
Поскольку в ЛКС с простейшей топологией (общая шина, кольцо, звезда) имеется только один путь передачи информации - моноканал, производительность сети ограничивается пропускной способностью этого пути, а надежность сети - надежностью пути. Поэтому по мере развития и расширения сфер применения локальных сетей с помощью специ-альных коммуникационных устройств (мостов, коммутаторов, маршрутизаторов) эти ограничения постепенно снимались. Базовые конфигурации ЛКС (шина, кольцо) превратились в элементарные звенья, из которых формируются более сложные структуры локальных сетей, имеющие параллельные и резервные пути между узлами.
Однако внутри базовых структур локальных сетей продолжают работать все те же протоколы Ethernet и Token Ring. Объединение этих структур (сегментов) в общую, более сложную локальную сеть осуществляется с помощью дополнительного оборудования, а взаимодействие РС такой сети - с помощью других протоколов.
В развитии локальных сетей, кроме отмеченных, наметились и другие тенденции:
В локальных сетях канальный уровень разделен на два подуровня:
Протоколы подуровней МАС и LLC взаимно независимы, т.е. каждый протокол подуровня МАС может работать с любым протоколом подуровня LLC, и наоборот.
Подуровень МАС обеспечивает совместное использование общей передающей среды, а подуровень LLC организует передачу кадров с различным уровнем качества транспортных услуг. В современных ЛКС используются несколько протоколов подуровня МАС, реализующих различные алгоритмы доступа к разделяемой среде и определяющих специфику технологий Ethernet, Fast Ethernet, Gigabit Ethernet, Token Ring, FDDI, 100VG-AnyLAN.
Протокол LLC. Для ЛКС этот протокол обеспечивает необходимое качество транспортной службы. Он занимает положение между сетевыми протоколами и протоколами подуровня МАС. По протоколу LLC кадры передаются либо дейтаграммным способом, либо с помощью процедур с установлением соединения между взаимодействующими станциями сети и восстановлением кадров путем их повторной передачи при наличии в них искажений.
Технология Ethernet (стандарт 802.3). Это самый распространенный стандарт локальных сетей. По этому протоколу в настоящее время работают большинство ЛКС. Имеется несколько вариантов и модификаций технологии Ethernet, составляющих целое семейство технологий. Из них наиболее известными являются 10-мегабитный вариант стандарта IEEE 802.3, а также новые высокоскоростные технологии Fast Ethernet и Gigabit Ethernet. Все эти варианты и модификации отличаются типом физической среды передачи данных.
Все виды стандартов Ethernet используют один и тот же метод доступа к передающей среде - метод случайного доступа CSMA/CD. Он применяется исключительно в сетях с общей логической шиной, которая работает в режиме коллективного доступа и служит для передачи данных между любыми двумя узлами сети. Такой метод доступа носит вероятностный характер: вероятность получения среды передачи в свое распоряжение зависит от загруженности сети. При значительной загрузке сети интенсивность коллизий возрастает и ее полезная пропускная способ-ность резко падает.
Полезная пропускная способность сети - это скорость передачи пользовательских данных, переносимых полем данных кадров. Она всегда меньше номинальной битовой скорости протокола Ethernet за счет служебной информации кадра, межкадровых интервалов и ожидания доступа к среде. Коэффициент использования сети в случае отсутствия коллизий и ожидания доступа имеет максимальное значение 0,96.
Технологией Ethernet поддерживаются 4 разных типа кадров, имеющих общий формат адресов. Распознавание типа кадров осуществляется автоматически.
Для всех стандартов Ethernet имеют место следующие характеристики и ограничения:
Технология Token Ring (стандарт 802.5). Здесь используется разделяемая среда передачи данных, которая состоит из отрезков кабеля, соединяющих все РС сети в кольцо. К кольцу (общему разделяемому ресурсу) применяется детерминированный доступ, основанный на передаче станциям права на использование кольца в определенном порядке. Это право предается с помощью маркера. Маркерный метод доступа гарантирует каждой РС получение доступа к кольцу в течение времени оборота маркера. Используется приоритетная система владения маркером - от 0 (низший приоритет) до 7 (высший). Приоритет для текущего кадра определяется самой станцией, которая может захватить кольцо, если в нем нет более приоритетных кадров.
В сетях Token Ring в качестве физической среды передачи данных применяется экранированная и неэкранированная витая пара и волоконно-оптический кабель. Сети работают с двумя битовыми скоростями - 4 и 16 Мбит/с, причем в одном кольце все РС должны работать с одной скоростью. Максимальная длина кольца - 4 км, а максимальное количество РС в кольце - 260. Ограничения на максимальную длину кольца связаны со временем оборота маркера по кольцу. Если в кольце 260 станций и время удержания маркера каждой станцией равно 10 мс, то маркер после совершения полного оборота вернется в активный монитор через 2,6 с. При передаче длинного сообщения, разбиваемого, например, на 50 кадров, это сообщение будет принято получателем в лучшем случае (когда активной является только РС-отправитель) через 260 с, что для пользователей не всегда приемлемо.
Максимальный размер кадра в стандарте 802.5 не определен. Обычно он принимается равным 4 Кбайтам для сетей 4 Мбит/с и 16 Кбайтам для сетей 16 Мбит/с.
В сетях 16 Мбит/с используется также и более эффективный алгоритм доступа к кольцу. Это алгоритм раннего освобождения маркера (ETR): станция передает маркер доступа следующей станции сразу же после окончания передачи последнего бита своего кадра, не дожидаясь возвращения по кольцу этого кадра и занятого маркера. В этом случае по кольцу будут передаваться одновременно кадры нескольких станций, что существенно повышает эффективность использования пропускной способности кольца. Конечно, и в этом случае в каждый данный момент ге-нерировать кадр в кольцо может только та РС, которая в этот момент владеет маркером доступа, а остальные станции будут лишь ретранслировать чужие кадры.
Технология Token Ring (технология этих сетей была разработана еще в 1984 г. фирмой IBM) существенно сложнее технологии Ethernet. В ней заложены возможности отказоустойчивости: за счет обратной связи кольца одна из станций (активный монитор) непрерывно контролирует наличие маркера, время оборота маркера и кадров данных, обнаруженные ошибки в сети устраняются автоматически, например, потерянный маркер может быть восстановлен. В случае выхода из строя активного монитора выбирается новый активный монитор и процедура инициализации кольца повторяется.
Стандарт Token Ring изначально предусматривал построение связей в сети с помощью концентраторов, называемых MAU, т.е. устройствами многостанционного доступа. Концентратор может быть пассивным (соединяет порты внутренними связями так, чтобы РС, подключенные к этим портам, образовали кольцо, а также обеспечивает обход какого-либо порта, если подключенный к этому порту компьютер выключается) или активным (выполняет функции регенерации сигналов и поэтому иногда называется повторителем).
Для сетей Token Ring характерна звездно-кольцевая топология: РС подключаются к концентраторам по топологии звезды, а сами концентраторы через специальные порты Ring In (RI) и Ring Out (RO) объединяются для образования магистрального физического кольца. Сеть Token Ring может строиться на основе нескольких колец, разделенных мостами, маршрутизирующие кадры адресату (каждый кадр снабжается полем с маршрутом прохождения колец).
Недавно технология Token Ring стараниями компании IBM получила новое развитие: предложен новый вариант этой технологии (HSTR), поддерживающий битовые скорости в 100 и 155 Мбит/с. При этом сохранены основные особенности технологии Token Ring 16 Мбит/с.
Технология FDDI. Это первая технология ЛКС, в которой для передачи данных используется волоконно-оптический кабель. Она появилась в 1988 г. и ее официальное название - оптоволоконный интерфейс распределенных данных (Fiber Distributed Data Interface, FDDI). В настоящее время в качестве физической среды, кроме волоконно-оптического кабеля, применяется неэкранированная витая пара.
Технология FDDI предназначена для использования на магистральных соединениях между сетями, для подключения к сети высокопроизводительных серверов, в корпоративных и городских сетях. Поэтому в ней обеспечена высокая скорость передачи данных (100 Мбит/с), отказоустойчивость на уровне протокола и большие расстояния между узлами сети. Все это сказалось на стоимости подключения к сети: для подключения клиентских компьютеров эта технология оказалась слишком дорогой.
Существует значительная преемственность между технологиями Token Ring и FDDI. Основные идеи технологии Token Ring восприняты и получили совершенствование и развитие в технологии FDDI, в частности, кольцевая топология и маркерный метод доступа.
В сети FDDI для передачи данных используются два оптоволоконных кольца, образующих основной и резервный пути передачи между РС. Станции сети подключаются к обоим кольцам. В нормальном режиме задействовано только основное кольцо. В случае отказа какой-либо части основного кольца оно объединяется с резервным кольцом, вновь образуя единое кольцо (это режим "свертывания" колец) с помощью концентраторов и сетевых адаптеров. Наличие процедуры "свертывания" при отказах - основной способ повышения отказоустойчивости сети. Существуют и другие процедуры для определения отказов в сети и восстановления ее работоспособности.
Основное отличие маркерного метода доступа к передающей среде, используемого в сети FDDI, от этого метода в сети Token Ring заключается в том, что в сети FDDI время удержания маркера является постоянной величиной только для синхронного трафика, который критичен к задержкам передачи кадров. Для асинхронного трафика, не критичного к небольшим задержкам передачи кадров, это время зависит от загрузки кольца: при небольшой загрузке оно увеличивается, а при большой - может уменьшаться до нуля. Таким образом, для асинхронного трафика метод доступа является адаптивным, хорошо регулирующим временные перегрузки сети. Механизм приоритетов кадров отсутствует. Считается, что достаточно разделить трафик на два класса - синхронный, который обслуживается всегда (даже при перегрузках кольца), и асинхронный, обслуживаемый при малой загрузке кольца. Станции FDDI применяют алгоритм раннего освобождения маркера, как это сделано в сети Token Ring со скоростью 16 Мбит/с.
В сети FDDI выделенный активный монитор отсутствует, все станции и концентраторы равноправны, при обнаружении отклонений от нормы они осуществляют повторную инициализацию сети и, если это не-обходимо, ее реконфигурацию.
Результаты сравнения технологии FDDI с технологиями Ethernet и Token Ring приведены в табл.5.1.
Технологии Fast Ethernet и 100VG-AnyLAN. Обе эти технологии не являются самостоятельными стандартами и рассматриваются как развитие и дополнение технологии Ethernet, реализованное соответственно в 1995 и 1998 годах. Новые технологии Fast Ethernet (стандарт 802.3и) и 100VG-AnyLAN (стандарт 802.3z) имеют производительность 100 Мбит/с и отличаются степенью преемственности с классическим Ethernet.
В стандарте 802.3и сохранен метод случайного доступа CSMA/CD и тем самым обеспечена преемственность и согласованность сетей 10 Мбит/с и 100 Мбит/с.
В технологии 100VG-AnyLAH используется совершенно новый метод доступа - Demand Priority (DP), приоритетный доступ по требованию. Эта технология существенно отличается от технологии Ethernet. Она поддерживает различные типы трафика в довольно узкой области и не нашла широкого распространения.
Отметим особенности технологии Fast Ethernet и ее отличия от технологии Ethernet:
Таблица 17.1. Сравнение сетей различных топологий |
|||
Характеристики |
Тип технологии |
||
FDDI |
Ethernet |
Token Ring |
|
Пропускная способность Мбит/с |
100 |
10 |
16 |
Топология |
Двойное кольцо |
Шина, звезда |
Звезда, кольцо |
Метод доступа |
Маркерный, доля от времени оборота маркера |
CSMA/CD |
Маркерный, приоритетная система резервирования |
Среда передачи данных |
Оптоволокно, неэкранированная витая пара |
Толстый коаксиал, тонкий коаксиал, витая пара, оптоволокно |
Экранированная и неэкранированная витая пара, оптоволокно |
Максимальная длина сети (без мостов) |
200 км (100 км на кольцо) |
2500 м |
4000 м |
Максимальное расстояние между узлами |
2 км |
2500 м |
100 м |
Максимальное количество узлов |
500 |
1024 |
260 |
Технология Gigabit Ethernet. Появление этой технологии представляет собой новую ступень в иерархии сетей семейства Ethernet, обеспечивающую скорость передачи в 1000 Мбит/с. Стандарт по этой технологии принят в 1998г., в нем максимально сохранены идеи классической технологии Ethernet.
По поводу технологии Gigabit Ethernet следует отметить следующее:
Технология Gigabit Ethernet позволяет строить крупные локальные сети, в которых серверы и магистрали нижних уровней сети работают на скорости 100 Мбит/с, а магистраль 1000 Мбит/с объединяет их, обеспечивая запас пропускной способности.
Технология Wi-Fi. Технология Wi-Fi (произносится "вай-фай", сокр. от англ. Wireless Fidelity - беспроводная надежность) - это стандарт на оборудование Wireless LAN, которое устанавливается там, где развертывание кабельной системы невозможно или экономически нецелесообразно. Мобильные устройства этого оборудования (смартфоны и ноутбуки), оснащенные клиентскими Wi-Fi приемо-передающими устройствами, могут подключаться к локальной сети и получать доступ в Internet через так называемые точки доступа (хост-порты).
Обычно схема Wi-Fi сети содержит не менее одной точки доступа и не менее одного клиента, но возможно подключение двух клиентов в режиме "точка-точка", и тогда точка доступа не используется, а клиенты со-единяются посредством сетевых адаптеров напрямую. Наименьшая скорость передачи данных для Wi-Fi - 1 Мбит/с. Стандарт Wi-Fi дает клиенту полную свободу при выборе критериев для соединения с другими клиентами. Последние версии операционных систем этого стандарта содержат функцию, которая показывает пользователю все доступные сети и позволяет переключаться между ними.
Технология Wi-Fi применяется в основном для управления движущимися объектами, а также в тех случаях, когда невозможно прокладывать проводные сети Ethernet.
Преимущества Wi-Fi:
В качестве недостатков Wi-Fi можно отметить следующие:
До сих пор рассматривались протоколы, работающие на первых трех уровнях семиуровневой эталонной модели ВОС и реализующие соответствующие методы логической передачи данных и доступа к передающей среде. В соответствии с этими протоколами передаются пакеты между рабочими станциями, но не решаются вопросы, связанные с сетевыми фай-ловыми системами и переадресацией файлов. Эти протоколы не включают никаких средств обеспечения правильной последовательности приема переданных данных и средств идентификации прикладных программ, нуждающихся в обмене данными.
В отличие от протоколов нижнего уровня, протоколы верхнего уровня (называемые также протоколами среднего уровня, так как они реализуются на 4-м и 5-м уровнях модели ВОС) служат для обмена данными. Они предоставляют программам интерфейс для передачи данных методом дейтаграмм, когда пакеты адресуются и передаются без подтвержде-ния получения, и методом сеансов связи, когда устанавливается логическая связь между взаимодействующими станциями (источником и адресатом) и доставка сообщений подтверждается.
Здесь лишь коротко отметим протокол IPX/SPX, получивший некоторое применение в локальных сетях, особенно в связи с усложнением их топологии (вопросы маршрутизации перестали быть тривиальными) и расширением предоставляемых услуг. IPX/SPX - сетевой протокол NetWare, причем IPX (Internetwork Packet Exchange) - протокол межсетевого обмена пакетами, а SPX (Sequenced Packet Exchange) - протокол последовательного обмена пакетами.
Протокол IPX/SPX. Этот протокол является набором протоколов IPX и SPX. Фирма Nowell в сетевой операционной системе NetWare применяет протокол IPX для обмена дейтаграммами и протокол SPX для обмена в сеансах связи.
Протокол IPX/SPX относится к программно-реализованным протоколам. Он не работает с аппаратными прерываниями, используя функции драйверов операционных систем. Пара протоколов IPX/SPX имеет фиксированную длину заголовка, что приводит к полной совместимости разных реализаций этих протоколов.
Протокол IPX применяется маршрутизаторами в сетевой операционной системе (СОС) NetWare. Он соответствует сетевому уровню модели ВОС и выполняет функции адресации, маршрутизации и переадресации в процессе передачи пакетов данных. Несмотря на отсутствие гарантий доставки сообщений (адресат не передает отправителю подтверждения о получении сообщения), в 95% случаев не требуется повторной передачи. На уровне IPX выполняются служебные запросы к файловым серверам, и каждый такой запрос требует ответа со стороны сервера. Этим и определяется надежность работы методом дейтаграмм, так как маршрутизаторы воспринимают реакцию сервера на запрос как ответ на правильно переданный пакет.
Протокол SPX работает на транспортном уровне модели ВОС, но имеет и функции, свойственные протоколам сеансового уровня. Он осуществляет управление процессами установки логической связи, обмена и окончания связи между любыми двумя узлами (рабочими станциями) ЛКС. После установления логической связи пакеты могут циркулировать в обоих направлениях с гарантией того, что они передаются без ошибок. Протокол SPX гарантирует очередность приема пакетов согласно очередности отправления.
Укажем назначение и наиболее важные особенности сетевых устройств, используемых в локальных сетях.
Сетевой адаптер (СА) - электронная плата для сопряжения компьютера со средой передачи информации в сети.
Сетевые адаптеры, концентраторы и кабельная система - это минимум оборудования для создания ЛКС с общей разделяемой средой, но с небольшим количеством РС, иначе общая среда становится узким местом по пропускной способности. Поэтому сетевые адаптеры и концентраторы используются для построения базовых фрагментов сетей, которые объединяются в более крупные структуры с помощью мостов, коммутаторов и маршрутизаторов.
Выпускаемые в настоящее время адаптеры можно отнести к адаптерам четвертого поколения. Они выполняют ряд высокоуровневых функций, таких как приоритизация кадров, адаптация к временным параметрам шины и оперативной памяти компьютера с целью повышения производительности обмена "сеть-компьютер".
Повторители - относятся к физическому уровню эталонной модели ВОС. Они позволяют увеличивать протяженность сети, гарантируя при этом, что сигналы (последовательность электрических или световых им-пульсов, несущих информацию и перемещающихся в среде передачи данных) будут распознаны принимающим устройством. Повторители принимают ослабленный (вследствие затухания) сигнал, очищают его от помех, усиливают и отправляют дальше в сеть, тем самым увеличивая расстояния, на которых сеть может функционировать. Выполняя те же функции, повторители дают возможность увеличить число узлов в сети, поскольку каждый узел является причиной небольшого ослабления сигнала.
Концентратор (хаб, многопортовый повторитель) - это сетевое устройство, которое выполняет основную функцию - повторение кадра либо на всех портах (как определено в стандарте Ethernet), либо только на некоторых портах согласно алгоритму, определенному соответствующим стандартом.
Важными особенностями концентраторов является то, что они:
Фильтрацией называется процесс, в ходе которого в сетевом трафике контролируются определенные характеристики, например, адрес источника, адрес получателя или протокол, и на основании установленных критериев принимается решение - пропускать трафик дальше или игнорировать его.
Мосты. Это устройство, служащее для объединения в единую сеть нескольких сетей различных типов, а также для снижения нагрузки в сети. Однако чаще мосты используются для соединения сегментов сети. Мосты работают на канальном уровне модели OSI и не занимаются исследованием информации от верхних уровней. Назначение мостов состоит в том, чтобы устранить ненужный трафик и уменьшить вероятность возникновения коллизий. Это достигается путем разделения сети на сегменты и за счет фильтрации трафика по пункту назначения или МАС-адресу.
Мосты фильтруют трафик только по МАС-адресу, поэтому они могут быстро пропускать трафик, представляющий любой протокол сетевого уровня. Мосты отвечают только за то, чтобы пропускать или не пропускать пакеты дальше, основываясь при этом на содержащихся в них МАС-адресах.
Наиболее важные особенности мостов:
Коммутатор - это сложное многопортовое вычислительное устройство, имеющее несколько процессорных модулей и реализующее технологию коммутации сегментов сети. В коммутаторе осуществляется параллельная обработка нескольких кадров, что обеспечивает существенное повышение производительности сети.
Главное достоинство коммутатора - это его высокая производительность. Разработчики коммутаторов стараются выпускать неблокирующие модели коммутаторов. Неблокирующий коммутатор - это такой коммутатор, который может передавать кадры через свои порты с той же скоростью, с которой они на них поступают.
Пропускная способность коммутатора - это количество пользовательских данных (в мегабитах в секунду), переданных в единицу времени через его порты. Максимальное значение пропускной способности коммутатора достигается при передаче кадров максимальной длины, для которых доля служебной информации гораздо меньше, чем для кадров минимальной длины.
Задержка передачи кадров - время с момента прихода первого байта кадра на входной порт коммутатора до момента появления этого байта в его выходном порту. При полной буферизации кадров (для кадров минимальной длины) эта задержка колеблется от 50 до 200 мкс.
Маршрутизатор - устройство межсетевого взаимодействия, используемое для объединения отдельных сетей и доступа к Internet. Маршрутизаторы обеспечивают сквозную маршрутизацию трафика между различными сетями на основании информации сетевого протокола и способны принимать решение о выборе оптимального маршрута движения данных в сети. С помощью маршрутизаторов решается также проблема чрезмерного широковещательного трафика, так как они не переадресовывают дальше широковещательные кадры, если им это не предписано. Маршрутизаторы и мосты отличаются тем, что:
Для успешной маршрутизации необходимо, чтобы каждая сеть имела уникальный номер, который включается в IP-адрес каждого устройства, подключенного к сети.
Таким образом, суммируя сведения о сетевых устройствах, можно отметить следующие:
Структурированная кабельная система (СКС) составляет фундамент любой компьютерной сети и представляет собой набор коммуникационных элементов (кабелей, разъемов, кроссовых панелей и шкафов, коннекторов), которые удовлетворяют стандартам локальных сетей и позволяют создавать регулярные, легко расширяемые структуры сетей путем добавления сегментов, коммутаторов или изъятия ненужного оборудования.
Структурированная кабельная система, отвечающая высоким требованиям к качеству кабельной системы, строится избыточной, что облегчает реконфигурацию и расширение сетей (стоимость последующего расширения СКС превосходит стоимость установки избыточных элементов).
СКС состоит из трех иерархически построенных подсистем: горизонтальной (в пределах этажа), соединяющей кроссовый шкаф этажа с розетками пользователей; вертикальной, соединяющей кроссовые шкафы каждого этажа с центральной аппаратной здания; подсистемы кампуса, соединяющей несколько зданий с главной аппаратной всего кампуса. Горизонтальная подсистема отличается многообразием ответвлений и перекрестных связей, наиболее подходящий тип кабеля для нее - неэкранированная витая пара. Вертикальная подсистема (иначе называемая магистральной) должна передавать данные на большие расстояния и с большей скоростью. Для нее выбор кабеля ограничивается двумя вариантами: волоконно-оптический кабель (это предпочтительный вариант) и толстый коаксиальный кабель - широкополосный кабель, используемый в кабельном телевидении. Для подсистемы кампуса предпочтительным кабелем является оптоволокно.
Структурированная кабельная система по сравнению с хаотически проложенными кабелями обладает рядом преимуществ: более высокой надежностью (производитель СКС гарантирует качество не только ее отдельных элементов, но и их совместимость), универсальностью (СКС может стать единой передающей средой в ЛКС для передачи компьютерных данных, организации локальной телефонной сети, передачи видеоинформации), большим сроком службы (до 10-15 лет), меньшими затратами при расширении сети с целью добавления новых РС (что объясняется избыточностью СКС), обеспечением более эффективного обслуживания (в СКС отказ одного сегмента не приводит к отказу всей сети, так как сег-менты объединяются концентраторами, которые диагностируют и локализуют неисправный участок).
В настоящее время эксплуатируется громадное количество сравнительно небольших локальных сетей (на 10-30 РС), в том числе и тех, в которых передаются большие объемы мультимедийной информации и применяются высокоскоростные технологии (скорость обмена до 1000 Мбит/с). Для них характерно использование одной разделяемой среды, что позволяет реализовать стандартные технологии и приводит к экономичным и эффективным решениям.
Эффективность одной разделяемой среды для небольших ЛКС очевидна:
Однако по мере развития локальных сетей, появления новых технологий и протоколов все в большей степени стали проявляться недостатки ЛКС на одной разделяемой среде. Главные из них следующие:
Все эти недостатки и ограничения, возникающие из-за использования общей разделяемой среды, преодолеваются путем разделения сети на несколько разделяемых сред, или отдельных сегментов, которые соединяются мостами, коммутаторами или маршрутизаторами. Следовательно, единая разделяемая среда, созданная концентраторами, делится на несколько частей (сегментов), подсоединяемых к портам моста, коммутатора или маршрутизатора. Такое деление сети, называемое структуризацией сети, обладает рядом преимуществ. К их числу относятся следующие.
Лекция 18
В конце шестидесятых годов:
В 1968 г. ARPA (Агентство по работе с исследовательскими проектами в области перспективных исследований военного ведомства США) открыло финансирование этого проекта.
К осени 1969г. была создана глобальная вычислительная сеть АРПА-НЕТ, состоявшая из 4 ЭВМ:
В дальнейшем сеть быстро развивалась: в 1971г. она насчитывала 15 узлов; в 1972 г. - 37; в 1973 г. к сети подключены зарубежные узлы (Университетский колледж в Лондоне и Королевская лаборатория радиолокации в Норвегии), и глобальная вычислительная сеть стала международной. В 1987 г. количество узлов в сети составляло 10000; в 1989 г. - 100000.
Сначала сеть работала по протоколу NCP (Network Control Protocol).
В 1974 г. Винт Серф и Боб Кан (сотрудники National Science Foundation) опубликовали первые спецификации протоколов TCP/IP. В 1983 г. ARPANET отказалась от NCP в пользу TCP/IP.
Internet - это "сеть сетей", не глобальная вычислительная сеть, а структура, объединяющая десятки тысяч глобальных вычислительных сетей.
Глобальная вычислительная сеть (ГВС) имеет в своей основе базовую сеть передачи данных (рис.18.1).
На рис.18.1:
Рис. 18.1. Типовая структура ГВС
При создании глобальной вычислительной сети в узлах СПД устанавливаются мощные ЭВМ, называемые хост-компьютерами. Возможны различные конфигурации ГВС. Звездообразная (рис.18.2):
Рис. 18.2. Звездообразная конфигурация ГВС
Звездообразная конфигурация обладает наименьшей надежностью из-за наличия единственного сетеобразующего узла.
Узловая (рис.18.3).
Рис. 18.3. Узловая конфигурация ГВС
Узловая глобальная вычислительная сеть - более надежная. Но наличие единственного центрального узла не позволяло решать задачи, поставленные перед разработчиками Министерством обороны США. Несмотря на это, примерно такая сеть реализована в нашей стране некоторыми министерствами.
Наибольшей надежностью и устойчивостью обладают сети распределенной конфигурации (рис.18.4), матричные, полносвязные и др.
Рис. 18.4. Полносвязная конфигурация ГВС
В сентябре 1971 г географическая карта ARPANET представляла собой (рис.18.5):
Рис. 18.5. Структура ГВС ARPANET
Затем, по примеру АРПАНЕТ, стали появляться другие глобальные сети.
Одна из первых сетей США - NSFNET - выглядела аналогично (рис.18.6)
Рис. 18.6. Сеть NSFNET
Таких сетей в США было создано много. Различные глобальные сети обслуживаются разными операторами связи: CompuServ, Prodiji, America Online, и др. Отдельные узлы сетей выделены как точки соединения сетей (Interconnect Points) и точки доступа к сети (Network Access Points).
Для объединения глобальных вычислительных сетей в единую структуру в течение 80-х годов в США был создан "магистральный хребет Интернет" (Internet Backbone), который лег в основу супермагистрали NSFNET.
Сначала эта суперскоростная магистраль имела пропускную способность 56 Кбит/сек. В 1988 г. ее пропускная способность была увеличена до 1,544 Мбит/сек. NSFNET перестала существовать в качестве супермагистрали в 1995 г.
Ее заменила vBNS (very high speed Backbone Network Service - сверхвысокоскоростная Сетевая служба магистрали) с пропускной способностью 155 Мбит/сек (владельцы: Национальный научный фонд и оператор дальней связи MCI Word Com).
24 февраля 1999г. в США параллельно с vBNS введена в эксплуатацию Интернет-2 - высокоскоростная магистраль Abilene (кольцо через всю страну из волоконно-оптического кабеля, длиной 21000 км). К Abilene было подключено 130 университетов. Вначале сеть использовалась только для научных исследований. Новая сеть обеспечивала передачу в реальном времени "видео телевизионного качества (30 кадров в секунду); транспортировку файлов терабайтного размера; телемедицину (консультации во время операций). Длина IP-адреса в новой сети увеличена с 32 до 128 бит.
Пропускная способность Abilene - 2,4 Гбит/сек. Предполагалось ее увеличить до 9,6 Гбит/сек. В перспективе Abilene должна охватить все университеты США. Обслуживание сети ведет университет штата Индиана. К сети разрешают подключаться некоторым канадским, скандинавским и голландским центрам.
В соответствии с концепцией национальной информационной инфраструктуры Альберта Гора, магистральная инфраструктура США (Abilene + vBNS) должна слиться со средствами массовой информации - произойдет слияние нескольких отраслей промышленности: компьютерной, телекоммуникационной, софтверной и промышленности информационного снабжения (т.е. создания и поставки информации: развлекательной, социальной, учебной, научной, медицинской, и др.), так как государству нужна связность посредством информационных сетей, выполняющих роль нервной системы страны.
К супермагистрали подключаются глобальные вычислительные сети меньшей производительности, которые имеют свои базовые сети передачи данных, предоставляющие услуги frame relay. Более подробно с супермагистралью Abilene можно познакомиться на ее сайте (рис.18.7): http://www.internet2.edu/maps/network
Рис. 18.7. Структура супермагистрали Abilene
В каждой ГВС применяется различная номенклатура технических средств (SUN, IBM PC, Apple и др.).
Форматы используемой в разных ГВС информации и системы команд различны.
Для того чтобы соединить две ГВС, построенные на разных типах ЭВМ (неоднородные ГВС), необходимы специальные технические и программные средства, реализованные в виде "шлюзов" (или "маршрутизаторов").
В шлюзах осуществляется перекодировка информации из кодов, действующих в одной сети, в коды, действующие в другой (например, из КОИ-7 в ДКОИ или в ASCII и обратно), и преобразовываются другие данные (например, адреса абонентов сети) в соответствии с правилами, принятыми в каждой ГВС.
При большом количестве разнородных глобальных вычислительных сетей для связи друг с другом эти ГВС должны иметь большое количество шлюзов, что связано с большими материальными затратами.
Значительно более эффективным является разработка общих для всех правил обмена информацией и способов ее представления.
1 января 1983 года ARPANET перешла на новый протокол (TCP/IP). Этот день принято считать официальной датой рождения Интернета.
При создании Internet разработаны единые правила обмена информацией - протоколы TCP (Transmission Control Protocol) и IP (Internet Protocol), применяемые обычно совместно и известные под именем TCP/IP, в состав которых входила стандартная система адресации ресурсов (URL - Uniform Resource Locator).
URL и протоколы TCP/IP являются стандартом Internet и обязательны для использования всеми ГВС для внешнего обмена информацией в составе Internet.
URL, или доменная система адресации, позволяет адресовать не только абонентов (в качестве которых могут выступать серверы, клиентские компьютеры, абонентские пункты, сетевые принтеры, и др.), но и информационные единицы, вплоть до файлов.
Согласно протоколу TCP, передаваемая информация разбивается на маленькие фрагменты - пакеты (дейтограммы). Соединение пакетов в соответствии с этим протоколом происходит на принимающей машине после их поступления (поступать они могут на принимающую машину вразбивку и по различным маршрутам).
Протокол IP определяет наилучший маршрут от одной ЭВМ к другой и управляет передачей пакетов.
Internet реализована с ориентацией на технологию "клиент-сервер", т.е. предусматривает наличие хост-компьютеров (хост-компьютером называется каждая постоянно подключенная к сети ЭВМ с установленным на ней программным обеспечением как минимум одного сервера), с которыми связываются компьютеры-клиенты (локальные ЭВМ).
В Internet насчитываются миллионы хост-компьютеров, принадлежащих различным глобальным вычислительным сетям (в 1969 г. было всего 4 "хоста", в 1996 г. количество хост-компьютеров возросло до 8,3 млн).
В таком количестве хост-компьютеров хранится огромное количество информации.
РосНИИРОС
В странах СНГ также создано большое количество глобальных сетей: региональных, ведомственных, принадлежащих отдельным крупным предприятиям. Создаваемые сети соединяются между собой для обмена информацией с помощью точек доступа, которые обычно являются государственными предприятиями связи.
Координацию работы всех заинтересованных организаций по использованию глобальных сетей ведет Российский научно-исследовательский институт развития общественных сетей (РосНИИРОС, английское наименование института - Russian Institute for Public Networks (RIPN)). Он осуществляет развитие базовых элементов инфраструктуры российского сегмента сети Интернет и является оператором опорной научно-об-разовательной сети RBNet.
С целью оптимизации межрегионального информационного обмена РосНИИРОС обеспечивает развитие соответствующих региональных систем обмена IP-трафиком: MSK-IX, SPB-IX, Samara-IX, NSK-IX. Как правило, эти системы создаются и эксплуатируются в рамках сети RBNet, а в дальнейшем могут быть выделены в специализированные организации, как это уже сделано в отношении MSK-IX (ее развитием и эксплуатацией занимается Центр взаимодействия компьютерных сетей, соучредителем которого является РосНИИРОС).
Для создания распределенных систем высокоскоростного доступа на региональном уровне РосНИИРОС развивает собственные волоконно-оптические сегменты (Москва, Санкт-Петербург, Новосибирск, Самара), на базе которых созданы сети ATM и Gigabit Ethernet.
Магистральная сеть науки и образования RBNet (Russian Backbone Network)
RBNet построена в рамках Межведомственной программы "Создание национальной сети компьютерных телекоммуникаций для науки и высшей школы" (1996-2002 гг.). В настоящее время RBNet функционирует в рамках смешанного финансирования: часть средств поступает из бюджета (Минобрнауки), а часть расходов на развитие и эксплуатацию покрывается за счет хозяйственной деятельности Российского НИИ развития общественных сетей, являющегося оператором сети.
Структура сети приведена на рис.18.8
Рис. 18.8. Структура сети RBNet
Сеть RBNet построена как базовая транспортная магистраль, обеспечивающая связность многочисленных сетевых сегментов, которые обслуживают различные группы пользователей, относящихся к сфере науки и образования РФ.
С технологической точки зрения RBNet представляет собой высокоскоростную IP-сеть, объединяющую федеральные округа с подключенными к ней региональными сегментами сетей науки и образования.
Вся эта сетевая инфраструктура охватывает около 50 регионов РФ. Подключения к сети RBNet осуществляются на базовых узлах, расположенных в городах: Москва, Санкт-Петербург, Ростов-на-Дону, Самара, Нижний Новгород, Казань, Екатеринбург, Новосибирск, Иркутск, Хабаровск, Обнинск.
Оборудование RBNet размещается, как правило, на региональных предприятиях связи, что гарантирует надежное круглосуточное обслуживание.
Канальная инфраструктура сети RBNet обеспечивается двумя крупнейшими российскими операторами связи - компанией "Транстелеком" и ОАО "Ростелеком".
В рамках сети RBNet обеспечивается подключение к общеевропейской магистральной исследовательской сети GEANT (координатор проекта - Межведомственный суперкомпьютерный центр РАН) и к международным системам обмена научно-образовательным трафиком StarLight и NetherLight (координатор проекта - РНЦ "Курчатовский институт"), с общей емкостью доступа 622 Мбит/с.
Для выполнения этих задач оборудование, находящееся под управлением РосНИИРОС, размещается в Амстердаме, Стокгольме и Чикаго.
Для обеспечения этих задач совместно с ГНИИ ИТТ "Информика" реализован проект создания интегрированной магистрали ("магистраль RUNnet/RBNet") по маршруту Москва - Санкт-Петербург - Стокгольм (2,5 Гбит/с) - Амстердам (622 Мбит/с).
Благодаря заключению пиринговых соглашений с сетью GEANT (Стокгольм), сетями Abilene (Internet2) и ASNET через Starlight (Чикаго) обеспечено взаимодействие сети RBNet c международными научными сетями с использованием протокола IPv6.
Федеральная университетская компьютерная сеть России RUNNet (Russian UNiversity Network) является основой телекоммуникационной инфраструктуры единой образовательной информационной среды. Сеть RUNNet была создана в 1994 году в рамках государственной программы "Университеты России" как IP-сеть, объединяющая региональные сети, а также сети крупных научно-образовательных учреждений. Основная задача RUNNet - формирование единого информационного пространства сферы образования России и его интеграция в мировое информационное сообщество.
В настоящее время сеть RUNNet является крупнейшей российской научно-образовательной IP-сетью, которая предоставляет услуги более чем 400 университетам и другим крупным образовательным и научно-исследовательским учреждениям, подключенным либо непосредственно к опорной сети RUNNet, либо через региональные научно-образовательные сети.
В число пользователей RUNNet входят такие крупные научно-образовательные сети, как FREEnet, RUHEP/Radio-MSU, RELARN-IP, RSSI, сети Московского и Санкт-Петербургского государственных университетов, и др.
Структура сети RUNNet приведена на рис.18.9.
Инфраструктура сети RUNNet состоит из опорной инфраструктуры, используемой всеми пользователями, и инфраструктуры доступа к опорной сети, используемой отдельными университетами. Опорная инфраструктура, в свою очередь, состоит из наземной и спутниковой, а наземная - из российской и международной.
Телекоммуникационная связность сети внутри России обеспечивается аппаратно-программными комплексами опорных узлов, расположенных в Москве, Санкт-Петербурге, Самаре, Новосибирске, Хабаровске, Екатеринбурге, Нижнем Новгороде, Ростове-на-Дону и Владивостоке.
Рис. 18.9. Структура сети RUNNet
Несколько десятков региональных научно-образовательных сетей и сетей крупных вузов подключены к опорным узлам RUNNet в Москве и Санкт-Петербурге по цифровым каналам емкостью от 2 до 8 Мб/с, арендуемым, в основном, у операторов связи "Ростелеком" и "ТрансТелеком".
Международная связность сети RUNNet обеспечивается каналами Москва-Стокгольм-Амстердам (магистральный канал) и Москва-Хельсинки-Стокгольм (резервный канал - 622 Мб/с) и осуществляется в рамках договора о транзите трафика с сетью NORDUnet. Международные опорные узлы сети RUNNet расположены в Стокгольме и Амстердаме. Емкость магистральных каналов: Москва-Стокгольм - 10 Гб/с, Стокгольм-Амстердам - 2.5 Гб/с.
Сеть RUNNet обеспечивает связность со следующими международными сетями:
Общее число пользователей этой сети близко к 2 000 000.
Узел маршрутизации Российского фонда фундаментальных исследований (РФФИ)
С целью обеспечения интеграции создаваемых в рамках проектов РФФИ региональных научных сетей и сетей крупных научных центров в глобальную сетевую инфраструктуру Интернет, а также с целью снижения затрат этих проектов на обеспечение межрегионального и международного трафиков в 1995 г. были организованы точка доступа и узел маршрутизации, а также введен в эксплуатацию международный наземный цифровой канал (64 Кбит/с).
Доступ региональных научных сетей к международному каналу связи и их обмен трафиком с основными российскими сетями обеспечивается узлом маршрутизации. Схема типового узла маршрутизации РФФИ приведена на рис.18.10.
Рис. 18.10. Схема типового узла маршрутизации РФФИ
Наряду с указанными на схеме региональными сетями к центру маршрутизации подключены 25 московских организаций, в том числе Российская государственная библиотека (РГБ) и Государственная публичная научно-техническая библиотека (ГПНТБ).
В состав центра маршрутизации входит оборудование РФФИ, а также оборудование, предоставленное ИОХ РАН, ВорГТУ, ЯрГУ и ЧГТУ и приобретенное в рамках выполняемых в этих организациях проектов.
Узел маршрутизации РФФИ имеет прямые соединения (10 Мбит/с) с российским центром обмена сетевым трафиком М9-IX и с ЮМОС, через которые осуществляется обмен трафиком с более чем 20 российскими научными и общественными сетями.
В 1996-97 гг. центр маршрутизации и международный канал РФФИ использовались 17-ю региональными сетями в Москве, Владикавказе, Вологде, Воронеже, Королеве, Новгороде, Нижнем Новгороде, Ростове-на-Дону, Пензе, Перми, Челябинске, Казани, Кемерово, Уфе, Твери, Черноголовке, Ярославле.
MSK-IX (Московский центр взаимодействия компьютерных сетей Internet eXchange)
Автономная некоммерческая организация "Центр взаимодействия компьютерных сетей "MCK-IX" (российская точка обмена интернет-трафиком) учреждена Российским научно-исследовательским институтом развития общественных сетей (РосНИИРОС) в 2001 году с целью развития проекта "Московский Internet Exchange".
MSK-IX организован в 1995 г. Начавшись с единственного узла, организованного на Московской международной телефонной станции ММТС-9, сегодня московский Internet Exchange представляет собой надежную, распределенную систему, которая включает десять равноправных точек, объединенных высокоскоростной магистралью. Благодаря распределенной структуре MSK-IX существенно расширяются возможности для московских и региональных провайдеров по подключению к системе обмена IP-трафиком, а также по получению высокоскоростного транзита между узлами MSK-IX.
Через М9 подключено более 80% Рунета. Через ММТС № 9 также проходит большинство телекоммуникационных каналов, соединяющих Россию с миром.
Сеть MSK-IX имеет 10 узлов доступа, объединенных высокоскоростной магистралью, что позволяет обеспечить высокое качество и доступность услуг MSK-IX в точках концентрации телекоммуникационых ресурсов, включая М9, М10, KIAEHOUSE и ряд других технологических площадок в Москве.
MSK-IX является одним из крупнейших европейских Internet Exchange по числу подключенных операторов и входит в ассоциацию международных сетей обмена трафиком - European Internet Exchange Association (Euro-IX).
Проект MSK-IX начинался в конце 1994 года, когда московские интернет-провайдеры Демос, Релком, МГУ, НИИЯФ МГУ, FREEnet, Ассоциация RELARN, Роспринт пришли к соглашению о создании точки вза-имного обмена IP-трафиком. Это соглашение было вызвано желанием провайдеров обмениваться своим трафиком друг с другом напрямую, оптимизируя маршруты прохождения трафика, что существенно сокращало как время передачи сетевых пакетов данных, так и загрузку дорогостоящих международных каналов связи.
Изначально точкой обмена трафика была избрана международная телефонная станция ММТС-9, или М9, в которой все интернет-провайдеры имели точки присутствия, т. к. на М9 приходили все международные и междугородные каналы связи. Координация MSK-IX была поручена Российскому НИИ развития общественных сетей (РосНИИРОС).
В 2002 году была произведена модернизация MSK-IX. Московский Internet Exchange стал распределенным, включив в себя 10 точек, соединенных волоконно-оптическим кабелем по технологии Gigabit Ethernet:
В декабре 2004 года российский универсальный оператор связи "Корбина Телеком" приступил к реализации в Москве проекта "Интернет 2", одной из отличительных особенностей которого является применение протокола передачи данных IPv6.
Способы использования Интернета определяются предоставляемыми посетителям сервисами, в число которых входят традиционные, специальные и новые виды сервиса.
К традиционным видам сервиса относятся:
К специальным сервисным средствам относятся:
Новые виды сервиса включают в себя:
Всех работающих в Интернете можно разделить на две группы: тех, кто предоставляет различные интернет-услуги (провайдеров Интернета), и тех, кто эти услуги использует (пользователей Интернета).
Обучение пользованию Интернетом в основном сводится к общему ознакомлению с устройством Интернета, с предоставляемыми сервисами, адресацией ресурсов, с поиском информации в сервисе WWW и основами работы с электронной почтой.
Провайдеры Интернета по составу предоставляемых услуг делятся на три группы:
ISP (Internet Service Provider)
ISP - это поставщик услуг Internet, т.е. организации или частные лица, предоставляющие доступ в Internet (hosting). Источником доходов ISP являются владельцы локальных ЭВМ, которым предоставляется доступ к данной глобальной вычислительной сети. Через имеющиеся шлюзы локальные пользователи могут получить доступ к другим глобальным сетям и таким образом получить возможность работать в Internet.
ISP подключены к Internet постоянно и имеют постоянный IP-адрес (IP-адрес является частью URL). Остальные пользователи (клиенты) могут подключаться к ISP лишь на время работы. IP-адрес присваивается им ISP каждый раз при подключении, а при отключении - отбирается и может быть отдан кому-нибудь другому. ISP часто предоставляет своим клиентам удаленный доступ по коммутируемым каналам телефонной связи (это называется "dual-up service"). Для этого ISP арендует у местной телефонной компании телефонные номера, по которым с ним можно связаться.
ISP иногда может предоставлять (делегировать) функции хостинга локальным ЭВМ (которые при этом получают свой постоянный IP-адрес), например, стоящим дома или на работе, и превращать таким образом локальную ЭВМ в ISP более низкого уровня. В свою очередь, локальная хост-ЭВМ может делегировать такие права другой локальной ЭВМ, которая становится хост-провайдером (т.е. ISP) еще более низкого уровня (если она, конечно, имеет доступ к каналам связи - например, через учрежденческую АТС). Образуется цепочка провайдеров, различающихся своими IP-адресами: mesi.ru; ex.mesi.ru; stud.ex.mesi.ru и т.д.
Широко известными интернет-сервис-провайдерами являются, например, mtu.ru и rol.ru.
IPP (Internet Presence Provider)
IPP - это провайдер, обеспечивающий своим клиентам присутствие в Internet. Он так же подключен к Internet постоянно и имеет постоянный IP-адрес. В отличие от ISP, он не предоставляет услуг типа dual-up service. Он может только размещать на своих серверах публикации других лиц, рекламу, веб-сайты, организовывать работу электронной почты и т.д.
IPP после регистрации на их сайте предоставляют имя, которое будет являться наименованием вашего почтового ящика (e-mail), и кроме того - именем вашего сайта, который размещается на ЭВМ провайдера.
Например, после регистрации на mail.ru предоставляется почтовый ящик имя@mail.ru. Адрес вашего сайта будет: http://www.mail.ru/~имя.
Такое имя сайта не удовлетворяет многих пользователей. У провайдера http://www.narod.ru имя сайта выглядит по-другому: http://www.имя.narod.ru. Получается, что ваш сайт имеет имя в домене III уровня, а не где-то среди каталогов IPP. Это выглядит солиднее, похоже на то, что у вас есть свой компьютер с постоянным IP-адресом.
Широко известными провайдерами присутствия в Интернете являются:
PCP (Private Content Publisher)
PCP - это издатель собственных материалов. Он является участником межсетевого обмена (провайдером услуг), который готовит информацию для размещения в Internet, размещает ее, как правило, на своих компьютерах и постоянно обновляет ее. На определенных условиях он разрешает пользоваться своими материалами клиентам, приходящим из Internet.
Он может содержать базу телефонов города, справочники различного назначения. Такой провайдер является квалифицированным источником информации. Обычно его базы данных относятся к области, в которой он является квалифицированным специалистом.
Этот тип провайдера очень бережно относится к своей информации, к исправности своего компьютера, и у него всегда можно получить самые достоверные, постоянно обновляемые данные по выбранной им специальности.
Пример этого типа провайдера - http://www.garant.ru (юридические документы).
В отличие от ISP, он не предоставляет услуг dual-up service. Подготовка провайдеров Интернета предусматривает изучение таких дисциплин, как:
Характеристики хостинг-провайдеров
Размещение сайтов на чужой технической базе называется хостингом. Хостинг бывает платный и бесплатный.
При платном хостинге оговаривается состав услуг, предоставляемых провайдером:
При бесплатном хостинге провайдер предоставляет URL, место на своих магнитных носителях, сервисные программы для создания и обслуживания сайта. Но взамен размещает свою баннерную рекламу на вашем сайте.
Хостинг-провайдеры характеризуются:
Скорость отклика сайта - это характеристика провайдера, которая связана с загрузкой его каналов. Например, провайдер имеет выход в Интернет, соединяясь по радиоканалу с другим провайдером, имеющим спутниковую связь. Канал может быть перегружен, и для связи с Интернетом через такого провайдера может понадобиться большое время. Большое значение также имеет связь локальных ЭВМ с провайдером (телефонный канал, количество телефонов для подключения локальных ЭВМ и др.);
Например, предоставление вам ЭВМ провайдера - и предоставление вам площадки для установки вашей ЭВМ различаются тем, что если вы устанавливаете у провайдера свою ЭВМ, то ее никто из сотрудников провайдера не имеет права трогать (но в договоре можно оговорить, что ремонт отказавшей ЭВМ проводится сотрудниками провайдера) - это ваша ЭВМ, тогда как если вам предоставлена ЭВМ провайдера, то ее могут заменить на другую без согласования с вами;
Программные ресурсы провайдера характеризуются также программным обеспечением, предоставляемым клиентам (компиляторы, интерпретаторы, СУБД, предустановленные скрипты, управляющие интерфейсы (мастера и шаблоны), и т.д.). Этот состав очень важен для размещения созданного сайта у хостинг-провайдера, так как провайдер может плохо относиться к продукции фирмы и не поддерживать конструкции FrontPage и другие расширения операционной системы Windows, а для клиента это программное обеспечение является основным;
Зеркальный сервер - это дублирующий сервер, содержащий ту же самую информацию, что и основной. Такие зеркала нужны для увеличения надежности системы и ее пропускной способности. Зеркальные серверы могут устанавливаться в различных частях света для того, чтобы не загружать глобальные вычислительные сети. Они имеют одно и то же имя, но службы DNS отправляют посетителей на ближайший из них.
Резервная мощность - это запасные технические средства, которые находятся в резерве (холодном, теплом, горячем). При отказе какой-либо ЭВМ провайдер переключает работу на резервную ЭВМ;
Эта служба ведет разработку техдокументации для клиентов, проводит мониторинг сайта и оценку его эффективности, резервное копирование сайта (backup) и др.;
Каждый сервис требует своего программного обеспечения (в общем виде структура программного обеспечения Internet приведена на рис.18.11).
Интернет построен на основе архитектуры "клиент-сервер". В сетях этого типа выделяется мощный хост-компьютер (или даже несколько хост-компьютеров), на который ставится серверное программное обеспечение.
На клиентских ЭВМ устанавливается клиентское программное обеспечение.
Хост-ЭВМ постоянно включены, имеют постоянные IP-адреса. Клиентские ЭВМ включаются по мере необходимости, связываются с серверным программным обеспечением хост-ЭВМ, получают от него времен-ный IP-адрес, действующий только в пределах данного сеанса связи.
Глобальные вычислительные сети имеют узлы (хосты), на которых устанавливается серверная часть программного обеспечения сервисов Интернета. Серверное и клиентское программное обеспечение взаимодействуют между собой.
Из рис.18.11 видно, что программное обеспечение Интернета состоит из трех видов программ: серверное ПО, клиентское ПО и ПО систем безопасности. Серверное ПО устанавливается на хост-компьютерах, клиентское - на локальных ЭВМ (т. е. на ЭВМ клиентов). ПО систем безопасности может не соответствовать архитектуре "клиент-сервер".
Системы безопасности либо устанавливаются на клиентской ЭВМ или только на хост-ЭВМ, либо для них выделяется отдельная ЭВМ, на которой устанавливаются специализированные программы, обеспечивающие безопасность, - такие программы называются "брандмауэрами", или
Рис. 18.11. Структура программного обеспечения Internet (общий вид)
"firewall" (эти названия заимствованы у пожарных, которые требуют, чтобы при строительстве длинных домов производилось их разделение на части и одна часть от другой отделялась каменной стеной, основное назначение которой - не допустить распространения огня на всю постройку при возгорании одной из ее частей). Программы безопасности являются аналогами такой стены между ЭВМ пользователей и Интернетом. Они могут быть настроены так, чтобы полностью разрывать связь между ЭВМ и Интернетом, могут допускать одностороннюю связь (например, разрешена только отправка почты с локальной ЭВМ) или разрешать двустороннюю связь только для определенных видов работ. Кроме того, может быть запрещено выполнение каких-либо действий.
Входная и выходная информация в таких программах проходит через фильтры, которые, например, могут быть настроены на выявление вирусов, на пропуск файлов, не превышающих заданных размеров, или файлов определенного типа, на запрет связи с определенными IP-адресами и т.д.
В клиентском программном обеспечении необходимо обратить внимание на VRML-браузеры, позволяющие просматривать виртуальные миры, работать в трех измерениях (в двух измерениях по экрану можно перемещаться вверх-вниз и вправо-влево; в трех измерениях, кроме этого, добавляется возможность приближаться к экрану или удаляться от него). VRML-браузеры - это клиентское программное обеспечение. В Ин-тернете есть несколько сайтов с серверами VRML и своеобразными виртуальными мирами.
Как на клиентских ЭВМ, так и на хостах могут быть размещены программы, расширяющие возможности серверов и клиентов. Для написания таких программ применяются специальные алгоритмические языки: HTML, PHP, система программирования CGI, Java, Java-script, Perl, SSI и др.
При использовании таких программ на сервере должно быть установлено соответствующее программное обеспечение.
Программирование глобальных вычислительных сетей - сложное направление, в котором применяются приведенные выше алгоритмические языки на основе правил работы, определяемых протоколами TCP/IP и соответствующих сервисов Интернета.