Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Модуль 1.
АРИФМЕТИКО-ЛОГИЧЕСКИЕ ОСНОВЫ ИНФОРМАТИКИ
[1] Лекция 1. Основные понятия информатики [2] Содержание лекции [2.1] Понятие и роль информатизации в развитии общества [2.2] Появление и развитие информатики [2.3] Структура информатики
[2.4] [2.5] Формы адекватности информации [2.6] Измерение информации [2.6.1] Синтаксическая мера информации [2.6.2] Семантическая мера информации [2.6.3] Прагматическая мера информации [2.7] Качество информации [3] Вопросы для контроля знаний |
Современный период развития цивилизации характеризуется тем, что человечество переходит от индустриального общества к информационному. Основным перерабатываемым «сырьем» становится информация, а физический труд в большей степени замещается интеллектуальным. Ведущие страны мира делают ставку на разработку и производство информации, а сфера информационных технологий является одной из самых прибыльных и стремительно растущих отраслей.
Деятельность каждого человека в отдельности, равно как и групп, коллективов, организаций сейчас зависит от их информированности. Залог успеха для всех состоит в умении эффективно использовать эту информацию. Прежде чем предпринять какие-либо действия, нам необходимо провести всесторонний анализ имеющихся данных, осмыслить каждый шаг, найти оптимальное решение. При этом большой объём работы по сбору и упорядочиванию информации, поиску рациональных решений среди огромного числа вариантов подчас провести невозможно без привлечения специальных технических средств.
Наблюдаемый сегодня бурный рост объёма человеческих знаний, называемый также «информационным взрывом», обеспечил пристальное внимание к информатике как науке. Статистика свидетельствует, что общая сумма человеческих знаний до середины второго тысячелетия изменялась медленно. Затем процесс получения новых знаний получил заметное ускорение, и считается, что к началу XIX века эта сумма удваивалась каждые 50 лет, к середине XX века уже каждые 10 лет, к 1970 году каждые 5 лет, после 1990 года ежегодно. Лавинообразный поток хлынувшей на человека информации не даёт нам возможности воспринять её в полной мере. В этом ежедневно обновляющемся потоке ориентироваться все труднее. Иногда мы считаем, что более выгодно создать новый материальный или интеллектуальный продукт, нежели разыскивать созданный ранее аналог.
Все эти факторы явились причиной весьма парадоксальной ситуации в то время как в мире накоплен громадный информационный потенциал, люди не могут им грамотно воспользоваться в силу ограниченности своих психофизических возможностей и неумения применять новые технологии обработки информации. Самыми мощными «усилителями» интеллектуальных способностей человека с момента возникновения цивилизации становятся глобальные сети, объединяющие множество компьютеров.
Применение ЭВМ в современных средствах переработки и передачи информации - информатизация, - послужило началом нового эволюционного процесса в человеческом обществе, находящемся на этапе индустриального развития.
Информатизация общества организованный процесс (социально-экономический и научно-технический) создания оптимальных условий для удовлетворения информационных потребностей граждан, работы органов власти и управления, организаций и общественных объединений на основе формирования и использования информационных ресурсов.
Как видим, понятие “информационные ресурсы” является ключевым в этом определении. Принятый в 2003 году Федеральный закон “Об информации, информатизации и защите информации” юридически закрепил многие термины, которые могут служить пользователю информации опорой при защите своих прав.
Информационные ресурсы это отдельные документы и отдельные массивы документов в информационных системах (библиотеках, архивах, фондах, банках данных, других информационных системах).
Надо понимать, что документы и массивы информации, о которых говорится в этом законе, не существуют сами по себе. В массивах в различных формах представлены знания, которыми обладали люди, создавшие их. Таким образом, информационные ресурсы - это знания, подготовленные людьми для использования в социуме и зафиксированные на материальном носителе.
Информационные ресурсы страны, региона, организации должны рассматриваться как стратегические ресурсы, аналогичные по значимости запасам сырья, энергии, ископаемых и прочим ресурсам.
Уделим внимание еще одному моменту, связанному с информатизацией общества. Необходимость быстрого восприятия и обработка больших объемов информации в новых условиях работы порождают зависимость информированности одного человека от информации, приобретенной другими. Поэтому нужно не только уметь самостоятельно осваивать и накапливать информацию, а научиться такой технологии работы, когда решения принимаются на основе коллективного знания. Это говорит о том, что человек должен иметь определенный уровень культуры по обращению с информацией. Для отражения этого факта был введен термин информационная культура.
Информационная культура умение целенаправленно работать с информацией и использовать для её получения, обработки и передачи компьютерную информационную технологию, современные технические средства и методы.
Информационная культура проявляется в следующих аспектах:
в конкретных навыках по использованию технических устройств (от телефона до персонального компьютера и компьютерных сетей);
в способности использовать в своей деятельности компьютерную информационную технологию, базовой составляющей которой являются многочисленные программные продукты;
в умении извлекать информацию из различных источников: как из периодической печати, так и из электронных коммуникаций, представлять ее в понятном виде и уметь ее эффективно использовать;
во владении основами аналитической переработки информации;
в умении работать с различной информацией;
в знании особенностей информационных потоков в своей области деятельности.
Информационная культура вбирает в себя знания из тех наук, которые способствуют ее развитию и приспособлению к конкретному виду деятельности. Это - информатика, кибернетика, теория информации, математика, теория проектирования баз данных и ряд других дисциплин.
Термин информатика возник в 60-х гг. во Франции для названия отрасли, занимающейся автоматизированной обработкой информации с помощью электронных вычислительных машин. Французский термин informatique (информатика) образован путем слияния слов information (информация) и automatique (автоматика) и означает «информационная автоматика» или «автоматизированная переработка информации». В англоязычных странах этому термину соответствует синоним computer science (наука о компьютерной технике).
Выделение информатики в самостоятельную область человеческой деятельности связано с развитием компьютерной базы. Появление микропроцессорной техники послужило началом второй электронной революции. С этого времени элементной основой ЭВМ стали интегральные схемы, а термин “информатика” приобрёл новое дыхание и используется сегодня не только применительно к компьютерной технике, но и связывается с процессами передачи и обработки информации. Следует отметить, что информатика нацелена на разработку общих методологических принципов построения информационных моделей. Поэтому методы информатики применимы всюду, где существует возможность описания объекта, явления, процесса и т.п. с помощью моделей.
Множество определений информатики говорит о многогранности ее функций, возможностей, средств и методов. Обобщая опубликованные в литературе по информатике определения этого термина, можно предложить следующую трактовку.
Информатика это область человеческой деятельности, связанная с процессами преобразования информации с помощью компьютеров и их взаимодействием со средой применения.
Информатика представляет собой единство разнообразных отраслей науки, техники и производства, связанных с переработкой информации. Информатику в узком смысле можно представить как состоящую из трех взаимосвязанных частей технических средств (hardware), программных средств (software) и алгоритмических средств (brainware).
Информатику обычно рассматривают с разных позиций: как отрасль народного хозяйства, как фундаментальную науку или прикладную дисциплину (рис. 1.1).
Информатика как отрасль народного хозяйства состоит из однородной совокупности предприятий разных форм хозяйствования, где занимаются производством электронной техники, программных продуктов и разработкой современных технологий обработки информации. Специфика и значение информатики как отрасли производства в том, что от нее зависит рост производительности труда. Более того, для нормального развития производства эффективность труда в самой информатике должна возрастать более высокими темпами, так как сама информация может являться предметом конечного потребления. В настоящее время около 50% всех рабочих мест в мире поддерживается средствами обработки информации.
Информатика как фундаментальная наука занимается разработкой методологии создания информационного обеспечения процессов управления любыми объектами на базе компьютерных информационных систем. Можно выделить следующие основные научные направления в области информатики: разработка сетевой структуры, компьютерно-интегрированные производства, экономическая и медицинская информатика, информатика социального страхования и окружающей среды, профессиональные информационные системы.
Информатика как прикладная дисциплина занимается изучением закономерностей в информационных процессах (накопление, переработка, распространение), созданием информационных моделей коммуникаций в различных областях человеческой деятельности, а также разработкой информационных систем и технологий в конкретных областях и выработкой рекомендаций относительно их жизненного цикла (для этапов проектирования и разработки систем, их производства, функционирования и т.д.).
Главная функция информатики заключается в разработке методов и средств преобразования информации и использовании этих методов в организации технологического процесса переработки информации.
Задачи информатики состоят в следующем:
исследование информационных процессов в любом качестве;
разработка информационной техники и создание новейшей технологии переработки информации на базе полученных результатов исследования информационных процессов;
решение научных и инженерных проблем создания, внедрения и обеспечения эффективного использования компьютерной техники и технологии во всех сферах общественной жизни.
Таким образом, информатика существует не сама по себе, а является комплексной научно-технической дисциплиной, объединяющей науку, технику и производство. Информатика призвана создавать новые технологии для решения различных проблем. Она предоставляет методы и средства исследования другим областям, даже таким, где считается невозможным применение количественных методов из-за неформализуемости процессов и явлений. Особенно следует выделить в информатике методы математического моделирования и методы распознавания образов, практическая реализация которых стала возможной благодаря достижениям компьютерной техники.
Термин информация происходит от латинского informatio (разъяснение, осведомление, изложение). С позиций материалистической философии информация есть отражение реального мира с помощью неких сведений сообщений, которые имеют форму представления в виде речи, текста, изображений, цифровых данных, графиков, таблиц и т.п. В широком смысле слова информация - это общенаучное понятие, включающее в себя обмен сведений между людьми, а также обмен сигналами между живой и неживой природой, людьми и устройствами.
Информация сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся степень неопределенности, неполноту знаний о них.
Информатика рассматривает информацию как концептуально связанные между собой сведения, данные, понятия, изменяющие наши представления о явлении или объекте окружающего мира. Наряду с информацией в информатике часто употребляется понятие данные. Покажем, в чем их отличие.
Информация и данные |
Данные могут рассматриваться как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся. В том случае, если появляется возможность использовать эти данные для уменьшения неопределенности о чем-либо, данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные. |
Пример. Напишите на листе 10 номеров телефонов в виде последовательности 10 чисел и покажите их вашему другу. Он воспримет эти цифры как данные, т.к. они не предоставляют ему никаких сведений. Затем против каждого номера укажите название фирмы и род деятельности. Для вашего друга непонятные цифры обретут определенность и превратятся из данных в информацию, которую он в дальнейшем может использовать.
При работе с информацией всегда имеется ее источник и потребитель (получатель). Пути и процессы, обеспечивающие передачу сообщений от источника информации к ее получателю, называются информационными коммуникациями.
Для потребителя информации очень важной характеристикой является ее адекватность.
Адекватность информации это определенный уровень соответствия создаваемого с помощью полученной информации образа реальному объекту, процессу, явлению и т.п.
Пример. Информацию о специальностях в вузе вам смогут рассказать знакомые или друзья. Но для того, чтобы получить более полные и достоверные сведения, вы, скорее всего, купите подробный справочник. Информация, полученная вами из справочника, более адекватно отражает направления обучения в вузе и помогает вам определиться в окончательном выборе.
В реальной жизни вряд ли возможна ситуация, когда вы можете рассчитывать на полную адекватность информации. Всегда присутствует некоторая степень неопределенности. От степени адекватности информации реальному состоянию объекта или процесса зависит правильность принятия решений человеком.
Адекватность информации может выражаться в трех формах: семантической, синтаксической, прагматической.
Синтаксическая адекватность. Она отображает формально-структурные характеристики информации и не затрагивает ее смыслового содержания. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов её представления, надежность и точность преобразования этих кодов и т. п. Информацию, рассматриваемую только с синтаксических позиций, обычно называют данными, т.к. при этом не имеет значения смысловая сторона.
Семантическая (смысловая) адекватность. Эта форма определяет степень соответствия образа объекта и самого объекта. Семантический аспект предполагает учет смыслового содержания информации. На этом уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи. В информатике устанавливаются смысловые связи между кодами представления информации. Эта форма служит для формирования понятий и представлений, выявления смысла, содержания информации и ее обобщения.
Прагматическая (потребительская) адекватность отражает отношение информации и ее потребителя, соответствие информации цели управления, которая на ее основе реализуется. Прагматические свойства информации проявляются только при наличии единства информации (объекта), пользователя и цели управления. Прагматический аспект рассмотрения связан с ценностью, полезностью использования информации при выработке потребителем решения для достижения своей цели.
Для измерения информации вводятся два параметра: количество информации I и объем данных V. Эти параметры имеют разные выражения и интерпретацию в зависимости от рассматриваемой формы адекватности. Каждой форме адекватности соответствует своя мера количества информации и объема данных (рис. 2.1).
Эта мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.
Объем данных Vд |
Объем данных в сообщении измеряется количеством символов (разрядов) в этом сообщении. |
В различных системах счисления один разряд имеет различный вес и соответственно меняется единица измерения данных:
в двоичной системе счисления единица измерения - бит (bit - binary digit - двоичный разряд);
в десятичной системе счисления единица измерения - дит (десятичный разряд).
Количество информации I |
Количество информации на синтаксическом уровне определяют с помощью понятия неопределенности состояния системы (энтропии системы). |
Действительно, получение информации о какой-либо системе всегда связано с изменением степени неосведомленности получателя о состоянии этой системы. Рассмотрим это понятие.
Пусть до получения информации потребитель имеет некоторые предварительные (априорные) сведения о системе . Мерой его неосведомленности о системе является функция H(), которая в то же время служит и мерой неопределенности состояния системы.
После получения некоторого сообщения получатель приобрел некоторую дополнительную информацию I(), уменьшившую его априорную неосведомленность так, что апостериорная (после получения сообщения ) неопределенность состояния системы стала H().
Тогда количество информации I() о системе, полученной в сообщении , определится как
I() = H()-H(),
т.е. количество информации измеряется изменением (уменьшением) неопределенности состояния системы.
Если конечная неопределенность системы H() обратится в нуль, то первоначальное неполное знание заменится полным знанием и количество информации I() = H(). Иными словами, энтропия системы H() может рассматриваться как мера недостающей информации.
Энтропия системы H(), имеющая N возможных состояний, согласно формуле Шеннона, равна
H() = ,
где Pi - вероятность того, что система находится в i-м состоянии.
Для случая, когда все состояния системы равновероятны, т.е. их вероятности равны Pi = , ее энтропия определяется соотношением
H() = .
Часто информация кодируется числовыми кодами в той или иной системе счисления, особенно это актуально при представлении информации в компьютере. Естественно, что одно и то же количество разрядов в разных системах счисления может передать разное число состояний отображаемого объекта, что можно представить в виде соотношения
N = mn,
где N - число всевозможных отображаемых состояний;
m - основание системы счисления (разнообразие символов, применяемых в алфавите);
n - число разрядов (символов) в сообщении.
Наиболее часто используются двоичные и десятичные логарифмы. Единицами измерения в этих случаях будут соответственно бит и дит.
Коэффициент (степень) информативности (лаконичность) сообщения определяется отношением количества информации к объему данных, т.е.
Y=1/Vд, причем 0<Y<1 .
С увеличением Y уменьшаются объемы работы по преобразованию информации (данных в системе). Поэтому стремятся к повышению информативности, для чего разрабатываются специальные методы оптимального кодирования информации.
Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие тезаурус пользователя.
Тезаурус это совокупность сведений, которыми располагает пользователь или система.
В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Ic, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рис. 2.2.
Рассмотрим два предельных случая, когда количество семантической информации Ic равно 0:
при Sp = 0 пользователь не воспринимает, не понимает поступающую информацию;
при Sp пользователь все знает и поступающая информация ему не нужна.
Максимальное количество семантической информации Ic потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом Sp (Sp = Sp opt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.
Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.
При оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин S и Sp.
Относительной мерой количества семантической информации может служить коэффициент содержательности C, который определяется как отношение количества семантической информации к ее объему: C = Ic / Vд .
Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.
Пример. В экономической системе прагматические свойства (ценность) информации можно определить приростом экономического эффекта функционирования, достигнутым благодаря использованию этой информации для управления системой:
In () = П(/) - П(),
где In ()- ценность информационного сообщения для системы управления ;
П() - априорный ожидаемый экономический эффект функционирования системы управления у;
П(/) - ожидаемый эффект функционирования системы при условии, что для управления будет использована информация, содержащаяся в сообщении .
Для сопоставления введенные меры информации представим в табл. 1.
Единицы измерения информации и примеры Таблица 1
Мера информации |
Единицы измерения |
Примеры (для компьютерной области) |
Синтаксическая: шенноновский подход компьютерный подход |
Степень уменьшения неопределенности Единицы представления информации |
Вероятность события Бит, байт, Кбайт и т.д. |
Семантическая |
Тезаурус Экономические показатели |
Пакет прикладных программ, персональный компьютер, компьютерные сети и т.д. Рентабельность, производительность, коэффициент амортизации и т.д. |
Прагматическая |
Ценность использования |
Емкость памяти, произво-дительность компьютера, скорость передачи данных и т.д. Денежное выражение Время обработки информации и принятия решений |
Возможность и эффективность использования информации обусловливается такими основными ее потребительскими показателями качества, как репрезентативность, содержательность, достаточность, актуальность, своевременность, точность, достоверность, устойчивость.
Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют:
правильность концепции, на базе которой сформулировано исходное понятие;
обоснованность отбора существенных признаков и связей отображаемого явления.
Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных, т.е. C = Ic/Vд .
С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.
Наряду с коэффициентом содержательности С, отражающим семантический аспект, можно использовать и коэффициент информативности, характеризующийся отношением количества синтаксической информации (по Шеннону) к объему данных Y = I/Vд.
Достаточность (полнота) информации означает, что она содержит минимальный, но достаточный для принятия правильного решения состав (набор показателей). Понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.
Доступность информации для восприятия пользователем обеспечивается выполнением соответствующих процедур ее получения и преобразования. Например, в информационной системе информация преобразовывается к доступной и удобной для восприятия пользователем форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя.
Актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации.
Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного со временем решения поставленной задачи.
Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. Для информации, отображаемой цифровым кодом, известны 4 классификационных понятия точности:
формальная точность, измеряемая значением единицы младшего разряда;
реальная точность, определяемая значением единицы последнего разряда числа, верность которого гарантируется;
максимальная точность, которую можно получить в конкретных условиях функционирования системы;
необходимая точность, определяемая функциональным назначением показателя.
Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.
Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.
Рис.1.1. Структура информатики как отрасли, науки, прикладной дисциплины
Теория информационных систем и технологий
азработка информационных систем и технологий. Рекомендации
Создание информационных моделей коммуникаций
Изучение закономерностей в информационных процессах
Методология создания информационного обеспечения
Разработка технологий переработки информации
Производство программных продуктов
Производство
технических
средств
Прикладная дис-
циплина (для конкретных областей)
Отрасль народного
хозяйства
Фундаментальная
наука
Технические Программные Алгоритмические
средства средства средства
Информатика
Рис. 2.1. Меры информации
Количество информации
Ic=CVд,
где С коэффициент содержательности
Количество информации
I()=H()-H(),
где H() энтропия
Объем данных
Vд
Прагматическая
мера
Семантическая
мера
Синтаксическая
мера
Меры информации
Iс
Sp
Sp opt
Рис. 2.2. Зависимость количества семантической информации, воспринимаемой потребителем, от его тезауруса Ic = f(Sp)
EMBED Equation.3