У вас вопросы?
У нас ответы:) SamZan.net

технической отраслевой информации; патентной информации; информации по стандартизации метрологии и

Работа добавлена на сайт samzan.net: 2016-03-13

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Имя

Выберите тип работы:

Принимаю Политику конфиденциальности

Скидка 25% при заказе до 1.7.2025

4. Источники и поставщики информационных ресурсов для специалистов.

Главной задачей этой группы поставщиков является доставка необходимой информации специалистам различных отраслей науки, промышленности и сельского хозяйства. Среди них целесообразно выделить следующие группы источников и поставщиков:

научно-технической отраслевой информации;
патентной информации;
информации по стандартизации, метрологии и сертификации;
информации по статистике;
юридически-правовой информации.

Наибольшую потребность в научно-технической информации (НТИ) испытывают научные и технические кадры предприятий и организаций, а также их непосредственное руководство. По оценкам отечественных и зарубежных специалистов, НТИ составляет около 15% объема мировых информационных ресурсов.

Традиционно источниками НТО являются: отчеты НИОКР, диссертации, патенты, нормативно-техническая документации, информация об экспертизе продукции, обзоры, указатели литературы, реферативные журналы, неопубликованные переводы и т.д.

Одной из наиболее крупных информационных систем России по праву считается Государственная система научно- технической информации — ГСНТИ (www.gsnti.ru), головной координирующей организацией которой является Всероссийски и институт научной и технической информации — ВИНИТИ РАН (unvw2.viniti.ru). Последний проводит исследования в целях развития ГСНТИ и ее взаимодействия с системами научно- технической информации, не входящими в состав ГСНТИ.

Созданная в 60-70-е гг. XX в. ГСНТИ — одна из крупнейших информационных систем не только на территории постсоветского пространства, но и во всем мире.

Целью создания ГСНТИ было формирование и эффективное использование государственных ресурсов НТИ, их интеграция в мировое информационное пространство и содействие изданию рынка информационных продукции и услуг.

Согласно основному нормативному документу (Положению о Государственной системе научно-технической информации, утв. постановлением Правительства РФ от 14 1)7.1997 г. № 950) ГСНТИ представляет собой совокупность научно-технических библиотек (НТБ) и организаций — юридических лиц независимо от формы собственности и ведомственной принадлежности, специализирующихся на сборе и наработке НТИ и взаимодействующих между собой с учетом принятых на себя системных обязательств.

Целью создания государственной системы НТИ является Обеспечение формирования и эффективного использования государственных ресурсов НТИ, их интеграция в мировое информационное пространство и содействие созданию рынка информационных продукции и услуг.

В состав государственной системы НТИ входят федеральные органы НТИ и НТБ, отраслевые органы НТИ и НТБ, региональные центры НТИ.

Органы НТИ, НТБ и центры обеспечивают сбор, хранение и наработку отечественных и зарубежных источников НТИ, формирование, ведение и организацию использования федеральных, отраслевых и региональных информационных фондов, баз и банков данных, составляющих государственные ресурсы НТИ.

ТЕМА 5 МИРОВЫЕ ИНФОРМАЦИОННЫЕ СЕТИ: СТРУКТУРА ИНФОРМАЦИИ. (4ч.)

1. Компьютерные коммуникационные сети.

2. Принцип построения групп Usenet.

3. Информационная система Gopher.

4. Система архивов FTP и их структура.

5. Распределенная гипертекстовая информационная система World Wide Web.

6. Программные средства просмотра электронных документов.

1. Компьютерные коммуникационные сети.

Образование глобальных сетей в России началось в 1990г. На российском рынке глобальных вычислительных сетей наиболее активно и эффективно функционируют следующие сетевые структуры:

Internet России с 1990г. объединяет более 300 тысяч машин, среди них научные, учебные, просветительские организации, банки, биржи, частные лица, агентства.

Сеть LASNET. Она создана в 1995г. институтом автоматизированных сетей. Эта сеть предоставляет услуги в области электросвязи.

Сеть РОСПАК. Создана АО Интертелеком, имеет свои узлы в 50 городах России, зарегистрирована в международном союзе электросвязи. Обеспечено взаимодействие с отечественными и зарубежными ТВС.

Сеть Исток-К - разработчики и держатели сети Концернтелеком. Она реализована на отечественных технических средствах и представляет собой совокупность центров коммутации пакетов и сообщений, соединенных стандартными каналами государственной сети связи.

Сеть РЕЛКОМ – сеть документального обмена общего пользования, разработанная в институте имени Курчатова. В качестве национальной стала частью европейской сети EVNET и имеет выход в Internet.

«Спринт-сети» - созданы российскими телеграфами. Являются сетями передачи данных и документооборота, обеспечивают выход в международные сети.

АКАДЕМ СЕТЬ – ведомственная сеть, созданная всероссийским НИИ прикладных автоматических систем, предназначенных для обеспечения доступа научных и исследовательских организаций к базам данных информационных центров. Это открытая неоднородная ИВС (информационная вычислительная система) с коммутацией пакетов. Основные ее компоненты – коммутационные и терминальные системы, а также рабочие системы на базе ЭВМ.

ИНФОТЕЛ - представляет собой сеть передачи данных и документооборота. В сети реализованы международные стандарты и рекомендации по сетям передачи данных общего пользования. Она взаимодействует со 190 зарубежными сетями. Основные услуги: передача текстовых и двоичных файлов, интерактивный доступ к информационным вычислительным ресурсам, выход в другие телекоммуникационные сети.

Сеть FIDONET - некоммерческая сеть, представляющая собой совокупность многочисленных электронных досок объявлений, объединенных в сеть, где в качестве средств связи используются обычные коммутированные телефонные каналы. Сеть Fidonet имеет иерархическую структуру. Все узлы объединяются по схеме: в пределах одного города, района, области формируется сеть, руководство которой осуществляет сетевой коридор.

В пределах одного государства формируется регион, общее руководство которого осуществляет региональный координатор.

В пределах материка формируется зона руководства, которое осуществляет зональный координатор.

В Fidonet имеется 6 зон: Северная Америка, Европа, Австралия, Латинская Америка, Африка и Азия. Работой всей сети Fidonet управляет международный координатор.

Узел сети Fidonet представляет собой аппаратно-программный комплекс для обеспечения обмена почтой с другими аналогичными узлами.

Дополнительный узел используется как доска объявлений ВВS. Информация на BBS делится на 3 категории – это файлы, почта и объявления. В качестве программного обеспечения сервера узла BBS в нашей стране используется обычный пакет Maximus, который позволяет просматривать почту, открытую для него или адресованную пользователю, отправлять сообщения другим пользователям BBS или другим BBS, входящим в Fidonet.

Системы электронной почты в этой сети реализуются в режиме диалога, что выгодно ее отличает от других сетей. Например, от Internet, где электронная почта работает в режиме отправления.

Некоторые узлы сети Fidonet являются шлюзами Internet, то есть для отправления письма в Internet следует его отправлять на ближайший шлюз.

2 января 1969 г. агентство перспективных исследовательских проектов (ARPA — Advanced Research Projects Agency), являющееся одним из подразделений Министерства обороны США, начало работу над проектом связи компьютеров оборонных организаций. В результате была создана сеть ARPANET, в основе функционирования которой лежали принципы, использованные позже при построении Internet. ARPANET, с одной стороны, должна была обеспечить сохранение коммуникаций в случае ядерной атаки противника, с другой стороны, облегчить сотрудничество различных исследовательских учреждений. ARPANET обеспечивала связь между университетами, военными учреждениями и предприятиями оборонной промышленности. В случае разрушения одной или нескольких линий связи система должна была уметь переключаться на другие линии. Спустя некоторое время в систему были встроены программы перемещения файлов и электронная почта.

Следующим этапом в развитии Internet было создание сети Национального научного фонда США (NSF — National Science Foundation). Сеть NSFNET объединяла научные центры США. Основой сети стали пять суперкомпьютеров, соединенных между собой высокоскоростными линиями связи. Все остальные пользователи могли подключаться к сети и использовать возможности этих суперкомпьютеров.

В 1987 г. был создан хребет сети NSFNET, состоящий из 13 центров, соединенных высокоскоростными линиями связи. Центры располагались в разных частях США. Сеть NSFNET быстро заняла место ARPANET, и последняя была ликвидирована в 1990 г. Таким образом, появилась сеть Internet в США.

Одновременно были созданы национальные сети в других странах. Они стали объединяться и в 1990-х гг. возникла сеть Internet в ее нынешнем виде. Сейчас Internet объединяет тысячи разных сетей, расположенных по всему миру, к ним имеют доступ десятки миллионов пользователей.

В России сеть Internet появилась недавно (сначала — электронная почта). Бурный рост пользователей в России начался с 1996 г.

Как и любая другая компьютерная сеть, Internet состоит из множества компьютеров, соединенных между собой линиями связи и установленных на этих компьютерах программ. Internet обеспечивает обмен информацией между всеми компьютерами, которые входят в сети, подключенные к ней. Тип компьютера и используемая ими операционная система значения не имеют.

Информационные ресурсы (ИР) Internet обычно классифицируют следующим образом:

1) Основные ИР:

система телеконференций Usenet;
система файловых архивов FTP,
базы данных Gopher,
базы данных WAIS;
базы данных WWW;
электронная почта;
Вспомогательные (справочные) ИР:
информационные ресурсы LISTSERV;
справочные книги Х.500;
справочная служба WHOIS;
информационное ресурсы Mailbase и TRICKLE.

2. Принцип построения групп Usenet.

Usenet — система телеконференций Internet. (Данный термин не очень удачен — в Internet есть и другие средства, которые также реализуют принцип телеконференций.) Пользователи Usenet предпочитают придерживаться термина newsgroup или group, который можно перевести как группа новостей (группа). Группа новостей — это постоянно изменяющийся набор сообщений, входящих в область интересов участников данной группы (рис. 22.5). Статья или сообщение отправляется в телеконференцию пользователем и становится доступной для всех подписчиков группы. Данным способом распространяется большинство сообщений Internet, например списки часто задаваемых вопросов (FAQ) или реклама программных продуктов.

Подписка подразумевает процедуру оповещения пользователя о появлении новых статей по интересующей его теме. Сообщение оформляется в соответствии со стандартом почтового сообщения Internet. Фактически Usenet выполняет функции периодического издания или избирательного распределения информации. Некоторые группы имеют редакторов, которые фильтруют поступившие статьи на предмет включения в список статей телеконференции. Система Usenet не, является эквивалентом электронной почты.

Имена доменов для групп новостей могут принадлежать к одной из нескольких категорий верхнего уровня. Ниже перечислены самые распространенные категории:

alt — обычно частные темы; могут иметь сомнительное содержимое;
сотр — темы, посвященные компьютерам;
misc — темы, не относящиеся ни к одной из стандартных категорий;
news — информация о группах новостей;
sci — научные темы;
soc — социологическая и культурная тематика;
talk — зависит от названия (политика, религия, текущие события и т.д.).

Новости разделены по иерархически организованным тематическим группам, и имя каждой группы состоит из имен подуровней иерархии, разделенных точками, причем более общий уровень пишется первым.

3. Информационная система Gopher.

Информационная система Gopher была разработана для реализации распределенной базы документов, которые хранятся на машинах сети и предоставляются пользователю в виде единой иерархической файловой системы. Модель файловой системы наилучшим образом подходит для отображения структуры хранения документов по следующим очевидным соображениям:

иерархическое представление данных привычно большинству пользователей, так как иерархии широко используются во многих компьютерных представлениях (UNIX, MS-DOS, системах BBS);
Gopher рассчитана на применение недорогих решений как в аппаратной части, так и в программировании, поскольку первоначально была ориентирована на разработку информационной системы университета (шт. Миннесота). Система соответствовала реальной структуре университета с его делением на университеты и кафедры, что также хорошо описывается иерархической моделью данных;
модель файловой системы может быть легко расширена путем добавления к традиционным файлам и директориям других объектов, которые можно назвать виртуальными файлами. Такие виртуальные объекты могут быть поисковыми запросами, или шлюзами в другие информационные ресурсы Internet. В начале система ориентировалась на два типа виртуальных файлов, добавленных к основным: информационный поиск по ключевым словам и записные/телефонные книжки.

Gopher представляет весь Internet (серверы Gopher) в виде единой иерархической системы. Gopher-серверы объединены в единое информационное пространство на Internet. Многие архивы дублируют информацию из других архивов (так называемые «зеркала» — mirrors). До сих пор основные информационные ресурсы Gopher сосредоточены в университетах. Gopher считается простой системой, легкой в установке и администрировании, достаточно надежной и защищенной. В России Gopher-серверы распространены не так широко, как во всем мире — пользователи предпочитают World Wide Web.

4. Система архивов FTP и их структура.

FTP -архивы — это распределенный депозитарий разнообразных данных, накопленных в сети за последние десятки лет. Любой пользователь может реализовать анонимный доступ к этому хранилищу и скопировать интересующие его материалы. Только объем программного обеспечения в архивах FTP составляет терабайты информации; кроме того, в FTP-архивах можно найти стандарты Internet (RFC), пресс-релизы, книги по различным отраслям знаний, главным образом по компьютерной проблематике, и многое другое.

Информация в FTP-архивах разделена на три категории (рис. 22.6):

защищенная информация, режим доступа к которой определяется ее владельцами и разрешается по специальному соглашению с потребителем. К этому виду ресурсов относятся коммерческие архивы (например, коммерческие версии программ в архивах ftp.microsoft.com или ftp.bsdi.com), закрытые национальные и международные некоммерческие ресурсы (например, работы по международным проектам CES или IAEA), частная некоммерческая информация со специальными режимами доступа (например, благотворительные фонды);
информационные ресурсы ограниченного использования, к которым относятся, например, программы класса shareware (Netscape и т.п.). В данный класс могут входить ресурсы ограниченного времени использования или ограниченного времени действия, т.е. потребитель может использовать текущую версию на свой страх и риск, но никто не будет оказывать ему поддержку;

• свободно распространяемые информационные ресурсы, или freeware, если речь идет о программном обеспечении. К этим ресурсам относится все, что можно свободно получить по сети без специальной регистрации. Это могут быть документация, программы или что-либо еще. Наиболее известными свободно распространяемыми программами являются программы проекта GNU Free Software Foundation. Следует отметить, что свободно распространяемое программное обеспечение не имеет сертификата качества, но, как правило, его разработчики открыты для обмена опытом.

Технология FTP была разработана в рамках проекта ARPA и предназначена для обмена большими объемами информации между машинами с различной архитектурой. Стержень технологии составляет FTP-протокол. Поскольку главным в проекте было обеспечение надежной передачи с современной точки зрения, FTP-протокол кажется перегруженным излишними редко используемыми возможностями.

5. Распределенная гипертекстовая информационная система World Wide Web.

Сервер World Wide Web (точнее — HTTP-сервер) — это программа, обслуживающая запросы клиентов. Главной задачей сервера «паутины» является обеспечение доступа пользователей к базе HTML- документов. Однако в дальнейшем функциональные возможности серверов расширились и вышли за пределы простой отсылки документов на запросы клиентов. Наиболее типичными для современных серверов являются следующие функции:

ведение иерархической системы документов;
контроль за доступом к информации со стороны клиентов;
предварительная обработка данных перед ответом на запрос;
реализация взаимодействия с клиентами и другими серверами в режиме посредника;
реализация встроенных или взаимодействие с внешними поисковыми машинами.

Структура базы данных сервера WWW. База данных сервера (или, как ее еще называют, Website) — часть файловой системы, отведенная для размещения файлов, содержащих HTML-документы. Большинство современных файловых систем — это иерархические деревья, следовательно, база данных WWW-сервера также является таким деревом. Для любой базы данных определено понятие единицы хранения — минимального объекта, к которому можно обратиться извне или который можно получить в качестве ответа на запрос. Стандартным объектом хранения в базе данных WWW-сервера является IIТМ/.-документ, которому соответствует обычный текстовый файл. Кроме такого стандартного объекта серверы поддерживают различные комбинированные объекты хранения, создаваемые в ряде случаев из нескольких файлов или генерируемые программами «налету».

Если обратиться к терминологии, которая принята в системах World Wide Web, то можно выделить следующие основные объекты:

страница базы данных World Wide Web — это законченный информационный объект, который отображается программой- клиентом пользователя при обращении к информационному ресурсу World Wide Web по универсальному идентификатору этого ресурса (URL)\
база данных World Wide Web (Website) — набор страниц базы данных World Wide Web. При более подробном рассмотрении Website — это вся совокупность данных и программного обеспечения, обеспечивающая отображение страниц информационной базы данных World Wide Web. Если страница Website физически представляет собой файл в стандарте HTML, то тогда говорят об элементарном (стандартном) элементе хранения. В этом случае URL указывает непосредственно на этот файл, и сервер просто отправляет его в ответ на запрос пользователя.

Многие страницы включают в себя контейнеры-формы, которые служат для передачи информации от программы клиента программе- серверу.

Страницей-формой называется в данном контексте файл в формате HTML, который включает HTML-форму. После обращения кстра- нице-форме, как правило, следует вызов программного модуля, генерирующего виртуальные страницы.

LISTSERV — это, строго говоря, не сервис Internet, а система почтовых списков BITNET. В мире насчитываются многие сотни списков LISTSERV, которые организованы по группам интересов, например, существуют группы разработчиков программ ядсрно-физичес- ких расчетов £'(75-4 или группы любителей научной фантастики. Любой член списка может послать сообщение на сервер, и тот перешлет это сообщение всем остальным подпиимикам. Данный сервис довольно удобен для обмена идеями и реальными результатами работ в некоторой области деятельности.

WHOIS. В любой коммуникационной сети есть справочники пользователей. Типичным примером такого справочника являются телефонные книги, которые содержат адреса абонентов телефонной сети. В Internet тоже есть такие книги — это базы данных сервиса WHOIS. Как и большинство других сервисов Internet, WHOIS — интерактивная система, но, как и в случае с FTP, существует возможность воспользоваться этим сервисом в режиме электронной почты. Работа с системой WHOIS несколько отличается от работы с Х500 в силу ее организации. WHOIS— распределенная система, т.е. запросы отправляются по всей совокупности серверов WHOIS в Internet, если не указан адрес конкретного сервера.

Х.500 — европейский стандарт для компьютерных справочных служб. Базы данных Х.5ОО содержат информацию о пользователях сети, их электронные и обычные почтовые адреса, идентификаторы и реальные имена, должности и места службы. Х.500 хранит информацию не только о физических лицах, но и об организациях. В последнем случае дается краткое описание основных направлений их деятельности. Данный информационный сервис служит для поиска информации о пользователях сети аналогично службе WHOIS.

Mailbase — национальная (Великобритания) система, во многом повторяющая описанный выше LISTSERV.

TRICKLE — доступ по почте к архивам FTP, который организован через шлюз, который имеет специальные навигационные средства для поиска нужной информации в сети. Пользователь может вести с ним своеобразный диалог в режиме электронной почты, выбирая нужную информацию путем ввода соответствующих команд TRICKLE.

6. Программные средства просмотра электронных документов.

Специальные программы для просмотра и поиска в Интернете электронных документов, созданных по правилам языка разметки HTML, называются браузерами. Основная функция браузера заключается в интерпретации кода HTML и выводе визуального результата на экран монитора пользователя. С помощью браузера можно просмотреть любую HTML-страницу, расположенную в Интернете, на жестком диске компьютера или в вашей локальной сети.

Сегодня существует великое множество самых разнообразных браузеров, но наибольшей популярностью пользуются программы: Internet Explorer, Mozilla и Opera. Рассмотрим немного подробнее каждую из них.

Компания Opera Software (г. Осло, Норвегия) разработала одноименный браузер в 1994 г. для норвежской телекоммуникационной компании Telenor. Группа разработчиков, включавшая в себя двух основателей Opera Software — Иона Штефенсона фон Тежнера (Jon Stephenson fon Tetzchner) и Гера Иварсоя (Geir Ivarsoy), поставила перед собой задачу создать интернет- и мультимедиаприложение, которым могли бы пользоваться все желающие, независимо от системных возможностей своих компьютеров.

В первоначальную концепцию браузера были заложены такие критерии, как скорость запуска программы и загрузки информации, небольшой размер приложения, минимальные требования к ресурсам компьютера пользователя.

Программа, изначально задуманная как небольшой по размеру и быстрый браузер для компьютеров с незначительными ресурсами, какое-то время использовалась в пределах внутренней информационной сети компании Telenor, а к концу 1995 г. авторы Opera покинули стены компании, чтобы продолжить самостоятельное развитие своего детища. Наконец, во второй половине 1996 г. браузер Opera 2.1 стал доступен для загрузки в Интернете в качестве 90-дневной условно-бесплатной (Shareware) версии.

К числу основных преимуществ Opera перед другими браузерами отнесем следующие:

- небольшой размер;

- минимальные системные требования;

- быстрая скорость загрузки HTML-документов;

- расширенные настройки;

- высокая масштабируемость просматриваемого документа.

Однако и у Opera есть ряд недостатков, которые также следует упомянуть:

- статус коммерческого программного продукта (регистрация стоит 39 дол. для полной версии; Freeware-вариант будет постоянно «радовать» вас показом чужих рекламных баннеров);

- отсутствие поддержки некоторых русских кодировок в английских версиях программы;

- недостаточно высокий уровень надежности выполнения скриптов на стороне пользователя (JavaScript/VBScript).

В августе 1995 г. компания Microsoft выпустила очередное обновление своей операционной системы Windows 95, в состав которой впервые был включен интернет-браузер Internet Explorer I.O. Однако первоначальный программный код браузера принадлежал не Microsoft, а компании Spyglass, которая впоследствии продала лицензию на изменение и коммерческое распространение кода разработчикам Microsoft. Последние поставили Internet Explorer на более высокий уровень развития, что позволило браузеру-дебютанту составить достойную конкуренцию Netscape Navigator — браузеру, которым к 1995 г. пользовались свыше 50% посетителей Интернета.

Можно назвать несколько основных возможностей браузера, благодаря которым Internet Explorer получил такую популярность:

- быстрый запуск программы;

- демократичность интерпретации HTML-кода. При загрузке документа, код которого содержит незнакомые конструкции и (иди) ошибки, Internet Explorer в большинстве случаев просто не выводит часть, вызывающую затруднения, на экран;

- полная интеграция с другими приложениями Microsoft, работающими под управлением ОС Windows;

- возможность масштабирования графических изображений, открытых в отдельном окне.

Среди недостатков можно выделить следующие:

- нестабильность работы;

- средняя скорость загрузки информации.

Компания Netscape Communications Corporation практически с самого начала считалась основным конкурентом корпорации Microsoft в продвижении своего браузера.

История возникновения браузера Netscape начинается в марте 1993 г., когда один из основателей будущей компании — Марк Андриссен (Marc Andreessen) — анонсирует выход программы Mosaic (прототипа будущего браузера Netscape). На следующий год Марк Андриссен и его коллега Джим Кларк (Jim Clark) основывают компанию Mosaic Communications (будущую Netscape Communications Сorporation), а буквально через несколько месяцев на свет появляется первая версия интернет-браузера Netscape 0.9.

В августе 2002 года выходит версия Netscape 7.0, а следом за ней появляется Mozilla 1.0. Более поздние версии браузера Mozilla получили в настоящее время достаточно широкое распространение.

ТЕМА 7 Информационно-поисковые системы. пРАВИЛА поиска информации. (4ч.)

1. Классификация информационно-поисковых систем.

2. Оценка эффективности информационного поиска.

3. Сравнительный анализ информационно-поисковых систем.

4. Структурно-функциональная организация типовой поисковой машины Интернет.

5. Поисковый сервис Интернет.

6. Простой и расширенный поиск информации в Интернет.

1. Классификация информационно-поисковых систем.

Информационно-поисковые системы (ИПС) подразделяются на три класса (рис.9.1): документальные, фактографические и гипертекстовые (ГИПС).

Документальные ИПС хранят и выдают сведения о документах, основное содержимое которых представлено в виде связанного текста на естественном языке (ЕЯ).

Признаки документа, отражающие его содержание в ИПС, называют поисковым образом, а признаки запроса к ИПС — поисковым предписанием.

Процедура перевода документа и запроса в форму представления, принятую в ИПС, связана с ее индексированием. При сопоставлении поискового образа и поискового предписания используется тот или иной критерий смыслового соответствия (релевантности).

Методы информационного поиска в ИПС

По набору дескрипторов

По метаданным

Полно-

текстовый поиск

По семантическому образу документа

По набору признаков (например, заданному SQL-выражением)

Автоматизированные инфрмационно-библиотечные системы

Документальные

ИПС

Гипертекстовые

ИПС

Фактографические

ИПС

Рис. 9.1 Классификация информационно-поисковых систем

Основным объектом информационного фонда документальной ИПС является аннотация (реферат) и библиографическое описание документа (книги, события, предмета). Реферат (аннотация) выражается на ЕЯ и отражает основные характеристики документа, представляющие интерес для пользователей. Предполагается, что в подобном описании можно выделить ряд слов и словосочетаний, число которых значительно меньше общего числа слов в описании.

В то же время выделенная информация достаточно точно характеризует описание. Такие слова и словосочетания называются ключевыми словами или дескрипторами. Запрос к документальной ИПС формулируется в виде перечня дескрипторов, которые, по мнению пользователя, характеризуют искомый документ.

При вводе в ИПС нового объекта (реферата) его дескрипторы автоматически включаются в словарь дескрипторов. Каждому дескриптору присваивается номер, называемый индексом дескриптора. Совокупность индексов, соответствующих полному набору дескрипторов реферата, составляет его поисковый образ. Новый поисковый образ снабжается уникальным идентификатором и включается в массив поисковых образов. Тем же идентификатором помечается новый реферат, заносимый в массив рефератов.

Поиск в дескрипторной ИПС организуется следующим образом. Запрос, сформулированный на ЕЯ, подвергается анализу, в рамках которого в нем выделяются дескрипторы, входящие в словарь дескрипторов. Их совокупность образует поисковое предписание, соответствующее запросу. Оно сопоставляется с поисковыми образами, в результате чего определяется их релевантность. Если поисковый образ и предписание релевантны, то из поискового образа извлекается идентификатор реферата, выдаваемого пользователю.

Ответом на запрос является множество рефератов, соответствующих отобранным в процессе поиска идентификаторам.

В целях ускорения поиска для каждого дескриптора в словаре дескрипторов указывается список идентификаторов рефератов, в которых он встречается. Такая информационная структура ИПС называется индексом.

С помощью дескрипторов можно лишь приблизительно отразить смысл документов. Это же относится к переводу запросов в поисковые предписания. Документальный поиск относится к числу сложных информационных процессов, поскольку он связан с проблемой оценивания смыслового соответствия документа и запроса. Из-за субъективности и неоднозначности подобного оценивания этот вид поиска, в принципе, не может быть исчерпывающе точным и полным, в нем всегда будет присутствовать элемент нечеткости.

Развитием поиска по дескрипторам является полнотекстовый поиск, где индекс формируется на основе всех слов и словосочетаний, содержащихся в документах, за исключением служебных неинформативных слов.

В фактографических ИПС хранятся не документы, а собственно сведения (факты) об объектах предметной области. Подобные ИПС реализуются, в частности, на основе реляционных БД. С точки зрения обеспечения релевантности результатов поиска (выборки данных) запросу фактографический поиск в отличие от документального является точным и полным.

В гипертекстовых ИПС кроме содержимого документов отражается их семантическая структура. Поэтому по глубине формализации ГИПС занимают промежуточное положение между документальными и фактографическими ИПС.

Еще одно направление развития технологии документальных ИПС связано со структуризацией и унификацией сведений о документах. Такие сведения по отношению к исходным документам играют роль метаданных. Примером метаданных служит библиографическое описание, содержащее информацию об авторах документа, дате его создания, объеме, форме представления и т. д. Ключевые слова также относят к метаданным.

Поиск по метаданным сближает технологии документальных и фактографических ИПС. С одной стороны, метаданные представляют документы. С другой стороны, некоторые элементы метаданных допускают четкое определение релевантности запроса и записи в БД (экземпляра метаданных, ассоциируемых с конкретным документом), что характерно для фактографических ИПС. В настоящее время хранилища метаданных обычно реализуются на основе реляционных и XML-ориентированных БД и используют механизмы поиска, воплощаемые в соответствующих системах управления БД (СУБД).

2. Оценка эффективности информационного поиска.

Эффективность информационного поиска документов, обеспечиваемая ИПС, оценивается по информационной полноте и информационному шуму. Названные показатели выражаются коэффициентами полноты Кn и шума Кш соответственно. Коэффициенты Кn и Кш принимают значения в интервале от 0 до 1. В некоторых источниках эти коэффициенты выражают в процентах.[1]

Пусть ИПС предъявлен i-й запрос. Информационно-поисковая система содержит множество документов релевантных этому запросу. В результате поиска получено множество . Возможны следующие варианты.

1. . Идеальный вариант: полнота максимальна (Кn = 1), а шум нулевой (Кш = 0).

2. . Имеет место неполнота (0 Кn < 1), а шум отсутствует (Кш = 0).

3. . Неполнота исключается (Кn = 1), но есть шум (0 Кш <1).

4. Ø & Ø & Ø. Худший вариант: нулевая полнота (ни один релевантный документ не найден; Кn = 0) и максимальный шум (все, что выделено, не соответствует запросу; Кш = 1).

5. Ø &&&. Имеют место и неполнота (0 Кn < 1 ), и шум (0 Кш < 1).

Определим коэффициенты полноты и шума [1]:

(3.1)

(3.2)

где m — достаточно большое число, чтобы по теореме о больших числах обеспечить требуемую достоверность результата эксперимента по определению Кn и Кш.

Смысл коэффициентов полноты и шума на теоретико-множественном уровне иллюстрирует рис.9.2.

Анализируя этот рисунок, нетрудно заметить, что успешность поиска формально определяется степенью совпадения множеств и (в идеале, при ,- выборка содержит все релевантные документы и ни одного не релевантного). Это дает возможность ввести оценку эффективности информационного поиска на основе мощностей множеств , и :

Информационный Шум (выдано лишнее)

Неполнота (не было выдано)

Релевантные результаты

Рис.9.2 Графическая интерпретация коэффициентов полноты и шума

Эффективность информационного поиска выражается через коэффициенты Кn и Кш, что позволяет рассматривать ее в качестве интегрального показателя эффективности информационного поиска ИПС.

(3.3)

В литературе в функции (Кn, Кш) вместо Кш принято использовать обратный ему показатель — коэффициент точности Кm.

(3.4)

Таким образом, запишем данную функцию в виде:

(3.5)

В теории информационного поиска предложен обобщенный комплексный показатель эффективности (мера Ван Ризбергена), позволяющий учитывать предпочтение, отдаваемое пользователем ИПС точности или полноте:

(3.6)

где β — параметр, отражающий предпочтение пользователя ИПС одному из показателей эффективности, входящих в (точности, полноте).

При β = 1 точность и полнота одинаково важны. На интервале β [0; 1] приоритет имеет точность, а на интервале β ]1; [ — полнота.

3. Сравнительный анализ информационно-поисковых систем.

Проведем сравнительный анализ документальных, фактографических и гипертекстовых ИПС по ряду показателей. Результаты представим в табл. 9.1.

Таблица 9.1

Сравнительный анализ ИПС

Характеристика ИПС	Виды ИПС
Документальные	Фактографические	Гипертекстовые
Полнота и шум	kn max =0,5 kш max = 1	kn max =1 kш max = 0	kn max =0,9÷1,0 kш max = 0,1÷0,2
Систематизирующая информация	Поисковые образы документов, мета-данные	Значения атрибутов объектов предметной области	Гипертекстовое представление документов, мета-данные
Тип поискового аппарата	Информационно-поисковые языки с развитой грам-матикой	Языки реляционного типа	Гипертекстовый тезаурус
Трудоемкость подготовки инфор-мационного массива	Требуется специ-альная лингвис-тическая подготовка сотрудника	Требуется высокая квалификация сотрудника	Относительно не-сложная подготовка по типам семан-тических связей
Структуры данных	Прямые и инверс-ные списки	Иерархические или реляционные струк-туры	Семантическая сеть: вершины – понятия, ребра – отношения
Математический характер критериев поиска	Логические и алгеб-раические выраже-ния	Логические и алгеб-раические выраже-ния	Семантические признаки
Тип собственного языка системы	Специальные информационные языки (например, Сетка-5)	Специальные языки (SQL, QBE)	ОЕЯ предметной области

Обеспечение высокой точности и полноты поискового процесса не являются единственным критерием эффективности информационно-поисковых систем. Не менее важным является и показатель быстродействия, то есть среднее время поиска одной структурной единицы, например, документа в БЗ. Эта проблема особенно актуальна для многомодульных иерархических баз знаний, содержащих значительное количество документов.

Таким образом, эффективность информационного поиска необходимо рассматривать в контексте обеспечения высоких характеристик точности, полноты и быстродействия.

4. Структурно-функциональная организация типовой поисковой машины Интернет.

Информационно-поисковые системы (поисковые машины) позволяют находить ресурсы Internet непосредственно по их текстовому содержимому. Функционирование поисковой машины включает два базовых процесса:

1) индексирование ресурсов Internet (автоматическое построение и обновление индекса);

2) поиск по индексу в соответствии с запросом пользователя.

Упрощенная структура типовой поисковой машины показана на рис.

Ее главными компонентами являются:

- программный агент, «перемещающийся» по сети и индексирующий ресурсы (web-страницы);

- база данных (БД) (индекс), содержащая информацию, собираемую агентом;

- программа поиска, применяемая пользователями для поиска информации в БД.

На этапе индексирования поисковые машины реализуют следующий примерный алгоритм работы.

1. Адреса web-узлов, включаемые в обрабатываемую область, определяются по гиперссылкам, ведущим из страниц данного web-узла. При этом используются различные модификации волнового алгоритма (например, с вычислением профилей узлов).

2. Агент либо переходит к индексированию очередного web-узла из сформированного списка, либо выполняет так называемое зеркалирование (дублирование) его содержимого на свой web-узел.

3. Производится собственно индексирование. Оно может быть полнотекстовым (обрабатывается весь текст) и неполнотекстовым (обрабатываются наиболее значимые части текста: заголовки, названия, ключевые поля, начальные слова разделов и т. д.).

4. Полученные данные о ключевых словах добавляются в БД.

5. Если был сделан зеркальный дубль, он стирается.

6. Пункты 2-5 повторяются для каждого адреса, полученного в п. 1.

Изложенный алгоритм соответствует некоторой канонической структуре поисковой машины. Конкретные их реализации различаются по многим параметрам: поддержке простого и сложного поиска; учету различий строчных и прописных символов; возможности поиска по частям слов и словосочетаниям; поддержке обработки запросов, содержащих логические операторы И, ИЛИ, НЕ; использованию специальных языков поиска информации, значительно сокращающих его время (к сожалению, такие языки не стандартизованы, поэтому в разных поисковых машинах реализуются различные поисковые языки).

Массив заявок на индексирование (адресов web-сайтов)

Индекс

Программные агенты Индексирующие

Web-страницы

Поисковая машина Internet

Блок приема заявок

Программа поиска

Web-страницы

Internet

Страница формирования заявки на индексирование

Браузер

Страница формирования запроса на поиск и представление результатов

Браузер

запрос

Результаты

Добавляемый адрес

запрос

Результаты

Web-страница

Адр

Рис. 4.3. Упрощенная структура типовой поисковой машины

6. Простой и расширенный поиск информации в Интернет.

Для поиска информации в Internet используются поисковые системы, выполненные в виде www-серверов и предлагающие простой и расширенный варианты поиска.

Простой запрос дает значительное количество ссылок на документы, так как в список попадают документы, содержащие одно из слов или простое словосочетание, введенное при запросе.

Правила оформления простого запроса:

1. Сложение наоборот. Если нам надо, чтобы поисковая система нашла страницы, на которых одновременно присутствуют все использованные ключевые слова, то перед каждым из них следует поставить знак «+». Используя знак «+», мы сужаем круг поиска и уменьшаем количество возможных ссылок. Например, необходимо найти информацию о протоколах Internet. Для этого нужно в строке поиска указать следующее:

+интернет+протокол

Поисковая система выдаст список страниц, на которых встречаются оба эти слова, хотя, конечно, не исключено, что между ними нет прямой связи.

Ряд систем выполняет такой поиск по умолчанию.

2. Вычитание. Конкретизировать круг поиска информации можно не только знаком «+» но и знаком «-». Например, необходимо найти информацию о протоколах Internet, но без учета тех страниц, на которых протокол рассматривается как нормативный документ. Для этого нужно в строке поиска указать следующее:

+интернет+протокол-документ

3. Применение джокера. В запрос информации можно включать специальный символ «*», расширяющий диапазон поиска. Символ «*» позволяет заменить любой другой символ или набор символов до конца слова. Например, необходимо найти информацию о протоколах Internet. Для этого в строке поиска запишем:

+интернет*+протокол*

Поисковая машина осуществит поиск всех документов, в которых встречаются словосочетания, состоящие из слов «Интернет» и «протокол» в различных падежах.

4. Контекстный поиск. В случае использования кавычек поисковая система разыскивает документы, в точности совпадающие с текстом, заключенным в кавычки. Поиск с помощью кавычек называется контекстным поиском.

Например: «глобальная сеть»

Поисковая система найдет все документы, в которых есть подобный текст.

5. Поиск по заголовкам. Каждая страница содержит заголовок. При его отсутствии как заголовок выделяется предложение из первого абзаца. В результате поиска выдается ссылка, в которой присутствует заголовок.

Например:

- Title: глобальная сеть

- Заг.: глобальная сеть

Поисковая система Апорт имеет несколько альтернативных команд:

- t=глобальная сеть

- з=глобальная сеть

Средства расширенного поиска позволяют более точно формулировать поисковое задание. В большинстве поисковых систем команды расширенного поиска формируются с помощью логических команд.

Преимущество использования логических команд связано с тем, что команды простого поиска у многих поисковых систем реализованы по-разному. Каждая поисковая система стремится сделать средства простого поиска наиболее удобными, а средства расширенного — наиболее стандартными.

Правила оформления расширенного запроса:

1. Команда OR. OR (или) служит для формирования поискового задания, состоящего из нескольких ключевых слов, если надо, чтобы разыскиваемый документ содержал любые из этих слов в любой комбинации.

2. Команда AND. AND (и) служит для формирования поискового задания, когда требуется, чтобы разыскиваемый документ содержал одновременно все слова, введенные пользователем. Аналогичные функции выполняет команда «+» простого поиска. Например: протокол AND TCP/IP.

3. Команда NOT. NOT (не) устанавливает исключения из результатов поиска.

Например: протокол NOT TCP/IP.

4. Команда NEAR. NEAR (рядом) — одна из самых удобных команд расширенного поиска. Она позволяет совместить достоинства поиска по ключевым словам и контекстного поиска при глубоком поиске возможно получение наилучших результатов. В поисковой системе Апорт расстояние между словами задается командой СЛ#(..., ..., …), где вместо знака «#» следует поставить число, обозначающее предельное расстояние между указанными словами, а вместо многоточий — список ключевых слов.

Например: СЛ5(протокол, TCP/IP).

5. Вложение команд. Вложение команд позволяет создавать весьма сложные запросы. Оно выполняется с помощью круглых скобок (). Команда, стоящая в скобках, выполняется в первую очередь.

Например: сеть AND (глобальная OR интернет)

6. Вы можете искать документы не только по всему русскоязычному Internet, но и по его части. Самый простой случай — поиск по определенному серверу. Например: url=www.intel.ru собака

По данному запросу будут найдены все документы на сервере www.intel.ru, содержащие слово "собака". Возможно, вам интересно, а что будет, если написать просто: url=www.intel.ru

В этом случае вы получите список всех документов, расположенных на указанном вами сервере.

Тема 8 Основы правового регулирования на информационном рынке (2ч.)

Согласно ст. 1225 Гражданского кодекса Российской Федерации (ГК РФ) результатами интеллектуальной деятельности и приравненными к ним средствами индивидуализации юридических лиц, товаров, работ, услуг и предприятий, которым предоставляется правовая охрана (интеллектуальной собственностью), на информационном рынке являются:

произведения науки, литературы и искусства;
программы для электронных вычислительных маши и (программы для ЭВМ);
базы данных;
исполнения;
фонограммы;
сообщение в эфир или по кабелю радио- или телепередич (вещание организаций эфирного или кабельного вещания);
изобретения;
полезные модели;
промышленные образцы;
селекционные достижения;
топологии интегральных микросхем;
секреты производства (ноу-хау);
фирменные наименования;
товарные знаки и знаки обслуживания;
наименования мест происхождения товаров;
коммерческие обозначения.

В основе правового регулирования на информационном рынке лежат юридические документы: законы, указы, поставновления. Среди основных документов выделяют:

- Гражданский кодекс Российской Федерации; Трудовой кодекс Российской Федерации;

- Федеральный закон от 27.07.2006 г. № 149-ФЗ "Об информации, информационных технологиях и о защите информации";

- Закон РФ от 27.12.1991 г. № 2124-1 "О средствах массовой информации";

- Федеральный закон от 29.12.1994 г. № 77-ФЗ "Об обязательном экземпляре документов";

- Закон РФ от 21.07.1993 г. № 5485-1 «О государственной тайне»;

- Федеральный закон от 27.07.2006 г. № 152-ФЗ "О персональных данных";

- Федеральный закон от 29.07.2004 г. № 98-ФЗ "О коммерческой тайне".

Информация может являться объектом публичных, гражданских и иных правовых отношений. Информация может свободно использоваться любым лицом и передаваться одним лицом другому лицу, если федеральными законами не установлены ограничения доступа к информации либо иные требования к порядку ее предоставления или распространения.

В зависимости от категории доступа информация подразделяется на общедоступную, а также на информацию, доступ к которой ограничен федеральными законами (информация ограниченного доступа).

Информация в зависимости от порядка ее предоставления или распространения подразделяется:

на информацию, свободно распространяемую;
информацию, предоставляемую по соглашению лиц, участвующих в соответствующих отношениях;
информацию, которая в соответствии с федеральными законами подлежит предоставлению или распространению;
информацию, распространение которой в Российской Федерации ограничивается или запрещается.

К общедоступной информации относятся общеизвестные сведения и иная информация, доступ к которой не ограничен. Общедоступная информация может использоваться любыми лицами по их усмотрению при соблюдении установленных федеральными законами ограничений в отношении распространения такой информации.

Граждане (физические лица) и организации (юридические лица) вправе осуществлять поиск и получение любой информации в любых формах и из любых источников при условии соблюдения требований, установленных федеральными законами.

Гражданин (физическое лицо) имеет право на получение от государственных органов, органов местного самоуправления, их должностных лиц в порядке, установленном законодательством Российской Федерации, информации, непосредственно затрагивающей его права и свободы.

Организация имеет право на получение от государственных органов, органов местного самоуправления информации, непосредственно касающейся прав и обязанностей этой организации, а также информации, необходимой в связи с взаимодействием с указанными органами при осуществлении этой организацией своей уставной деятельности.

Федеральными законами устанавливаются условия отнесения информации к сведениям, составляющим коммерческую тайну, служебную тайну и иную тайну, обязательность соблюдения конфиденциальности такой информации, а также ответственность за ее разглашение.

Защита информации, составляющей государственную тайну, осуществляется в соответствии с законодательством Российской Федерации о государственной тайне. Информацией владеет само государство и именно оно выдвигает требния по ее защите и контролирует их выполнение.

Государственная тайна — защищаемые государством сведения в области его военной, внешнеполитической, экономической, разведывательной, контрразведывательной и оперативно-розыскной деятельности, распространение которых может нанести ущерб безопасности Российской Федерации. Перечень сведений, составляющих государственную тайну, — совокупность категорий сведений, в соответствии с которыми сведения относятся к государственной тайне и засекречиваются на основаниях и в порядке, установленных федеральным законодательстном.

Персональные данные — любая информация, относящаяся к определенному или определяемому на основании такой информации физическому лицу (субъекту персональных данных), в том числе его фамилия, имя, отчество, год, месяц, дата и место рождения, адрес, семейное, социальное, имущественное положение, образование, профессия, доходы, другая информация.

Понимая степень значимости этой информации и ее роль в обеспечении безопасности каждой отдельно взятой личности, государство взяло ее под свой патронаж и рассматривает ее защиту, как одну из своих важных задач. Федеральный закон от 27.07.2006 г. № 152-ФЗ "О персональных данных" обеспечивает защиту прав и свобод человека и гражданина при обработке его персональных данных, в том числе защиту прав на неприкосновенность частной жизни, личную и семейную тайну.

Конфиденциальность персональных данных — обязательное для соблюдения оператором или иным получившим доступ к персональным данным лицом требование не допускать их распространение без согласия субъекта персональных данных или наличия иного законного основания.

Обеспечение конфиденциальности персональных данных не требуется:

в случае обезличивания персональных данных;
в отношении общедоступных персональных данных.

Коммерческая тайна — режим конфиденциальности информации, позволяющий ее обладателю при существующих или возможных обстоятельствах увеличить доходы, избежать неоправданных расходов, сохранить положение на рынке товаров, работ, услуг или получить иную коммерческую выгоду.

Информация, составляющая коммерческую тайну (секрет производства), — сведения любого характера (производственные, технические, экономические, организационные и другие), в том числе о результатах интеллектуальной деятельности в научно-технической сфере, а также сведения о способах осуществления профессиональной деятельности, которые имеют действительную или потенциальную коммерческую ценность в силу неизвестности их третьим лицам, к которым у третьих лиц нет свободного доступа на законном основании и в отношении которых обладателем таких сведений введен режим коммерческой тайны.

Право на отнесение информации к информации, составляющей коммерческую тайну, и на определение перечня и состава такой информации принадлежит обладателю такой информации.

Доступ к информации, составляющей коммерческую тайну, — ознакомление определенных лиц с информацией, составляющей коммерческую тайну, с согласия ее обладателя или на ином законном основании при условии сохранения конфиденциальности этой информации.

Сроки актуальности информации, составляющей коммерческую тайну, определяется самим учреждением, эта информация остается таковой до момента, когда ее перестают охранять или делают общедоступной.

Следует отметить, что учреждение не имеет права относить информацию о гражданах к информации, составляющей коммерческую тайну.

Особое место в правовом регулировании на информационном рынке занимает авторское право. Авторское право распространяется на произведения науки, литературы и искусства, являющиеся результатом творческой деятельности, независимо от назначения и достоинства произведения, а также от способа его выражения. К объектам авторского права также относятся производные произведения, сборники и другие составные произведения, представляющие собой по подбору и расположению материалов результат творческого труда.

Под массовой информацией понимаются предназначенные для неограниченного круга лиц печатные, аудио-, аудиовизуальные и иные сообщения и материалы.

Под средством массовой информации понимается периодическое печатное издание, радио-, теле-, видеопрограмма, кинохроникальная программа, иная форма периодического распространения массовой информации.

Тема 3 Основы разработки Web-страниц (4 ч.)

1. Программные средства разработки web-страниц. Основные понятия языка HTML.

2. Структура документа HTML. Основные процедуры.

1. Программные средства разработки web-страниц. Основные понятия языка HTML.

Среда программирования (среда разработки) – это программное обеспечение, позволяющее эффективно создавать элементы Web станиц, разрабатывать сценарии и осуществлять их отладку.

Основные из них:

Блокнот.
MS Font Page.
Macromedia Dream Weaver и др.

Рассмотрим основные понятия языка HTML.

Гипертекст — информационная структура, позволяющая устанавливать смысловые связи между элементами текста на экране компьютера таким образом, чтобы можно было легко осуществлять переходы от одного элемента к другому. На практике в гипертексте некоторые слова выделяют путем подчеркивания или окрашивания в другой цвет (гиперссылки). Выделение слова свидетельствует о наличии связи этого слова с некоторым документом, в котором тема, связанная с выделенным словом, рассматривается более подробно. Отдельный документ, выполненный в формате HTML, называется:

- HTML-документом;

- Web-документом;

- Web-страницей.

Такие страницы, как правило, имеют формат НТМ или HTML.

Гиперссылка — фрагмент текста, который является указателем на другой файл или объект. Гиперссылки необходимы для того, чтобы обеспечить возможность перехода от одного документа к другому.

Группа Web-страниц, принадлежащих одному автору или одному ИЭДВ телю и взаимосвязанных общими гиперссылками, образует структуру, которая называется Web-узлом, или Web-сайтом. Каждая HTML-страница имеет свой уникальный URL - aдpеc в Интернете.

Фрейм (Frame) — термин, имеющий два значения. Первое значение область документа со своими полосами прокрутки. Второе — 0ДНН0Ч ное изображение в анимационном графическом файле (кадр).

Апплет (Applet) — программа, передаваемая на компьютер клиенте В виде отдельного файла и запускаемая при просмотре Web-страницы.

Скрипт (Script), или сценарий, — программа, включенная в состав Web-страницы для расширения ее возможностей. Браузер lnternet Explorer в определенных ситуациях выводит сообщение: «Разрешить выполнение сценариев на странице?». В этом случае имеются в виду скрипты.

CGI (Common Gateway Interface) — общее название программ, которые, работая на сервере, позволяют расширять возможности Web-страниц. Без таких программ невозможно создание интерактивных Web-страниц.

Браузер (Browser) — программа для просмотра Web-страниц.

Элемент — конструкция языка HTML. Можно представить его себе как контейнер, содержащий данные и позволяющий отформатировать их определенным образом. Любая Web-страница представляет собой набор элементов. Одна из основных идей гипертекста — возможность вложения элементов. Например:

<Начало элемента> Содержание элемента, данные, которые форматирует элемент </Конец элемента>

Тег (по-английски tag — метка, дескриптор, ярлык) — начальный или конечный маркер элемента. Теги определяют границы действия элементов и отделяют элементы друг от друга. В тексте Web-страницы теги заключаются в угловые скобки < >, а конечный тег всегда снабжается косой чертой. Текст, не находящийся между такими скобками (< >), виден весь при просмотре в браузере. Например:

<Начальный тег> Содержание элемента, данные, которые

форматирует элемент </Конечный тег>

<Р> Этот текст будет расположен в отдельном абзаце </Р>

Элемент, содержащий некоторый текст, ограничен начальным тегом (маркером) <р> и конечным тегом (маркером) </р>, т.е. текст помещен между тегами, как в контейнер, а теги <р> и </р> размечают начало и конец абзаца соответственно.

Любая Web-страница представляет собой набор элементов. Один из основных принципов HTML — возможность вложения одного элемента в другой.

Атрибут — параметр или свойство элемента. Атрибуты располагаются внутри начального тега и отделяются друг от друга пробелами. Если цемент содержит текст, то атрибуты могут задавать цвет и размер шрифта, выравнивание текстового абзаца и т.п. Если элемент содержит рисунок, то атрибуты могут задавать размер рисунка, наличие и размер рамки вокруг рисунка и пр.

<Р align="center"> Этот текст будет выравнен по центру экрана

</Р>

В этом примере опять встречается тег, определяющий начало и конец абзаца. Однако в начальном теге находится атрибут align, который задает выравнивание текста по центру экрана.

Обратите внимание:

- любая полезная информация должна находиться между начальным и конечным тегами, указывающими ее формат;

- все атрибуты располагаются в начальном теге;

- для удобства работы начальный тег вы можете писать с прописной (заглавной) буквы (Р), а конечный — со строчной (маленькой) буквы (/р), хотя это и не обязательно;

- не для всех элементов требуется ставить конечный (закрывающий) тег;

- написание каждого нового элемента начинайте с новой строки. Вложенные элементы выделяйте отступом (табуляцией). Это опять-таки не обязательно, но значительно облегчит вашу работу.

2. Структура документа HTML. Основные процедуры.

Для того чтобы понять структуру Web-страницы, нам необходимо подробно рассмотреть все элементы, входящие в приведенный листинг (к рис.):

Рис. 2.1. Вот что у вас должно получиться

</COMMENT>

<HTML>

<HEAD>

<TITLE> моя первая страница </title>

<МЕТА NAME="AUTHOR" CONTENT="IVANOV

IVAN">

<META NAME="Keywords"

CONTENT ="Животные, природа, фауна"> </head>

<BODY>

Здравствуйте, это моя первая страница.

<!—<PRE> Комментарий </рге>—>

<BR>

Добро пожаловать! :)

</body>

</html>

COMMENT> </comment>

Текст комментария. В любом языке программирования есть конструкции, позволяющие создавать произвольные ремарки. HTML в этом смысле - не исключение. Текст, помещенный внутри COMMENT, игнорируется браузером. COMMENT может располагаться в любом месте кода Web-страницы. Комментарий должен быть отделен от основного текста.

Существует, правда, одно ограничение: внутри комментария не должны располагаться другие элементы. Так должно быть, разумеется, только в том случае, когда необходимо, чтобы все содержимое элемента ;СOMMENT не отображалось на экране монитора. Если в комментарии будет присутствовать другой элемент, то его содержимое, отформатированное соответствующим образом, будет выведено на экран.

Существует еще один способ обозначения комментария. Он заключается в использовании восклицательного знака и обрамлении текста комментария двойными тире. Например:

< ! -- Комментарий -- Не комментарий -- Снова комментарий -->

Отличительный признак HTML-документа. Одним из принципов языка является многоуровневое вложение элементов. HTML является самым внешним, так как между его стартовым и конечным тегами должна находиться вся Web-страница. В принципе этот элемент можно рассматривать как формальность. Он имеет атрибуты version, lang и dir, которыми в данном случае мало кто пользуется, и допускает вложение элементов HEAD, BODY и PLAINTEXT, определяющих общую структуру Web-страницы. Естественно, что конечным тегом </html> заканчиваются все гипертекстовые документы.

Информация о документе, которая не выводится на экран, называется заголовком. Так же как и HTML, HEAD служит только для формирования общей структуры документа. Этот элемент может иметь атрибуты lang и dir и допускает вложение элементов TITLE, ISINDEX, BASE, МЕТА, LINK, NEXTID.

Элемент для размещения заголовка Web-страницы. Строка текста, расположенная внутри, отображается не в документе, а в заголовке окна браузера. Эта особенность часто используется для организации поиска в WWW. Поэтому авторы, создающие Web-страницы, должны позаботиться о том, чтобы строка внутри TITLE, не будучи слишком длинной (не более 64 символов), достаточно точно отражала назначение документа.

<МЕТА>

Этот элемент содержит служебную информацию, которая не отображается при просмотре Web-страницы. Внутри него нет текста в обычном понимании, поэтому нет и конечного тега. Каждый элемент МЕТА содержит два основных атрибута, первый из которых определяет тип данных, а второй - содержание. Далее приведено несколько примеров метаданных (табл. 2.1).

Таблица 2.1

Метаданные

Дата, обозначающая «срок годности» документа	name="Expires" content="Дата"
Адрес электронной почты	name="Reply to" content ="Имя@Адрес"
Имя автора Web-страницы	name="Author" content="Имя автора"

Окончание

Набop ключевых слов для поиска	name="Keywords" content="Слово1, слово2, ..."
Краткое описание содержания Web-страницы	name="Description" content ="Содержание страницы"
Описание типа и характеристик Web-страницы	name="Content-Type" content –"Описание страницы"
Указание приложения, в котором была создана Web-страница	name="Generator" content="Название HTML-редактора"

Атрибут name используется приложением-клиентом для получения дополнительной информации о Web-страницах и их упорядочения. Этот атрибут часто заменяют атрибутом http-equiv. Он используется сервером для создания дополнительных полей при выполнении запроса.

Кроме этого элемент МЕТА может содержать URL. Шаблон соответствующего атрибута таков:

URL="http: // адрес"

Этот элемент заключает в себе гипертекст, который определяет собственно Web-страницу. Это та часть документа, которую разрабатывает автор страницы и которая отображается браузером. Соответственно конечный тег этого элемента надо искать в конце HTML-файла. Внутри BODY можно использовать все элементы, предназначенные для дизайна Web-страницы. Внутри стартового тега элемента BODY можно расположить ряд атрибутов, обеспечивающих установки для всей страты в целом (табл. 2.2).

Это могут быть атрибуты, задающие:

- цвет фона Web-страницы;

- обои или рисунок фона страницы;

- цвет текста на всей странице;

- цвет гиперссылок (активных, выбранных, посещенных).

	Таблица
Атрибуты элемента BODY
Параметр	Функция
bgcolor="#RRGGBB"	Определение цвета фона. Цвет фона задается тремя двухразрядными шестнадцатиричными числами, которые определяют интенсивность красного, зеленого и синего цветов соответственно. Более подробно об определении цветов будет рассказано ниже
background="Путь к файлу фона"	Указание фонового рисунка. Оба вышеприведенных атрибута не являются альтернативными и часто используются совместно
text="#RRGGBB"	Определение цвета основного текста
link="#RRGGBB"	Определение цвета текста гиперссылок
vlink="#RRGGBB"	Определение цвета для использованных гиперссылок
alink="#RRGGBB"	Определение цвета для последней выбранной пользователем гиперссылки
bgproperties	Изменение свойств фона (например, фиксирование фонового рисунка)
topmargin="10", bottommargin="10", leftmargin,rightmargfn	Определение размера отступа от верхнего, нижнего, левого и правого краев документа. Значение задается в пикселях
marginwidth="10", marginheight="10"	Netscape объединяем упомянутые параметры в две группы: горизонтальные и вертикальные отступы Для учета особенностей всех браузеров надо поставить и те и другие параметры

Пример:

<body topmargin="5", bottommargin="5", leftmargin="10",

rightmargin="10", marginwidth="10", marginheight="5"

1. . Виробниче приміщення замкнутий простір в спеціально призначених будинках та спорудах в яких пості
2. Философия мира
3. Документы по внешнеэкономической деятельности
4. на тему- Биржевые сделки и расчеты по ним Вариант 16 Студент- Стромский Ю
5. Прийняття та зміна Конституції Угорщини
6. Тема 3- Середовище і розвиток теорій міжнародних економічних відносинrdquo; План 1
7. Тема 1 Исходные положения экономической теории как науки
8. Физиологические свойства синапсов их классификация Синапс ~ это структурнофункциональное образование
9. з курсу Класична механіка і механіка суцільних середовищ 1
10. Варіант 1 1 Бюджетний дефіцит перевищення видатків над постійними доходами бюджету якими є податки й обо

Материалы собраны группой SamZan и находятся в свободном доступе