Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

Подписываем
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Предоплата всего
Подписываем
Деловые ресурсы Интернета
Обычно под словом "Интернет" понимается глобальная компьютерная сеть, или Сеть сетей. С точки зрения пользователя Интернет можно рассматривать как глобальное средство обмена информацией. Одним из распространенных и перспективных сервисов Интернета является сервис прямого доступа Word Wide Web WWW, представляющий собой систему документов, включающих текстовую и графическую информацию, размещенных на узлах Интернета и связанных между собой гиперссылками. В 2002 г. объем Интернета оценивался в 4 млрд веб-сайтов [19].
Источники информации в Интернете могут быть классифицированы по разным основаниям. По способам представления информации можно выделить следующие виды:
4. Базы данных могут быть доступны через сеть Интернет, содержать кроме текстовой и другие виды информации.
Информационные ресурсы также могут быть разделены по языковому признаку. Практически все основные языки представлены в сети Интернет, однако главным языком в силу исторически сложившихся традиций является английский язык. Ряд сайтов представляет информацию на нескольких языках.
В Интернете имеет место классификация и по территориальному признаку. Ряд сайтов представляет информацию для потребителей определенного региона, хотя доступ к сайту возможен с любой точки сети.
Наиболее важным аспектом классификации информационных ресурсов Интернета является классификация по содержанию информации. Деловая информация по этому критерию может быть разделена на следующие группы:
1. Сведения о фирмах, организациях. Эта группа сведений существенно отличается по наполнению для различных организаций. Данные отличия определяются степенью освоения организацией возможностей Интернета по продвижению своей продукции или услуг. Различают три типа серверов данной группы (категории):
серверы присутствия в Интернете. Они могут быть разделены [43] на рекламные и информирующие серверы. Рекламный сервер обычно содержит одну или несколько страниц. Информирующий сервер содержит более подробную информацию о фирме и производимой ею продукции или оказываемых услугах;информационные серверы. Они предоставляют информа
цию потребителям. Серверы данной группы ведут информационно- аналитические агентства и другие структуры, в том числе государственные;
интерактивные магазины. Серверы этой группы обеспечивают продажи товаров посредством Интернета. При этом могутбыть реализованы в электронном виде следующие функции:
предоставление клиенту необходимой информации о товареили услуге;
оформление заказа;
оплата заказа (при использовании платежных систем, работающих в онлайновом режиме);
отправка полученного товара, если товаром является информация.
Сведения о состоянии мировой экономики и экономикиотдельных стран. Данная информация представлена достаточношироко в профессиональных базах крупнейших информационно-аналитических агентств мира. Серверы этих агентств входят в
состав информационных ресурсов Интернета. Однако сама информация, как правило, платная. Информация о состоянии национальной экономики обычно размещается на серверах государственных структур, отвечающих за государственную поддержку экономики, государственных статистических органов,различных экономических институтов.
из профессиональных баз крупнейших мировых информационных агентств, найдя сведения о технологиях доступа к этимбазам на сайтах Интернета;
в консалтинговых или маркетинговых агентствах, чьи сайты также представлены в Интернете;
в многопрофильных и отраслевых журналах, регулярно публикующих обзоры рынков. Одни издательства на сайтах представляют оглавления номеров журналов, например многопро
фильный журнал "Эксперт". Другие журналы в открытом доступепредоставляют публикуемые материалы, например журнал "Профиль".
4. Деловые новости. Большинство мировых информационных агентств предоставляют потребителям доступ к профессиональным базам, содержащим деловые новости. В 2005 г. Объем торговли информацией в Интернете составил около 40 млрддолл. США . Из зарубежных агентств крупнейшими поставщиками деловых новостей являются LexisNexis, Dialog, Reuters.
Среди отечественных агентств следует выделить:
Интегрум-Техно, предоставляющий доступ к материалам 250 центральных и крупнейших региональных газет, а также к за рубежным новостям;
РИА "Новости" государственное информационно-аналитическое агентство Российской Федерации;
ИТАР-ТАСС Государственное информационное телеграфное агентство России;
агентство Интерфакс, входящее в состав международнойинформационной группы Interfax Information Services.
Интернет предоставляет бесплатный доступ к ежедневной электронной интернет-газете "Gazeta.ru". Ряд крупнейших газет в Интернете имеют электронные версии. Доступ к некоторым из них платный, например, к электронным версиям печатных изданий Издательского дома "Коммерсанть", к другим, например к электронной версии газеты "Аргументы и факты", бесплатный.
5. Справочная информация. В Интернете широко представлена справочная информация. Это списки веб-сайтов компаний, отобранных по определенному принципу, телефонно-адресный справочник "Желтые страницы" с возможностью поиска информации по названию фирмы и виду деятельности и телефонные справочники городов Российской Федерации, стран СНГ и Балтии. В Интернете имеется информация о расписании движения поездов, авиарейсов, о погоде и многое другое.
Виды информации в Интернете и профессиональных базах
Информация о предметной области, т. е. об объектах и их связях, может быть представлена в двух видах: формализованном и в виде текста на естественном языке.
Формализованное описание конкретного объекта включает имя, свойства (характеристики) и значение этого свойства для данного объекта. Имя свойства отражает грамматическую роль значения этого свойства по отношению к данному классу объектов. Значение свойства (характеристики) может задаваться нормированным словарем или произвольно. Например, значение свойства "организационно-правовая форма фирмы, организации" должно выбираться из нормированного словаря, а значение свойства "название организации" является произвольным. Формализованное описание объекта во многом схоже с анкетной формой описания объекта. Некоторые авторы называют формализованное описание информации числовым. Это не совсем точное определение, так как фамилия лица или название организации задается не числовым значением, но может быть представлено в формализованном виде.
Названия классов объектов, свойств и областей возможны? значений этих свойств (характеристик), т. е. язык формализованного описания для каждой предметной области, разрабатываю! квалифицированные специалисты. С помощью отдельны> свойств устанавливаются связи между объектами. Например, если описаны два объекта: фирма и товар, то между ними устанавливается связьотношение, указывающее, что эта фирма выпускает этот товар. Описание такого формализованного языка после согласования с источниками и потребителями информации н данной предметной области издается в виде нормативного документа, и на основе его создаются базы данных формализованной информации. Описание информации в таких базах в максимальной степени приближено к представлению специалиста о предметной области, в которой он работает. Формализованный язык описания предметной области выполняет следующие основные функции:
позволяет источнику отбирать лишь ту информацию и описывать ее так, как это необходимо потребителю;
позволяет в базах данных отражать информацию в том же виде, в каком она отражена в сознании специалиста данной предметной области;
позволяет в информационных системах по указанию потребителя проводить автоматическую обработку формализованной информации;
существенно облегчает поиск нужной информации в базах данных.
Другим видом информации о предметной области является информация, представленная в виде текста на естественном языке.
Для того чтобы понять, в какой степени информация на естественном языке, накапливаемая в информационных системах, подходит для удовлетворения информационных потребностей пользователя, рассмотрим в общих чертах природу восприятия человеком реальной действительности и отображение этой действительности на естественном языке. Индивидуальное знание предметной области источником и потребителем информации складывается из совокупности представлений и понятий [52]. Представления это чувственно-наглядные образы объектов реального мира. Источником формирования представлений являются психологические процессы ощущения и восприятия, а также информация, получаемая от других членов общества в процессе общения. В результате создаются представления об объектах реального мира. Представления носят субъективный характер, который определяется внутренним психологическим миром данного человека. Хотя у разных людей создаются разные представления о реальном мире, в них присутствует элемент общности, который позволяет использовать представления в процессе общения.
Понятия образуются в результате логического осмысления представлений об объектах реального мира и являются формой абстрактного мышления, отражающей и фиксирующей существенные признаки данных объектов. Понятия более объективны и в большей степени отражают коллективный опыт. Понятия и представления тесно взаимосвязаны и являются формой отражения реальной действительности в мышлении.
Язык это средство, с помощью которого люди передают друг другу информацию о реальном мире. Словарные выражения являются материальной формой понятий и представлений. Естественный язык является результатом длительного развития общества. Поскольку для различных слоев общества характерна разная степень общности представлений, возникла многозначность слов естественного языка: одно и то же слово приобретало множество различных значений и для одного и того же слова использовалось несколько словесных выражений. Таким образом, общим недостатком естественного языка с позиций оценки эффективности поиска является избыточность и недостаточность.
Избыточность проявляется в следующем:
Недостаточность проявляется в следующем:
Если рассматривать процесс отражения объектов реального мира текстом на естественном языке, то можно выделить план содержаниясмысл сообщения, т. е. результат процесса мышления, и план выражения произвольный текст на естественном языке. Таким образом, тексты на естественном языке, хранящиеся в информационных системах, находятся на уровне плана выражения и характеризуются всеми недостатками естественного языка, отмеченными выше. Следует иметь в виду, что выявленные недостатки следует рассматривать лишь с позиций эффективного поиска сообщений в информационных системах. Причина неоднозначности выражений при рассмотрении под другим углом будет отнесена к достоинствам естественного языка, например эллипсность.
Отметим, что потребитель информации пользователь нуждается в получении информации о предметной области в соответствии со своими представлениями об объектах, свойствах и отношениях в этой области. Свой запрос он также формулирует на уровне плана выражения.
Таким образом, в самой информационной системе, содержащей тексты на естественном языке, мы имеем массив планов выражения источников на естественном языке, а на входе информационной системы множество запросов в виде планов выражения, сформулированных потребителями информации.
Для того чтобы решить задачу поиска требуемой потребителю информации, необходимо смоделировать, представить, о каком фрагменте предметной области потребитель хочет получить информацию. Затем нужно просмотреть хранящиеся документы планы выражения, составленные источниками, представить и смоделировать, что хотел сказать источник о предметной области и на основе научно обоснованной методики отобрать те из них, которые отвечают на поставленный вопрос полностью или частично.
Работы в областях теории построения документальных информационных систем и машинного перевода, проводимые последние 50 лет в нашей стране и за рубежом, показали, что процесс выявления смысла из произвольного текста на естественном языке не может быть реализован автоматически, а лишь с участием человека, обладающего глубокими знаниями в данной предметной области.
Однако общество нуждалось в построении документальных информационных систем в первую очередь в области научно-тех-
нической информации. Для того чтобы облегчить поиск в больших массивах текстовой информации, стали строить информационно-поисковые системы, в которых документы описывались с помощью специальных поисковых языков. С помощью элементов этого же языка описывались и запросы. Для отбора документов в ответ на запрос осуществлялось сравнение поисковых образов запросов и поисковых образов документов, которое проводилось на одном и том же искусственном языке.
Такой подход является вынужденным. Из-за недостатков естественного языка, отмеченных выше, документальные информационные системы не дают ответа на вопрос потребителя, а выдают ему документы, в которых может содержаться ответ на его запрос, предоставляя потребителю самостоятельно выявить смысловое содержание этих документов. Вопросы оценки эффективности поиска информации в документальных информационных системах будут рассмотрены ниже.