Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

тема обработки информации в которой реализованы функции централизованного хранения и накопления обрабатыв

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 23.11.2024

17. Понятие БД, назначение

В основе решения многих задач лежит обработка информации. Для обеспечения обработки информации создаются Информационные Системы, а ИС с применением ВТ называется Автоматизированные ИС. В широком понимании под определением ИС подпадает любая система обработки информации, в которой реализованы функции централизованного хранения и накопления обрабатываемой организованной в одну  либо несколько баз данных.

База данных  -  это совокупность взаимосвязанных и упорядоченных данных, которая обеспечивает их оптимальное использование в определённой человеческой деятельности.

База представляет собой совокупность специальным образом организованных данных хранимых в памяти ВС и отражающих состояние объектов и их взаимосвязей в рассматриваемой предметной области.

Базу данных можно создавать на бумаге или в текстовом файле, но везде используется одна и та же информация.

При создании компьютерной БД учитывается и содержимое, и принципы организации БД.

БД должны обеспечивать:

- Простоту, легкость и гибкость работы с данными (пользователи должны чётко представлять какие данные имеются в их распоряжении и какие имеются методы доступа к данным).

- Целостность данных, в БД должна хранится информация полная непротиворечивая, необходимая и достаточная.

- Безопасность хранения данных (достигается шифрованием, использование защиты паролем, поддержкой уровня доступа к БД).

- Простата внесения изменений;

- Гибкие организационные формы эксплуатации.

- Функционирование сети  -  использование средств управления доступом пользователей к совместно используемым данным

БД разделяют на:

1. Файлы с данными называемыми базой данных

2. Программы, которые используются для обработки этих данных, системы управления базой данных (СУБД).

Различают фактографические  и документальные автоматизированные системы на основе баз данных.

Фактографические базы используют форматированные записи. Форматированной записью может даже листок по учёту кадров.

Документальные базы отличаются от фактографических возможностью поиска документов по содержанию. Для упрощения поиска применяются ключевые слова, которые способны наиболее полно его охарактеризовать.

Модель данных – совокупность структур данных и операции их обработки.
Иерархические базы данных могут быть представлены как дерево, состоящее из объектов различных уровней. Верхний уровень занимает один объект, второй — объекты второго уровня и т. д.Между объектами существуют связи, каждый объект может включать в себя несколько объектов более низкого уровня. Такие объекты находятся в отношении предка (объект более близкий к корню) к потомку (объект более низкого уровня), при этом возможна ситуация, когда объект-предок не имеет потомков или имеет их несколько, тогда как у объекта-потомка обязательно только один предок. Объекты, имеющие общего предка, называются близнецами. ( Например, если иерархическая база данных содержала информацию о покупателях и их заказах, то будет существовать объект «покупатель» (родитель) и объект «заказ» (дочерний). Объект «покупатель» будет иметь указатели от каждого заказчика к физическому расположению заказов покупателя в объект «заказ».)
Сетевые базы данных подобны иерархическим, за исключением того, что в них имеются указатели в обоих направлениях, которые соединяют родственную информацию.
Несмотря на то, что эта модель решает некоторые проблемы, связанные с иерархической моделью, выполнение простых запросов остается достаточно сложным процессом.Также, поскольку логика процедуры выборки данных зависит от физической организации этих данных, то эта модель не является полностью независимой от приложения. Другими словами, если необходимо изменить структуру данных, то нужно изменить и приложение.

Реляционная модель данных (РМД) некоторой предметной области представляет собой набор отношений, изменяющихся во времени. При создании информационной системы совокупность отношений позволяет хранить данные об объектах предметной области и моделировать связи между ними.

Реляционная база данных представляет собой хранилище данных, содержащее набор двухмерных таблиц. Данные в таблицах должны удовлетворять следующим принципам.
1. каждое значение, содержащееся на пересечении строки и колонки,
должно быть не расчленяемым на несколько значений).
2. Значения каждого атрибута должны принадлежать к одному и тому же типу. 

3. Каждая запись в таблице уникальна.
4. Каждое поле имеет уникальное имя.
5. Последовательность полей и записей в таблице не существенна.
В реляционной БД используются четыре основных типов полей:
Числовой,
Символьный (слова, тексты, коды и т.д.),
Дата (календарные даты в форме «день/месяц/год»),
Логический (принимает два значения: «да» - «нет» или «истина» - «ложь»).

Инфологическая модель

В базах данных содержится информация об объектах, существующих в реальном мире. Все эти объекты являются материальными, обладающим некоторыми свойствами и присущим им поведением. При создании программного продукта, свойства объектов хранятся в базе данных, а их поведение реализуется в приложении посредством методов — процедур, которые представляют собой отклик на события инициируемых пользователем.

Инфологическая модель является проблемно-ориентированной и системно-независимой, т.е. не зависимой от конкретной СУБД, операционной системы и аппаратного обеспечения ЭВМ.

Основным требованием к инфологической модели, вытекающим из ее назначения, является требование адекватного отображения предметной области. Инфологическая модель должна быть непротиворечивой. Она является единым интегрированным описанием предметной области и отражает взгляды и потребности всех пользователей системы

Инфологическая модель представляет информационные потоки, сущности и связи данной предметной области. Она может быть представлена в виде ER-модели и реляционной схемы.

Целью построения этой структуры является выявление и объединение информационных требований пользователя, связей между элементами данных без относительно к их содержанию и среде их хранения. Инфологическая модель должна обладать свойством легкой расширяемости, обеспечивающим ввод новых данных без изменений ранее определенных.

Центральной компонентой инфологической модели является описание объектов предметной области и связей между ними (ER-модель).

Цель инфологического моделирования — обеспечение наиболее естественных для человека способов сбора и представления той информации, которую предполагается хранить в создаваемой базе данных. Поэтому инфологическую модель данных пытаются строить по аналогии с естественным языком (последний не может быть использован в чистом виде из-за сложности компьютерной обработки текстов и неоднозначности любого естественного языка).

Основными конструктивными элементами инфологических моделей являются сущности, связи между ними, идентификаторы (ключи) и свойства (атрибуты).

Сущность — любой различимый объект (объект, который мы можем отличить от другого), информацию о котором необходимо хранить в базе данных. Сущностями могут быть люди, места, самолеты, рейсы, вкус, цвет и т.д. Необходимо различать такие понятия, как тип сущности и экземпляр сущности. Понятие тип сущности относится к набору однородных личностей, предметов, событий или идей, выступающих как целое.

Экземпляр сущности относится к конкретной вещи в наборе. Например, типом сущности может быть ГОРОД, а экземпляром — Москва, Киев и т.д.

Атрибут — поименованная характеристика сущности.

Его наименование должно быть уникальным для конкретного типа сущности, но может быть одинаковым для различного типа сущностей (например, ЦВЕТ может быть определен для многих сущностей: СОБАКА, АВТОМОБИЛЬ, ДЫМ и т.д.). Атрибуты используются для определения того, какая информация должна быть собрана о сущности. Примерами атрибутов для сущности АВТОМОБИЛЬ являются ТИП, МАРКА, НОМЕРНОЙ ЗНАК, ЦВЕТ и т.д. Здесь также существует различие между типом и экземпляром. Тип атрибута ЦВЕТ имеет много экземпляров или значений: Красный, Синий, Банановый, Белая ночь и т.д.,однако каждому экземпляру сущности присваивается только одно з

Таблица является основным объектом для хранения информации в реляционной базе данных. Она состоит из строк и столбцов, в которых содержатся данные. Таблица занимает в базе данных физическое пространство и может быть постоянной или временной.начение атрибута.

Поле базы данных - это столбец таблицы, содержащий значения определенного свойства.

Строки таблицы являются записями об объекте; эти записи разбиты на поля столбцами таблицы, поэтому каждая запись представляет собой набор значений, содержащихся в полях.

Запись базы данных - это строка таблицы, содержащая набор значений свойств, размещенный в полях базы данных.

Каждая таблица должна содержать, по крайней мере, одно ключевое поле, содержимое которого уникально для каждой записи в этой таблице. Ключевое поле позволяет однозначно идентифицировать каждую запись в таблице.

Тип поля определяется типом данных, которые оно содержит. Поля могут содержать данные следующих основных типов:

  •  счетчик - целые числа, которые задаются автоматически при вводе записей. Эти числа не могут быть изменены пользователем;
  •  текстовый - тексты, содержащие до 255 символов;
  •  числовой - числа;
  •  дата/время - дата или время;
  •  денежный - числа в денежном формате;
  •  логический - значения Истина (Да) или Ложь (Нет);
  •  гиперссылка - ссылки на информационный ресурс в Интернете (например, Web-сайт).

Поле каждого типа имеет свой набор свойств. Наиболее важными свойствами полей являются:

  •  размер поля - определяет максимальную длину текстового или числового поля;
  •  формат поля - устанавливает формат данных;
  •  обязательное поле - указывает на то, что данное поле обязательно надо заполнить.

В каждой таблице БД может существовать первичный ключ. Под первичным ключом понимают поле или набор полей, однозначно (уникально) идентифицирующих запись. Первичный ключ должен быть минимально достаточным: в нем не должно быть полей, удаление которых из первичного ключа не отразится на его уникальности. Правила хорошего тона при разработке структур баз данных, и чисто практические соображения должны побудить разработчика всегда определять первичный ключ для таблицы базы данных.

Для работы с записями из нескольких таблиц часто приходится создавать запросы, соединяющие таблицы. Запрос сопоставляет значения в поле первичного ключа первой таблицы с полем внешнего ключа второй таблицы. Например, чтобы получить строки, в которых перечисляются все заказы для каждого из клиентов, можно создать запрос, соединяющий таблицу "Клиенты" с таблицей "Заказы" на основе поля "Код клиента". В окне "Схема данных" можно вручную указать поля для соединения. Но если связь между таблицами уже существует, Access использует соединение по умолчанию на основе существующей связи между таблицами. Кроме того, при использовании одного из мастеров запросов Access использует сведения об уже определенных связях между таблицами, чтобы предоставить пользователю выбор и подставить в параметры свойств соответствующие значения по умолчанию.

Существует три типа связей между таблицами.

  •  Связь "один-ко-многим"

Рассмотрим базу данных для учета заказов, содержащую таблицы "Клиенты" и "Заказы". Клиент может оформить любое количество заказов. Следовательно, у любого клиента, представленного в таблице "Клиенты", может быть много заказов, представленных в таблице "Заказы". Поэтому связь между таблицами "Клиенты" и "Заказы" — это связь "один-ко-многим".

Чтобы создать связь "один-ко многим" в структуре базы данных, добавьте первичный ключ на стороне "один" в таблицу на стороне "многие" в виде дополнительного поля. В данном примере необходимо добавить новое поле — поле "Код" из таблицы "Клиенты" — в таблицу "Заказы" и назвать его "Код клиента". После этого Access сможет использовать номер "Код клиента" из таблицы "Заказы" для поиска клиента, оформившего тот или иной заказ.

  •  Связь "многие-ко-многим"

Рассмотрим связь между таблицей "Продукты" и таблицей "Заказы". Один заказ может включать несколько продуктов. С другой стороны, отдельный продукт может содержаться в нескольких заказах. Следовательно, для каждой записи таблицы "Заказы" может существовать несколько записей в таблице "Продукты" и наоборот. Такой тип связи называется связью "многие-ко-многим", поскольку каждому продукту может соответствовать много заказов и наоборот. Обратите внимание, что для обнаружения существующей связи "многие-ко-многим" между таблицами важно рассмотреть обе ее стороны.

Чтобы представить связь "многие-ко-многим", нужно создать третью (связующую) таблицу, в которой она разбивается на две связи "один-ко-многим". Первичные ключи двух таблиц вставляются в третью таблицу. В результате в третьей таблице сохраняются все экземпляры связи. Например, таблицы "Заказы" и "Продукты" имеют связь "многие-ко-многим", определяемую путем создания двух связей "один-ко-многим" в таблице "Заказано". В одном заказе может быть много продуктов, и каждый продукт может быть указан во многих заказах.

18.

Систе́ма управле́ния ба́зами да́нных (СУБД) — совокупность программных и лингвистических средств общего или специального назначения, обеспечивающих управление созданием и использованием баз данных.

Основные функции СУБД:

  •  управление данными во внешней памяти (на дисках);
  •  управление данными в оперативной памяти с использованием дискового кэша;
  •  журнализация измененийрезервное копирование и восстановление базы данных после сбоев;
  •  поддержка языков БД (язык определения данныхязык манипулирования данными).

Обычно современная СУБД содержит следующие компоненты:

  •  ядро, которое отвечает за управление данными во внешней и оперативной памяти и журнализацию,
  •  процессор языка базы данных, обеспечивающий оптимизацию запросов на извлечение и изменение данных и создание, как правило, машинно-независимого исполняемого внутреннего кода,
  •  подсистему поддержки времени исполнения, которая интерпретирует программы манипуляции данными, создающие пользовательский интерфейс с СУБД
  •  а также сервисные программы (внешние утилиты), обеспечивающие ряд дополнительных возможностей по обслуживанию информационной системы.

Основные характеристики и возможности СУБД Access

СУБД Access (фирма Microsoft) имеет достаточно высокие ско­ростные характеристики и входит в состав чрезвычайно популяр­ного в нашей стране и за рубежом пакета Microsoft Office. Набор команд и функций, предлагаемых разработчикам программных продуктов в среде Access, по мощи и гибкости отвечает большин­ству современных требований к представлению и обработке дан­ных. В Access поддерживаются разнообразные всплывающие и мно­гоуровневые меню, работа с окнами и мышью, реализованы фун­кции низкоуровневого доступа к файлам, управления цветами, на­стройки принтера, представления данных в виде электронных таб­лиц и т.п. Система также обладает средствами быстрой генерации экранов, отчетов и меню, поддерживает язык управления запроса­ми SQL, имеет встроенный язык Visual Basic for Applications (VBA), хорошо работает в сети. СУБД Access позволяет использовать дру­гие компоненты пакета Microsoft Office, такие как текстовый про­цессор Word for Windows, электронные таблицы Excel и т.д.

Перечисленные факторы определили выбор СУБД Access в ка­честве среды для практического изучения вопросов проектирова­ния баз данных в данной книге.

Приведем некоторые из средств Microsoft Access, существенно упрощающие разработку приложений.

1. Процедуры обработки событий и модули форм и отчетов. На встроенном языке VBA можно писать процедуры обработки собы­тий, возникающих в формах и отчетах. Процедуры обработки со­бытий хранятся в модулях, связанных с конкретными формами и отчетами, в результате чего код становится частью макета формы или отчета. Кроме того, существует возможность вызова функции VBA свойством события.

2. Свойства, определяемые в процессе выполнения. С помощью макроса или процедуры обработки событий можно определить практически любое свойство формы или отчета в процессе вы­полнения в ответ на возникновение события в форме или отчете.

3. Модель событий. Модель событий, похожая на используемую в языке Microsoft Visual Basic, позволяет приложениям реагиро­вать на возникновение различных событий, например нажатие клавиши на клавиатуре, перемещение мыши или истечение оп­ределенного интервала времени.

4. Использование обработки данных с помощью VBA. С помощью языка VBA можно определять и обрабатывать различные объекты, в том числе, таблицы, запросы, поля, индексы, связи, формы, отчеты и элементы управления.

5. Построитель меню. Предназначен для помощи при создании специальных меню в приложениях. Кроме того, специальные меню могут содержать подменю.

6. Улучшенные средства отладки. Помимо установки точек пре­рывания и пошагового выполнения программ на языке VBA, мож­но вывести на экран список всех активных процедур. Для этого следует выбрать команду Вызовы в меню Вид или нажать кнопку [Вызовы) на панели инструментов.

7. Процедура обработки ошибок. Помимо традиционных спосо­бов обработки ошибок возможно использование процедуры обра­ботки события Error для перехвата ошибок при выполнении про­грамм и макросов.

8. Улучшенный интерфейс защиты. Команды и окна диалога за­щиты упрощают процедуру защиты и смены владельца объекта.

9. Программная поддержка механизма OLE. С помощью меха­низма OLE можно обрабатывать объекты из других приложений.

10. Программы-надстройки. С помощью VBA можно создавать программы-надстройки, например нестандартные мастера и по­строители. Мастер — средство Microsoft Access, которое сначала задает пользователю вопросы, а затем создает объект (таблицу, запрос, форму, отчет и т.д.) в соответствии с его указаниями.

Диспетчер надстроек существенно упрощает процедуру установ­ки программ-надстроек в Microsoft Access.

Для создания объектов базы данных (таблиц, запросов, форм, отчетов) используются специализированные диалоговые графические средства, называемые Конструктор (Design), а также программы-мастера Access (Wizard). Наряду с диалоговыми средствами создания объектов БД,  Access  располагает средствами программирования:

·       SQL(Structured Query Language) – структурированный язык запросов;

·       язык макрокоманд;

·       VBA  (Visual Basic for Applications) - объектно-ориентированный язык программирования.

19.Компьютерные вирусы - это класс программ способных к саморазмножению и самомодификации в работающей вычислительной среде и вызывающих нежелательные для пользователей действия. Действия могут выражаться в нарушении работы программ, выводе на экран посторонних сообщений или изображений, порче записей, файлов, дисков, замедлении работы ЭВМ и др.

Классификация. вирусы можно разделить на:

1.Компьютерные вирусы:

* файловые;

*загрузочные;

*макро;

*скрипт вирусы

Файловые вирусы заражают выполняемые файлы (это наиболее распространенный тип вирусов), либо создают файлы-двойники (компаньон-вирусы), либо используют особенности организации файловой системы (link-вирусы).

Загрузочные вирусы заражают загрузочные сектора дисков (boot-сектор), либо главную загрузочную запись (Master Boot Record), либо меняют указатель на активный boot-сектор.

Макровирусы - разновидность файловых вирусов встраивающиеся в документы и электронные таблицы популярных редакторов. пишутся на макро языках.

Скрипт вирусы они пишутся на специальных скрипт языках :java,PHP.

2. Сетевые черви(размножаются самостоятельно, не являются файлами)

* интернет черви

* lan черви.

* смешанные черви.

Интернет черви .они распространяются путём вложения в эмайл,письма.

Чат черви. Они распространяются при помощи программы мгновенного передачи сообщений.

3. Троянские программы.(они не распространяются и не заражают сами. Основная их цель, это сбор секретной информации.)

* DDOS атаки.

* дропперы.

* утилиты не санкционированного удалённого управления.

Дроппер .Это программа ,которая сбрасывает в систему вирусы и сама ничего не делает.

Утилиты не санкционированного удалённого управления. Хакер может совершать любое действие.

Эмуляторы DDOS атак. Отправляют на компьютер огромное количество пакетов.(валят сервер).

Антивирусные программы.

Все антивирусные программы можно разделить на 2 класса:

  1.  чистый антивирус.
  2.  антивирус двойного назначения.

Чистые программы. такие программы имеют специализированное антивирусное ядро, содержащие образцы вирусов.

  Наибольшее относят к антивирусникам:

       Касперский ,доктор web , Nod32.

Программы двойного назначения. Эта программа , используется как в качестве антивируса, так и в качестве программы с сравнением с эталоном, в сравнение с контрольной суммой и эвристический анализ. Алгоритм контрольной суммы предполагает, что действие какого-либо вирусного изменения контрольных параметров и ОС. Эвристический анализ. Он предполагает , что при заражении компьютерный вирус должен выполнять ряд типовых действий:

  1.  не запускать исполняемые файлы ,полученные с электронным письмом.
  2.  проверять все внешние носители на вирусы.
  3.  регулярно выполнять резервное копирование информации.
  4.  регулярно выполнять обновление антивирусной базы.

Пример . Запуск антивирусной программы Dr.Web для проверки и лечения диска В:. Обнаруженные зараженные файлы будут "вылечены". Проверке подлежат все файлы диска. Если файл "вылечить" не удастся, то программа будет просить разрешение на его удаление. Для поиска вирусов должен использоваться эвристический уровень анализа 1. Программа должна выполняться только в режиме командной строки с выходом в DOS после завершения тестирования:

DrWeb В: /AL /CUP /HA1 /QU / CL

20. автоматизация обработки документов.

 Компьютер предназначен для работы с документами, имеющими электронную форму. В то же время, нам часто приходится иметь дело с бумажными изданиями и документами: журналами, книгами, письмами, служебными записками и т. д. Чтобы в работе с информацией такого рода тоже можно было использовать компьютер, необходимы средства преобразования бумажных документов в электронную форму.

Если предполагается, что документ содержит в основном текстовую информацию, то можно выделить следующие основные этапы такого преобразования:

в ходе сканирования при помощи устройств оцифровки изображения производится создание электронного образа (изображения) документа;

процесс распознавания позволяет преобразовать электронноеизображение в текстовые данные (с сохранением элементов форматирования оригинала или без них);

для документов, исполненных на иностранном языке применяют дополнитель ные средства автоматизированного перевода на другой язык.

Преобразование документов в электронную форму

Сканирование документов

Процесс создания электронного изображения бумажного документа напоминает его фотографирование и требует применения соответствующего устройства. Сегодня в качестве такого устройства выступает сканер. Такие устройства, как цифровые камеры, пока не могут обеспечить для документов стандартного формата качество изображения, которое гарантировало бы их надежное распознавание.

Основной рабочий элемент сканера включает источник света, используемый для освещения документа, и светочувствительную головку, воспринимающую отраженный свет. Универсальные сканеры, в отношении которых нет специальных требований по функциональным возможностям, качеству и скорости сканирования делятся на три основные категории.

Ручной сканер протягивается над Поверхностью документа вручную. Он обеспечивает минимальное качество сканирования, в частности, непригоден для сканирования документов, содержащих иллюстрации.

Листовой сканер способен сканировать отдельные страницы, протягивая их мимо светочувствительного элемента. Его недостатком является невозможность сканирования книг и журналов без разборки на отдельные страницы.

В планшетном сканере подвижный светочувствительный элемент перемещается в ходе сканирования внутри корпуса устройства. Сканируемый документ располагается напротив прозрачного окна в корпусе прибора. Этот вид сканера лишен недостатков, присущих типам, рассмотренным выше.

Сканер является внешним устройством и подключается к компьютеру через специальный разъем. При высоком разрешении и большой площади сканируемого документа объем передаваемых данных оказывается очень большим и требует производительной линии передачи. Малопроизводительные сканеры используют порт принтера. Наиболее быстрые устройства подключаются через интерфейс SCSI (Small Computer System Interface).

Разные модели сканеров понимают разные управляющие команды. Чтобы избежать разнобоя, был принят универсальный стандарт взаимодействия сканера и приложений. Этот стандарт называется TWAIN. Приложение посылает команды драйверу TWAIN, который преобразует их в инструкции, распознаваемые сканером. Таким образом, для приложения перестает иметь значение конкретная модель сканера. Операционная системаWindows 98 поддерживает интерфейс TWAIN, а все современные сканеры совместимы с ним и предоставляют необходимые драйверы нижнего уровня.

Сканирование через посредство интерфейса TWAIN осуществляется следующим образом. Сначала следует включить сканер. Команда сканирования располагается в приложении в меню Файл .(например, в программеImaging соответствующий пункт так и называется – Сканировать). После выбора этой команды открывается диалоговое окно драйвера TWAIN, вид которого зависит от модели сканера (рис. 17.1). В этом окне задают параметры сканирования: черно-белый или цветной режим, разрешение, коррекция яркости и контрастности. Большинство сканеров позволяют также произвести предварительное черновое сканирование с низким разрешением и по его результатам точно задать область сканирования – часть страницы документа.

После настройки всех параметров следует щелкнуть на кнопке Сканировать (надпись на кнопке может быть иной). Процесс сканирования происходит автоматически, и изображение передается в приложение. Диалоговое окно драйвера TWAIN автоматическине закрывается, так что, например, в многооконных графических редакторах (таких как Adobe PhotoShop) можно сразу провести сканирование нескольких изображений.

Распознавание документов

Этап распознавания документа состоит в преобразовании электронного изображения (фактически набора цветных или черно-белых точек) в текстовый документ. Ранее для описания этого процесса обычно использовался термин OCR (Optical Character Recognition), который соответствует одному из используемых методов. При таком подходе происходит “сравнение” элемента изображения с эталонными вариантами начертания символов, после чего выбирается наиболее подходящий символ. Этот подход требует использования специального комплекта шрифтов, но дает на нем наилучшие результаты. Современные алгоритмы распознавания не привязаны к конкретному начертанию символов, так же, как человек способен узнавать буквы при любых начертаниях (и даже при значительных искажениях).

В ходе распознавания сначала в изображении выделяются крупные элементы текста: колонки, абзацы, отдельные текстовые блоки (например, подрисуночные подписи), ячейки таблиц. Этот этап называют сегментацией, он может выполняться автоматически или вручную. После этого выполняется автоматический этап распознавания:

блоки разбиваются на строки, строки – на отдельные символы, каждый из которых распознается независимо и помещается в итоговый текстовый документ.

Автоматизированный перевод документов

К средствам автоматизации перевода можно отнести два вида программ: электронные словари и программы перевода. Электронные словари представляют собой средства для перевода отдельных слов, отображаемых на экране или имеющихся в документе. Удобство их использования состоит в возможности немедленно получить перевод неизвестного слова без поиска его в отдельном толстом томе. Программы перевода получают на входе текст, выполненный на одном языке, и выдают текст на другом языке, то есть автоматизирует перевод текста.

Электронные словари удобны для профессиональных переводчиков, которые выполняют большую часть работы по переводу вручную. Их также могут использовать лица, в целом знающие иностранный язык, если надо не обеспечить перевод документа, а просто ознакомиться с его содержанием.

Надежный и качественный автоматический перевод документов с одного языка на другой (мы будем говорить в основном о переводе с английского на русский) пока остается недостижимым идеалом. Причин для этого множество, и главная из них состоит в том, что перевод текста не сводится к переводу отдельных лексических единиц. Преодолеть этот барьер современные программы автоматического перевода пока не могут.

Тем не менее, современные средства автоматизации перевода достигли того уровня, который позволяет эффективно использовать их на практике. Дело в том, что технический текст, в отличие от художественного,использует ограниченное число языковых конструкций и более ориентирован на однозначную интерпретацию. Среди используемых лексических единиц встречается большое число технических терминов, имеющих совершенно определенный смысл в рамках данной научной или технической дисциплины. Это значительно упрощает процесс перевода и позволяет в отдельных случаях автоматически получать текст, близкий к результату ручного подстрочного перевода.

Программы автоматического перевода имеет смысл использовать для перевода технических текстов в следующих случаях:

  •  при абсолютном незнании иностранного языка;
  •  при необходимости получить перевод быстро, даже ценой снижения его качества (например, это относится к переводу Web-документов);
  •  для перевода на иностранный язык (умения читать иноязычные тексты недостаточно, чтобы научиться объясняться на иностранном языке);
  •  для быстрого создания первоначального черновика (“подстрочника”), используемого в ходе подготовки полноценного перевода.




1. ТЕМА- Витамины. Нормы питания
2. этика ненасилия воспринимается как тавтология и часто порождает недоуменный вопрос-1
3. Реферат- Учение Гегеля о бытие
4. История становления и развития экономической теории
5. реферат дисертації на здобуття наукового ступеня кандидата педагогічних наук КИЇВ ~ Д
6. тема сохранения жизни и здоровья работников в процессе трудовой деятельности вкл
7. Сущность аудита, его цель и задачи
8. КОНТРОЛЬНА РОБОТА з дисципліни ldquo;Корпоративна соціальна відповідальність Охорона праці в галузіrdquo
9. ПРАВОВЫЕ ОСНОВЫ ГОСУДАРСТВЕННОЙ СЛУЖБЫ В ОРГАНАХ ВНУТРЕННИХ ДЕЛ
10. Петербурга
11. А Открытые торги на конкурентной основе Анализ это- D Метод познания который предполагает разделение це
12. Определение витамина В12 в биологических объектах
13. Механизмы срочной адаптации спортсменов к воздействиям физических нагрузок
14. Заслуженное если подходить к ней с критериями принятыми для спринтеров
15. то что обычно видят в нём люди
16. Пояснительная записка Учебнометодический комплекс по дисциплине Методика преподавания физической культ
17. Простые механизмы.html
18. По теме Память ее виды и условия формирования Выполнил- студент 3 курса факультета ТИ1
19. Каковы принципиальные отличия амниот от анамниот наличие дополнительных эмбриональных оболочек- амн
20. а Порядок возбуждения уголовного преследования Уголовное преследование