Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

аналитика синтетической обработки

Работа добавлена на сайт samzan.net:


 Аналитику необходимо понимать в широком смысле, т.е. распространяя ее практически на все сферы коммуникативной деятельности, при этом мы исходим из определния языка как материального воплощения информации и рассматриваем его как деятельность, связанную с материальными результатами. Достижение этих результатов может идти разнообразными способами, в частности способом перевода. Исходя из представления о языке в лингвистике как о деятеле, большинство процессов получения информации ее обмена можно описать в терминах "аналитика синтетической обработки". В этом смысле не требует дополнительных пояснений отношение к аналитико-синтетической обработке материализованной информации, под которой принято подразумевать классификацию и систематизацию, направленные на кодирование, библиографическое описание и аннатирование информации, обобщение, реферирование и перевод с одного языка на другой. Во всех этих случаях результатом аналитико-синтетической обработки информации является вторичная информация. Но и порождение первичной информации в любом виде непосредственно связано с аналитико-синтетическим процессом. Если источником вторичной информаии служит информация первичная, то источником последней является целенаправленная трудовая деятельность. С позиций понимания коммуникативной деятельности, в результате которой возникает первичная информация, текст оказывается первичным, коммуникативным инструментом. Первичная коммуникотивная деятельность состоит из совокупности этапов, главные из которых это ориентирование в условиях достижения цели коммуникации, слечения полученного результата с намеченной целью и отображения коммуникативной деятельности, например в виде текста. Продуктом первичной коммуникативной деятельности и ее предметно-знаковом продолжении является текст. Перевод полностью относится к сфере речевой деятельности, сохраняя все ее специфические особенности, главные из которых обусловлены тем, что он осуществляется в среде двух языков. С позиции аналитико-синтетической обработки информации примим следующее определение перевода: Перевод - есть вид специализированной речевой деятельности, опирающийся на использование двух языков в целях воссоздания на одном языке речевых высказываний, эквивалентных по форме и содержанию речевым высказываниям на другом языке. Аналитико-синтетический процесс складывается из трех основных этапов:

  •  анализ информации
  •  ее переработка
  •  и синтез вторичной информации

 Вторичная информация - понятие относительное и специфическое. Перевод, как документ в любом виде в системе обмена информацией в конкретной предметной области может быть признан первичной информацией. С позиции аналитико-синтетического процесса специфика перевода заключается еще и в особом соотношении предметов анализа и синтеза. Основные характеристики такого соотношения - эквивалентность и адекватность. И по форме и по содержанию перевод (вторичная информация) призван адекватно замещать источник (первичную информацию). Традиционно мировой лингвистикой рассматривались три жанра письменного перевода:

  •  художественный (литературный)
  •  специализированный (научный)
  •  библейский (библейские тексты)

В настоящее время специально перевод принято распределять на множество предметных направлений:

  •  политический 
  •  юридический
  •  технический
  •  медицинский
  •  военный

И т.д. Все эти основные направления укладываются в три сферы:

  •  буквальный перевод (духовная литература)
  •  свободный перевод (художественная литература)
  •  прагматический трансфер (тематических материалов для информационных процессов)

Многие десятилетия научный подход к теории перевода стремится идти по пути его компьютеризации. Уже внедрены существенные достижения, но от чисто математического подхода 60-х годов теория постепенно возвращается в лингвистику: по сей день основными остаются две классические области (семантика и дискурс). Эти области лингвистики имеют большое значении не только для теории, но и для практики перевода. Понимание текста как коммуникативного дискурса стало исходным условием многих плодотворных теорий перевода. Коммуникация реализуется посредством текста (невозможно перевести адекватно изолированные слова или даже предложения пока они не станут частью полного дискурса, который обычно входит в контекст ситуации). Кроме того важно отметить, что перевод дискурса возможен только в том случае, если известны эквивалентные структуры в том языке на котором осуществляется перевод, а это знание складывается из сравнения из сопостовительной лингвистики или точнее из контративной текстологии. Чтобы перевести отдельные предложения какого-либо сообщения необходимо знать не только то имеются ли в передающем языке и в языке перевода соотносящиеся лексические и грамматические единицы, но и то, какие стилистические условия приняты в тексте сообщения. Это положение преобретает серьезное сдерживающее значение для автоматизации и компьютеризации процессов перевода. Если для правильного понимания предложения и его перевода надо учитывать весь окружающий текст, то следовательно система машинного перевода (или автоматический переводчик) должна каким-то образом сверять перевод каждого предложения со всем переведенным текстом, но это действие требует достаточно развитого интелекта, которым еще не обладает ни одна компьютерная система.

Модели процесса перевода.

Одним из самых устойчивых затруднений является то, что в процессе перевода нет прямого доступа к действиям переводчика. Все исследования основываются на косвенных фактах в виде продукта или результата процесса. Перевод - это процесс и продукт, предмет и цель исследования, творчество и его результат. Самым привлекательным направлением в теории перевода является выход за пределы сравнений различных версий перевода. Коммуникативная или социо-лингвистическая точка зрения на перевод позволяет выполнять исследования завершенного текста, а не его отдельных избранных исследовательных документов. Предшествующие ей взгляды на процесс перевода (в различные периоды долгой истории перевода его трактовали и как метоморфозы, и как замены и интерпритации) не могли учесть большую часть переменных в этом сложном процессе. Следует иметь в виду, что перевод - это особый вид коммуникации, отличающийся прежде всего тем, что в него включены, по меньшей мере, два кода (два языка или два диалекта). Модели этого процесса должны отражать взаимные отношения между различными коммуникационными системами.

Основные теорические модели перевода.

Ситуационная модель перевода.

Это модель описывает процесс перевода в терминах эквивалентности. Основной ее особенностью является то, что она учитывает условные стили в ассоциации с различными коммуникативными ситуациями, т.е. при переводе текста необходимо найти ситуационно-эквивалентный параметр в другом языке. В дальнейшем процесс развивается через ситуационную эквивалентность и по своей методике близкой к стилистической адоптации. Большая часть политических переводов выполняется по этой модели, т.к. политический дискурс маркирован четче других и его обычно ожидает больше совпадений в других языках. Некоторые лингвисты представляют аналогичную модель в терминах грамматики предложения и она эксплицирует (сопровождает) лингвистические процедуры, которые могут быть востребованы для достижения "динамической эквивалентости" между передающим языком и языком перевода сообщений.

Исходный текст

Глубинные структуры, анализ смысла

Трансфер

Синтаксические структуры, передача смысла

Текст перевода

Эквивалентность рассматривается здесь не как случайные совпадения, а как результат управляемого когнитивного процесса, который может быть доказан лингвистической теорией.

Многоуровневая модель перевода.

Среди известных моделей перевода привлекает к себе внимание идея многоуровневой иерархической структуры, которую многие лингвисты рассматривают как релевантную (важную) процессу понимания перевода. Модель Кэтфорда Холлидея выделяет мысль о том, что эквивалентность перевода зависит от возможности формального совпадения между лингвистическими единицами на различных структурных уровнях (формальные, грамматические, лексические, фонетические, графические). Процесс перевода в данном случае развивается через формальные соответствия, но способы достижения эквивалентности эта модель не раскрывает. 

Коммуникативная модель перевода.

Это модель, предложенная Гертом Ягером, включает в себя реалии дискурса и его анализ в терминах лингвистики и семиотики. Первостепенно-важным компонентом в нижеязыковом посредничестве здесь признается переводчик и его билингвальная компетенция. Он единственный интерфейс в этой коммуникации, работающий в режиме переключения. Процесс перевода развивается через способность переводчика к декодированию и кодированию, который он достигает различными методами обучения письменному и устному переводу. Это модель представляется слишком жесткой, чтобы воспринимать комплексность перевода как набор интегрированных процессов.

Комплексная модель перевода.

В этой модели обусловлены все факторы, которые должны быть учтены для того, чтобы дискурс перевода мог квалифицированно представлять лингвистическую теорию перевода. Однако из нее не следует явно насколько учтены психо-лингвистический трансфер или семиотическое перекодирование. Если вернуться к определению билингвального контакта, то становится понятно место этих лингвистических параметров в рассматриваемой модели. Соответствия, которые могут наблюдаться по завершению этих процессов между лингвистическими единицами, встречающимися в параллельных текстах, являются результатом сознательного или подсознательного выравнивания (переключение кодов) если переводчик счел его необходимым средствами ссылок на внутренние факторы дискурса и внешние объекты или события, а не формальностями, обусловленными взаимным соответствием двух языковых систем. 

Аппроксима́ция, или приближе́ние  научный метод, состоящий в замене одних объектов другими, в том или ином смысле близкими к исходным, но более простыми.

Итак, перевод является открытой, гибкой, вариативной процедурой и критерии оценки его эффективности должны включать степень практической реализации билингвальной компетенции, знания внутриязыковых условий переключения и осведомленность в предметной области к которой относится предмет коммуникации. Большинство моделей до сих пор учитывали роль переводчика в процессе перевода как некий «черный ящик» или как «декодирующий\кодирующий» аппарат перевода. В действительности переводчик, на основе своего интеллектуального потенциала, используя всю билингвальную компетенцию, принимает участие как в ситуационном контексте адресанта, так и в ситуационном тексте адресата, как можно больше аппроксимируя (приближая) и минимально (но согласуясь с предметом текста) используя в любой конкретной ситуации формальные и стилистические условности каждой языковой системы. По этой модели процесс перевода развивается от одного дискурса к другому через коммуникативную компетенцию билингва, который не всегда является профессиональным переводчиком. При этом происходит поиск эквивалентности на всех уровнях (от синтагматико-грамматического до прадигма-симантического). Способность к аппроксимации посредника содержит в себе аналитический компонент по отношению к тексту на передающем языке и его адресанту и синтетический компонент по отношению к тексту на языке перевода и его адресату.

Типы переводов.

Традиционное разделение переводов по типу жанров (библейский, литературный, специальный) можно справедливо критиковать за чрезмерную ориентированность на стилистические критерии. По своему участию в коммуникации перевод должен рассматриваться с позиции факторов, определяющих успех или неуспех в коммуникации, проблемы и практические аспекты перевода изменяются, например в диапазоне видов взаимодействия между адресантом и адресатом. Они могут зависеть от занимаемых социальных положений (автор-читатель, профессор-студент), во всех этих случаях цель перевода будет сильно отличаться. И самые большие отличия будут связанны с прагматическим компонентом. Другим обусловливающим фактором является тип ситуации. Прагматический контекст вносит большие различия в формы речи, например в зависимости от национального и политического климата, образовательного уровня, традиций билингвальных контактов внутри языка и в отношениях с другими языками. Особо значимым фактором является переводчик (вне зависимости от профессиональности и т.п.). В любом случае процедуры, которые он выполняет для своей работы, не могут быть унифицированы (нельзя загнать в рамки). Они могут варьироваться в широких пределах, от буквального перевода до резюмирования, от калькирования до полного переосмысления сообщений. Возникают проблемы – нет возможности оценки адекватности перевода. Качество перевода оценивается по ситуациям адресанта и адресата, по типам текстов и билингвальной компетенции устного и письменного переводчика. Единственно реальной выполнимой методикой обеспечения стабильного качества перевода является подбор-переводчик по его билингвальной компетенции для выполнения конкретной работы и последующее контрольное редактирование. Качество перевода находится в прямой зависимости от оценки текста оригинала, билингвальной компетенции переводчика и требований (ситуации) адресата перевода. Те же принципы лежат в основе переводческого сервиса, предлагаемого «Бюро переводов комиссии европейского сообщества». Его технологии отличают то большое значение, которое предается оценке требований заказчика, что заметно усиливает роль прагматического документа. Там различают пять категорий перевода:

-«Сырой устный» перевод (rough oral ). В целях извлечения исходной информации. Часто выполняется переводчиком в присутствии заказчика.

- «Содержательный» перевод (abstracting the contest). Для получения полной информации о содержании сообщения на передающем языке.

-«Сырой письменный» перевод (rough written). В служебных целях для последующей аналитической обработки.

-«Чистовой» перевод (careful written). Для документального использования и длительного хранения.

-Текстовой перевод. Аутентичный (подлинный) перевод с учетом многоязычного производства этой международной организации.

Прагматика термин языкознания, обозначающий раздел семиотики, изучающий отношения между знаковыми системами и теми, кто их использует.

Аутентичный – действительный, подлинный.

Все это доказывает жизненную стойкость типологии перевода и переводческого труда в отрыве от грамматического и лексического анализа текста, но со строгим контрастивным текстологическим анализом. 

Лингвистический ингредиент.

Перевод – это понятие очень широкое, вмещающее в себя самые различные результативные уровни, а именно – от художественного перевода, связанного со сложнейшими творческими процессами, до буквального перевода отдельных фрагментов информации. Соответственно использование средств компьютеризации текстовой деятельности в художественном переводе, обретают характер вспомогательного инструментария. Скорее всего в этом виде перевода технологический подход будет невозможен, хотя создание информационно-справочной базы и умение пользоваться ею продуктивно поможет и переводчику художественной литературы. Тексты, описывающие технологии и продукты этих технологий, сами становятся частью таких технологий и частью таких продуктов. Обязательный, неотъемлемый элемент любого товара – это инструкция для пользователя на языке страны его реализации. Такие тексты по своей сути являются лингвистическим ингредиентом материального продукта или технологии. Обычно эта часть товара требует перевода на другие языки, следовательно для создания и обработки таких текстов (редактирования, аннотирования, перевода) вполне можно использовать технологический подход. Лингвистический ингредиент может быть представлен в виде сопутствующей текстовой информации, веб-страницы и рядом других форм. При экспорте\импорте продукта возникает непростая проблема перевода лингвистического ингредиента и адаптации его в другой языковой культуре. Это означает что кроме перевода неизбежно решение еще многих задач, связанных с оформлением текста, а именно строжайшее сохранение его форматов или наоборот, изменение форматов в соответствии с другими правилами, сохранение или изменение иллюстративного материала, транслитерация некоторых надписей. Лингвисты считают, что перевод (как репродукция на другом языке) составляет лишь 25% всех трудозатрат по переработке лингвистического ингредиента при экспорте\импорте товаров, услуг и технологий. Для организации современной технологии перевода важно разделить всевозможные технологические операции на две группы: «ручные» (доступные только человеку) и «формальные» (рутинные), подлежащие автоматической интерпретации с помощью компьютера. К сожалению, такое деление не может быть абсолютным, а производиться лишь с большой долей вероятности. Четкой линии раздела мы добиться не сможем, но более менее технологичное распределение «обязанностей» между переводчиком и компьютером в современном мире вполне достижимо. Существует множество «рабочих» определений перевода как деятельности и как продукта этой деятельности каждый автор такого определения подчеркивает в нем те параметры, которые важны для него при решении поставленных задач. В самом общем смысле под переводом до недавнего времени мы понимали процесс, в результате которого смысл, стиль и целенаправленность текста на одном языке с наибольшей полнотой репродуцируется на другом языке. Этому определению вполне соответствовала ситуация, когда в обязанность переводчика входило представить конкретный текст на другом языке. В своей работе он мог использовать пишущую машинку, несколько словарей, а в лучшем случае консультировался с авторами исходного текста для уточнения смысла и терминологии. Производительности всего процесса определялась почти исключительно персональной квалификацией переводчика. Для ее повышения не было никаких объективных возможностей, но и объемы переводов были не такими огромными, с какими имеем дело сейчас. Новые товары появлялись редко, не часто происходило обновление уже существовавших моделей.

Пример: если всего 25-30 лет назад для чистки зубов был выбор между зубным порошком и пастой, то сейчас, почти ежедневно, мы знакомимся с рекламой все новых и новых сортов, видов и разновидностей зубных паст. На их упаковках содержится исчерпывающая информация о составе, дается инструкция по употреблению, рекомендация по хранению и т.п. Без подобного лингвистического ингредиента товар просто перестает существовать. Никому не придет в голову купить белый тюбик, в котором будто бы, согласно самому искреннему уверению продавца находится зубная паста. 

Запросы на переводческую продукцию резко возросли вместе с объемами промышленного производства. В переводческом бизнесе так же произошли изменения, появились компьютеры. Даже самое простое, неспециализированное программное обеспечение позволяет редактировать тексты и печатать их без тех проблем, что были связаны с печатными машинками. Но все же человеческий фактор в переводческом бизнесе заменить или хотя бы изменить его роль практически невозможно. Считается, что человек может перевести в день около 2000 слов независимо от того будет ли он создавать текст с помощью простой шариковой ручки, пишущей машинки или компьютера. Но стал совершенно иным характер промышленного производства, появилось много однотипных товаров, сопровождаемых сходными лингвистическими ингредиентами. Тексты, разъясняющие особенности новых разновидностей товара в значительной мере повторяются. Зачастую они представляют собой прежние тексты в новой редакции. 

Ученые, занимающиеся исследованиями компьютеризации текстовой деятельности считают, что очередной, обновленный промышленный продукт, а следовательно и его описание, отличаются от его предыдущей версии в среднем на 30%. Большинство текстов сопровождающих продукцию, представляют собой лишь редакцию нового текста, который уже был переведем. Это позволяет переосмыслить организационные процессы в переводческом бизнесе и подсказывает пути автоматизации повторного перевода с помощью специализированных программных средств, а именно переводческого инструментария. Так появился целый класс сервисных программ под названием «переводческие инструменты». В отличие от систем машинного перевода эти программные средства самостоятельно никаких переводческих функций не выполняют, но они оказывают эффективную организационную поддержку переводческого процесса, создают комфортную среду, беря на себя рутинные операции, повышая производительность труда переводчика. К таким программным средствам прежде всего относятся системы, накапливающие в памяти, фрагменты текста и варианты их переводов, это своеобразная память выполненных переводов. Во всем мире такие компьютерные программы называют translation memory или сокращенно tm-tools. В российском переводоведении их обычно называют тм-инструментами. Кроме них так же широко распространены компьютерные «системы терминологического обеспечения» (terminology management systems). Эти системы автоматически просматривают исходный текст и предлагают варианты переводов терминов, которые уже были приняты переводчиком в выполненных ранее и внесенных в память системы перевода. Существует еще целый класс сервисных программ для упрощения условий перевода и редактирования текстов в специфических форматах, например тексты веб-страниц, насыщенных дополнительной информацией (знаки форматирования, ссылки), которые затрудняю применение средств автоматизации перевода. Сервисные программы берут на себя решение проблемы конвертирования электронного текста в удобную для перевода форму, а затем уже в переводе восстанавливают все прежние специфичные знаки форматирования. Таким образом происходит подстановка текста на другом языке при полном сохранении внешнего вида страницы. 

Самостоятельный класс программ представляет собой автоматические переводные и толковые словари, энциклопедии и справочники. 

Д\з: сочинение об Оренбурге (10-15 предложений) слова: университет, достопримечательности, мост, город, исторчиеский; работа в ворде(заголовок в вордарте, колон-титулы с именем, текст найти любой и перевести с русского на англ (или наоборот), подобрать несколько инструкций по использованию однотипных товаров (на английском) (основное задание), в подобранных инструкциях подчеркнуть термины и определить  а) количественное соотношение терминов и слов общей лексики в каждой инструкции б) соотношение повторяющихся в разных текстах терминов и общего кол-ва терминов во всех инструкциях; попытаться количественно (в процентах) оценить совпадение этих текстов (будем делать тут).

ICQ

  1.  Download and install Trillian, which you can find at the Cerulean Studios website (see Resources below). Once installed, simply run it from your Start menu or double-click the Trillian desktop icon.
  2.  Add your ICQ account(s) you use to Trillian using the "Manage My Connections" menu option. Just enter your ICQ number and password into the text boxes. If you don't already have an ICQ account, click the "Register for a New Account" button and go through the account creation process via ICQ.
  3.  Click "Connect" to use your ICQ account in Trillian. If you've enabled Auto-login then it will connect automatically to ICQ whenever you restart Trillian. When you first add your ICQ account you can click the "Automatically connect to this account at startup" check box to enable the feature.
  4.  Send ICQ users instant messages by double-clicking their names, typing your messages in the text boxes and pressing "Enter" once you're done.

Skype

  1.  In Skype, click the Contacts tab.
  2.  Find the person you want to call. If you have lots of contacts, you can type a name into the search box to find the person you're looking for.
  3.  Click the contact. You will see their details in the main window.
  4.  Click Call. The screen changes colour, a call bar appears near the bottom of the screen and you will hear ringing until the other person answers.
  5.  If you don't hear the other person or they can't hear you, click the call quality icon in the call bar (you may have to move your mouse to make the call bar appear).
  6.  To hang up, click the End call button.

Терминологичность информации.

Не меньшее значение для повышения качества и производительности переводческого бизнеса имеет оперативное терминологическое обеспечение. Существует много электронных словарей, которые интегрируются с текстовым редактором «Ворд», они хорошо зарекомендовали себя и получили всеобщее признание и широкое распространение не только среди переводчиков, кроме того они постоянно пополняются. Во многих случаях можно совершенно официально, регулярно, пополнять через интернет лицензионную копию словаря на своем персональном компьютере. 

Периодически и довольно часто в продажу поступают дополненные новые версии имеющихся словарей. Но в современной ситуации этого не всегда бывает достаточно. Многие бюро переводов и индивидуальные переводчики создают свои узкоспециализированные словари терминов и профессионализмов. Все предлагаемые современным рынком электронные переводные словари состоят из множества тематических разделов. Каждый раздел представляет собой словарь, зачастую электронную версию бумажного словаря, при поиске нужного термина можно воспользоваться всеми имеющимися разделами словарей или подключить к поиску лишь некоторые словари из коллекции. Расположив словари в определенном порядке можно организовать иерархию их приоритетов, соответствующую их избранной многозначности. Как правило разработчики предлагают еще и «пользовательский словарь». Этот раздел технически выполнен как и все остальные разделы-словари, но наполнять его терминами и эквивалентами может сам пользователь. Такой словарь будет работать наравне с остальными и с тем приоритетом, которым его наделит сам пользователь. Большинство ТМ инструментов обладают функцией терминологического обеспечения, при обнаружении в переводимом тексте слова или словосочетания, которое было помечено как термин в прежних переводах, ТМ инструмент обращает внимание переводчика на этот фрагмент переводимого текста, таким образом реализуется еще один важный параметр повышения качества перевода, это принцип единства терминологии, который должен неукоснительно соблюдаться. Естественно в условиях локальной компьютерной сети принцип единства терминологии будет четко выдержан всем составом переводческого бюро.

В настоящее время уже существуют готовые терминологические базы данных, которые могут быть подключены к ТМ-инструментам в виде дополнительных, сменных или временных блоков. Как правило такие терминологические базы создаются производителями экспортной продукции при выдачи заказа на перевод сопроводительной документации к своей продукции, фирмы обычно передают переводчику терминологическую базу в виде временного блока для ТМ-инструмента переводчика. Это не только ускоряет процесс перевода, повышает его качество, но и унифицирует документацию в фирме.

Системы машинного перевода.

Обособленную и в высшей степени специфическую группу лингвистического программного обеспечения составляют системы машинного перевода. В отличие от ТМ-инструментов, которые помогают переводчику лишь организованно-рационально использовать его потенциал, системы машинного перевода выполняют перевод, а человек при этом необходим для организации работы компьютера. В связке «человек-компьютер» происходит противоположное распределение функций. В отношении к машинному переводу в настоящее время нет определенности (в любом случае у вас найдутся сторонники). Секрет этого двойственного отношения скрывается в понимании назначения машинного перевода и его целесообразности. Для достижения коммерчески-оправданных результатов применения какой-либо системы машинного перевода, прежде всего необходима мудрость ее пользователя. Но очень часто возникает необходимость принятия оперативного производственного решения по материалом какого-либо объемного текстового массива на иностранном языке. В такой ситуации машинный перевод оказывается единственно правильным способом. Возможно его качество будет невысоким, но тем не менее он даст информацию не только для принятия производственного решения, но и для выделения той части текста, которая в последствии может понадобиться в производственных целях и которую будет целесообразно передать в бюро переводов для выполнения качественного перевода. Современные системы машинного перевода работают примерно по такому же алгоритму, по которому в самых общих чертах работает обычный переводчик. Обычно система выполняет перевод по предложениям, уже на этом этапе возможны потенциальные ошибки. Переводчик видит весь текст или значительный его фрагмент и понимает его контекст, отсутствие контекста порождает ошибки. Далее системы машинного перевода проводят синтаксический анализ для нахождения наиболее вероятного подлежащего, сказуемого и других членом предложения. К сожалению, далеко не все реальные предложения могут корреспондироваться с моделями, имеющимися в блоке синтаксического анализа систем. Подлежащее, выраженное инфинитивом, очень часто интерпретируется системой машинного перевода как сказуемое или его часть и перевод оказывается некачественным. После синтаксического анализа входного предложения на языке оригинала, следует конструирование грамматической конструкции для языка перевода и замена в этой конструкции слов одного языка на эквиваленты в другом языке, но в условиях многозначности ошибки просто неизбежны. В этой кратко представленной технологии машинного перевода можно подметить критические точки, в которых несложно увидеть резервы повышения его качества. Если текст оригинала написан четким логичным стилем, если предложения полные и короткие, то синтаксис текста будет вполне удовлетворительным. 

Если задуматься над лексическими проблемами машинного перевода, то и здесь имеются резервы для повышения качества перевода. Просмотрев текст, направляемый на перевод, лингвист этой системы может указать приоритетный список словарей, которыми должна пользоваться система при переводе. Конечно такие словари должны быть четко распределены по тематике, они требуют постоянной корректировки и добавления, но при современном развитии лексикографии и оснащения ее мощными компьютерными средствами, это перестает быть проблемой.

Найти значение слова лексикография, лексема.

Уже сейчас существует немало фирм, которые готовят свою документацию с учетом того, что она будет переводиться с помощью систем машинного перевода. В таких фирмах выработан свой стиль, ограниченный количеством инструкций и словарем, исключающим возникновение проблем многозначности. При подготовке документа – важным критерием оценки языкового стиля является оценка его переводимости именно той системой машинного перевода, которой располагает данная фирма. Учитываются возможные проблемы и предугадываются ошибки, которые могут быть устранены в процессе постредактирования. Качество машинного перевода и рентабельность его систем значительно повышают две дополнительные технологические ситуации – предредактирование и постредактирование. В процессе предредактирования происходит доработка текста подлежащего переводу. Этот этап напоминает операцию перефразирования, которой часто пользуются переводчики. Мысленно переводчик перестраивает данную фразу в более удобную для переводу форму, упрощает грамматические конструкции, уточняет многозначные лексемы. Как правило, крупные фирмы, издающие довольно большие объемы сопроводительной документации, заинтересованы в переводе своей документации сразу на несколько языков. Тщательная лингвистическая проработка и предредактирование исходного текста, экономически целесообразно, поскольку повышают качество сразу нескольких переводов. Нельзя не учитывать еще и тенденцию к формулизации языка оперативной коммуникации, в электронной почте, в смс, в автоматических подтверждениях о запросах, чаще всего употребляются языковые штампы, что создает выгодную ситуацию для использования систем машинного перевода. Дополнительный шанс для подобных систем предоставляется в связи с новыми тенденциями дел производств. Компьютеризация текстовой деятельности повышает технологичность текстов, упрощает редактирование текста, способствует его дальнейшей формулизации, все это расширяет систему применения машинного перевода. В интернете появляется все больше сайтов, располагающих системой перевода, которой можно воспользоваться в онлайновом режиме. Сейчас уже не стоит вопрос о возможности или невозможности обращения к такому виду перевода, существует только две проблемы: определение целесообразности использования той или иной системы машинного перевода и поиск средств повышения качества получаемого перевода.

Основные принципы локализации при переводе.

Получение текста на другом языке чаще всего еще не означает завершение технологического цикла перевода. Одним из главных условий выполнения качественного перевода является его функциональная равнозначность по сравнению с текстом на языке оригинала. Следует убедиться, что текст перевода занимает ту же позицию, какая отведена оригиналу. Кроме того необходимо, чтобы информационное направление нового текста было выражено языком, привычном для его потребителя. В отдельных случаях еще требуется соблюдение некоторых формальных условий, таких как объем текста, допустимый уровень экспрессивности. Этическая адекватность и тп. Например, текст должен физически умещаться в какую либо рамку на этикетке товара или его звуковая форма по продолжительности должна соответствовать видеоряду рекламного ролика. Довольно часто образность некоторых метафор в разных языковых культурах не совпадает, метафор, переведенных буквально, может сильно повлиять на функциональность всего перевода. Для решения перечисленных проблем, существует специальная технологическая операция – локализация текста перевода.

С такими мелочами как последовательность написания календарной даты, точка или запятая в качестве разделителя в десятичных числах и т.п. могут существенно повлиять на информационную значимость текста. Особенно наглядно такие несовпадения проявляются, например, при переводе, связанным с продажей компьютерного программного обеспечения в другую языковую среду и в другую массовую культуру. Тексты системных сообщений (сообщений об ошибках, тексты меню и служебной информации) распределены внутри программ. Для человека-переводчика будет практически нереально обнаружить все эти текстовые включения: перевести и технически грамотно поместить их в текстах оригинала и перевода. 

Развитие информационных технологий в этом направлении происходило в два этапа: сначала специалисты в области локализации (процессы адаптации к культуре какой-либо страны) пошли по пути создания вспомогательного переводческого инструмента. Это была сервисная программа, которая извлекала из локализируемой программы всю текстовую информацию. После перевода она возвращала соответствующие тексты на языке перевода на прежние места в локализированной программе. 

На современном этапе развития локализации принята другая технология: при разработке программного обеспечения предусматривается сервисный блок, который сразу же собирает все текстовые сообщения в одном месте с соответствующими адресами и служебной информацией, описывающей правила вывода сообщения на экран. Отпала необходимость поиска текстовых включений по всей программе, повысилась надежность самого программного обеспечения и упростилась его адаптация, произошло приближение к традиционной технологии перевода. Выполняется требование предпереводческой подготовки материала, направленного на перевод. Это совпадает с операциями предредактирования в машинном переводе или перефразирования в традиционном переводе.

Даже не подозревая этого, мы сталкиваемся с аналогичной ситуацией, когда нам необходима информация из интернета. Любая страничка в наиболее распространенном формате htlm принципиально ничем не отличается от компьютерной программы, только в ней будет больше текста и меньше команд. Если при подготовке компьютерной программы программист-разработчик уже позаботился о этапе предредактирования и упростил работу переводчика, то страничку из интернета никто заранее не готовил для перевода. Но для переводчика, владеющего ТМ-инструментом, проблем здесь не прибавится. Все современные ТМ-инструменты располагают сервисной программой, которая может нейтрализовать специальные команды языка ahtml (теги) на время перевода и восстановить их действие в тексте перевода после завершения всех переводческих операций. Такая сервисная программа в составе ТМ-инструментов называется фильтром. Наиболее универсальные ТМ-инструменты имеют в своем составе достаточно большое кол-во фильтров, так как в различных информационных технологиях могут использоваться самые разнообразные форматы использования текста. Одна из важнейших проблем, относящихся к локализации – несовпадение объема текстов на различных языках. Приведем простой пример: словосочетание «японский язык» в русском языке представлено 13 символами, на английском «japanese language», на японском будет 3 иероглифа. Конечно иероглифы сложнее кириллицы или латыни, но места они занимают гораздо меньше.

Огромной проблемой становится так же подбор более удобного синонима или способа сокращения текста. Даже европейские языки, зачастую имеющие общее происхождение, могут различаться объемами содержательно одинаковых текстов на 30-35%. Если необходимо перевести довольно большой текст, для управления объемом могут быть использованы обычные редакторские способы, в чем переводчику помогут навыки экономии выразительных средств. Существуют и более сложные адаптации текста перевода в другой языковой среде и культуре. Среди них одна из наиболее понятных – это оформление текста. Можно назвать немало языков, участвующих в тексте, в котором направление строк не совпадает слева направо и наоборот, горизонтальное направление и вертикальное. Для решения таких проблем уже недостаточно владения навыками подбора более удачных синонимов или какими-то особыми редакторскими приемами. Переводчику приходится обращаться к специальным программным средствам локализации перевода. Многие системы локализации основаны на тех же принципах действия что и ТМ-инструменты (действия по подобию), в них расширены функции форматирования, добавлены функции графического редактирования (например, программы могут предоставить возможность изменения размеров информационных окон для вывода требуемого объема текста, автоматически ввести функцию прокрутки текста при невозможности изменения размеров окна и т.п.). Современная система локализации позволяет выполнять все эти действия вне зависимости от разработчика продукции, руководство по использованию которой переводится на другой язык, т.е. для этого не требуются исходные файлы. Системы могут так же изменять информацию, сопровождающую готовую продукцию. Для того, чтобы обеспечить своей продукции более широкий рынок многие дальновидные разработчики предусматривают вероятность последующего перевода в сопроводительных текстах на другие языки и необходимость адаптации в другой языковой культуре. Так японцы иероглифические тексты традиционно пишут строками сверху вниз, а строки располагают справа налево. Но в технической документации иероглифическое написание соответствует европейской традиции представления текста, что упрощает процессы локализации.

Рентабельность (степень эффективности) технологий перевода.

В деятельности бюро перевода производственного предприятия могут сложиться две принципиально разные ситуации: в одной из них переводы выполняются с иностранного языка на родной, для того, чтобы воспользоваться товарными или технологическими преимуществами поставщика из другой языковой среды; во второй – переводы делаются на иностранные языки для продвижения отечественной продукции и ее услуг на международном рынке. Обе ситуации должны стремиться к сближению. Продвижение своего товара, как правило, сопровождается предоставлением документации на языке рынка продаж, а потому и исключает необходимость его перевода. По интенсивности преобладания второй ситуации, современные бюро перевода делятся на четыре категории:

  1.    Бюро, которые выполняют перевод документации для «событийной» презентации продукции предприятия, подготавливая, так называемый, «пилотный» комплект документации. В подобном случае не приходится ожидать высокой рентабельности процесса перевода, это будет штучный перевод и его технологичность практически невозможно повысить никакими автоматизированными средствами, если не брать в расчет, ставшими уже обязательными переводческими инструментами, электронные словари, справочники, энциклопедии и информационные ресурсы интернета. Но такой перевод обнаружит «узкие» места и в подготовке оригиналов документов и в самой организации процесса перевода. Если будут зафиксированы все «ввод на будущее нужно учесть…» то такое бюро перевода сможет претендовать на место в следующей категории.
  2.   Бюро, которые способны влиять на качество подготовки оригиналов и корректировать свои технологические процессы в зависимости от особенности представляемых текстов. Это способствует выработки характерного стиля работы бюро переводов. Документация всей последующей модификации продукции выдерживается в одном стиле, а расширяющийся ее ассортимент узнается по единому стилю всего товарного ряда. Технология такого бюро перевода уже не может обойтись без внедрения ТМ-инструментов. 
  3.   Для завоевания позиции в следующей категории необходимо адекватное реагирование на потребности и особенности рынка, особое значение при этом приобретают презентативные и культурологические проблемы перевода, при решении которых невозможно обойтись без внедрения систем локализации.
  4.   К высшей категории относятся те бюро перевода, которые способно оперативно реагировать на любые изменения в политике продвижения продукции своего предприятия: выполнять редактирование документации в процессе модификации продукции, осуществлять локализацию в зависимости от изменения рынка, оперативно подготавливать дупликации на другие языки и проводить унификацию документации одновременно на всех предполагаемых к использованию языка. Такое бюро приобретает функции унифицированной, мультиплексной службы, для которой характерно использование сетевых версий всех видов программного обеспечения переводческой деятельности. 

Приведенная категоризация никак не связана с качеством выполнения переводов, предполагается, что в любом из рассмотренных случаев конечным продуктом деятельности бюро переводов будет качественный перевод документов на другой язык. Выделение обозначенных категорий характеризует технологичность переводческого процесса и степень его оснащенности новыми информационными технологиями. Главными основаниями для внедрения для внедрения дорогостоящих технологий являются объемы переводческой деятельности бюро и интенсивность, и разветвленность экспортной политики организации. По параметрам рентабельности, то или иное бюро переводов может достаточно уверенно позиционировать себя в любой из описанных категорий, объективно соотнося свою деятельность с объемами производства и долей лингвистического компонента в его продукции. 

Закрытое и открытое программное обеспечение.

Современное переводческое программное обеспечение в целом делится на два класса: системы автоматические и автоматизированного перевода (CAT computer added translation), представителями которых являются переводческие редакторы, программы управления терминологии, в том числе электронные словари, и системы памяти переводов (TM translation memory). Автоматический перевод сделал возможным быстрый и дешевый перевод, но остается много проблем: дело в том, что языки – сильно зависят от контекста и различных коннотаций слов и словосочетаний. Не всегда возможно предоставить полный текст, поэтому MT ограничены некоторыми ситуациями: всегда необходимо последующее редактирование. Сейчас МТ не стремится полностью заменить людей-переводчиков, а САТ – это перевод при помощи компьютера, используя специальные программы.

Переводческие редакторы или translation editors – это программы, которые делают удобным сам процесс перевода, организуя рабочее место переводчика. Терминологические базы, используется в виде электронных словарей. Что касается памяти переводов ТМ, то это лингвистическая база данных, в которых хранятся исходные тексты и их переводы. Тексты эти разделены на сегменты, которые часто совпадают с предложениями. ТМ позволяют облегчить перевод: система запоминает переведенные фразы (сегменты) для будущего использования. САТ (как и ТМ, так и корпусы и терминологические базы) основываются на том, что цифровые документы обеспечивают возможность произвольного доступа к информации. Стало возможным анализировать предложения исходного текста, анализировать контекст, кроме того любую часть перевода можно модифицировать в любой момент. Переводчику стало легче, поскольку он свободен проделывать и отменять изменения в ходе работы. Зачастую сам переводчик выбирает, какой именно способ перевода (или их комбинацию) использовать. 

Виды перевода:

-автоматический

-память перевода (автоматизированный)

-ручной перевод

Факторы выбора способа перевода:

- Скорость

- Объем

- Тематика

- Точность (full dress или information only)

- Последовательность словоупотребления

- Стоимость

Есть проекты типа translation router, которые помогают переводчику решить как лучше переводить данный текст – в ручную или использовать МТ. Маршрутизатор – система, отвечающая за принятие решений о выборе наилучшего пути на основе нескольких критерий.

Разработка программного обеспечения как научное исследование.

Особенность программного обеспечения состоит в том, что оно производиться в одной форме, а именно в виде исходного текста (source code), а распространяется и используется в другой, в виде двоичной программы, машинных кодов, по которым невозможно восстановить исходный текст. Чтобы изменять программу, исправлять ошибки или просто точно установить что и как делает программа, необходимо располагать ее исходным текстом. Первоначально создание программного обеспечения компьютеров было в первую очередь академическим занятием для специалистов в области компьютерной науки (computer science) каждая программа представляла собой результат научного исследования. Это означает, что исходный текст программы был обязательно доступен всему научному сообществу, поскольку любой научный результат должен подтверждаться другими исследователями и быть открытым для критики. Таким образом процесс разработки программного обеспечения более принципиально схож с научным процессом, ученный брал существующие процессы, исправлял их в соответствии со своими идеями и публиковал исправленные программы, в итоге – новый результат.

Программное обеспечение как «собственнический» продукт.

В ситуации, когда программное обеспечение является проектом продажи наравне с предметами обихода, на него автоматически распространяется уже не только законы научной разработки, но и свойства материальных предметов, которыми можно торговать, обмениваться, право владение и пользования которыми стоит охранять законодательно. Так программное обеспечение попало в разряд интеллектуальной собственности: т.е. исходный текст программы стал рассматриваться как произведение, объект применения авторского права. Чтобы защитить свои интересы производители компьютеров и программного обеспечения используют лицензии. 

Лицензия – вид договора между обладателем авторских прав и пользователя (покупателя) программного обеспечения. 

Собственнический программный продукт – наличие у программы собственника, который относиться к ней как к материальному объекту. Собственнические программы называют иногда проприетарными или просто коммерческими.  

Определение свободного программного обеспечения.

Для того, чтобы сохранить модель научного сотрудничества между разработчиками необходимо было обеспечить, чтобы исходные тексты программ, написанных разработчиками, оставались доступными для чтения и критики всему научному сообществу, для этого было сформулировано понятие «свободное или открытое программное обеспечение», в котором отразились принципы открытой разработки программ в научном сообществе, сложившимся в американских университетах в 70-е годы.

Принципы открытой разработки:

  1.  Программы можно использовать с любой целью (нулевая свобода)
  2.  Можно изучать как программа работает и адаптировать ее для своих целях (первая свобода). Условием этого является доступность исходного текста программы.
  3.  Можно распространять копии программы – в помощь товарищу (вторая свобода)
  4.  Программу можно улучшать и публиковать свою улучшенную версию с тем, чтобы принести пользу всему сообществу (третья свобода). Условием этого является доступность исходного текста. 

Только удовлетворяющая всем принципам программа может считаться свободной, т.е. гарантированно открытой и доступной для научного сообщества, однако эти принципы оговаривают только доступность программ для всеобщего использования, критики и улучшения, но никак не оговаривают связанные с распространением программ денежные отношения, в том числе не предполагают и бесплатности. В англоязычных текстах здесь часто возникает путаница, поскольку слово free значит не только свободный, но и бесплатное , и не редко употребляется с программным обеспечением, которое распространяется без взимания платы за использование, но которое совершенно недоступно для изменения сообществом просто потому что его исходные тексты не опубликованы. Такое бесплатное обеспечение не является свободным, наоборот свободное программное обеспечение можно распространять взимая при этом плату, однако соблюдая при этом критерии свободы. А именно каждому пользователю предоставляется право получить исходные тексты программы, изменять их и распространять далее. Всякое программное обеспечение, пользователем которого не предоставляется такое право, является несвободным. Открытый доступ к исходным текстам программ в действительности является ключевым признаком свободного программного обеспечения, поэтому open source soft wear представляется даже более удачным для обозначения феномена свободного программного обеспечения, чем free soft wear. Апофеозом открытого программного обеспечения является система GNU\Linux, практически полностью состоящая из открытых компонентов. 

Сообщество разработчиков и пользователей. 

Однако главные условия существования свободного программного обеспечения не лицензия, а люди, которые готовы делиться текстами своих программ и совершенствовать тексты чужих. Свободное программное обеспечение унаследовало модель открытой научной разработки, а вместе с ней и специфическую организацию сообщества разработчиков и пользователей, в некоторых отношениях напоминающих академическое сообщество. Чтобы лучше продемонстрировать специфику этого сообщества сравним социальные отношения, сопровождающего использования свободного и собственнического программного обеспечения. У любого пользователя программного обеспечения непременно возникают вопросы ,когда он пытается применить его для решения своих задач.Традиционно комерческая модель разработки и использования програмного обеспечения основано на том,что исходные тексты программ являются комерческой тайной производителя,а пользователь получает готовый продукт скомпелированную программу,такая программа является несвободной.Пользователь несвободный, собственической программы ,платит за нее производителю,который взамен предоставляет ему некоторые гарантии,одна из которых отвечать на вопросы о работе программы.Специально для этого производитель организует службу поддержки,которая по телефону или электронной почте отвечает на вопросы пользователя.Пользователь свободно распространяемой программы не получает вместе с ней никакой гарантии.Автор сделал ее исходный текст открытым для общества ,но при этом не брал на себя обязательств объяснять всем,как работает программа,поэтому получить ответ на свой вопрос пользователь может из двух источников ,из документации,а если ее не достаточно то более из опытных пользователей,кроме того в любой программе имеются ошибки.Производитель собственической прогаммы оплачивает работу отдела контроля качества,который занимается поиском ошибок тем не менее некоторые ошибки этот отдел все же пропускает и они достигают пользователя.Пользователь несвободной программы сталкнувшись с ошибкой не может выявить причину посколько ему недоступны исходные тексты программы,но скорее всего способен описать эту ошибку и условия в которых она происходит.Он может сообщить об ошибке производителю программы и если там решат,что ошибка действительно в программе ,а не в работе пользователя ,о ней будет сообщено разработчику в итоге пользователь может ожидать ,что в следующей версии программы ошибка будет исправлена.

У свободно распространяемой программы обычно нет оплачиваемого контроля качества значит пользователь может сталкнуться с еще большим количеством ошибок ,чем патентовоной программы,тем актуальней для него возможность сообщать об ошибке разработчикам программы.Чем больше у свободной программы пользователей готовых вносить исправления и дополнения и делится ими ,тем надежнее работает и развивается быстрее программа причем такая свободная модель отслеживания и исправления ошибок для программы у которых 1000 активных пользователей может оказаться гораздно более эффективной,чем у любой собственической программы:ни одна компания не может позволить себе такой огромный штат сотрудников в отделе контроля качества, поэтому действительно популярная программа может оказаться гораздо надежнее собственических аналагов. 

Принцип свободного ПО "Делись и вноси вклад".Это справедливо даже если вы не являетесь програмистом.Местом свободных программ на сегодняшнем рынке програмного обеспечения очень значительно и многие комерческие предприятия используют прямо и упосредованно.Выгода использования ПО очевидно.Не надо платить,а если приходится то оно стоит гораздно дешевле собственических аналагов.Точно так же и для переводчиков свободное ПО привлекательно по 3ем причинам,бесплатно,весьма надежно и гораздно легче связаться с разработчиками программы и сообщать об ошибке или попросить реализовать какую-то функцию.Две самые критчино важные для переводчика свободные программы офисный пакет open офис и система памяти перевода омега T.

Open ofice.ork. это свободная замена для Майкрософт офис.Понятно что она является его бесплатность.Опен офис можно получить не заплатив ни копейки.Опен офис орк умеет открывать и сохранять файлы в формате мс офис ,а вдобавок в формате пдф(стандарт)для технической документации и в формате одф,который призван стандартом хранения текстов официальной организацией АЭСО(международная стандартная организация).Признание АЭСО означает,что в скором времени большинство правительственных и других организаций будут хранить тексты именно в этом формате.21 Декабря 2010 года федеральным агенством по техническому и метрологии Росии октрытый формат для офисных документов OPEN DOCUMENT(ОДФ)был зарегестрирован в качестве стандарта.Опен офис орк обладает практически всеми возможностями ,как и майкрософт офис.Включает в себя текстовый процессор ,электронные таблицы(эксел),векторные редакторы,редактор формул,базу данных.Вообщем вывод такой,для переводчика более осмыслено выбирать опен офис орк как с точки зрения бесплатности ,так и с точки зрения возможности экспорта документов в пдф.Так же из полезных но не особо важных программ открытых,отметим,браузер файрефокс,которые можно использовать всместо интернет искплорера,и почтовый клиент thunderbird ,которая может стать аналогом таких програм как аутлук и the Bat.

Учить лекцию и найти информацию об открытом программном обеспечении и закрытом обеспечении.Книгу посмотреть Георгия Курячева и Кирила Маслинского .

Форматы файлов (документов) 

Нужно понимать что существуют пользовательские и системные файлов.Переводчики в основном встречается с файлом который представляет из себя документ.Имя и содержания файла определяет сам програмист.Что можно делать с базовыми операциями с документом?Создать его,открыть чтобы использовать его содержимое,Установить для него атрибут файлов(скрытый для чтения),читать содержания ,изменять,сохранять,закрыть соотвественно потерять доступ к нему пока не откроем его снова ,и удалим файл.Для удобстава файл размещают в папке ,они же каталоги,деректоры.Эти слова все означают одно и то же.Исторически сложилось что документы бывают разных типов.Обычно для определения файлов используют часть его имени,так называемое(расширение файлов,файл exstantion).В старых операционных системах это были три символа отделенных точкой от имени файла.В более новых системах длина расширения практически неограничена.Например HTLM файла может соответствовать ...... или "Дот ....."файлы эмос горд имеют расширение "ДОК".Пользователь может случайно изменить расширение файла при его переименовании и сделать его недоступным или вообще потерять,поэтому мс виндоус,по умолчанию вообще скрывает и пользователь определяет тип файла исключительно по его графической"иконке".Заметим что сама по себе смена расширения ни как не влияет на его содержимое это просто смена имени файла.Тип файла или формат файла термин который используется для описания структуры данных записанных в комп файле.Любой файл в том числе и документ представляет собой просто последовательность битов то есть нулей и единиц поэтому комп программы сохраняющие данные в файле должны как то преобразововать последующую информацию ,последовательность битов и наоборот.Алгаритм этого преобразования как раз составляет то что входит в понятие файла.Алгартим преобразования в последовательность битов.Различные форматы файлов могут различаться степенью детализации.При этом один и тот же файл может быть отнесен к нескольким форматам.Например текстовый формат накладывает только самые общие ограничения на структуру данных.Формат htlm(интернет страницы)устанавливает более подробные правила внутреннего устройства файла но при этом любой htlm файл является текстовым файлом. Любой файл это .Насколько это последовательность верна при прочтении. Для многих форматов файлов существуют свободные опубликованные асификции в которых подробна описана структура файлов данного формата, то как программа должна кодировать данные для записи в этот формат и как декодировать их прочтение. Большинство таких классификаций доступны, некоторые распространяются за небольшую плату. Такие форматы файлов называются открытыми. Например пдф-это открытый формат. Поэтому существуют множество программ, которые могут читать такие файлы, но иногда компании могут считать определённые форматы файлов своим коммерческим секретом и не публиковать их. Хорошо известный пример старые программы файлов Майкрософт офис(док,эксел эс и тд),но не док экс или эксел экс.В некоторых случаях компания выпустившая приложение просто не считает нужным тратить время на написание подробной спецификации ,такие форматы называются закрытыми. Если спецификация формата недоступна то для обеспечения совместимости других программ с данным форматом. Например чтобы файлы мс ворд могли быть прочитаны при помощи других программ, то разработчиком таких программ приходится заниматься не совсем легальной процедуры под названием обратная разработка ,фактически «взломом» формата. К счастью для взламывающих форматы файлов не защищены законами об авторских правах, однако в некоторых странах патентами могут быть защищены алгоритмы используемы для кодирования данных , в какой либо формат в этом случае свободное использование еще более затруднено. Необходимо понимать различия между программами с которыми мы работаем и которые используем для операции с данными и форматами файлов.

Книга Курячева. 

Оренбург в алфавите.

Armada, BeachKarer, Chkalov, Dmitrievskaya ch., Europe and Asia border sign, Fresh cafe, Gulliver, History of the Orenburg, In-tempo, Jangildina str., Kosmos, Lokomotiv, Markov and Ko, National country, OSU, ParkTopolja, QuarterStepnoy, Rostoshy, Sovetskaya str., Theatre of Drama, Ural, Voskhod, White Bridge, X.., Yuri Gagarin, Zauralnaya Roscha.

Представление и поиск информации в Интернете.

В 1962 году Маршал Макклюен издал книгу «Галактика Гутенберга», в которой проанализировал эффекты разнообразных средств коммуникации на европейскую культуру и человеческое сознание. Тогда еще не было интернета, но он практически предвидел его. «Галактика Гутенберга» - это весь массив печатных текстов, созданных человечеством. Сложно точно назвать величину «Галактики» (500 террабайт – 2000 винчестеров по 250 гигобайт). 

Интернет – это н просто «галактика» печатных текстов, это «галактика» оцифрованных текстов. Это значит, что с ними гораздо легче производить какие-либо операции, анализы, синтезы, чем обычно и занимается лингвист. Поэтому для лингвиста интернет - это совершенно бесценная среда, глобальный корпус центра с несколькими встроенными механизмами поиска, обновляющийся самостоятельно. Плохо лишь то, что этот корпус (текста) по большей части не аннотированный (не расставлены грамматические, семантические, синтаксические пометы, и не произведено сопоставление текстов на разных языках). Для переводчика удобен интернет, чтобы посмотреть где используется какое-либо слово, а так же найти перевод в контексте. Для поиска в интернете используется поисковая машина – специальные системы, разработанные, чтобы искать информацию, которая хранится на веб-страницах. Поисковая машина позволяет пользователю сделать запрос на информацию, соответствующую определенным критериям (обычно содержащую какое-то слово или фразу) и возвращает список адресов, информация которых соответствует этим критериям. Список обычно отсортирован в соответствии с реливантностью результатов (реливантность – соответствие информации запросам пользователя. Чтобы работать эффективно поисковые машины используют индексы интернета, которые регулярно обновляются. Они создаются следующим образом: каждая поисковая машина в круглосуточном режиме сканирует весь интернет особыми роботами (search robots), идущие по всем ссылкам, которые им встречаются. Все результаты сохраняются в базе данных поисковой машины и особым образом обрабатываются или индексируются для более быстрого поиска (т.е. когда вы задаете запрос, она ищет в базе данных). Например, иногда страницы, которую мы нашли, более не существует, но она сохранилась в базе, и вы все еще можете ее посмотреть. 

Кроме поисковых машин существуют так же сайты, хранящие каталоги ссылок на другие сайты, разбитые по категориям. Каталоги были очень популярны в 90-е годы, но сейчас почти все службы каталогизации (yahoo и rambler) переквалифицировалить в поисковые системы. Причина в том, что интернет стал слишком большим и более невозможно каталогизировать всю сеть. Можно только постоянно, в автоматическом режиме, индексировать ее и использовать эти индексы в поиске по определенным словам или фразам. На сегодня наиболее популярные машины поиска в сети является Google. В свое время он стал популярен, поскольку использовал новую для своего времени технологию: учитывалось, сколько сайтов ссылается на тот или иной адрес. Чем больше на него ссылок – тем выше позиция сайта в результатах поиска. Поэтому реливантность результатов гугла была высока по сравнению с другими поисковыми системами в начале 2000-х. Сейчас подобные технологии используют другие поисковики. Практически все поисковые машины предлагают инструменты расширенного поиска (например поиск по словам, по фразе и т.п). Как уже говорилось, поисковая машина предоставляет лингвисту, в том числе и переводчику, инструменты для выяснения существующей нормы употребления того или иного языкового явления (например, мы можем ввести фразу «contradict to или contradict with» и сделать вывод какая из них более используется).

Проблемы поисковых машин следующие:

  1.  Интернет растет быстрее, чем поисковые машины успевают его индексировать
  2.  Некоторые сайты не индексируются поисковыми машинами
  3.  Некоторые поисковики ранжируют не по реливантности, а по кол-ву денег, которые им заплатили сайты

Эти проблемы решаются, но тем не менее окончательно с ними еще не справился никто. 

Авторское право.

Следует помнить, что большинство информации в интернете вовсе не находится в общественной собственности. У них есть автор, который как минимум хочет, чтобы его имя упоминалось в цитировании. Некоторые хотят чего-то большего (деньги, письменные разрешения). Тогда говорят, что данный текст защищен копирайтером. Согласно российскому гражданскому кодексу, любое произведение\статья автоматически защищается копирайтером в момент создания, т.е. если не указан иной, то любой текст защищен копирайтером и его использование без разрешения автора запрещено законом. В прочем существуют информационные ресурсы, в которых явно указаны иные отношения авторов и пользователей, особняком стоит Википедия. Это свободная энциклопедия, которая содержит энтузиаста, наполняют ее добровольцы. Википедия основана на принципе «viki» - это от гавайского «вики-вики», что означает «быстро». Принцип заключается в создании веб-сайта, который позволяет посетителям удалять, сохранять, редактировать собственные записи. Нет необходимости даже в какой-либо регистрации. Вики-сайты полностью открыты для изменений, но любое изменение записывается и всегда может быть отменено, т.е. вики-подход это не для того чтобы не было вреда, а для того, чтобы любой ущерб мог быть отменен (неправильная статья). Кроме того это дает возможность легко назначать перекрестные ссылки между страницами. Такое легкое взаимодействие делает Вики очень эффективным инструментом для коллективной разработки текстов (например в некоторых компаниях используется для коллективного написания корпоративной документации). Поскольку Википедия наполняется всеми своими посетителями – не стоит полностью доверять ее содержимому, хотя вообще то в ней существует довольно серьезная защита качества (например, они должны соответствовать нейтральности). Вы всегда можете попасть в такой момент, когда статью уже изменил какой-либо дилетант, а профессионал еще не заметил. Очевидным плюсом Википедии является то, что вы официально можете использовать любой ее материал в любых целях, не боясь нарушить копирайт. Юридически это оформляется лицензией Creative Commons (CC). Википедия и ее ресурсы отражают генеративную, креативную природу интернета. И побуждают каждого пользователя строить базу знаний. Если вы пользуетесь, то и публикуйте.

Копирайт и лицензия СС.

 Больной вопрос – вопрос индивидуальной собственности или копирайтера. Научная традиция предполагает свободный обмен текстами и их свободную переработку. Именно из такого взаимодействия рождаются события. Для защиты от плагиата можно использовать лицензия СС.

СС – это семейство лицензий, разрешающие более свободное использование творческих работ. Достаточно поставить рядом с произведением соответствующий значок и желательно ссылку на полный текст лицензии. С точки зрения законодательства считается что тем самом вы предупредили всю аудиторию об ограничениях использования данного текста\рисунка.

Цель СС: позволить авторам передать некоторые из прав на свои изобретения общественности и в то же время сохранить за собой другие права. Дело в том, что в соответствии с действующими законами копирайт в большинстве стран все права принадлежат автору автоматически. СС делает возможным передавать некоторые права общественности посредством особым образом составленных лицензий. Таким образом цель СС способствует свободному распространению информации. 

Переводчик может публиковать под СС свои статьи, научные разработки, переводы, тексты в своем блоге. В зависимости от желания вы можете выбирать любую комбинацию базовых лицензий. В случае если вы узнаете о нарушении лицензии (например, кто-то начал продавать вашу работу, хотя вы указали СС-NC «только не коммерческое использование», то вы смело можете подавать в суд.

Примеры лицензии СС (4 примера)

Посмотреть сайт «думать вслух». Почитать об истории Вики. О «Галактике Гутенберга». СС найти оф сайт. Выписать примеры лицензии СС (где что разрешено и запрещено, со значками)




1. экономических экологических ресурсныыыыыдыыыырыылеыыыВ этой связи в разряд наиважнейших проблем функци
2. Задание на лабораторную работу 3 Работа с текстом документа в ИПС Консультант Плюс Задание 1 Отрабо
3. спілкування Спілкування це багатогранний процес що реалізується в різноманітних формах і вивчається
4. Тема реферата-Оптическая обработка информации
5. научных дисциплин изучает материальный мир законы его развития химическую форму движения материи
6. практикум Александра Жукова ldquo;Перезагрузкаrdquo; Получите больше информации
7. Реферат- Учетная политика предприятия
8. Лабораторна робота 1~3 Лабораторна робота 52 Лабо
9. Проблема периодизации истории науки
10. Здоровье ног
11. это особое состояние души эмоциональный радостный подъем вызванный переживаниями какоголибо торжественн
12. тема управления издержками предприятия в рамках CVPподхода 2
13.  Информация это совть знание о различных объектах и взаимосвязях между ними
14. Регулирование сельскохозяйственного производства в зарубежных странах
15. Контрольна робота І курс 2 семестр 1 варіант Знайдіть у тексті іменники та визначте їх відміну
16. на тему- Антропогенное загрязнение Выполнила- Проверила-
17. Реферат- Проблемы речевого развития детей на смежных образовательных ступенях-дошкольной и начальной
18. Уход за неврологическими больными
19. Реферат языки программирования
20. Васильев Федор Александрович