Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

Контентанализ документов- сущность и специфика

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 9.11.2024

1.Контент-анализ документов: сущность и специфика. Его виды.

Контент-анализ представляет собой перевод в количественные показатели массовой информации (текстовой, аудиовизуальной цифровой) с последующей статистической ее обработкой.

Контент-анализ (англ. content analysis — анализ содержания) — количе ственный анализ текстов и текстовых массивов с целью последующей  со держательной интерпретации выявленных числовых закономерностей.

Под текстами в контент-анализе понимают книги, книжные главы, эссе, интервью, дискуссии, заголовки газетных статей и сами статьи, исторические документы, дневниковые записи, речи выступлений, рекламные тексты и т.д. Когда говорят о контент-анализе текстов, то главный интерес всегда заключается не в самих характеристиках содержания, а во внеязыковой реальности, которая за ними стоит, — личных характеристиках автора текста, преследуемых им целях, характеристиках адресата текста, различных событиях общественной жизни и др.

Как любой другой социологический метод, контент-анализ используется не сам по себе, а в составе крупного исследовательского проекта, под который составлена научная программа, где четко прописаны цели и задачи, проблема и объект, теоретическая модель и предмет исследования, выдвинуты гипотезы и проведены все другие операции, которые требует научный метод. Когда становится ясным, что поставленных целей никаким иным способом, как только анализом документов, достичь нельзя, социолог прописывает все этапы его применения: устанавливает объект, выделяет единицы анализа (их нередко называют еще единицами наблюдения и т.п.), выбирает статистический метод анализа данных, идет в библиотеку за источниками или садится за Интернет (полевая стадия), а потом ищет, суммирует, считает и интерпретирует. Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении. Он позволяет вписать содержание документа в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни.

Принято считать, что контент-анализ состоит из трех основных этапов: 1) выделяются единицы анализа, которые затем сводятся в категории анализа и переводятся в машиночитаемый вид; 2) проводится подсчет частотных распределений, применяется математический аппарат для выявления взаимосвязей единиц анализа; 3) осуществляется интерпретация полученных результатов.

Объектом контент-анализа могут быть экземпляры книг, плакатов или листовок, номера газет, фильмы, публичные выступления, теле- и радиопередачи, общественные и личные документы, журналистские интервью, ответы на открытые вопросы анкет и др. Они составляют то, что называется выборкой, — ту часть текстов, которые достаточны для анализа всего массива публикаций, и обеспечивают репрезентативность данных.

идея контент-анализа предполагает анализ боль ших информационных массивов; с другой стороны, его относитель ная дешевизна и технологичность делают такой анализ принципи ально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных сло ганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени.

Выбор единиц анализа зависит от исследовательской програм мы, объекта, предмета, цели, задач и гипотез исследования. Если, скажем, нам предстоит выяснить перспективы забастовки рабочих Предприятия, то станет очевидной потребность контент-анализа, как минимум, протоколов собраний рабочих, решений соответству кзщих профсоюзных комитетов, распоряжений руководителей, за конов, регулирующих забастовочную борьбу, и т.п. Переход от за дачи к единицам анализа аналогичен процедуре теоретической и эмпирической интерпретации понятий и поиска индикаторов.

Виды контент-анализа


По функциям:

поисковый – направленный на проверку выдвинутой гипотезы, выявление неизвестных тенденций;

контрольный – связанный с более точным определением уже известного (более или менее) содержания.

^ По характеру:

направленный, когда точно известно, что нужно измерять;

ненаправленный, когда исследователь действует интуитивно, не систематизируя заранее объекта исследования.

Составление кода контент-анализа

Код или перечень категорий и признаков в контент-анализе – очень важный полевой документ, по которому кодируется содержание документов (текстов СМИ, писем в редакцию, открытых вопросов анкет и т. п.). Конечно, выбор категорий и признаков контент-анализа диктуется программой исследования.

Для этого важно знать основную терминологию контент-анализа как метода.

1. Категории анализа – это сферы анализа, совокупность признаков, которые подлежат анализу. Например, если мы анализируем прессу, это может быть тема, жанр, тип автора и т. п. 

2. Признаки анализа – это анализируемые элементы категорий. Например, в категории «тема» будут следующие признаки: политика, экономика, спорт, культура и т. п. В категории «жанр» признаками будут заметка, интервью, репортаж и т. п.

3. Единица анализа – тот текст, фрагмент текста, в которых мы ищем эти признаки, например, публикация, рекламный ролик, телесюжет.

4. Единица счета – единица измерения признаков текста. Это могут быть строчки, сантиметры, длительность показа на ТВ или звучания на РВ, могут быть и просто упоминания признака, его наличие (отсутствие) в тексте, в визуальных или звуковых документах. Можно кодировать имена исторических личностей, например, частоту употребления фамилий членов правительства или олигархов на страницах какой-то газеты, отдельные понятия, например, семантический ценностный ряд: добро, зло, созидание, разрушение и т. п. 

Сфера применения

Круг дисциплин, в которых применяется контент-анализ, довольно широк. Помимо социологии и политологии данная методика находит применение в антропологии, управлении персоналом, психологии, литературоведении, истории, истории философии[3]. Оле Холсти приводит следующее распределение исследований в области контент-анализа по наукам: социология, антропология — 27,7 %, теория коммуникации — 25,9 %, политическая наука — 21,5 %. Следует также отметить применение контент-анализа в области исторических исследований[4] и связей с общественностью.[5]

С помощью контент-анализа можно анализировать такие различные типы текстов, как сообщения СМИ, заявления политических деятелей, программы партий, правовые акты, рекламные и пропагандистские материалы, исторические источники, литературные произведения.

Этапы применения контент-анализа

Необходимым условием применения методики анализа содержания является наличие материального носителя информации. Во всех случаях, когда существует или может быть воссоздан такой носитель, допустимо использование методики контент-анализа.

Первый этап

Определение совокупности изучаемых источников или сообщений с помощью набора заданных критериев, которым должно отвечать каждое сообщение:

заданный тип источника (пресса, телевидение, радио, рекламные или пропагандистские материалы)

один тип сообщений (статьи, заметки, плакаты);

заданные стороны, участвующие в процессе коммуникации (отправитель, получатель (реципиент);

сопоставимый размер сообщений (минимальный объём или длина)

частота появления сообщений,

способ распространения сообщений;

место распространения сообщений;

время появления сообщений.

При необходимости можно использовать и другие критерии, однако перечисленные выше встречаются чаще всего.[6]

Второй этап

Формирование выборочной совокупности сообщений. В некоторых случаях можно изучать всю определенную на первом этапе совокупность источников, поскольку подлежащие анализу случаи (сообщения) часто ограничены по числу и хорошо доступны. Однако иногда контент-анализ должен опираться на ограниченную выборку, взятую из большего массива информации.[6]

Третий этап

Выявление единиц анализа. Ими могут быть слова или темы. Правильный выбор единиц анализа — важная составляющая всей работы. Простейшим элементом сообщения является слово. Тема — это другая единица, представляющая собой отдельное высказывание о каком-либо предмете. Существуют достаточно четкие требования к выбору возможной единицы анализа:

она должна быть достаточно большой, чтобы выражать значение;

она должна быть достаточно малой, чтобы не выражать много значений;

она должна легко идентифицироваться;

число единиц должно быть настолько велико, чтобы из них можно было делать выборку.[1]

Если в качестве единицы анализа избирается тема, то она также выделяется в соответствии с некоторыми правилами:

Тема не может выходить за пределы абзаца.

Новая тема возникает, если происходит смена:

воспринимающего,

действующего,

цели,

категории.[1]

Существуют также и специальные методики контент-анализа, адаптированные к нуждам исторических и историко-философских исследований.

Четвертый этап

Выделение единиц счета, которые могут совпадать со смысловыми единицами или носить специфический характер. В первом случае процедура анализа сводится к подсчету частоты упоминания выделенной смысловой единицы, во втором — исследователь на основе анализируемого материала и целей исследования сам выдвигает единицы счета, которыми могут быть:

физическая протяженность текстов;

площадь текста, заполненная смысловыми единицами;

число строк (абзацев, знаков, колонок текста);

длительность трансляции по радио или ТВ;

метраж пленки при аудио- и видеозаписях,

количество рисунков с определенным содержанием, сюжетом и прочее.[2]

В некоторых случаях исследователи используют и другие элементы счета. Принципиальное значение на этом этапе контент-анализа имеет строгое дефинирование его операторов.

Пятый этап

Непосредственно процедура подсчета. Она в общем виде сходна со стандартными приемами классификации по выделенным группировкам. Применяется составление специальных таблиц, применение компьютерных программ, специальных формул, статистических расчетов.

2. Количественный контент-анализ

Количественный контент-анализ (также именуется содержательным) основывается на исследовании слов, тем и сообщений, сосредоточивая внимание исследователя на содержании сообщения. Таким образом, собираясь подвергнуть анализу выбранные элементы, нужно уметь предвидеть их смысл и определять каждый возможный результат наблюдения в соответствии с ожиданиями исследователя.[8]

На деле это означает, что в качестве первого шага при проведении контент-анализа этого типа исследователь должен создать своего рода словарь, в котором каждое наблюдение получит определение и будет отнесено к соответствующему классу.[8]

Проблема состоит в том, что исследователь должен предвидеть не только упоминания, которые могут встретиться, но и элементы их контекстуального употребления, а для этого должна быть разработана детальная система правил оценки каждого случая употребления. Эта задача обычно решается посредством пилотажа подлежащей анализу совокупности сообщений (то есть с помощью выявления на материале небольшой выборки сообщений тех типов ключевых упоминаний, которые с наибольшей вероятностью могут встретиться в последующем, более полном анализе) в сочетании с арбитражными оценками контекстов и способов употребления терминов. Предпочтительнее иметь дело с наблюдениями не одного, а нескольких исследователей.[8]

Более трудной является задача, заключающаяся в необходимости приписывания ключевым упоминаниям конкретных оценок, — когда мы должны решить, приводится ли данное упоминание в позитивном или негативном смысле, «за» или «против» интересующего нас объекта и т. д., а также когда нам надо ранжировать ряд упоминаний соответственно силе их оценок (т.е. в соответствии с тем, какое из них самое положительное, какое следующее за ним по положительности и т. д.). При этом исследователь нуждается в показателях достаточно тонких, которыми можно было бы измерять не только настроения политических субъектов, но и силу этих настроений. Особенно трудным выполнение этой задачи является в исторических, историко-философских и психологических исследованиях, поскольку предполагает высокий уровень гуманитарной подготовки специалистов, использующих методику контент-анализа. Существует множество методов, облегчающих принятие такого решения. В некоторых случаях они опираются на суждения группы арбитров (экспертов) о значении или силе (интенсивности) некоторого термина. В качестве примера таких приемов можно привести метод Q-сортировки и шкалирование методом парного сравнения.[8] На рубеже XX-XXI вв. специалисты по применению математических методов в исторических исследованиях много внимания уделяли разработке специальных компьютерных экспертных систем (в рамках идеологии Искусственного Интеллекта).

Количественный анализ документов (контент-анализ). Наиболее существенным ограничением, связанным с использованием традиционных методов анализа таких документов, как газеты и т.п. источники, является возможность, субъективных влияний на результаты анализа, т.е. влияния установок исследователя, его интересов, сложившихся стереотипных представлений о предмете анализа. Эти влияния могут не осознаваться, а строгих критериев для обнаружения подобных влияний при интуитивном анализе не существует. Данный недостаток преодолевается методиками формализованного анализа, которые основаны на статистическом расчете различных объективных характеристик текста. Например, частота публикаций в газете материалов по определенной теме, число строк, отводимых редакцией отдельным темам, рубрикам, авторам, частота упоминаний проблем, терминов, имен. Географических названий и т.п.

Потенциальными объектами исследования в контент-анализе могут быть любые документальные источники, содержащие текст, - книги, газеты, песни, речи, выступления, письма, дневники, ответы на открытые вопросы анкет. При этом конечно подразумевается, что изучаемая характеристика существует и распределена в некоторой массовой совокупности - слов, фраз, параграфов, книг, журналов, авторов и др.

Задачи, решаемые методом контент-анализа, укладываются в достаточно простую и очевидную схему: “Кто сказал, что, кому, как, с какой целью и с каким результатом?”

Суть метода контент-анализа сводится к тому, чтобы найти и использовать для подсчета такие признаки документа (например, упоминания названий партий), которые отражали бы определенные существенные стороны его содержания. Так, тематическую направленность этой главы данной книги можно определить, если подсчитать частоту употребления в тексте слова “метод” и сравнить ее с аналогичной частотой в других главах.

Обычно контент-анализ, как и методы массового опроса, использует выборочный метод изучения и лишь единицы анализа и единицы отбора в них различны. В контент-анализе единицы отбора - слова, фразы, смысловые единицы, отдельные статьи, в выборочных опросах - люди.

Принципиальным моментом в разработке методики контент-анализа является разработка правил соотнесения единиц текста с перечнем категорий анализа. Эти правила оформляются в форме кодификатора. В кодификатор включают не только список наблюдаемых индикаторов, но и данные о самом документе, которые подвергаются кодированию (например, название газеты, город издания, дата издания, другие характеристики газеты - число страниц, формат и т.п.).

Контент-анализ целесообразно использовать при наличии больших текстовых массивов с четкой структурой, определяемой коммуникативными намерениями авторов текста. Этот метод широко используется при изучении сообщений, транслируемых на массовую аудиторию газетами, радио, телевидением.

При анализе больших массивов текстов приходится решать проблему обеспечения репрезентативности результатов при отборе текстов из их общей генеральной совокупности. В большинстве случаев здесь применимы модели выборки, изложенные ранее. Причем уже на стадии планирования необходимо продумать, какова функция информации, полученной методом контент-анализа, а общей структуре эмпирических данных, полученных другими методами, которые используются в исследовании.

 

3. Качественный контент-анализ

Помимо слов, тем и других элементов, обозначающих содержательную сторону сообщений, существуют и иные единицы, позволяющие проводить качественный или, как он ещё называется, структурный контент-анализ. В этом случае исследователя интересует не столько что говорится, сколько как говорится.[8]

Например, может ставиться задача выяснить, сколько времени или печатного пространства уделено интересующему предмету в том или ином источнике или сколько слов или газетных столбцов было уделено каждому из кандидатов во время определенной избирательной кампании.[8]

С другой стороны, могут браться в расчет и другие, возможно, более тонкие вопросы, относящиеся к форме сообщения: сопровождается ли конкретное газетное сообщение фотографией или какой-либо иллюстрацией, каковы размеры заголовка данного газетного сообщения, напечатано ли оно на первой полосе или же помещено среди многочисленных рекламных сообщений. При ответе на подобные вопросы внимание исследователя фокусируется не на тонкостях содержания, а на способе презентации сообщения. Основным вопросом здесь является факт наличия или отсутствия материала по теме, степень его выделенности, его размеры, а не нюансы его содержания. В результате такого анализа часто получаются куда более надежные измерения, чем в случае исследования, ориентированного на содержание (поскольку формальным показателям в меньшей степени присуща неоднозначность), но зато, как следствие, и куда менее значимые.[8]

Измерения в параметрах, исследуемых в ходе качественного контент-анализа, поверхностно затрагивают само содержание каждого сообщения в отличие от детального и внимательного обследования, необходимого при количественном анализе. В результате качественный контент-анализ обычно более прост в разработке и проведении, а потому и более дешев и надежен, чем содержательный контент-анализ. И хотя его результаты, возможно, удовлетворят в меньшей степени, ибо они дают скорее набросок, чем законченную картину сообщения, но при ответе на конкретный исследовательский вопрос они могут зачастую оказаться вполне адекватными.[8]

4. Программа контент - анализа документа.

В настоящее время различается четыре методологии контент-анализа: грамматический (лингвистический) — по размеру абзацев, длине фраз, порядку слов в предложении, метрическому составу и другим формальным признакам языка; семантический (социологический) — по экспертным оценкам содержания; документа-листический (кибернетический) — по параметрам языка, текста и документа как сообщения (дескрипторы и их нагрузка, компактность, информационная плотность, аспектность, проточность, физический и информационный объемы, информационная емкость и информативность); цитационный — анализ библиографических ссылок в научной литературе26.

Проведение контент-анализа требует предварительной разработки ряда исследовательских инструментов. Разные специалисты и источники называют неодинаковое число таких документов. По мнению СИ. Григорьева и Ю.Е. Растова, их должно быть пять: 1) классификатор контент-анализа; 2) протокол итогов анализа (он еще называется — бланк контент-анализа); 3) регистрационная кар-точка (кодировальная матрица); 4) инструкция исследователю, не посредственно занимающемуся регистрацией и кодировкой единиц счета; 5) каталог (список) проанализированных документов. Классификатором контент-анализа авторы называют общую таблицу , в которую сведены все категории (и подкатегории) анализа и единицу,в цы анализа. Ее основное предназначение — предельно четко зафик-сировать то, в каких единицах выражается каждая категория, ис пользуемая в исследовании. Классификатор уподобляется социоло гической анкете, где категории анализа играют роль вопросов,а единицы анализа — ответов, и считается основным методическим документом контент-анализа, предопределяющим содержание дру гих документов. Протокол (бланк) контент-анализа содержит: во первых, сведения о документе (его авторе, времени издания, объе ме и т.п.); во-вторых, итоги его анализа (количество случаев упот ребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа). Протоколы заполняют ся, как правило, в закодированном виде, но не ради сохранения тайны контент-анализа, а исходя из желания на одном листе бума ги уместить всю информацию о документе (так удобнее сопостав лять друг с другом итоги анализа разных документов). Регистра ционная карточка представляет собой кодировальную матрицу, В которой отмечается количество единиц счета, характеризующих единицы анализа. Протокол контент-анализа каждого конкретно го документа заполняется на основе подсчета данных всех pегист рационных карточек, относящихся к этому документу.

По другим источникам, главными среди методических доку ментов контент-анализа являются кодировочная карточка (коди фикатор, код, бланк кодировки) и инструкция кодировщику.

Первый нормативный документ принимает разные формы, может быть менее и более подробным, но в любом своем виде он представляет собой таблицу.

В более подробном варианте в кодировочной карточке, т.е. специальной таблице, перечислены единицы наблюдения с необ ходимой степенью дробности, указаны правила их регистрации и оставлено место для записей результатов наблюдений (подсчета числа упоминаний и других показателей). В ней указываются также общие характеристики анализируемого текста (название источника, дата и номер анализируемого экземпляра, название анализируемой публикации, автор, жанр). В сокращенном варианте, иногда называемом бланком кодировки, количество сообщаемых сведений меньше. Бланк кодировки составляется в соответствии со схемой операциональных понятий, содержит единицы анализа и все элементы описания проблемной ситуации, устанавливает однозначное соответствие между лексикой текста и кодами, над которыми производятся вычислительные операции.

Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. Операции кодирования проводит кодировщик — сотрудник, который работает с текстом, фиксирует частоту употребления единиц счета.

Инструкция кодировщику. Ее содержанием выступает описание правил соотнесения единиц текста с перечнем категорий анализа, а также правил регистрации в Кодировочной карточке. Примером может служить список категорий и элементов регламентации, который называют кодификатором (кодом). Карточка содержит не только список наблюдаемых индикаторов, но и данные в документе, который подвергся кодированию (например, номер или название подразделения, в котором используется данная инструкция, ее объем в страницах, число разделов и т.п.).

Инструкция кодировщику содержит обычно не только правила поиска и регистрации единиц текста, соответствующих делениям кодификатора, но и примеры таких единиц, слова, высказывания, суждения и т.п.

Если контент-анализ применяется впервые, то допускаются многочисленные ошибки. Среди них специалисты31 отмечают наиболее типичные просчеты:

Анализ документов опережает разработку исследовательской программы.

Анализируются документы, не связанные с гипотезами исследования (имеющие сходство с темой исследования лишь по названию).

Не проверена подлинность документа.

Не уточнено его авторство.

Неполно учтено его предназначение.

Категории анализа не определены до такой степени, которая позволяет четко различать смысловые единицы текста документа.

Категории анализа не субординарны и не приведены в соответствие с теми дефинициями и операционализирующими их терминами, которые зафиксированы в программе исследования.

Категории анализа несопоставимы со смыслом и языком текста анализируемого документа.

Единицы анализа характеризуют категории анализа лишь внешне, а не по существу, поэтому единицы анализа не позволяют идентифицировать содержание документа в полном соответствии с категориями анализа.

Анализ документа ведется без предварительной подготовки всего комплекса методических инструментов.

Классификатор имеет недочеты, составлен с нарушением правил логики.

Регистраторы (кодировщики) не получили должной методической подготовки.

Инструкция по регистрации и кодировке недостаточно полная, составлена исследователем, который сам предварительно не апробировал инструментарий.

Кодировка не соответствует программе математической обработки данных исследования.

Результаты контент-анализа не перепроверены информацией, собранной иными методами.

Контент-анализ прессы требует сравнительно больших затрат времени и средств, поэтому может использоваться и метод экспресс-анализа. В его основе лежит количественный подсчет содержательных элементов текста (факт, конфликт, аргумент, тема, обобщение), а также учет качественных характеристик публикаций (соответствие цели, информативность, актуальность, доказательность, конструктивность). Как и при контент-анализе, эти характеристики текста кодируются, обозначаются определенной цифрой, и затем при чтении текста исследователь их фиксирует32.




1. Литосфера и рельеф Земли
2. OCR- cepehd@ol
3. 1939 Dozentin Chrustlew
4. тема 3 ВАО г Москвы Центральная библиотека 126 Справочнобиблиографический отдел www
5. РЕФЕРАТ Дисертації на здобуття вченого степеня кандидата технічних наук Севастоп
6. Козацька шайка клянемось- Клянемося Олександру Дмитровичу що пальці в розетку ми впихати не будемо та
7. 1 Этиопатогенез и клиническая картина нарушений осанки у детей 67 лет [3
8. Свойства древесины
9. О некоторых вопросах замены института прописки институтом регистрации
10. наМайне руководимом М
11. ТЕМАТИКИ ПРИКЛАДНЫЕ РАЗДЕЛЫ МАТЕМАТИКИ Контрольная работа 2 по дисциплине и методи
12. Тема- Функции трудового права Выполнил- студент группы ЮРб 121 форма обучения очная Суле
13. бути здоровим і тримати себе в формі 10 goldene Regeln lernen ~ вчити 10 золотих правил весь текст топіку ~ це і є ці 10
14. Кэсси ты почти готова моя соседка по комнате Мелисса крикнула в коридор1
15. Земля планета на которой мы живем Чему учится ребенок- изменять имена существительные по числам; находи
16. производят по одной молекуле молочной кислоты этанола и СО2
17. Механизм действия закона спроса и предложения, рыночное равновесие
18. Электромонтаж Ордена Трудового Красного Знамени Всесоюзный научноисследовательский проектный и п
19. темами используемыми в качестве инструментария проведения аудита
20. по теме- Что мы знаем о нашей стране и о своем селе