Контент-анализ: сущность, задачи, процедуры. Понятие «контент-анализ Смотреть что такое контент анализ

Термин content-analysis впервые начал применяться в конце XIX – начале XX вв. в американской журналистике (см. раб.: Б.Мэттью, А.Тенни, Д.Спиид, Д.Уипкинс). У истоков методологии контент-анализа находились американский социолог Г. Лассуэл и французский журналист Ж.Кайзер.

Так, в начале 60-х гг. Г. Лассуэл осуществил попытку политологического анализа СМИ, исходя из учета формальных критериев. Он ввел в научный оборот некую абстрактную единицу: «слово». Целью работы Лассуэла было получение собственно социологического результата на нетипичном для социологии материале: текстах печатных изданий. Исследователь проделал огромную работу, но, поскольку в методике Лассуэла качественные оценки не были адекватно соотнесены с количественными методами, результаты его трудов с трудом поддавались верификации.

В начале 60-х гг. Ж. Кайзер разработал оригинальную методику статистического анализа периодики. В ее основе лежал подход к тестовому массиву, как информационной системе. Тем самым Кайзер сформулировал теоретическую базу последующего распространения социологических методов в сферы изучения всех нарративных источников, включая эпиграфический и эпистолярный материал. В работе Ж. Кайзера акцентировалось внимание на внешней форме организации материала: его расположении, оглавлении, оформлении и т.д. Кайзер разработал целый комплекс исследовательских процедур, обеспечивающих полную формализацию, как единичного газетного номера, так и совокупности однотипных периодических изданий. Тем самым Ж.Кайзер сформулировал систему, позволяющую фиксировать развитие тенденций в публикациях СМИ.

Свое дальнейшее развитие «кайзеровское направление» методологии контент-анализа получило в работах Э. Морэн. Э. Морен ввела в научный оборот термин «единица информации» - семантический блок, содержание которого отвечает на вопрос: «О чем говориться?» Последнее обстоятельство сделало возможным изучение любых форм организации текстового материала, причем, как на терминологическом уровне, так и на уровне фразы, абзаца, статьи и даже целых книг. Тем самым, Э.Морэн разрушила критерий однородности, применявшийся ранее при статистической обработке нарративов. Взамен, она предложила идеологию «семантических групп», которые, по ее мнению, должны учитываться по тематическому признаку. Кроме того, Э.Морэн разработала концепцию «тона» материала, который определялся социометрически: «положительная информация», «отрицательная», «нейтральная».

Важный вклад в развитие контент-анализа внесли российские и эстонские социологи, особенно А.Н.Алексеев, Ю. Вооглайд, П. Вихалемм, Б.А. Грушин, М. Лауристинь и др.

Для изучения содержания текста традиционно применяется метод контент-анализа. Слово «контент» означает содержимое (или содержание) документа. Под документом при этом понимается не только официальный текст (типа инструкции или правового закона), но все написанное или произнесенное, все, что стало коммуникацией. Так, по словам Ядова В.А., документальной называют любую информацию, фиксированную в печатном или рукописном тексте, на магнитной ленте, на фото- или киноплёнке.

Контент-анализу подвергаются книги, газетные или журнальные статьи, объявления, телевизионные выступления, кино- и видеозаписи, фотографии, лозунги, этикетки, рисунки, другие произведения искусства, а также, разумеется, и официальные документы. В настоящее время в связи с активным использованием электронных средств общения, анализу подвергаются и электронные документы.

Существуют различные определения контент-анализа, некоторые из них не совпадают во взглядах на количественный и качественный аспект метода. Так, существуют две точки зрения на контент-анализ :

Контент-анализ - самостоятельный метод, отличный от обычного содержательного анализа документов

Принципиальное отличие этих методов анализа заключено в явно выраженной строгости, формализованности, систематизированности контент-анализа. Он нацелен на выработку количественного описания смыслового и символического содержания документа, на фиксацию его объективных признаков и подсчет последних.

Федотова Л.Н. выделяет такие присущие методу характеристики: сложность, тщательность, пунктуальность трудоёмкость.

Являясь сторонником данной точки зрения на контент-анализ, В.А.Ядов определяет контент-анализ следующим образом - это перевод в количественные показатели массовой текстовой (или записанной на плёнку) информации с последующей статистической её обработкой.

Вторая точка зрения принимает в расчет оба вида анализа.

Контент-анализ включает в себя как количественный, так и качественный анализ текста.

Первый дополняет второй, а их сочетание углубляет понимание смысла любого текста. Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении, но что имеет важный социальный смысл.

Итак, с точки зрения видов проводимого анализа, выделяется два вида: количественный и качественный контент-анализ. При проведении количественного контент-анализа анализируется частота появления в тексте каких-либо единиц, будь упоминания тем или названий компаний. Определения качественного контент-анализа достаточно размыты, в них чаще всего говорится, что при проведении качественного анализа выводы делаются на основе наличия в тексте какого-либо факта. На самом деле, речь идет об интерпретации содержания текста, которое часто встречается в исторической науке и филологии. По этой причине качественный контент-анализ вернее называть интерпретативным.

В западной исследовательской традиции контент-анализ однозначно рассматривается как количественный метод. Несомненно, что количественный контент-анализ обладает более широкой областью применения и надежностью, чем качественный. Одна из наиболее значимых причин – это объективный характер количественных показателей, в то время как интерпретация почти всегда носит субъективный характер. Впрочем, интерпретация результатов количественного анализа тоже имеет субъективные элементы.

По мнению ряда социологов (Маркоффа, Шапиро, Вейтмана и др.), контент-анализ можно было бы назвать «текстуальным кодированием», так как он предполагает получение количественной информации о содержимом документа на основе ее кодирования.

Итак,количественный контент-анализ в первую очередь интересуется частотой появления в тексте определенных характеристик (переменных) содержания.

Качественный контент-анализ позволяет делать выводы даже на основе единственного присутствия или отсутствия определенной характеристики содержания.

На вопрос: "в каких случаях не следует прибегать к количественному анализу?", В.А. Ядов отвечает: если мы имеем дело с уникальными документами, где главная цель изучения - всесторонняя содержательная интерпретация материала.

От количественных данных качественные отличаются тем, что содержание последних несет в себе смысл, непосредственно характеризующий самого их носителя, в то время как количественные указывают на масштаб, объем, интенсивность характеристик изучаемого явления. Качественные данные позволяют раскрыть значения социального явления, количественные показывают, насколько часто оно случается или насколько интенсивно представлено в социальной реальности. Качественные данные обозначают предмет исследования, количественные - показывают, насколько сильно он проявлен в объекте. Продолжая такого рода рассуждения, можно сделать вывод, что одни данные в большей степени ориентированы на создание суждения о социальном явлении, другие - на оценку значимости или тестирование этого суждения. Эти различия в природе двух типов данных привели к тому, что так называемые качественные исследования (исследования, основанные на сборе и анализе качественных данных) стали связывать в большей степени с этапом генерирования или построения теории, а количественные исследования - с ее верификацией.

То, что качественным методам отводится второстепенная роль, значительно сужает их возможности, по мнению Б. Глезера и А. Страусса, выдвинувших "обоснованную теорию" (grounded theory). Авторы помещают свой метод качественного исследования - "обоснованную теорию" - между подходом контент-анализа и подходом, предлагающим выработку некоторых предварительных идей и гипотез. Классический контент-анализ предлагает следующую модель: сначала задается модель кодировки, а потом данные систематически собираются, оцениваются и анализируются по заранее определенным, неизменным и единым для всех них шкалам, которые позволяют придать качественным (словесным) данным квантифицируемую форму.

Метод Глезера и Страусса предполагает постоянное сравнение и перегруппировку данных. Цель метода постоянного сравнения, в котором объединены кодирование и анализ, - генерирование теории более систематически, чем предполагается во втором подходе, при помощи использования развернутого кодирования и аналитических процедур.

Сравнительный метод используется на каждом этапе аналитического процесса построения обоснованной теории. Он включает в себя следующие процедуры: кодирование, выделение ключевых категорий, теоретический отбор и формирование теоретической выборки, теоретическое насыщение и интеграцию теории.

Этапы контент-анализа

	Определение задач, теоретической основы и объекта исследования, разработка категориального аппарата, набор соответствующих качественных и количественных единиц.
	Составление кодировочной инструкции.
	Пилотажная кодировка текста
	Кодировка всего массива исследуемых текстов.
	Статистическая обработка полученных количественных данных.
	Интерпретация полученных данных на основе задач и теоретического контекста исследования.

Контент-анализ состоит из ряда этапов: отбора материалов, выбора единицы анализа, подсчета единиц и, наконец, интерпретации результатов. С точки зрения чистой методологии отбор материалов носит предварительный характер. После определения темы происходит определение потенциального круга источников, в которых может находиться интересующая информация. Затем из этой информации отбирается та, которая содержит значимую с точки зрения исследования информацию. Отобранные материалы далее анализируются. В классических описаниях метода оговаривается, что при большом объеме более или менее однородных источников допустим анализ не всего массива информации, а только части её.

Описывая процедуру контент-анализа, можно выделить несколько этапов, а именно:

1-й этап исследования : Определение задач, теоретической основы и объекта исследования, разработка категориального аппарата, набор соответствующих качественных и количественных единиц.

Данный этап непосредственно связан с составлением программы исследования. Он носит характер качественного анализа, который подготавливает перевод смыслового содержания текста в цифровое выражение для его последующего количественного анализа. В этих целях на основе задач и теоретического контекста осуществляется выбор объекта исследования и определяются конкретные единицы анализа.

2-й этап : Составление кодировочной инструкции.

На этом этапе осуществляется соотнесение категорий и подкатегорий контент-анализа с конкретными содержательными элементами текста, т.е. происходит отыскание в тексте индикаторов выбранных категорий исследования. Здесь либо составляется соответствующий словарь индикаторов категорий, либо даётся развёрнутое описание категорий в терминах исследуемых текстов. Все категории и подкатегории контент-аналитического исследования кодируются, т.е. им даются определённые цифровые или буквенные обозначения, что составляет код данного исследования. Всё это входит в кодировочную инструкцию. В неё также включается обозначение знака информации. Он обычно определяется как "положительное", "отрицательное" и "нейтральное" отношение, что соответственно кодируется как +, -, 0.

Составление кодировочной инструкции имеет очень большое значение, так как по существу в ней находят своё конкретное выражение основные положения методики исследования. Кроме соответствующего определения категорий и подкатегорий и других единиц анализа в кодировочную инструкцию включаются правила кодирования, оговариваются спорные случаи и т.д. При составлении конкретного кода в категориях предусматривается подкатегория "другое", в которую включаются те индикаторы данной категории, которые не вошли в выделенные подкатегории, но тем не менее являются её референтами и поэтому должны быть зафиксированы в частоте (и объёме) её упоминаний. Необходимость включения подкатегории "другое" вызывается тем, что заранее невозможно, а часто и не нужно предусматривать все подкатегории.

3 -й этап: Пилотажная кодировка текста

На данном этапе осуществляется кодировка части исследуемого массива текстов с целью апробации методики, изложенной в кодировочной инструкции. Кодировка текста представляет собой процедуру непосредственного перевода качественных, смысловых единиц (категорий, подкатегорий) через нахождение их индикаторов в тексте в количественные единицы, т.е. перевод текстов в условные обозначения - коды (цифры или буквы, которыми обозначены в кодировочной инструкции те или иные подкатегории). Подобная пилотажная кодировка даёт возможность проверить надёжность методики, т.е. испытать её на обоснованность (соответствие задачам и теоретическим понятиям исследования) и устойчивость (воспроизводим ость результатов)

Обоснование полноты объёма выделяемых смысловых единиц доказывается следующим образом: выделяются все смысловые единицы из первого анализируемого текста, затем из второго текста - те же единицы плюс ранее не встречавшиеся, из третьего документа - те же, что встречались в двух предыдущих, плюс дополнительные и т.д. После изучения 3-5 очередных текстов, в которых не попадается ни одной новой единицы, ранее не фиксированной в предыдущих документах, можно полагать, что "поле" смысловых единиц из изучаемого материала исчерпано.

Устойчивость данных определяется при помощи повторного кодирования тех же документов тем же кодировщиком ("устойчивость во времени") или разными кодировщиками по единой инструкции ("устойчивость среди аналитиков").

4-й этап : Кодировка всего массива исследуемых текстов.

Осуществляется процесс квантификации, т.е. перевод в цифровое выражение всей совокупности исследуемых текстов. Регистрация частоты (и объёма) упоминания категорий и подкатегорий контент-анализа может производиться либо в заранее подготовленных таблицах, либо на отдельных карточках и перфокартах.

5-й этап: Статистическая обработка полученных количественных данных.

Эта обработка осуществляется вручную или на ЭВМ. Нередко оба эти способа используются одновременно в сочетании. Существуют специальные компьютерные программы, помогающие осуществить анализ более оперативно, такие как Контент-анализ 1.6, WINMAX, ATLAS/ ti, NUDIST, а также AQUAD, CAQDAS, ETHNOGRAPH.

Статистическая обработка цифрового материала, полученного в процессе кодировки, не отличается фактически по своим методам от статистической обработки данных, полученных в других видах социально-психологических исследований. Обычно используются процентные и частотные распределения, разнообразные коэффициенты корреляций и т.д. Вместе с тем используются и особые способы количественной обработки данных (см. формулу "удельного веса" смысловых категорий в общем объёме текста, предложенную А.Н. Алексеевым).

6 -й этап: Интерпретация полученных данных на основе задач и теоретического контекста исследования.

На данном, последнем этапе исследования, как и на первом, связанным с составлением программы, особенно ярко выступает качественная сторона контент-анализа в отличие от количественного аспекта, преобладающего на промежуточных этапах. Для адекватной интерпретации результатов и их соотнесения с данными, полученными с помощью других методов, особенно большое значение имеет учёт более широкого теоретического и социального контекста.

Формализованность, систематизированность и строгость контент-анализа проявляется в следующем. Прежде, чем непосредственно анализировать текст документа, исследователь определяет категории анализа, т.е. ключевые понятия (смысловые единицы), имеющиеся в тексте и соответствующие тем дефинициям и их эмпирическим индикаторам, которые зафиксированы в программе исследования. При этом желательно избежать крайностей. Если за категории анализа будут приняты слишком общие (абстрактные) понятия, то это предопределит поверхностность анализа текста, не позволит углубиться в его содержание. Если же категории анализа будут предельно конкретными, то их окажется слишком много, что приведет не к анализу текста, а к его сокращенному повторению (конспекту). Нужно найти золотую середину и постараться достичь того, чтобы категории анализа были: а) уместными, т.е. соответствовали решению исследовательских задач; б) исчерпывающими, т.е. достаточно полно отражали смысл основных понятий исследования; в) взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме); г) надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.

Единицы контент-анализа После определения системы категорий анализа выбирается соответствующая им единица анализа текста.

Богомолова Н.Н. И Стефаненко Т.Г. предлагают разделять единицы контент-анализа на две большие группы:

качественные

количественные .

Качественные единицы контент-анализа отвечают на вопрос, ЧТО надо считать в тексте, а количественные единицы отвечают на вопрос, КАК надо считать.

К качественным предлагают отнести категории и их референты в тексте (индикаторы). Следует обратить внимание на то, что для обозначения различных единиц контент-анализа используются разнообразные термины, лишь основная единица контент-анализа - категория - признаётся всеми авторами. Большой разнобой в терминологии при обозначении различных единиц контент-анализа в определённой степени затрудняет понимание процедуры данного метода.

Категории могут подразделяться на более мелкие качественные единицы - подкатегории. Индикаторами категорий называются те элементы текста, те единицы содержания, которые служат референтами, качественными признаками соответствующих категорий и подкатегорий. В зависимости от специфики исследования индикаторы категорий могут выражаться в виде отдельных слов, словосочетаний, суждений, тем и т.д.

За единицу анализа может быть принято: а) слово б) предложение в) тема г) идея д) автор е) персонаж ж) социальная ситуация з) часть текста, объединенная чем-то, что соответствует смыслу категории анализа

Когда контент-анализ выступает единственным методом информации, оперируют не одной, а сразу несколькими единицами анализа.

При использовании самой простой единицы анализа, слова, очень легко потерять контекст упоминания. Прямой подсчет количества упоминаний дает так называемые «простые частоты». Однако для сравнения, например, количества упоминаний такой показатель не подходит в силу того, что является нестандартизированным. Возникает необходимость использования «относительных частот», т.е. количество упоминаний на какую-либо единицу текста (общее число слов в публикациях, тысячу слов, количество предложений, абзацев, публикаций и т.д.).

Количественными единицами контент-анализа являются единицы счёта и единицы контекста.

Единицы контекста используются для обозначения того сегмента текста, в пределах которого определяется частота упоминания соответствующих категорий и подкатегорий. Единицей контекста может служить предложение, статья, ответ на вопрос анкеты, интервью и т.д. Затем устанавливаетсяединица счета , т.е. количественная мера единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте. Единицами счета могут быть число определенных слов или их сочетаний, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических пространственных величинах и многое другое.

Богомолова Н.Н. И Стефаненко Т.Г. выделяют два вида подсчётов частоты упоминаний категорий и подкатегорий при квантификации: а) сплошной, терминологический, б) сегментарный, типологический.

При сплошном подсчёте регистрируются, а потом подсчитываются все появления индикаторов данной категории или подкатегории. При сегментарном, тематическом подсчёте упоминаний категорий регистрируется лишь первое появление данной категории в единице контекста, а повторные упоминания этой категории в данной единице контекста не учитываются.

Единицей счёта может быть объём - физическая протяженность или площадь текстов, заполненная смысловыми единицами. Объём упоминаний категорий может измеряться различными способами: подсчётом числа строк, печатных знаков, квадратных сантиметров площади, посвященных данной категории и т.д.

В основу системы кодирования должна быть заложена по крайней мере одна (или несколько) из следующих четырех характеристик содержания текста: частоты, направленности, интенсивности и пространства. Как уже отмечалось выше, чаще всего измеряют частоту и объём занимаемого пространства. В исследовательском проекте, основанном на контент-анализе, исследователь может замерить как одну, так и все четыре характеристики. Поясним, что собой представляет каждая из них.

Частота. Это всего лишь фиксация и подсчет, имеет ли нечто место или нет, а если да, то как часто. Например, сколько пожилых людей появляется в телевизионных программах на протяжении одной недели? Какова их доля среди всех персонажей? Или же какова доля этих программ среди остальных?

Направленность. Речь идет об указании направления сообщений внутри содержания некоего континуума (их позитивный или негативный, поддерживающий или опровергающий характер). Например, исследователь может разработать перечень способов показа ситуаций, в которых действуют пожилые люди. Способы эти могут быть позитивными (например, дружелюбный, мудрый, уравновешенный человек), либо негативными (например, непристойный, тупой, самовлюбленный).

Интенсивность. Это сила или мощь сообщения в заданной направленности. Например, негативная характеристика забывчивости может быть смягчена (забыл взять ключи, уходя из дома; не сразу вспомнил имя человека, которого не видел несколько лет) или преувеличена (не помнит, как его зовут, не узнает своих детей).

Пространство. Исследователь может зафиксировать размер сообщения или количественно охарактеризовать пространство, им занимаемое. Пространство письменного текста измеряется путем подсчета слов, предложений, абзацев или места, отведенного сообщению на странице (например, в квадратных дюймах или сантиметрах). Для измерения видео- и аудиотекстов можно использовать количественные характеристики времени. Например, персонаж может присутствовать в течение нескольких секунд или появляться периодически в каждой сцене двухчасовой программы.

В общем виде процедуры подсчёта при контент-анализе аналогичны стандартным приёмам классификации по выделенным группировка, ранжирования и шкального измерения. Для исчисления результатов контент -анализа используются и специально разработанные формулы.

А.Н. Алексеев предложил для оценки "удельного веса" смысловых категорий в общем объёме текста следующую формулу, указывающую на уровень интенсивности представленной в тексте определённой темы:

Укс - "удельный вес" данной смысловой единицы

Кгл - число случаев, когда смысловая единица оказалось главной

Квт - число случаев, когда та же единица оказывается второстепенной

E - сумма анализируемых текстов (документов)

Специальным способом, разработанным для нужд контент-анализа, является методика Ч. Осгуда анализа зависимости элементов для расчёта совместной встречаемости различных элементов в тексте. Процедура данной методики состоит в том, что после подсчёта совместной встречаемости единиц анализа, рассчитывается квадратная матрица возможных и фактических совместных появлений этих единиц в тексте.

» Контент-анализ социология

Контент-анализ - описание метода

Контент-анализ (от англ. contens содержание) - метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Не все документы могут стать объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Основные направления применения контент-анализа: выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта - окружающей действительности, автора или адресата); определение того, что существует только в тексте как таковом (различные характеристики формы - язык, структура, жанр сообщения, ритм и тон речи); выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа - наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике отечественного контент-анализа сложилась довольно устойчивая система категорий - знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа - лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. В практике отечественных контент-аналитических исследований наиболее, употребительными единицами анализа являются слово, простое предложение, суждение, тема, автор, герой, социальная ситуация, сообщение в целом и др. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа - контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица - «предложение». Наконец, необходимо установить единицу счета - количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаше всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации - 12-16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.

Необходимым условием является разработка таблицы контент-анализа - основного рабочего документа, с помощью которого проводится исследование. Тип таблицы определяется этапом исследования. Например разрабатывая категориальный аппарат, аналитик составляет таблицу, представляющую собой систему скоординированных и субординированных категорий анализа. Такая таблица внешне напоминает анкету: каждая категория (вопрос) предполагает ряд признаков (ответов), по которым квантифицируется содержание текста. Для регистрации единиц анализа составляется другая таблица - кодировальная матрица. Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с тетрадью таких матричных листов. Если выборка невелика (до 100 единиц), то можно проводить двумерный или многомерный анализ. В этом случае для каждого текста должна быть своя кодировальная матрица. Эта работа трудоемка и кропотлива, поэтому при больших объемах выборки сопоставление интересующих исследователя признаков осуществляется на компьютере.

Важным условием контент-анализа является разработка инструкции кодировщику - системы правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя) заданные единицы анализа. В инструкции точно и однозначно излагается алгоритм действий кодировщика, дается операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как следует поступать в спорных случаях, и т.д. Процедура подсчета при количественном контент-анализе в общем виде аналогична стандартным приемам классификации по выделенным группировкам ранжирования и измерения ассоциации. Существуют также специальные процедуры подсчета применительно к контент-анализу, напр., формула коэффициента Яниса, предназначенного для вычисления соотношения положительных и отрицательных (относительно избранной позиции) оценок, суждений, аргументов. В случае, когда число положительных оценок превышает число отрицательных,

Контент-анализ

Это первая статья на моём блоге о контент-анализе, и она даёт общее представление о методе контент-анализа. Перевод с английского мой. Приятного прочтения.

Бернард Р Берелсон (1912-1979)

Контент-анализ – это детище эры электроники. Вместе с тем контент-анализ регулярно проводился уже в 1940-е года и ещё стал более часто используемым и пользующимся доверием методов с середины 1950-х годов, когда исследователи стали опираться не на слова, а на оперирование отдельными тематико-семантическими структурами, их стали интересовать связи между этими смыслами [корреляции], а не простое присутствие слов в массивах текстов.

Области использования контент-анализа.

Благодаря тому, что контент-анализ может быть использован для изучения любого по содержанию и форме текста или массива текстов или другой форме записи коммуникации, метод применяется в самых разных областях, например в сфере маркетинга и области изучения СМИ, литературе и риторике, этнографии и культурологи, в дисциплинах, изучающих гендерн и возраст, социологии и политологии, психологии и когнитивных науках и в других исследовательских областях знания и науках. Также контент-анализ тесно связан с социо- и психолингвистикой, он играет ключевую интегральную роль в системах разработки искусственного интеллекта. Нижеследующий список, опирающийся на труды Берелсона, описывает и другие категории сфер применения контент-анализа:

Даёт возможность понять интернациональные различия в коммуникациях
Определяет присутствие материалов пропагандистского характера
Идентифицирует намерения и тенденции в индивидуальной или групповой коммуникации
Описывает поведенческие реакции в рамках коммуникаций
Определяет психологический и эмоциональный фон отдельных индивидов и групп

Типы контент-анализа

Существуют две основные категории контент-анализа: концептуальный (понятийный) [в русскоязычных материалах его принято называть количественным, независимо от семантического неравенства терминов] и корреляционный. Концептуальный ориентирован на идентификацию присутствия и частоту появления этих концептуальных единиц [единиц счёта]. Корреляционный анализ ориентирован на идентификацию связей между отдельными единицами счёта в рамках текста.

Концептуальный контент-анализ

Традиционно контент-анализ рассматривался только в качестве концептуального его варианта. В концептуальном анализе концепция [единица счёта] выбрана как средство изучения текста с помощью подсчёта частоты её появления в тексте. Поскольку единицы счёта могут проявляться как эксплицитно так и имплицитно перед началом квантификации единиц важно заранее чётко определить и зафиксировать варианты имплицитного проявления единиц счёта. Для того чтобы избежать субъективности в определении объектов в качестве единиц счёта на данном этапе принято использовать специальные словари контент-анализа [тезаурусы].

Как и во многих других методах, концептуальный контент-анализ начинается с определения ключевых вопросов исследования и выборки или выборок. Будучи выбранным для анализа текст должен быть закодирован в рамках установленной исследователем системы категорий. Процесс кодирования представляет собой процесс сокращения объёма материала, являющийся основной идеей контент-анализа. Разделение массива текста на отдельные тематически целостные и релевантные категориальному аппарату единицы информации позволяет идентифицировать определённые характеристики материала, анализировать и интерпретировать их.

Примером концептуального анализа может являться изучение текста посредством подсчёта встречаемости кодов входящих в словарь контент-анализа кодов. В рамках анализа исследователь должен, например, ставить вопрос о том, как часто в тексте встречаются слова, подтверждающие ту или иную позицию, и как часто встречаются слова, её опровергающие. Исследователь должен быть заинтересован только лишь в подсчёте этих слов, но не в идентификации семантических и тематических связей между ними, что характерно для корреляционного анализа. В концептуальном анализе исследователь изучает только присутствие объектов релевантных вопросам исследования, то есть определяет – что в большей мере представлено в тексте – подтверждение той или иной гипотезы или гипотез или её (их) опровержение.

Корреляционный контент-анализ

Как уже было сказано выше, корреляционный контент-анализ базируется на принципах концептуального контент-анализа, изучая связи между единицами счёта (концепциями, позициями). И как в случае с другими типами исследований, данный подход базируется на определении выборки и категорий анализа, операционализированных словарём контент-анализа, что и определяет дальнейших ход исследования. Для корреляционного контент-анализа определить какие типы позиций (единиц счёта) будут эксплуатироваться в рамках исследования. Проводились исследования с использованием всего нескольких таких позиций (concepts) и проводились с использованием более 500 категорий концепций. Очевидно, что слишком большое число категорий может дать некорректные результаты исследования, так как с увеличением числа категорий и единиц счёта растёт и сложность анализа. Такое же утверждение характерно и для слишком маленьких категориальных аппаратов и словарей, дающих при использовании ненадёжные и потенциально некорректные результаты. Таким образом, при создании словарей и категориальных аппаратов важно опираться на особенности анализируемого массива и на конкретные задачи замера.

Существует большое количество методик проведения корреляционного контент-анализа, что определяет гибкость и популярность метода. Исследователи могут самостоятельно разрабатывать собственные методики проведения корреляционного контент-анализа в соответствии с задачами конкретного исследования. Когда разработанная процедура в достаточной мере доказала свою эффективность и объективность, она может быть принята и распространена среди других исследователей. Процесс проведения корреляционного контент-анализа достиг высокого уровня развития в компьютерной среде – среде автоматизации расчетов, но, даже не зависимо от этого, как и многие другие методы исследований, он является весьма длительным, требующим массу времени на реализацию. Вероятно, самым серьёзным требованием к этом методу является необходимость соответствия строгим статистическим нормам при условии сохранения богатства материала, выраженного в отдельных деталях, требующих качественного подхода для анализа.

Вопросы надёжности и верификации

Вопросы надёжности и верификации актуальны и в рамках данного метода. Надёжность результатов контент-анализа опирается на однородность процесса изучения, его стабильность (stability), умении кодировщиков и интерпретаторов оперировать данными единым образом на протяжении всего исследования; воспроизводимость или умение группы кодировщиков классифицировать материал в соответствии с заданным категориальным аппаратом единым образом; высокая статистическая точность классификации материала в соответствии с заданными категориями.

Ключевой проблемой концептуального контент-анализа является проблема получения спорных, сомнительных результатов, что является следствием использования самих процедур метода. Главный вопрос в данном контексте – какой объём и уровень заложенного в тексты смысла объективно доступен для идентификации, или, другими словами, являются ли полученные данные результатом использования исключительно введённого инструментария либо они получены и при участии других факторов, повлиявших на результаты исследования? При этом едва ли можно представить себе различные варианты толкования, например, числа 99 в точных науках. Объективные результаты исследования можно получить при использовании только основных [репрезентативных тематически, релевантных теме замера] материалов, массивов текстов, но и при этом, вопрос об объективности и возможности верификации и обоснования результатов остаётся открытым и злободневным.

Обобщения, заключения исследователей во многом зависимы от того, как конкретно исследователь определяет для себя значение той или иной категории, равно как актуальна и надёжность самого категориального аппарата. Исследователь обязательно должен точно определить категории и единицы счёте которые позволят объективно замерить исследуемый объект. Аналогично, точнейшим образом необходимо создать объективную системы правил и инструкция для исследования. Разработка правил, которые позволят всем кодировщикам и интерпретаторам следовать единым стандартам в работе, одинаковым образом кодировать материал, жизненно важна для успеха в проведении концептуального контент-анализа. Воспроизводимость [объективный выбор инструментов анализа, в случае необходимости выбранный идентично в рамках аналогичного исследования] и точность, не только категорий анализа и единиц счёта, но и ключевых подходов к анализу материала, позволяют получать более корректные и надёжные результаты.

Один из первых трудов по контент-анализу: Б.Берелсон "Формирование политических предпочтенией на президенских выборах"

Преимущества контент-анализа

Контент-анализ имеет ряд серьёзных преимуществ перед другими методами и просто очевидных достоинств. Среди них стоит выделить:

Изучает непосредственно саму коммуникацию через анализ текстов, что позволяет исследователю взаимодействовать с первичным средством коммуникаций в социуме
Работает как с качественными, так и с количественными данными
Может дать ценную историческую/культурологическую информацию, описывающую разные исторические периоды, опираясь только на анализ текста
Позволяет получать информацию близкую по форме изложения [текст], хотя степень такой близости варьируется в зависимости от используемого инструментария
Может быть использован для анализа материала, необходимого как средства развития тех или иных систем
«Ненавязчивый» способ анализа коммуникаций [участники коммуникации в данном случае не испытывают при анализе никакого дискомфорта, так как метод не вмешивается непосредственно в коммуникации]
Комплексно, интегрально и вдумчиво, глубинно подходит к изучению моделей человеческих мыслей и языка
Если метод используется корректно, то он расценивается в качестве объективного (базируется на реальных фактах, в отличие от дискурсивного анализа)

Недостатки контент-анализа

Контент-анализ также имеет и ряд недостатков, как теоретического так и прикладного характера:
Может потребовать очень много времени на проведение замера
Потенциально опасный для допущения ошибки, в особенности если используется корреляционный анализ, ориентированный на идентификацию глубинных данных
Часто не имеет теоретической базы в рамках различных методик проведения, либо, ради достижения важных для исследования результатов, может игнорировать теоретические научные ориентиры
По своей природе – редуктивен, то есть ориентирован на игнорирование слабо проявленной информации, в особенности, если производится анализ сложных по содержанию текстов
Часто ориентирован на упрощение результатов, так как опирается на простой подсчёт слов
Нередко игнорируется контекст содержания единиц счёта (слов), либо нивелируется значимость последующих слов
Может быть непрост для применения компьютерных технологий и автоматизации исследования

Оригинал статьи находится по следующему адресу: http://www.gslis.utexas.edu/~palmquis/courses/content.html

(перевод Алексея Рюмина)

Введение

В XXI веке информационные потоки обрушились на человека _ выросло количество телевизионных программ, изменился и их формат. Готовый продукт, передаваемый в эфир, оказывает влияние на аудиторию, формирует ее социальные установки и мнения. В этой связи становится важным изучение соотношения «экранной картинки» с реальной жизнью, насколько та или иная передача (проект), соответствуют тому, что происходит в обществе с внесением последующих изменений и корректировок в телеконтент.

Объектом исследования является изучение метода контент-анализа, предметом - исследование его характеристик и применения.

Цель курсовой работы _ дать определения методу «контент-анализ», изучить его структуру, выявить особенности и способы применения в исследовании телепрограммы и применить на практике.

Для достижения поставленной цели необходимо решить следующие задачи:

1. Раскрыть сущность понятия «контент-анализ».
2. Рассмотреть составляющие метода«контент-анализ», выявить его основные функции и алгоритм применения.
3. Применить метод «контент-анализа» (на примере телепередачи «Битва экстрасенсов»).

Методологической основой исследования стали научные труды отечественных и зарубежных ученых в области социологии, политологии и теории коммуникации. В качестве методов исследования в работе применялись: метод анализа и синтеза, наблюдения, статистические и математические методы.

Понятие «контент-анализ»

В социологии при сборе первичных данных используют четыре основных метода: опрос (анкетирование и интервьюирование), анализ документов (качественный и количественный «контент-анализ»), наблюдение (невключенное и включенное) и эксперимент (контролируемый и неконтролируемый). Несмотря на функциональное различие у этих методов, у них есть общая внутренняя структура. В ней можно выделить три группы элементов: нормативную, инструментальную и процедурную.

В данной главе мы рассмотрим, что такое метод контент-анализа. Возникновение термина «анализ содержания», обозначавшего статистически точные измерения содержания материалов массовой информации, относится к первым попыткам такого рода исследований в американской журналистике в конце XIX - начале XX вв.

В ранних работах исследователей американской прессы преобладала тенденция качественного анализа, осмысления содержания, поэтому особое внимание они уделяли разработке подобной классификации материалов прессы по форме изложения и, главным образом, по тематике, сравнивая затем объем материалов по категориям. Специалисты в области американской журналистики занимались не только разработкой различных классификаций, но и общетеоретических оснований самой процедуры анализа, однако их категории были слишком широки. Полномасштабное использование контент-анализа как объективного и систематического количественного описания явного содержания текстов требовало повышения его точности, и первым к решению этой задачи приступил Гарольд Лассуэл, который выделил в текстах повторяемость их отдельных частей и элементов на основе строгих математических расчетов.

Основное внимание Лассуэл обращал на частоту применения тех или иных «символов»: чем чаще встречается то или иное слово, тем более значима связанная с ним информация. Он учитывал только «словарное значение» слова, что делало строгим (объективным) полученный результат. Рассмотрение в качестве основного критерия контент-анализа исключительно количественной характеристики ограничивало возможности этого метода, не принимавшего в расчет редко встречающиеся темы или «символы». Контент-анализ в том виде, который придал ему Лассуэл, стал распространенным методом изучения газетной и журнальной прессы.

Важный вклад в развитие процедур контент-анализа внесли и российские и эстонские социологи, особенно А.Н. Алексеев, Ю. Вооглайд, П. Вихалемм, Б.А. Грушин, Т.М. Дридзе, М. Лауристинь.

Метод контент-анализа кажется простым, но реальная проблема для исследователя заключается в отборе смысловых единиц, значимых именно для исследуемой содержательной области, и в правильной категоризации отобранных текстов. Для того, чтобы отбор смысловых единиц (категорий) был «правильным», и для того, чтобы правильной была категоризация (подведение единиц текста под одну из наличных категорий), необходимы как экспертные свидетельства, так и более или менее глубокое предварительное содержательное изучение исследуемой области.

Б. Берельсон характеризует этот метод как «метод исследования, с помощью которого достигается объективный, систематический и количественный анализ открытого текста». Смысл объективности состоит в том, что категории, используемые при анализе содержания, должны быть определены настолько точно, чтобы, используя их, разные люди, разбирая один и тот же текст, получали одинаковый результат. Также это означает, что все термины и категории, содержащие явный элемент оценки, должны быть исключены, т.е. они очень субъективны, и значение их меняется с изменением ситуации и времени. Систематичность предполагает, что выбор текста или его части для анализа должен осуществляться на формальном основании, без учета личной заинтересованности и предрасположенности исследователя. Результаты анализа должны быть выражены в математической форме.

Известный социолог В.А. Ядов дает определение контент-анализу, говоря о том, что «это перевод в количественные показатели массовой тестовой информации с последующей статистической ее обработкой. М.К. Горшков пишет, что «стремление в максимальной степени избежать субъективизма, потребность в социологическом изучении и обобщении большого объема информации. Ориентация на использование современной компьютерной техники при обработке содержания текстов привели к становлению метода формализованного, качественно-количественного изучения документов _ контент-анализа, согласно которому, содержание текста определяется как совокупность имеющихся в нем сведений, оценок, объединенных в некую целостность единой концепцией, замыслом. Формализованный анализ документов имеет дело с текстом, но ориентирован, прежде всего, на изучение стоящей за ним реальности».

Дж. Б. Мангейм и Р.К. Рич определяют контент-анализ как «формализованный метод, который эффективен, когда необходимо обеспечить высокую точность показателей, исследовать обширный несистематизированный материал. Этот метод используется, когда есть возможность познакомиться с материальным источником информации газета, журнал, книга, фонограмма, аудио- или видеозапись. Протокол, стенограмма заседания, рекламный плакат и предполагает систематическую обработку, оценку и интерпретацию формы и содержания.

В.И Добреньков и А.И. Кравченко пишут о том, что «контент-анализ _ это количественный анализ текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей. Этот тип неопросного исследования называют еще анализом документов. Под документами (текстами) в контент-анализе понимают книги, книжные главы, эссе, интервью, дискуссии. Заголовки газетных статей и свои статьи, исторические документы, дневниковые записи, речи выступлений, рекламные тексты.

Как социологический метод, контент-анализ используется не сам по себе, а в составе крупного исследовательского проекта, под который составлена научная программа, где прописаны цели и задачи, проблема и объект, теоретическая модель и объект исследования, выдвинуты гипотезы. Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении. Он позволяет вписать содержание документа в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни.

К числу достоинств контент-анализа относятся:

Возможность точной регистрации внешне неразличимых показателей в объемных массивах эмпирических данных;

Способность к выявлению скрытых тенденций и закономерностей;

Допустимость осуществления отсроченного по времени анализа событий и ситуаций;

Относительная объективность процедур и надёжность результатов;

Отсутствие проявлений эффекта воздействия исследователя на поведение испытуемых.

Наряду с этим контент-анализу присущи и некоторые ограничения:

Характер информации во многом определяется замыслами ее автора и спецификой форм предъявления. Поэтому возможно принятие исследователем вымысла за документальность или упущение каких-либо существенных данных вследствие недостаточной выраженности их в обрабатываемом материале;

Искажения информации могут возникать и по вине исследователя, неспособного, к примеру, адекватно выделить категории анализа или учесть все имеющиеся варианты их словесного выражения.

В терминологическом словаре телевидения «контент-анализ телепередач _ метод изучения тематики, содержания телепрограмм. Его задача - выявить, как отражается действительность на экране, насколько созданные телевидением модели соответствуют тому, что происходит в обществе. Система категорий: внешние признаки показываемой действительности; контекстовые признаки показываемой действительности; персонаж, субъект изображения. Система обработки позволяет в итоге получить данные разного характера: оперативные _ описание содержания передач определенного периода, например одной недели; сравнительные _ описание содержания одного периода в сравнении содержания телепередач с газетными статьями, с радиопередачами. В конечном итоге контент-анализ способствует повышению эффективности вещания».

При контент-анализе телепрограмм важно, каким образом в контексте телепрограммы используются средства формирования и распространения образов, отвлечения внимания посредством создания новых информационных поводов (предлогов). Предоставления сенсации, эмоциональной окраски события, не связанного с основным событием телесюжета, а также средства изменения тональности текста или контекста через «последнее слово» ведущего (репортера). Создания двойного стандарта или дозирования информационной базы, опускания или исключения информации, предоставления позитивной (негативной) окраски изложения события через положительную (негативную) подводку сюжета и ее позитивное (негативное) окончание (метод «сладкого» или «ядовитого сендвича»). Средства раздувания детали и осложнения и усложнения информационной базы (когда точка зрения или позиция объекта мониторинга выкладывается максимально академически, детализировано, с использованием сложных научных терминов, которая делает такую точку зрения или позицию непонятной). Исследователи обращают внимание и на средства манипулирования семантической структурой высказывания (подбор слов, которые опосредствовано, вызывают ту или другую эмоцию) и на средства манипулирования цветом, светом.

Американский социолог Б. Тернер говорит о преимуществах контент-анализа, характеризуя его как ненавязчивый (нет взаимодействия с фоном исследования, который мог бы исказить результаты) и косвенный метод (выводы исходят из того, что непосредственно не наблюдается), дающий представление об объектах, которые исследователь непосредственно не наблюдает.

Задачи, функции и основные процедуры контент-анализа.

Эстонский социолог М. Лауристинь обобщает задачи, предмет и объект контент-анализа применительно к изучению массовых коммуникаций:

Проблематика отражения действительности;

Область реализации целей коммуникатора и социального института, который он представляет;

Сфера потребностей аудитории массовой коммуникации, удовлетворяемых ею;

Область взаимодействия коммуникатора и аудитории.

Далее развертывается система индикаторов применительно к каждому из названных аспектов. Например, для первого аспекта (отражение реальности) ставятся задачи: реконструировать события и явления и установить закономерности отображения действительности средствами массовой коммуникации (СМК). Объектом анализа здесь выступают содержание сообщений, их тематика и смысловые значения, а предметом _ картина мира, представляемая СМК. В последнем аспекте (взаимодействие) ставятся задачи прогнозировать эффективность информационного воздействия, его социальный эффект и коммуникативные отношения между различными группами аудитории. Объект коммуникации _ язык и структура текста (то, о чем сообщается) и характеристики источника сообщения, а также его адресата.

Объектом контент-анализа могут быть экземпляры книг, плакатов или листовок, номера газет, фильмы, публичные выступления, теле- и радиопередачи. Общественные и личные документы, журналистские интервью, ответы на открытые вопросы анкет.

По функциям контент-анализ делится:

На поисковый, направленный на проверку выдвинутой гипотезы, выявление неизвестных тенденций;

Контрольный, связанный с более точным определением уже известного (более или менее) содержания.

По характеру:

Направленный, когда точно известно, что нужно измерять;

Ненаправленный, когда исследователь действует интуитивно, не систематизируя заранее объект исследования.

Алгоритм контент-анализа заключается и в определении модальности и тональности текста. Модальность текста _ это выражение в тексте отношения автора к сообщаемому, его концепции, точки зрения, позиции, его ценностных ориентаций, сформулированных ради сообщения их читателю. Выделяют положительную, нейтральную и отрицательную модальность.

Тональность _ категория, отражающая психологическую установку автора, относится к понятийному полю субъективной модальности. Материалы, часть (блоки) газетных материалов, сюжеты, часть сюжетов, разграничиваются. По нейтральной, позитивной (положительной) и негативной тональности. Тональность материалов, части (блоков) газетных материалов, сюжетов, части сюжетов, определяется по:

Наличию оценочных суждений и оценочной лексики (эпитеты, существительные уничижительного, уменьшительно-ласкательного характера);

По интонации (в письменной речи _знаки препинания, особенно восклицательный и вопросительный);

Использование метафор, сравнений, пословиц, символов, описывающих человека, предмет или явление;

По формулировке основного сообщения (заглавий);

По контексту;

По соответствию вербального текста и видеоряда (фото, иллюстраций);

По соответствию синхрона и видеоряда;

По верстке части (блоков) сюжета, частям (чередованием) их тональности;

По прямой или опосредствованной оценке окружения субъектов контент-анализа;

По прямой или опосредствованной оценке субъектов контент-анализа со стороны других субъектов контент-анализа;

По прямой или опосредствованной оценке субъектов контент-анализа со стороны журналистов;

По прямой или опосредствованной оценке субъектов контент-анализа со стороны других действующих лиц, засвидетельствованных в сюжете.

Проведение контент-анализа требует предварительной разработки ряда исследовательских инструментов. По мнению С.И. Григорьева и Ю.Е. Растова их должно быть пять:

Классификатор контент-анализа;

Протокол итогов анализа (бланк контент-анализа);

Регистрационная карточка или кодировальная матрица;

Инструкция исследователю, непосредственно занимающемуся регистрацией и кодировкой единиц счета;

Каталог (список) проанализированных документов.

Классификатором контент-анализа авторы называют общую таблицу, в которую сведены все категории (и подкатегории) анализа и единицы анализа. Ее основное предназначение _ предельно четко зафиксировать то, в каких единицах выражается каждая категория, используемая в исследовании. Классификатор можно уподобить социологической анкете, где категории анализа играют роль вопросов, а единицы анализа _ ответов.

Протокол (бланк) контент-анализа содержит сведения о документе (его авторе, времени издания, объеме) и итоги его анализа (количество случаев употребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа).

Протоколы заполняются в закодированном виде, исходя из того, что нужно уместить всю информацию о документе для удобства сопоставления итогов анализа.

Регистрационная карточка представляет собой кодировальную матрицу, в которой отмечается количество единиц счета, характеризующее единицы анализа. Протокол контент-анализа каждого конкретного документа заполняется на основе подсчета данных всех регистрационных карточек, относящихся к анализируемому.

К стадиям разработки и проведения контент-анализа относят формулирование темы, задач, гипотезы исследования, определяют категории анализа _ наиболее общие, ключевые понятия, соответствующие исследовательским задачам.

Категории анализа - смысловые единицы, обозначающие эмпирические признаки текстовой информации, которые являются результатом операционализации опорных теоретических понятий в концепции исследования. К категориям анализа предъявляют определенные требования, они должны выражать теоретические понятия исследования, иметь в соответствии признаки (смысловые единицы) в тексте, обладать возможностями однозначной регистрации признаков, составляющих эти категории.

При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

Уместными, т.е. соответствовать решению исследовательских задач;

Исчерпывающими, т.е. достаточно полно отражать смысл основных понятий исследования;

Взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме);

Надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.

В настоящее время различают четыре методологии контент-анализа:

Грамматический (лингвистический) (по размеру абзацев, длине фраз, порядку слов в предложении, метрическому составу);

Семантический (социологический) (по экспертным оценкам содержания);

Документалистический (кибернетический) (по параметрам языка, текста и документа как сообщения (дескрипторы и их нагрузка, компактность, информационная плотность, аспектность, проточность, физический и информационные объемы, информационная емкость и информативность));

Цитационный (анализ библиографических ссылок в научной литературе).

Контент-анализ проводится в несколько этапов. Исследователь должен составить план работы, определить источники информации, затем выделить единицы анализа и составить кодировочный бланк, который заполняется во время работы с текстами.

Первый этап предполагает выбор единиц анализа: необходимо выбрать соответствующие, служащие в тексте индикатором интересующих исследователя явлений, которые зависят от исследовательской программы, объекта, предмета, цели, задач и гипотез исследования. Главной смысловой единицей может быть социальная идея, социально значимая тема, отраженная в операционных понятиях. В тексте она выражается по-разному _ словом, сочетанием слов, описанием. Цель _ отыскать индикаторы, указывающие на наличие в документе темы, значимой для анализа, и раскрывающие содержание текстовой информации.

В качестве единиц анализа используются:

Понятия, выраженные в отдельных терминах. Например, из области экономики: «формы собственности», «приватизация», «финансовая система», «денежное обращение»; политики: «правящие круги» и «оппозиция», «демократия», «международное сотрудничество». Нравственные или правовые символы: «права человека». «Гуманизм», «активность», «преступность»; научные: «модель», «система», «космическое пространство»;

Темы, выраженные в целых смысловых абзацах, частях текстов, статьях, радиопередачах. По тематике можно еще более полно представить содержание документа. Столь же показательны сюжеты из личных документов, например, писем о самом себе или о своих близких, в делах производственных и политике, об искусстве. Все это _ свидетельства определенной направленности взглядов, интересов, ценностных ориентаций и норм деятельности;

Имена исторических личностей, политиков, выдающихся ученых и деятелей искусства, организаторов производства, лидеров движений и партий, наименований общественных институтов, организаций и учреждений. Эти характеристики могут свидетельствовать о влиянии отдельных лиц или представляемых ими социальных институтов, сообществ, групп на общественное мнение. По числу ссылок на отдельных авторов определяют значимость той или иной научной цели: если число ссылок растет или падает, это свидетельствует о росте или падении авторитета данной концепции. По частоте упоминаний общественных движений или их лидеров легко заключить о влиятельности этих движений;

Целостное общественное событие, официальный документ, факт, произведение, случай, несут специфическую смысловую нагрузку и тоже могут быть приняты за единицу анализа.;

Смысл апелляций к потенциальному адресату-пользователю рекламируемой продукции, или гражданину как возможному стороннику политического, иного движения. В коммерческой рекламе содержатся апелляции к возрастным когортам («молодежь выбирает»), социальному слою, активизирующие разные потребности личности (здоровье, социальный статус), нацеленные на мотивацию избежания опасности или достижение успеха.

Второй этап связан с выбором единиц измерения (счета), т.е. количественной меры единиц анализа (индикаторы единиц анализа), позволяющей регистрировать частоту (регулярность) появления признака категории анализа в тексте. За единицу счета могут быть приняты:

Частота появления признака категории анализа;

Объем внимания, уделяемого категории анализа в содержании текста. Для установления объема внимания могут быть учтены количество печатных знаков, абзацы, площадь текста, выраженная в физических пространственных единицах.

Единицы счета могут и совпадать и не совпадать с единицами анализа. При анализе прессы за единицу счета часто принимают физическую протяженность или площадь текстов (в квадратных сантиметрах), заполненную смысловыми единицами: число строк, абзацев, знаков; длительность трансляции по радио и телевидению, метраж пленки при магнитофонных записях. Преимущество такой единицы счета заключается в быстроте работы кодировщика.

Процедура контент-анализа включает в себя применение стандартных правил выделения в изучаемом тексте однотипных единиц анализа (счета, наблюдения). И подсчет частоты встречаемости этих единиц в выборке (количество документов, подвергаемых счету) как в абсолютных (число раз), так и в относительных (проценты) величинах. Обязательный момент в такой процедуре - использование математико-статистических методов счета, т.к. основу контент-анализа составляет подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными количественными и качественными характеристиками.

Третий этап _ подготовка инструментария, составление кодировочного бланка. Каждой из выделенных единиц приписывается определенный код _ числовое обозначение. Это может быть одна цифра, если ключевых немного, но может быть и двухзначным или трехзначным. Все присвоенные коды вписываются в специальный журнал, которым пользуются дешифровальщики.

Бланк кодировки _ обязательный инструментарий осуществления формализованного анализа документов. Он составляется в соответствии со схемой операциональных понятий, содержит единицы анализа и все элементы описания проблемной ситуации, устанавливает однозначное соответствие между лексикой текста и кодами, над которыми производятся вычислительные операции.

В общем виде процедуры подсчета при контент-анализе аналогичны стандартным приемам классификации по выделенным группировкам, ранжирования. Для исчисления результатов контент-анализа используются и специально разработанные формулы. Так, А.Н. Алексеев предложил формулу оценки «удельного веса» смысловых категорий в общем объеме текста. Формула указывает на уровень интенсивности представленной в тексте определенной темы (или аргументации, способов обращения к читателю).

Применяются также статистические расчеты доходчивости текста (терминов, предложений), его интересности для читателя и более сложные приемы изучения взаимосвязи распределений смысловых единиц. Процедуры обработки данных контент-анализа происходят в специальной программе SPSS.

Широко используемое средство, позволяющее проверить надежность, достоверность информации и одновременно исследовать содержание документов _ внутренний и внешний анализ. Внешний анализ состоит в изучении обстоятельств возникновения документа, его исторического, социального контекста. Внутренний анализ _ это изучение содержания документа, всего того, о чем свидетельствует текст источника и тех объективных процессов и явлений, о которых он сообщает.

Надежность информации, получаемой контент-анализом, обеспечивается следующими способами:

Обоснование полноты объема выделяемых смысловых единиц методом «снежного кома». Первоначально выделяются все смысловые единицы из первого анализируемого текста, далее из второго _ те же плюс дополнительные, ранее не встречавшиеся, из третьего документа _опять те же, что встречались в двух предыдущих плюс дополнительные. После изучения других текстов, в которых не появляется ни одной новой единицы, ранее фиксированной в предыдущих документах, можно полагать, что «поле» смысловых единиц из изучаемого массива исчерпано;

Контроль на обоснованность содержания смысловых единиц с помощью судей. Специалисты в данной области обсуждают, насколько предложенные качественные единицы соответствуют поставленным задачам;

Обоснованность по независимому критерию. Например, данные контент-анализа дневников или сочинений учащихся с целью выявить их профессиональную склонность выборочно проверяются путем опросов или по данным наблюдений, или тестом по известной группе;

Устойчивость данных определяется при помощи кодирования одного текста разными кодировщиками на основе единой инструкции.

Контент-анализ – метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах.
Контент-анализ – формализованный метод изучения текстовой и графической информации, заключающийся в переводе изучаемой информации в количественные показатели и ее статистической обработке. Характеризуется большой строгостью, систематичностью.
Контент-анализ не отменяет необходимости обычного (т.е. содержательного) анализа документов. Первый дополняет второй, их сочетание углубляет понимание смысла любого текста. Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении, но что имеет важныйсоциальный смысл.

Кроме того, контент-анализ отличается от всех прочих способов изучения документов, тем, что он позволяет «вписать» содержание документа в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни. «Вписывание» документа в изучаемую проблему предполагает выявление того, что: а) существовало до него и получило в нем отражение, б) наличествует только в нем, в) будет после него, т.е. явится итогом его восприятия адресатом.

Сущность метода

фиксация определенных единиц содержания,
изучает документы в их социальном контексте,
может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Объект контент-анализа

документы, исследуемое содержание которых, позволяет задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, интересующие исследователя элементы содержания встречаются с достаточной частотой (принцип статистической значимости).
чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Основные направления применения контент-анализа

выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта – окружающей действительности, автора или адресата);
определение того, что существует только в тексте как таковом (различные характеристики формы – язык, структура, жанр сообщения, ритм и тон речи);
выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

Стадии разработки и применения контент-анализа

формулируются тема, задачи и гипотезы исследования
определяются категории анализа – наиболее общие, ключевые понятия, соответствующие исследовательским задачам.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

уместными, т.е. соответствовать решению исследовательских задач;
исчерпывающими, т.е. достаточно полно отражать смысл основных понятий исследования;
взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме);
надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.

Необходимо выбрать соответствующую единицу анализа – лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления.

За единицу анализа может быть принято:

слово,
предложение,
тема,
идея,
автор,
персонаж,
социальная ситуация,
часть текста, объединенная чем-то, что соответствует смыслу категории анализа.

Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа – контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица – «предложение».

Необходимо установить единицу счета – количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Единица счета – количественная мера единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте. Единицами счета могут быть число определенных слов или их сочетаний, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических пространственных величинах и многое другое.

Важен выбор необходимых источников, подвергаемых контент-анализу.

Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования.

Чаще всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации – 12-16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.

Основные процедуры контент-анализа

Выявление смысловых единиц контент-анализа, которыми могут быть:

понятия, выраженные в отдельных терминах;
темы, выраженные в целых смысловых абзацах, частях текстов, статьях, радиопередачах и т.п.;
имена, фамилии людей;
события, факты и т.п.;
смысл апелляций к потенциальному адресату.

Единицы контент-анализа выделяются в зависимости от содержания, целей, задач и гипотез конкретного исследования.

Выделение единиц счета, которые могут совпадать либо не совпадать с единицами анализа. В 1-м случае процедура сводится к подсчету частоты упоминания выделенной смысловой единицы, во 2-м – исследователь на основе анализируемого материала и здравого смысла сам выдвигает единицы счета, которыми могут быть:

физическая протяженность текстов;
площадь текста, заполненная смысловыми единицами;
число строк (абзацев, знаков, колонок текста);
длительность трансляции по радио или ТВ;
метраж пленки при аудио- и видеозаписях,
количество рисунков с определенным содержанием, сюжетом и пр.

Процедура подсчета в общем виде сходна со стандартными приемами классификации по выделенным группировкам. Применяется составление специальных таблиц, применение компьютерных программ, специальных формул (напр., «формула оценки удельного веса смысловых категорий в общем объеме текста»), статистические расчеты понятности и аттрактивности текста.

Проведение контент-анализа требует предварительной разработки ряда исследовательских инструментов. Из них обязательными являются:

классификатор контент-анализа,
протокол итогов анализа, который имеет второе обозначение – бланк контент-анализа,
регистрационная карточка или кодировальная матрица,
инструкция исследователю, непосредственно занимающемуся регистрацией и кодировкой единиц счета,
каталог (список) проанализированных документов.

Классификатором контент-анализа называется общая таблица, в которую сведены все категории (и подкатегории) анализа и единицы анализа. Ее основное предназначение – предельно четко зафиксировать то, в каких единицах выражается каждая категория, используемая в исследовании. Классификатор можно уподобить социологической анкете, где категории анализа играют роль вопросов, а единицы анализа – ответов. Он является основным методическим документом контент-анализа, предопределяющим содержание всех прочих инструментов этого метода.

Протокол (бланк) контент-анализа содержит: во-первых, сведения о документе (его авторе, времени издания, объеме и т.п.); во-вторых, итоги его анализа (количество случаев употребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа). Протоколы заполняются, как правило, в закодированном виде, но не ради сохранения тайны итогов контент-анализа, а исходя из желательности на одном листе бумаги уместить всю информацию о документе, чтобы удобнее было сопоставлять друг с другом итоги анализа разных документов. Если в исследовании осуществляется контент-анализ малого числа документов, то можно обойтись без кодирования и заполнять эти протоколы в открыто-содержательном виде.