© О.Т.Манаев
Контент-анализ(от англ, contens —содержание) — специальный достаточнострогий метод качественно-количественногоанализа содержания документов в целяхвыявления или измерения социальныхфактов и тенденций, отраженных этимидокументами. Особенность его состоитв том, что он изучает документы в ихсоциальном контексте.
Контент-анализможет использоваться в качестве основногометода исследования (например, висследовании социальной направленностигазеты); параллельного, т.е. в сочетаниис другими методами (например, в исследованииэффективности функционирования средствмассовой информации); вспомогательногоили контрольного (например, приклассификации ответов на открытыевопросы анкет).
Не вседокументы могут выступить объектомконтент-анализа. Необходимо, чтобыисследуемое содержание позволило задатьоднозначное правило для надежногофиксирования нужных характеристик(принцип формализации), а также чтобыинтересующие исследователя элементысодержания встречались с достаточнойчастотой (принцип статистическойзначимости). Чаще всего в качествеобъектов исследований посредствомконтент-анализа выступают сообщенияпечати, радио, телевидения, массовойустной агитации и пропаганды, протоколысобраний, письма, приказы, распоряженияи т.д., а также данные свободных интервьюи открытые вопросы анкет.
Существуюттри основных направления примененияконтент-анализа:
а)выявление того, что существовало дотекста и что тем или иным образом получилов нем отражение (текст как индикаторопределенных сторон изучаемого объекта— окружающей действительности, автораили адресата);
б)определение того, что существует тольков тексте как таковом (различныехарактеристики формы — язык, структураи жанр сообщения, ритм и тон речи);
в)выявление того, что будет существоватьпосле текста, т.е. после его восприятияадресатом (оценка различных эффектоввоздействия).
Вразработке и практическом примененииконтент-анализа выделяют несколькостадий. После того, как сформулированытема, задачи и гипотезы исследования,определяются категории анализа, т.е.наиболее общие, ключевые понятия,соответствующие исследовательскимзадачам. Система категорий играет рольвопросов в анкете и указывает, какиеответы должны быть найдены в тексте. Впрактике советских контент-аналитическихисследований в свое время сложиласьдовольно устойчивая система категорий,среди которых можно назвать такие, какзнак, цели, ценности, тема, герой, автор,жанр и др. Все более широко распространяетсяконтент-анализ сообщений средствмассовой информации, основанный напарадигматическом подходе, в соответствиис которым изучаемые признаки текстов(содержание проблемы, причины еевозникновения, проблемообразующийсубъект, степень напряженности проблемы,пути ее решения и др.) рассматриваютсякак определенным образом организованнаяструктура. Категории контент-анализадолжны быть исчерпывающими (т.е. охватыватьвсе части содержания, определяемыезадачами данного исследования);взаимоисключающими (одни и те же частине должны принадлежать различнымкатегориям); надежными (т.е. междукодировщиками не должно быть разногласийпо поводу того, какие части содержанияследует относить к той или иной категории);уместными (т.е. соответствоватьпоставленной задаче и исследуемомусодержанию).
Привыборе категорий необходимо избегатьдвух крайностей: выбора слишкоммногочисленных и дробных категорий,почти повторяющих текст, и выбора слишкомкрупных категорий, т.к. это может привестик упрощенному, поверхностному анализу.Иногда же необходимо принимать вовнимание и отсутствующие элементытекста, которые могут быть значимыми.
Послетого, как категории сформулированы,необходимо выбрать соответствующуюединицу анализа — лингвистическуюединицу речи или элемент содержания,служащие в тексте индикатором интересующихисследователя явлений. Сложные видыконтент-анализа обычно оперируют неодной, а одновременно несколькимиединицами анализа.
Единицыанализа, взятые изолированно, могутбыть не всегда правильно истолкованы,поэтому они рассматриваются на фонеболее широких лингвистических илисодержательных структур, указывающихна характер членения текста, в пределахкоторого идентифицируется присутствиеили отсутствие единиц анализа —контекстуальных единиц. Например, дляединицы анализа «слово» контекстуальнаяединица — «предложение».
Наконецнеобходимо установить единицу счета —количественную меру взаимосвязитекстовых и внетекстовых явлений.Наиболее употребительны такие единицысчета, как время-пространство (числострок, площадь в квадратных сантиметрах,минуты, время вещания и т.п), появлениепризнаков в тексте, частота их появления(интенсивность).
Важенвыбор необходимых источников, подвергаемыхконтент-анализу. Проблема выборкисодержит в себе выбор источника, числасообщений, даты сообщения и исследуемогосодержания. Все эти параметры выборкиопределяются задачами и масштабамиисследования. Чаще всего контент-анализпроводится на годичной выборке: еслиэто изучение протоколов собраний, тодостаточно 12 протоколов (по числумесяцев), если изучение сообщений средствмассовой информации — 12-16 номеров газетыили теле- радиодней. Обычно выборкасообщений средств массовой информациисоставляет 200-600 текстов.
Необходимымусловием контентного исследованияявляется разработкатаблицы контент-анализа—основного рабочего документа, с помощьюкоторого оно проводится. Тип таблицыопределяется этапом исследования. Так,разрабатывая категориальный аппарат,аналитик составляет таблицу, представляющуюсобой систему скоординированных исубординированных категорий анализа.Такая таблица внешне напоминает анкету:каждая категория (вопрос) предполагаетряд признаков (ответов), по которымквантифицируется содержание текста.Таблица-анкета может быть достаточнообъемной.
Длярегистрации единиц анализа составляетсядругая таблица — кодировальная матрица:
Признак | Текст | |||||
1 | 2 | 3 | n | Σn | ||
А | + | |||||
В | + | + | ||||
С | + | + | ||||
... | ||||||
n | ||||||
Σn |
Еслиобъем выборки достаточно велик (свыше100 единиц), то кодировщик, как правило,работает с тетрадью матричных листов.Если выборка сравнительно невелика (до100 единиц), то можно проводить двумерныйили даже многомерный анализ. В этомслучае для каждого текста должна бытьсвоя кодировальная матрица. Однако этаработа очень трудоемка и кропотлива,поэтому при больших объемах выборкисопоставление интересующих исследователяпризнаков осуществляется на компьютере.
Иногдатаблица может быть необходимой и наэтапе количественной обработки данных.Например, при использовании анализаслучайностей, разработанного американскимсоциальным психологом Ч. Осгудом,строится так называемая матрицаслучайностей:
Реальноесовпадение | Ожидаемоесовпадение | |||||
А | В | С | n | Σn | ||
А | - | 0,15 | 0,02 | |||
В | 0,05 | - | 0,06 | |||
С | 0,08 | 0,12 | - | |||
... | - | |||||
n | - | |||||
Σn | - |
Спомощью такой матрицы выявляются мерыслучайности совпадения каждойклассификационной единицы со всемиостальными. Например, единица Австречается в 30%анализируемых текстов (Р= 0,3), а единица В— в 50% текстов (Р= 0,5), тогда ожидаемаячастота совместного появления этихединиц будет равна: РАВ= РА• Рв=0,3 • 0,5 = 0,15. Вдействительности же признаки Аи Всовместно встретилисьлишь в 5% текстовАВ =0,05. Сравнивая ожидаемыеи реальные совпадения признаков, можноопределить, какие фактические зависимостиоказались не случайными (напр., изприведенной выше таблицы видно, чтосовместное появление единиц Аи В— случайное, т.к.реальное совпадение меньше ожидаемого,а единиц В иС —не случайное, т.е. реальное совпадениевыше ожидаемого). Цели применения даннойматрицы могут быть различными: проследитьслучайность-неслучайность совпаденияпризнаков для проверки гипотезы, отметитьустойчивые-неустойчивые парные сочетанияпризнаков, что может оказаться значимымдля характеристики деятельностиотправителя информации, и т.д.
Важнымусловием К.-А. является разработкаинструкции кодировщику — системы правили пояснений для того, кто будет собиратьэмпирическую информацию, кодируя(регистрируя) заданные единицы анализа.В инструкции точно и однозначно излагаетсяалгоритм действий кодировщика, даютсяоперациональное определение категорийи единиц анализа, правила их кодирования,приводятся конкретные примеры изтекстов, являющихся объектом исследования,оговаривается, как следует поступатьв спорных случаях, и т.д.
Процедураподсчета при количественном контент-анализе.в общем виде аналогична стандартнымприемам классификация по выделеннымгруппировкам ранжирования и измеренияассоциаций. Существуют также специальныепроцедуры подсчета применительно кконтент-анализу, напр., формула коэффициентаЯниса (с), предназначенногодля вычисления соотношения положительныхи отрицательных (относительно избраннойпозиции) оценок, суждений, аргументов.В случае, когда число положительныхоценок превышает число отрицательных,коэффициент Яниса подсчитывается поформуле
где;-число положительных оценок; п— число отрицательныхоценок; г — объемсодержания текста, имеющего прямоеотношение к научаемой проблеме; t— общий объеманализируемого текста.
Вслучае, когда число положительных оценокменьше, чем отрицательных, коэффициентЯниса находится по формуле
Естьи более простые способы измерения.Удельный вес той или иной категорииможно вычислить с помощью формулы