Метод контент-анализа и его применение в отечественной социологии. Анализ документов

Контент-анализ текстов массовой коммуникации проектируется по всем правилам социологического исследования позитивистского образца. Прорабатывается программа, то есть формулируются цели, задачи и гипотезы, описываются предмет и объект исследования. Предметом контент-анализа всегда является состояние и тенденции развития социально значимого содержания СМИ. Структура и динамика этого содержания - то политические ценности, историко-культурные факты, то образцы социального взаимодействия индивидов и групп - в первую очередь интересуют аналитика. Объектом, как правило, представляет собой совокупность текстов, целый массив сообщений транслируются прессой, радио, телевидением, кино и т.

Вполне понятно, что первый вопрос, который возникает при организации контент-анализа, касается выборки такой совокупности текстов. Понятно и то, что она не будет такой суровой, как в случае опросов. Вообще следует иметь в виду, что контент-анализ обычно опирается на конвенционные, достигнутые совместным опытом, согласованные среди исследователей предположение. Дело в том, что текстовая реальность - символическая версия, знаковое изображение социального мира во всех его проявлениях и взаимосвязях, которое отнюдь не является каким слепком, буквальным отражением его. В работе с символическими структурами многое зависит от того, насколько первоначальное прочтение текстов по определенным правилам способствует сравнению результатов, полученных отдельными исследователями. Кон-венцийнисть сопровождает и представления об отборе сообщений для анализа. Выборка текстов не тождественна выборке людей. На любую воображаемую генеральную совокупность текстов СМИ влияют нарушения периодичности изданий, случайность и непредсказуемые обстоятельства их производства и тому подобное. Можно сказать, что требования к выборке текстов несколько "мягче", чем в выборку респондентов, а апелляции к тому, что "так принято" или "практика показывает", случаются здесь чаще. Однако это не означает, будто небрежность и произвол вызывают сочувствие. Напротив, исследователю, что берется за контент-анализ, следует учитывать и по возможности элиминировать влияние на текстовую упорядоченность разного рода внешних факторов.

Обычно используется многоступенчатая выборка текстов СМИ. Прежде всего отбирают каналы, источники информации, конкретные периодические издания или программы. Скажем, нас интересует ценностное сознание политических элит альтернативной идеологической направленности, которые появились на украинской политической сцене в конце 80-х годов. На основании предварительной аналитической работы мы отбираем для изучения два печатных издания, наиболее откровенно представляют позиции. В нашей общественной опыте это были газеты "Правда Украйны" и "Литературная Украина". Для анализа новостей отбираются специфически ориентированные телепрограммы, радиопередачи и т.д., которые предлагаются теми или иными каналами, станциями, информационными компаниями. Отбор конкретного источника уже заранее ограничивает рамки интерпретации выводов аналитика, поскольку он должен корректно распространять их особенности и тенденции содержания больших по объему информационных потоков.

Следующая ступенька выборки - формирование совокупности сообщений помощью. Основным ограничителем здесь есть временная рамка информационного пространства. Отрезок времени определяется целью и задачами исследования, направленного или на отражение современного состояния массовой коммуникации, или на наблюдение за его динамикой, или на то и другое одновременно. Следует заметить, что контент-анализ, как и анализ документов вообще, открывает возможность не только лонгитюдного исследования социума, осуществляется с помощью опросов, но и ретроспективного изучения социальной реальности, ценностей, норм и образцов прошлого. Месяц, полгода, трехлетие или пятилетие, "середина 90-х годов" и, наконец, "все послевоенное время" - примеры того, как можно ограничить временную рамку.

В рамках сплошной выборки анализируются все материалы источники: каждая телепрограмма, каждый номер газеты, вышедший в течение определенного периода. Иногда она модифицируется в "50-проц-кову". Выборочная совокупность определяется как "сплошная" не только по параметру времени. Важную роль играет и тематическая реле-вантнисть сообщений предмета исследования. Согласно анализируются или все содержание номера или "телевизионного дня", когда, например, мы ищем все возможные культурные индикаторы в массовой коммуникации, или отдельные рубрики, сюжеты, материалы, которые касаются предмета изучения - международных отношений, рекламы, политических ценностей, экологических представлений и тому подобное. Сплошные выборки используют при наблюдении за ходом предвыборных кампаний, имеющих определенные временные рамки, в случае "оперативного" анализа, например, обсуждение в мировой прессе международных визитов государственных лидеров.

Для анализа новостей, тематической направленности СМИ чаще всего применяют модели выборки, близкие к типологических. С этой целью в практике контент-анализа принято наблюдать за каждым пятым или шестым числом газеты, учитывая периодичность выхода ее и смещение информации в зависимости от дней недели.

Проектируются и случайные выборки, в которых заранее определяется шаг отбора текстовых единиц или экспериментально рассчитывается количество их, достаточная по минимальной ошибки для репрезентативного изображения всего массива. Такое количество номеров газеты можно затем набрать по таблице случайных чисел.

В таком случае исследователь должен иметь четкое представление о генеральной совокупности текстов масс-медиа, которые он изучает.

Итак, выборку сообщений сделано. Следующая задача - разработка надежного инструментария кодирования их содержания. Процедура предусматривает три основных аналитические операции: определение категорий анализа, единиц анализа и единиц счета.

Категории анализа - это понятие, с помощью которых описывается предмет исследования. Совокупность их образует концептуальную схему контент-анализа. Однако это не абстрактная теоретическая модель, это содержательная конструкция, адаптированная для изображения образа предмета, имеющегося в текстовой реальности. Вот почему концептуальная схема должна соответствовать особым требованиям. Безусловно, ей предшествует теоретическое моделирование. Однако она должна быть пригодной для того, чтобы полностью и одновременно экономно описать предмет, учитывая также на абстрактные представления о нем и опыт его текстовых версий. При этом категории должны быть исчерпывающими, то есть полностью описывать предмет, а в совокупности представлять весь смысл текста. Категории имеют недвусмысленно характеризовать лишь один аспект этого предмета, и тогда кодировщик, читая текст, сможет безошибочно сопоставлять его отдельный фрагмент из конкретной категории. На практике аналитик разрабатывает концептуальную схему, используя три основных возможности:

1) категории добираются экспериментальным путем на основании представлений о предмете. Например, эксперты назвали самые актуальные социально-экономические проблемы общества. Перечень их служить номинальной шкале категорий в кон-тент-анализе современной прессы, что имеет целью выяснить, каким образом социальной реальности она предлагает читателям;

3) категории избираются исследователем на прагматичной основе, то есть он опирается на собственные теоретические представления о предмете, в историко-культурный и социальный анализ ситуации, на практике контент-анализа.

Предметом контент-анализа обычно является тематическая и ценностная структура содержания текстов СМИ. Пожалуй, именно репрезентация ценностей, ценностных суждений, ценностного сознания групп и сообществ, ценностно окрашенных образцов поведения основном интересует социолога в исследовании массовой коммуникации. Стремление стандартизировать категории, описывающие поле социальных ценностей, яе угасает среди аналитиков. Для этого они обращаются к известным концептуальных разработок проблемы ценностного сознания Д. Лассуэлла, Милтона Рокича, Рональда Инглехарта. Однако особенности социокультурного контекста массовой коммуникации в том или ином обществе, стабильный или обуреваемый состояние социальной среды требуют внесения корректив в эти попытки.

Например, концептуальная схема контент-анализа прессы, созданная для изучения политического климата послевоенной Швеции под руководством К. Розенгрен, состоит из девяти таких ценностных категорий, отобранных во время пилотажного исследования: свобода, демократия, равенство, социализм, безопасность, трудовая занятость, экономический рост, состояние окружающей среды, социальное регулирование. Полностью использовать эту схему в контент-анализе современной украинской прессы нецелесообразно, поскольку в Швеции сложилась достаточно стабильная, устойчивая во времени система ценностей, имеющих определенное толкование и привычное, известное текстовое или вербальное выражение. Политическая риторика в трансформирующемся, а именно таким является украинское, в большей степени характеризуется амбивалентным отношением к традиционным демократическим ценностям, апелляцией к альтернативным ценностных позиций.

Нарушение меры числа категорий, применяемых также приводит к аналитическим просчетов. Такое число трудно определить: стремление максимально подробно описать предмет набором понятий вращается слишком раздробленной категориальной схеме, не приспособленных классифицировать содержание текстов в удобной и убедительной форме. В конце 40-х годов проводилось известное исследование "RADIR" (Revolution and Development of International Revolution). Оно имело целью идентифицировать и картографировать тенденции символического репрезентування основных ценностей в современном мире, а также определить факторы, влияющие на этот процесс. Обследовалась пресса шестерых ведущих стран с 1890 по 1949 гг. Вуло проанализировано около 20 тыс. Статей - передовиц газет, появлялись 1-го и 15-го числа каждого месяца. Категориальная схема вместе с субкатегорию насчитывала 416 ключевых символов - субъектов политики (лидеров, наций, институтов), ценностей политического мира, географических названий. Как следствие, агрегация их вызвала трудности. И наоборот, использование более общих категорий привело к искажению связей между значениями в текстах, анализировались.

Если категории тесно связаны с предметом исследования, то единицы анализа характеризует его объект и операционализують концептуальную схему в текстовых референтах. Единицы анализа - это малые или большие фрагменты текста, по которым кодировщик методично наблюдает, отыскивая в них ссылки на категории значений или их вербально выраженные признаки. К стандартным единиц анализа относятся: слово или символ (например даты), часть предложения, одно или несколько предложений, абзац, вся статья, наконец. В контент-анализе аудиовизуальной информации такими единицами являются: кадр, кино- или телефраза - небольшой фрагмент содержания с четкими границами (например, изменение субъектов, говорящих), телепрограмма.

Единицей анализа может быть и герой сообщение (персонаж, актер, субъект социального действия), упоминание о котором также фиксируются в различных текстовых фрагментах и относятся кодировщиком в соответствующие ценностных категорий, например, качеств личности. Бывают и более сложные единицы анализа с нечеткими границами, такие как "проблемная ситуация" - абстрактный символ, синтезирующий образец описания, объяснения и освоения мира, учитывая его "проблемность" или "конфликтность". Такая единица предложена на основе "парадигматического" подхода, который практиковали финские исследователи и к которому прибегали в свое время эстонские и российские социологи для изучения экологической пропаганды и экологических представлений населения.

Для того чтобы отыскать признак категории в единицы анализа, установить, что именно на нее ссылается коммуникатор в небольших текстовых фрагментах, используются списки ключевых слов, относящихся к этой категории. Применяются также тонкие приемы - наблюдение за интенсивностью признаков, отношением автора к упомянутым категорий (оно может быть положительным, нейтральным или отрицательным, например, одобрение или неприятие тех или иных ценностных позиций индивидов и групп); модальность суждений - скажем, поисковые ссылок на ин-туциональни нормы помогут показатели, которые выражают то, что должно произойти; императивность, но не вероятность или возможность ("должен", а не "ему хотелось бы»); глагольные модификации, указывающие на современное, прошлое или будущее.

Наряду с единицей анализа определяется и то, как следует количественно отразить насыщенность сообщение или массива сообщений категориями, то есть отразить в числах (абсолютных или в процентах) все характеристики предмета, а также даты его целостный образ. Этой задаче соответствуют единицы счета. Обычно это:

1) показатели пространства, занимают в тексте каждая из категорий (количество строк, высота стандартной газетной колонки, плоскость текста, метраж кино * и магнитной пленки), и времени, потрачено на описание их в аудиовизуальных сообщениях;

2) появление категории или признаки категории в тексте. Эта единица счета используется в случае, если единицы анализа слишком сложно формализовать, например в контент-анализе художественно-образной информации. Она популярна в "качественном" контент-анализе, принцип которого предложен А. Джорджем. Последний настаивает на том, что именно фиксация наличия или отсутствия категорий в сообщении позволяет получить точные указатели для содержательных выводов. Например, постепенное исчезновение из речей западных политиков вербального символа "Сталин" недвусмысленно свидетельствовало об изменениях в международных отношениях в послевоенный период. "Качественный" контент-анализ еще раз привлекает внимание к проблеме "качественных" и "количественных" исследований текста, взаимосвязь между которыми не всегда уместно характеризовать как "связь чисто альтернатив";

3) частота появления категорий или признаков категорий в текстах. Фиксируется не только присутствие или отсутствие ссылки на категорию в единице анализа, но и сколько раз оно встречается. Так определяется степень внимания коммуникатора к каждой категории, измеряется ценность и важность, которую он придает ей.

Единицы анализа и единицы счета взаимообусловлены. Если подсчитывается "появление категорий", то единицей анализа является конечно большой текстовый фрагмент - вся статья. "Частота появления категории" фиксируется в наблюдениях за наименьшими единицами анализа.

Алгоритм процедуры подробно описывается в обязательном методическом документе - "Инструкции кодировщике". Однако перед этой операцией следует выяснить "надежность" инструментария. Под надежностью аналитик понимает меру допустимого "субъективизма" в изучении текстов. Надежность контент-анализа свидетельствуют показатели обоснованности и устойчивости процедуры. Первая конечно подтверждается после сопоставления опытными судьями результатов пилотажа данным экспертов и других опросов. Постоянство проверяется в двух аспектах - во времени (когда текст кодируется вдруг через некоторое время) и среди кодировщиков (выясняется степень идентичности их работы над одним и тем же текстом, для чего используют стандартные приемы проверки инструментария, измеряющий). Совпадение данных для вывода об устойчивости должна составлять около 80%.

Методики обработки результатов кодирования привлекают все способы, пригодные для интерпретации ранговых и ассоциативных структур содержания, посредством определения коэффициентов рангового связи, измерения сопряженности согласно критерию X2, Частотный контент-анализ допускает и более сложные формы обработки, такие как факторный анализ в компьютер Компьютерная версиях этого метода. Использованию компьютерного контент-анализа (разработан в 60-е годы Филиппом Стоуном) предшествует создание больших и точных словарей, например словаря ценностей Лассуэлла, которые позволяют идентифицировать вербальные знаки с конкретными категориями.

Понимание методологических основ контент-анализа, надежная процедура формализованного прочтения текстов - залог успехов аналитика в интерпретации содержания массовой коммуникации, взвешенности выводов относительно структуры и динамики содержания текста.

Основные понятия и термины раздела

"Двухступенчатая модель" массовой коммуникации - структурирует макрокомуникативний процесс на две стадии: сначала сообщение СМИ воспринимаются активной частью аудитории - "лидерами мнений", а затем от них межличностными каналами транслируются пассивной части, равнодушной к радио и газет.

Средства массовой коммуникации - пресса, радио, телевидение, то есть средства вещания и обнародования сообщений (информации) с помощью языка и других знаков.

Контент-анализ - формализованный метод интерпретации содержания и структуры текстов сообщений СМИ.

Массовая коммуникация - состояние современного общества, сложная структура социального и культурного пространства которого воплощена в символических формах и образах; только в таком виде ее способна воспринимать и понимать корпоративная, массовая и индивидуальное сознание.

Единицы анализа - малые или большие фрагменты текста, объект наблюдения кодировщика для сопоставления с категориями анализа.

Единицы счета - знаки и символы, которые позволяют представить в абсолютных величинах или процентах насыщенность текста категориями анализа.

Парадигма "эффектов" масс-медиа - концептуальное представление того факта, что массовая коммуникация хоть и важный, но лишь один из многих факторов воздействия на индивидуальное и групповое сознание.

Парадигма "тотального" влияния - концептуальное понимание аудитории как таковой, что беззащитен перед потоком информации и теми, кто производит и транслирует ее.

Дейк И. ван. Язык. Познание. Коммуникация. - M .: Прогресс, 1989.

Зернецъка А.В. Новые средства массовой коммуникации (социо-культурный аспект). - К.: Наук, мысль, 1993.

Коробейников BC Редакция и аудитория. - M .: Мысль, 1983.

Костенко Н.В. Ценности и символы в массовой коммуникации. - К.: Наук, мысль, 1993.

Массовая информация в советском промышленном городе. - М.: Политиздат, 1980.

Массовая информация и общественное мнение молодежи. - К.: Наук, мысль, 1990.

Массовая коммуникация и охрана среды. - Таллинн: Эсти-раамат, 1987.

Медиа в выборах: между политикой и культурой. - М.: Ин-т социологии НАН Украины, в 1999.

Методологические и методические проблемы контент-анализа: В 2 т. - М.: Наука, 1973.

Моль А. Социодинамика культуры. - М.: Прогресс, 1973. Фирсов Б.М. Пути развития массовой коммуникации. - Л.: Наука, 1977.

Culture, Society and Media. - London, 1982.

Holsti OR Content Analises for the Social Science and Humanities. -London, 1969.

Sociology of mass communications / Ed. McQuail D. - London, 1976.

Понятие контент-анализа

Определение 1

Контент-анализ - это метод изучения документов на основании формирования определенного набора категорий с последующей квалификацией исследуемого материала по принципу частоты появления и повторения элементов избранных категорий. Применение этого метода дает возможность получить определенные количественные данные, которые могут быть подвергнуты компьютерной обработке и статистическому анализу. Эта исследовательская техника используется в социологии с целью получения выводов о состоянии и свойства социальной действительности.

Контент-анализ широко применяется при изучении простых и сложных признаков и особенно эффективен при обработке больших по объему и различных по содержанию источников.

Главная суть контент-анализа заключается в том, что, исходя из исследовательских задач, выделяется определенная система качественных признаков, характеризующих свойства объектов и явлений, а затем делается их счет или счет их элементов, обладающих этими признаками и находящихся в определенных сочетаниях. Эти признаки могут кодироваться, и таким образом описательная информация может быть формализована и представлена в системе числовых значений. Последние могут сводиться в разного рода таблицы, удобные для последующей обработки.

Основные процедуры и методы в контент-анализе

Определение 2

Контент-анализ – это эмпирический метод перевода количественных показателей в текст с последующей обработкой информации.

Метод контент-анализа начинается с выявления смысловых единиц (объектов), в качестве которых используют следующие:

  • Понятие, высказанные в отдельных терминах. Например, экономика: формы собственности, приватизация, финансовая система, технический прогресс, инновации, методы хозяйствования, менеджмент политика: правительство, оппозиция, партия, демократия, авторитаризм, сотрудничество, консенсус, конфликт.
  • Тема, выраженная в отдельных смысловых абзацах, частях текстов, статьях, радио и телепередачах и тому подобное. По тематике создается представление о содержании документа. Например: инициатива и предприимчивость, борьба с коррупцией и бюрократией, соблюдение прав человека, трудовая дисциплина.
    • Имена значимых в истории личностей, например политиков, ученых, артистов, лидеров партий и социальных движений, наименование институтов. По числу ссылок на авторов судят о научной идее.
  • Общественное событие, любой официальны значимый документ, факт, произведение, случай несут специальное смысловую нагрузку и могут приниматься за единицу анализа.
  • Частота и продолжительность упоминания общественного события или государственного решения - свидетельство его важности для общества.
  • Содержание апелляций к потенциальному адресату - покупателя, гражданина, сторонника.

Пример 1

Смысловой единицей анализа выявляются на основе плана гипотезы, заложенной в исследовании. Единицы подсчета могут либо совпадать, либо не совпадать с единицей анализа.

  • В первом случае классификация сводится к определению частот упоминания определенных параметров в тексте.
  • Во втором случае единицей счета считают физическую длину или площадь текстов, заполненных смысловыми единицами. Например, число строк или абзацев - в печатных текстах, продолжительность трансляции по радио или на телевидении, метраж пленки на магнитоносителей. В контент-анализе могут исспользоватся одновременно несколько единиц счета и единиц анализа.

Необходимость применения количественного анализа

Замечание 1

Количественный анализ текстов применяется тогда, когда требуется высокая степень точности при сопоставлении однопорядковых данных. Первым шагом в этом направлении является выявление индикаторов ключевых понятий исследования.

Квантификацию в контент-анализе целесообразно использовать при сопоставлении квант-текстов с другими количественными характеристиками. Количественные характеристики должны обязательно связывается с качественными, которые в исследовании документов фиксируют свойства и признаки выделенных исследователем объектов и позволяют ему проанализировать связанность этих характеристик с исследуемой сферой деятельности составителя документальной информации.

Контент-анализ (от англ, contens - содержание) - специальный достаточно строгий метод качественно-количественного анализа содержания документов в целях выявления или измерения социальных фактов и тенденций, отраженных этими документами. Особенность его состоит в том, что он изучает документы в их социальном контексте.

Контент-анализ может использоваться в качестве основного метода исследования (например, в исследовании социальной направленности газеты); параллельного, т.е. в сочетании с другими методами (например, в исследовании эффективности функционирования средств массовой информации); вспомогательного или контрольного (например, при классификации ответов на открытые вопросы анкет).

Не все документы могут выступить объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследований посредством контент-анализа выступают сообщения печати, радио, телевидения, массовой устной агитации и пропаганды, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Существуют три основных направления применения контент-анализа:

а) выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта - окружающей действительности, автора или адресата);

б) определение того, что существует только в тексте как таковом (различные характеристики формы - язык, структура и жанр сообщения, ритм и тон речи);

в) выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа, т.е. наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике советских контент-аналитических исследований в свое время сложилась довольно устойчивая система категорий, среди которых можно назвать такие, как знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура. Категории контент-анализа должны быть исчерпывающими (т.е. охватывать все части содержания, определяемые задачами данного исследования); взаимоисключающими (одни и те же части не должны принадлежать различным категориям); надежными (т.е. между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории); уместными (т.е. соответствовать поставленной задаче и исследуемому содержанию).

При выборе категорий необходимо избегать двух крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда же необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа - лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явлений. Сложные виды контент-анализа обычно оперируют не одной, а одновременно несколькими единицами анализа.

Единицы анализа, взятые изолированно, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа - контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица - «предложение».

Наконец необходимо установить единицу счета - количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, числа сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаще всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации - 12-16 номеров газеты или теле- радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.

Необходимым условием контентного исследования является разработка таблицы контент-анализа - основного рабочего документа, с помощью которого оно проводится. Тип таблицы определяется этапом исследования. Так, разрабатывая категориальный аппарат, аналитик составляет таблицу, представляющую собой систему скоординированных и субординированных категорий анализа. Такая таблица внешне напоминает анкету: каждая категория (вопрос) предполагает ряд признаков (ответов), по которым квантифицируется содержание текста. Таблица-анкета может быть достаточно объемной.

Для регистрации единиц анализа составляется другая таблица - кодировальная матрица:

Признак Текст
1 2 3 n Σn
А +
В + +
С + +
...
n
Σn

Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с тетрадью матричных листов. Если выборка сравнительно невелика (до 100 единиц), то можно проводить двумерный или даже многомерный анализ. В этом случае для каждого текста должна быть своя кодировальная матрица. Однако эта работа очень трудоемка и кропотлива, поэтому при больших объемах выборки сопоставление интересующих исследователя признаков осуществляется на компьютере.

Иногда таблица может быть необходимой и на этапе количественной обработки данных. Например, при использовании анализа случайностей, разработанного американским социальным психологом Ч. Осгудом, строится т.наз. матрица случайностей:

Реальное совпадение Ожидаемое совпадение
А В С n Σn
А - 0,15 0,02
В 0,05 - 0,06
С 0,08 0,12 -
... -
n -
Σn -

С помощью такой матрицы выявляются меры случайности совпадения каждой классификационной единицы со всеми остальными. Например, единица А встречается в 30% анализируемых текстов (Р = 0,3), а единица В - в 50% текстов (Р = 0,5), тогда ожидаемая частота совместного появления этих единиц будет равна: РАВ = РА Рв=0,3 0,5 = 0,15. В действительности же признаки А и В совместно встретились лишь в 5% текстов АВ = 0,05. Сравнивая ожидаемые и реальные совпадения признаков, можно определить, какие фактические зависимости оказались не случайными (напр., из приведенной выше таблицы видно, что совместное появление единиц А и В - случайное, т.к. реальное совпадение меньше ожидаемого, а единиц В и С - не случайное, т.е. реальное совпадение выше ожидаемого). Цели применения данной матрицы могут быть различными: проследить случайность-неслучайность совпадения признаков для проверки гипотезы, отметить устойчивые-неустойчивые парные сочетания признаков, что может оказаться значимым для характеристики деятельности отправителя информации, и т.д.

Важным условием К.-А. является разработка инструкции кодировщику - системы правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя) заданные единицы анализа. В инструкции точно и однозначно излагается алгоритм действий кодировщика, даются операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как следует поступать в спорных случаях, и т.д.

Процедура подсчета при количественном контент-анализе. в общем виде аналогична стандартным приемам классификация по выделенным группировкам ранжирования и измерения ассоциаций. Существуют также специальные процедуры подсчета применительно к контент-анализу, напр., формула коэффициента Яниса (с), предназначенного для вычисления соотношения положительных и отрицательных (относительно избранной позиции) оценок, суждений, аргументов. В случае, когда число положительных оценок превышает число отрицательных, коэффициент Яниса подсчитывается по формуле

© Социология: энциклопедия. М., 2003

В наше время, когда информация стала основным богатством, особенное значение приобретают методы, нацеленные на исследование разнообразных ее источников. К таковым относится и контент-анализ, который применяется в отношении не только документации, но и прочих данных.

Что это такое?

Так называют специальный метод, используемый для изучения текстовой и графической информации. Суть его в том, что все эти показатели переводят в количественное исчисление, а уж потом анализируют, применяя для этого более-менее стандартные математические методы и модели. Вполне естественно, что контент-анализ отличается большой строгостью, систематизацией подхода.

Если говорить совсем научно, то сущность метода состоит в «классификации единиц содержания», которая впоследствии может быть изучена. Кроме того, нередко можно встретить понятие «квантификация данных», что подразумевает все то же самое: разбиение информации на малые количественные единицы с целью ее лучшего восприятия.

В качестве объектов анализа могут выступать, к примеру, содержание цифровых и печатных СМИ во всем их многообразии, записи публичных выступлений, материалы рекламного характера и даже анкеты, заполняемые добровольными помощниками.

Когда он появился?

Вообще, когда же появился контент-анализ? Произошло это в США, где его сравнительно активно начали применять, начиная с 30-х годов прошлого века. Впервые на «вооружение» его взяла журналистика, а уж потом - литераторы. Основные положения учения в то же время были разработаны учеными-социологами X. Лассуэллом и Б. Берелсоном.

Первый использовал свои же работы в области эффективной пропаганды. Именно он продолжил модернизировать и совершенствовать разработанный им самим же способ, уделяя особенное внимание систематизации получаемых сведений и их разбиению на простейшие блоки (для облегчения их усвоения).

Совсем неудивительно, что массовое развитие СМИ, как никогда, подстегнуло контент-анализ во всем мире. И это во многом помогло союзникам во Второй мировой войне: они широко использовали положения теории для ведения эффективной пропагандистской деятельности, а также в разведывательных целях.

Работы Берелсона

Но не стоит предполагать, что компаньон Лассуэлла все это время сидел сложа руки. Именно Б. Берелсон провел полную систематизацию их совместных работ, подытожив результаты в собственной книге «Контент-анализ в коммуникационных исследованиях», которую написал в 50-х годах. Он не только определил непосредственный алгоритм действий, но и подробно описал его различные виды, а также вывел специальные критерии и единицы.

Неудивительно, что произведение Берелсона до сих пор используется специалистами в любой области, где хотя бы теоретически требуется контент-анализ. Как метод исследования он стал чрезвычайно распространен, так что в последние годы его активно берут на вооружение даже те научные отрасли, где ранее эта методика не использовалась.

Так, Ч. Осгуда в 1959 году создает методику «связанности символов», согласно которой и поныне ученые выявляют те моменты в выступлениях и печатных изданиях, которые не несут общего смысла, являясь чужеродными элементами.

Европейские методики

Конечно же, в Западной Европе исследователи предпочитали всецело опираться на опыт своих американских коллег. Впрочем, и в таких условиях оказалось возможным появление совершенно самостоятельных, оригинальных разработок (Ж. Клейзер, А. Моль).

Основные способы, процедуры анализа

Вот где и как появился контент-анализ. Как метод исследования он включает в себя сразу несколько основных процедур, которые мы сейчас и рассмотрим.

1. Во-первых, нужно выявить смысловые единицы анализируемого контента, в роли которых могут выступать:

а) Некие термины, являющиеся смысловыми понятиями, используемыми в отдельных научных отраслях.

б) Темы, причем не только всего текста или выступления в целом, но и те, которые подразумеваются разными смысловыми абзацами или фрагментами речи выступающего.

в) Особенно важны имена и фамилии людей, которые встречаются в данном материале.

г) Анализу следует подвергать все упоминаемые события и факты.

д) Если у речи или документа есть потенциальные оппоненты, то нужно разобраться и со смысловыми реляциями, которые на них направлены.

Нужно заметить, что единицы обязательно должны выделяться в контексте содержания, а также задач и целей, которые преследует данная публикация. Конечно же, всегда нужно учитывать еще и те научные гипотезы, которые были использованы (если они были) при ее создании.

2. Во-вторых, выделяются единицы счета. Они могут как совпасть, так и не совпасть с элементами анализа, о которых мы только что говорили. Если совпадают, то исследователю остается банально определить частоту появления каждого термина (или аналогичного понятия) в тексте.

Во втором же случае ему самому, на основе тематики какого-то произведения и собственного здравого смысла, предстоит выделить эти самые единицы, которыми могут являться:

а) Общая протяженность написанного текста или произнесенной речи.

б) Площадь произведения, где в большей концентрации имеются смысловые единицы.

в) Общее количество печатных знаков или же абзацев.

г) Если речь идет о публичном выступлении, видеозаписи или аудиофайле, то определяется общее их время.

д) При анализе старых кинохроник можно принять во внимание также общий метраж использованной пленки.

е) Наконец, при изучении старинных гравюр или аналогичных произведений всегда нужно определять общее количество рисунков, которые связаны определенным содержанием.

3. Затем исследователи занимаются простым подсчетом, технология которого схожа с теми методами, которые используются для любой классификации понятий или явлений. Составляются математические модели и диаграммы, по специально разработанным формулам выводится "общая понятность текста" и аналогичные данные, которые могут помочь в дальнейших исследованиях.

Рабочая таблица

Вообще, при любом исследовании, в котором так или иначе задействован данный метод, придется строить и активно использовать специальную рабочую таблицу. Ее тип и внешний вид определяются характеристиками проводимой научной работы. К примеру, если в ходе изучения в поле зрения ученого попадает какой-то признак, который крайне нуждается в классификации и упорядочивании, то он создает таблицу, в которой отображает все сопутствующие факторы.

В общем-то, по внешнему виду такой документ очень похож на классическую анкету: напротив каждой категории есть варианты ответа. Причем чем больше будет однотипных элементов, тем проще проанализировать сам текст и определить его типовую принадлежность.

Не исключено, что контент-анализ документов будет проводиться по очень объемной таблице. Так, при исследовании эффективности государственных СМИ в свое время руководствовались приблизительно 250 разнообразными признаками. Важно заметить, что на этом же этапе разрабатывается и внедряется инструкция к кодировщику. Это система строгих правил и указаний по действиям, которые допускаются во время эмпирического исследования документа.

Важно абсолютно точно и однозначно задать алгоритмы действий человека, ему выдается адекватное определение категорий и единиц анализа, а также рассказывается о ситуациях, в которых их допускается координировать. Необходимо привести хотя бы несколько примеров, причем в качестве таковых должны присутствовать куски того самого текста, который и предстоит подвергнуть анализу.

Процедура подсчета

Чтобы лучше понять, о чем до сей поры вообще шла речь, необходимо рассказать о самой методике. Подсчет ведется посредством так называемого коэффициента Яниса. Вот он:

C=F²-F*N/R*T, где:

С - значение коэффициента.

F - общее количество положительных оценок.

N - количество оценок отрицательных.

R - количественный объем изучаемого текста или иной исследуемой единицы, в котором речь идет непосредственно об изучаемой проблеме.

Т - соответственно, общий объем всего изучаемого текста.

Как видите, в формуле нет ничего особенно сложного.

В каких отраслях наиболее востребован метод?

В качестве вспомогательного метод крайне широко практикуют практически все психологи, антропологи, историки и социологи. Так, контент-анализ в социологии попросту незаменим при исследовании результатов анкетирования различных слоев общества, а также для выявления адекватных, непредвзятых результатов психологических экспериментов, проводимых над группами добровольцев.

Способ часто применяется для анализа результатов, полученных при исследованиях фокус-групп. Помимо этого, контент-анализ в социологии используется в контексте социальных медиа, а также в маркетинговых исследованиях компаний, которые заинтересованы в повышении своей прибыли путем переориентации производства на другую категорию потребителей. Или, напротив, расширения сфер влияния путем привлечения новых категорий покупателей.

Подчеркнем, что лучше всего метод контент-анализа работает при изучении каких-то документальных источников. Но это утверждение работает только при том условии, если в них много повторяющихся, однотипных данных.

Использование в психологии

В психологии данный способ может быть использован в качестве совершенно самостоятельного инструмента исследовательских работ. Это особенно важно, если требуется систематизировать и обобщить полученные в ходе экспериментов данные.

Но тут следует заметить, что большинство специалистов предпочитают немного не так использовать контент-анализ: исследование может принести реальную пользу только в том случае, если одновременно практикуются исконно психологические приемы коммуникационного взаимодействия с добровольцами. Таким образом, в психологии этот способ более популярен в качестве прикладной дисциплины, но никак не самостоятельного метода, который может дать ответы на все вопросы.

Социальная психология

Иное дело - психология социальная. В этом случае чрезвычайно распространен количественный контент-анализ, который используется для выявления общих алгоритмов человеческого вербального общения, а также коммуникативных связей между большими и малыми группами населения, которые могут быть изолированы друг от друга в повседневной жизни.

Заметим, что каждый документ, который был использован в ходе такого исследования, помечается как «сообщение». Это весьма специфическое социально-психологическое понятие, которое указывает на динамическое развитие объекта исследования, а также его постоянное нахождение в коммуникативной системе. Проще говоря, подразумевается зависимость сведений от той социальной среды, в которой постоянно "вертится" человек.

Основные особенности метода в психологии

А сейчас давайте выделим основные отличительные характеристики, которыми отличается контент-анализ в психологии:

    Сквозь призму документов и доступных записей публичных выступлений изучается не столько сам человек, сколько его окружение. К слову говоря, это крайне важно еще и для историков, так как таким путем можно исследовать не только события, которые произошли сравнительно недавно, но и бывшие в далеком прошлом.

    Помимо прочего, применение контент-анализа помогает всесторонне охарактеризовать многие коммуникативные методы и средства. Этим объясняется любовь к данному средству пропагандистов, которые имеют возможность выбрать лучший прием для овладения умами аудитории.

    Наконец, все же проводится (посредством анализа "сообщений") изучение психологической составляющей того человека, кому принадлежит текст, картина или публичное выступление.

    Наконец, методика контент-анализа позволяет достоверно выяснить истинную степень влияния политика или иного публичного человека на аудиторию, понять, в чем заключаются его просчеты во время выступлений и как их нужно исправлять.

Наконец, следует упомянуть о применении метода исключительно во вспомогательных, второстепенных целях:

    Обработка, уточнение и систематизация тех данных, которые были получены исследователями в других областях наук, но в данное время необходимы именно психологам.

    Как ни странно, но проведение контент-анализа зачастую крайне необходимо для правильного понятия тезисов и положений, которые встречаются в специальной литературе.

В политике

Мы неоднократно упоминали, что инструмент этот широко используется политиками. Исследователи в этом случае берут запись выступления (обязательно запись, так как краткий спич может быть недостоверен), а затем "прогоняют" ее на предмет использования однотипных слов и выражений. Важно помнить, что нужно учитывать не только их простое количество, но и частотность во всем объеме текста и применительно к его непосредственной тематике.

Время рождения метода контент-анализа приходится на рубеж XIX-XX веков. В науке об обществе в данный период наблюдается тенденция к социологизации и кроме того, существует и «субъективная» необходимость в такого рода методе: теоретики и практики журналистики много говорят о роли и возможностях средств массовой коммуникации в обществе. В текстах подозревается огромная сила воздействия на массы. В первых теориях массовой коммуникации людская масса представлялась абсолютно беззащитной перед набирающей обороты пропагандистской машиной. Метод контент-анализа применялся вначале для изучения эффективности массовой пропаганды (какой эффект произведет тот или иной текст массовой информации, как создавать такие тексты, которые произведут на людей наибольшее впечатление). Помимо всего прочего, в обстановке войны этот метод был единственной возможностью изучать в широких масштабах пропаганду противника, моральный дух населения страны противника, события, происходящие в данной стране. В работах Лассвелла Г., с именем которого связывается определенный вклад в разработку существенных принципов этого метода, основная цель изучения текстов пропаганды выглядит так: определить, что пропагандист ставит в центре внимания, чтобы добиться определенного эффекта у аудитории. Ныне метод контент-анализа стал сильнейшим средством анализа различных документов. В политологических исследованиях контент-анализ позволяет анализировать различные текстовые документы, а, следовательно, создавать, например, образ той или иной партии. Под текстами в контент-анализе понимают книги, книжные главы, эссе, интервью, дискуссии, заголовки газетных статей и сами статьи, исторические документы, дневниковые записи, речи выступлений, рекламные тексты и т.д.

В современной науке наблюдается два полюса восприятия метода контент-анализа:

количественный контент-анализ, интересующийся, в первую очередь, частотой появления в тексте определенных характеристик (переменных) содержания;

качественный контент-анализ, позволяющий делать выводы даже на основе единственного присутствия или отсутствия определенной характеристики содержания;

Различие двух подходов довольно легко проиллюстрировать примерами. В 50-е годы западные аналитики на основе количественного анализа статей газеты "Правда" обнаружили резкое снижение числа ссылок на Сталина. Отсюда они сделали закономерный вывод, что последователи Сталина стремятся дистанцироваться от него.

С другой стороны, качественный аналитик мог бы сделать аналогичный вывод на основе единственного факта, что в публичной речи одного из партийных функционеров, посвященной победе СССР в Великой Отечественной войне, Сталин вообще не был упомянут. Прежде такое было бы немыслимо. В данной работе речь пойдет об использовании количественного контент-анализа в политико-социологических исследованиях.

Конечно нельзя говорить о повсеместном использовании именно количественного контент-анализа. Вероятно, будет неразумно использовать данный метод в том случае, если мы имеем дело с уникальными документами, или же перед нами описания весьма сложных явлений, или данных недостаточно для массивной обработки, они нерепрезентативны. По мнению одного из основателей метода количественного анализа текстов Берельсона Б. , лучше всего использовать количественный метод анализа данных в том случае, если требуется высокая степень точности при сопоставлении однопорядковых данных, если существует в наличии необходимое количество материала и он репрезентативен.

В ведении было упомянуто несколько небольших работ по контент-анализу, представленных аспирантами и магистрантами различных университетов. Так, Элеазер А. В., студент 2 курса магистратуры отделения политологии факультета Социальных наук РГПУ им. А.И.Герцена, в своей работе «Исследование избирательных стратегий - метод контент-анализа» раскрывает суть метода контент-анализа и его возможностей при исследовании индивидуальных избирательных стратегий кандидатов в депутаты на примере выборов в Законодательное собрание Санкт-Петербурга второго созыва в 48 избирательном округе. Рытов А., аспирант исторического факультета Белгосуниверситета (г.Минск) применяет контент-анализ в биографическом исследовании: «Опыт применения контент-анализа в биографическом исследовании цесаревича Александра Николаевича Романова». Он пишет: «Использование контент-анализа, при изучении источников данного типа, способно придать результатам исследования точность и соответственную научную валидность. Именно (и только) текст, в данном случае написанный рукой исследуемого персонажа, несет в себе скрытую информацию о его психологической уникальности, являясь продуктом социальной среды в широком смысле. Он (текст) несет в себе следы влияния разнообразных социальных и психологических факторов, что дает возможность обнаружения и замера этих факторов и соответственное постижение так называемой внетекстовой реальности, используя при этом формализованный подход к источнику.» Нельзя не упомянуть в этой связи и новосибирскую современную школу социологии и таких авторов как, например, В. Шляпентох, Ф. М. Бородкин и мн. др.

За последние годы институт социологии РАН создал ряд программных систем, которые отвечают современным требованиям к уровню обработки информации: экспертно-диагностическая система «МАКС», программа «АЛЕКС», система контент-анализа, программа «КСЕНИЯ» и др. Система контент-анализа предназначена для исследования текстов любого типа, включает в себя количественный и качественный подходы к анализу. Данная система позволяет изучать социально-психологические потребности аудитории, анализировать письма, документы, устанавливать авторства текстов, может применяться для анализа потока информации в информационных сетях и мн. др. Например, программа «Контент-анализ» используется телекомпанией ОРТ для автоматического отбора информации и информативных массивов, доступ к которым осуществляется через Интернет. Вполне естественно, что такая программа стоит немалых денег, поэтому доступна она совсем не многим. В данной работе будет сделана попытка провести контент-анализ при помощи обыкновенной Microsoft Word - программы, которая имеется под рукой практически у каждого.

Основная трудность при работе с доступными (т.е. нецелевыми) документами - умение читать данные на языке гипотез исследования. Ведь текст (документ) был составлен вовсе не для того, чтобы проверить гипотезы социолога. Поэтому, прежде чем анализировать документальные материалы по существу, социолог вынужден проделать утомительную работу поиска в документе индикаторов (признаков) ключевых понятий исследования.

Качественный анализ документов - необходимое условие для всех количественных операций. Но прежде следует заметить, что квантификация текстов далеко не всегда целесообразна. Как уже говорилось выше, неразумно прибегать к количественному анализу текста, если мы имеем дело с уникальным документом. Здесь главной целью изучения будет всесторонняя содержательная интерпретация материала. Количественный анализ текстов уместен, если требуется высокая степень точности при сопоставлении однопорядковых данных. Далее, - когда текстового материала не только достаточно, но столько много, что его нельзя охватить без суммарных оценок. Наиболее целесообразно использовать количественный анализ, если сопоставлять текст с иными, также количественными характеристиками. Например, выраженные в статистических распределениях особенности содержания газетных сообщений сопоставляются с численностью подписчиков, их мнениями об этих материалах, тоже выраженными в числах.

Квантификация текстового материала получила широкое распространение, и в 40-х годах для нее была разработана специальная процедура, названная «контент-анализ». Контент-анализ - это перевод в количественные показатели массовой текстовой (записанной на пленку или иные носители) информации с последующей статистической ее обработкой. Его основные операции были разработаны американскими социологами Лассуэллом Г. и Берельсоном Б. Гарольд Лассуэлл применяет методы семантики - раздела лингвистики, занимающейся изучением значений языковых единиц. Он разрабатывает методы семантического анализа текстов, предполагавших исследование ключевых терминов, лозунгов и доктрин под углом зрения того, как их понимают потребители информации. Его подходы к проблеме количественного контент-анализа политической коммуникации стали классическими. Пожалуй, всем известна формулировка Лассуэла Г., согласно которой "акт коммуникации" рассматривается по мере ответа на комплекс вопросов: "КТО - ЧТО сообщает - по какому КАНАЛУ - КОМУ - с каким ЭФФЕКТОМ?".

Одной из первых работ с использованием метода контент-анализа содержания в советской социологии было исследование А. В. Баранова.

Объектом изучения в данном исследовании была газета «Известия», предметом - субъективный фактор в механизме общественной жизни: его доля упоминаний в анализируемых номерах газеты наряду с материально-техническими, экономическими и социально-политическими факторами. В качестве субъективного фактора выступали психологические качества личности или группы, которые повлияли на описываемые газетой события. Кроме того, автора интересовала детализация этих «двигателей» человеческих поступков, мотивов человеческого поведения, выяснение того, «какие нравственные качества (чувства) человека выступают как активные силы в общественной жизни».

На это же десятилетие приходится освоение контент-анализа как социологической методики в социологической службе Гостелерадио, в новосибирской школе социологов под руководством Шляпентоха В.

Массированное применение этот метод нашел в крупном социологическом проекте под руководством Грушина Б.А. в рамках отдела «Общественное мнение»» Института конкретных социологических исследований АН СССР (1967-72). Программой проекта был предусмотрен замер функционирования в пределах среднего города СССР общественного мнения в его содержательной плоти, что влекло за собой информационный замер всех текстов, существующих на линии обмена «социальные институты - массовое сознание», в частности, текстов, проходящих по каналам СМК.

Как сам проект, так и ряд использованных в нем методик продемонстрировали большие возможности социологического анализа действительности, практически были одним из самых крупных событий в истории советской социологии конца XX века.

Это был период активного освоения метода отечественными социологами. Об этом красноречиво свидетельствует тот факт, что контент-анализу были посвящены две профессиональные встречи социологов: Сибирский социологический семинар «Проблемы контент-анализа в социологии», организованный Сибирским отделением советской социологической ассоциации в 1970 году, и рабочее совещание социологов «Методологические и методические проблемы контент-анализа» в 1973 году в Ленинграде.

На конец 70-х - 80-х гг. приходится деятельность группы анализа эффективности телевидения факультета журналистики МГУ, которая использовала этот метод для многолетнего мониторинга телевизионной информационной программы «Время» (Федотова Л.Н., Красавченко И.А.), а также анализа телевидения различных стран.

Если этому периоду были свойственны исследования с применением контент-анализа в рамках крупных социологических проектов, когда этот метод использовался вкупе с другими социологическими процедурами исследования информационных потоков, то нынешняя ситуация в российской социологии с применением контент-анализа характеризуется тем, что это, как правило, единичные исследования. Публикация о них чаще всего содержит результаты исследования, а описание методологического арсенала отсутствует. Еще большая часть исследований, имеющая эксклюзивный характер, востребованная в рамках политических мониторингов в русле политического маркетинга, практически вообще не имеет широкой прессы.