Содержание
Стр.
|Введение |6 |
|1.Типы информационных массивов и единицы |8 |
|контент-анализа | |
| 1.1 «Физические» единицы |8 |
| 1.2 Структурно-семиотические единицы |10 |
| 1.3 Понятийно-тематические единицы |10 |
| 1.4 Референциальные и квазиреференциальные |11 |
|единицы | |
| 1.5 Пропозициональные единицы и оценки |11 |
| 1.6 Макроструктурные единицы |12 |
| 1.7 Единицы, представляющие результаты |13 |
|концептуальных операций | |
| 1.8 . «Поэтические» единицы |13 |
|2 Частотные и системные характеристики в |14 |
|контент-анализе | |
| 2.1 Единицы, категории и признаки |14 |
| 2.2 «Фронтальный» и «рейдовый» контент-анализ |14 |
| 2.3 Обработка, презентация и интерпретация |15 |
|результатов | |
|Литература |18 |
Ведение
Контент-анализ, количественный анализа текстов и текстовых массивов с целью
последующей содержательной интерпретации выявленных числовых
закономерностей. Основная идея контент-анализа проста и интуитивно
наглядна. При восприятии текста и особенно больших текстовых потоков мы
достаточно хорошо ощущаем, что разные формальные и содержательные
компоненты представлены в них в разной степени, причем эта степень по
крайней мере отчасти поддается измерению: ее мерой служит то место, которое
они занимают в общем объеме, и/или частота их встречаемости. Через все
выступления X-а красной нитью проходит тема Y; X постоянно обращался в
своей речи к проблеме Y; Он не упускал ни одного случая, чтобы не лягнуть Z-
а; Ну, задудел в свою дуду, – все эти выражения, число которых можно легко
увеличить, свидетельствуют об осознании нами такого феномена, как наличие в
изливающемся на нас информационном потоке некоторых настойчиво
повторяющихся тем, образов, ссылок на проблемы, оценок, утверждений
(Карфаген должен быть разрушен или Российская экономика задыхается без
инвестиций), аргументов, формальных конструкций, конкретных имен и т.д.
Более того, подобно тому как в мире механики мы ощущаем не скорость, а
ускорение, так и при восприятии текста мы особенно хорошо осознаем именно
динамику содержания – те случаи, когда, например, кого-то вдруг перестают
или начинают бранить или когда в текстах вдруг появляется какая-то новая
тема.
Замысел контент-анализа заключается в том, чтобы систематизировать эти
интуитивные ощущения, сделать их наглядными и проверяемыми и разработать
методику целенаправленного сбора тех текстовых свидетельств, на которых эти
ощущения основываются. При этом предполагается, что вооруженный такой
методикой исследователь сможет не просто упорядочить свои ощущения и
сделать свои выводы более обоснованными, но даже узнать из текста больше,
чем хотел сказать его автор, ибо, скажем, настойчивое повторение в тексте
каких-то тем или употребление каких-то характерных формальных элементов или
конструкций может не осознаваться автором, но обнаруживает и определенным
образом интерпретируется исследователем – отсюда принадлежащее социологу
А.Г.Здравомыслову полушутливое определение контент-анализа как «научно
обоснованного метода чтения между строк». Реально главной отличительной
чертой контент-анализа является не его декларируемая во многих определениях
«систематичность» и «объективность» (эти черты присущи и другим методам
анализа текстов), а его квантитативный характер. Контент-анализ – это
прежде всего количественный метод, предполагающий числовую оценку каких-то
компонентов текста, могущую дополняться также различными качественными
классификациями и выявлением тех или иных структурных закономерностей.
Поэтому наиболее удачным определением контент-анализа можно считать то,
которое зафиксировано в относительно недавней книге книге Мангейма и Рича:
контент-анализ – это систематическая числовая обработка, оценка и
интерпретация формы и содержания информационного источника. С точки зрения
лингвистов и специалистов по информатике, контент-анализ является типичным
примером прикладного информационного анализа текста, сводящегося к
извлечению из всего разнообразия имеющейся в нем информации каких-то
специально интересующих исследователя компонентов и представлению их в
удобной для восприятия и последующего анализа форме. Многочисленные
конкретные варианты контент-анализа различаются в зависимости от того,
каковы эти компоненты и что именно понимается под текстом. Конкретные
прикладные цели контент-анализа также варьируют в широких пределах. Еще в
1952 американский исследователь Б.Берелсон сформулировал 17 целей,
воспроизводимых с тех пор в пособиях по контент-анализу; в их числе –
описание тенденций в изменении содержания коммуникативных процессов;
описание различий в содержании коммуникативных процессов в различных
странах; сравнение различных СМИ; выявление используемых пропагандистских
приемов; определение намерений и иных характеристик участников
коммуникации; определение психологического состояния индивидов и/или групп;
выявление установок, интересов и ценностей (и, шире, систем убеждений и
«моделей мира») различных групп населения и общественных институтов;
выявление фокусов внимания индивидов, групп и социальных институтов и др.
Исторически контент-анализ – наиболее ранний систематический подход
к изучению текста. Самый первый упоминаемый в литературе контент-
аналитический опыт (прикладная цель которого выглядит очень узнаваемой) –
это проведенный в Швеции в 18 в. анализ сборника из 90 церковных гимнов,
прошедших государственную цензуру и приобретших большую популярность, но
обвиненных в несоответствии религиозным догматам. Наличие или отсутствие
такового соответствия и определялось путем подсчета в текстах этих гимнов
религиозных символов и сравнения их с другими религиозными текстами, в
частности запрещенных церковью текстами «моравских братьев». В конце 19 –
начале 20 вв. в США появились первые контент-аналитические исследования
текстов массовой информации. Их мотивация выглядит удивительно знакомой:
авторы задавались целью продемонстрировать прискорбное «пожелтение»
тогдашней нью-йоркской прессы. В 1930–1940-х годах были выполнены
исследования, признаваемые ныне классикой контент-анализа, прежде всего
работы Г.Лассуэлла, деятельность которого продолжалась и в послевоенные
годы. Во время Второй мировой войны имел место самый, пожалуй, знаменитый
эпизод в истории контент-анализа – это предсказание британскими аналитиками
времени начала использования Германией крылатых ракет «Фау-1» и
баллистических ракет «Фау-2» против Великобритании, сделанное на основе
анализа (совместно с американцами) внутренних пропагандистских кампаний в
Германии. Начиная с 1950-х годов контент-анализ как исследовательский метод
активно используется практически во всех науках, так или иначе практикующих
анализ текстовых источников – в теории массовой коммуникации, в социологии,
политологии, истории и источниковедении, в культурологии,
литературоведении, прикладной лингвистике, психологии и психиатрии.
Разнообразие конкретных проектов, реализованных за примерно 70-летнюю
историю интенсивного использования контент-анализа, очень велико. Среди
интересных проектов, выполненных за последние годы в России, можно назвать
исследование образов и метафор, использовавшихся в 1996–1997 в ходе
развернутой тогда в российской прессе дискуссии о национальной идее, а
также выполненный в тот же период анализ текстов левонационалистической
оппозиции. Локальные контент-аналитические проекты периодически реализуются
в ходе различного рода социологических мониторингов – общенациональных и
региональных. Наиболее широкое распространение контент-анализ получил в
теории массовой коммуникации, политологии и социологии. Этим отчасти
объясняется тот факт, что иногда этот термин используется как обобщающий
для всех методов систематического и претендующего на объективность анализа
политических текстов и текстов, циркулирующих в каналах массовой
коммуникации. Однако такое расширительное понимание контент-анализа
неправомерно, поскольку существует ряд исследовательских методов – либо
специально разработанных для анализа политических текстов (например, метод
когнитивного картирования), либо применимых и применяемых для этой цели
(например, метод семантического дифференциала или различные подходы,
предполагающие изучение структуры текста и механизмов его воздействия), –
которые не могут быть сведены к стандартному контент-анализу даже при
максимально широком его понимании.
Тем не менее контент-анализ действительно занимает среди аналитических
методов особое место в силу того, что является среди них самым
технологичным и в силу этого в наибольшей степени подходящим для
систематического мониторинга больших информационных потоков. Помимо этого,
контент-анализ достаточно гибок для того, чтобы в его рамки мог быть
успешно «вписан» весьма разнообразный круг конкретных типов исследований.
Наконец, будучи в основе своей количественным методом (хотя и содержащим
немалую качественную составляющую), контент-анализ в определенной степени
поддается формализации и компьютеризации.
1. ТИПЫ ИНФОРМАЦИОННЫХ МАССИВОВ И ЕДИНИЦЫ КОНТЕНТ-АНАЛИЗА
Основа контент-анализа – это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными иными количественными или качественными характеристиками.
Отсюда понятно, что главная предпосылка контент-анализа – это выяснение того, что считать; иными словами, определение единиц анализа. Единицы эти в зависимости от целей анализа, типа информационного массива, а также ряда дополнительных причин могут быть (и реально бывают) весьма разнообразными.
К ним предъявляются два естественных, но, к сожалению, обычно плохо совместимых требования. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте; в идеале хотелось бы, чтобы их выявление вообще могло быть алгоритмизовано. Понятно, что такому требованию лучше всего удовлетворяют формальные элементы текста или же элементы, имеющие четко выраженные и однозначные формальные соответствия, например слова. С другой стороны, от единиц контент-анализа чаще всего требуется некая субъективная, да к тому же еще и зависящая от контекста значимость, делающая их распределение и динамику такого распределения диагностичными для выявления изменений в индивидуальном и общественном сознании, системах убеждений и т.д. – иными словами, единицы должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации. Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими разнообразными способами. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения. Характеристику единиц контент-анализа необходимо предварить кратким соображением о природе анализируемого информационного массива.
В самом определении метода контент-анализа нет ничего, что препятствовало бы применению его к отдельно взятому тексту; более того, примеры такого анализа известны. Тем не менее существует ряд причин, по которым объектом контент-аналитических проектов обычно является не отдельный текст, пусть даже значительный по объему, а именно информационный массив, или информационный поток, состоящий из большого количества текстов. Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки. Во-вторых, большинство целей контент-анализа предопределяют его тяготение к компаративности; аналитиков чаще всего интересуют не одномоментные срезы, а динамика изменений, а если и срезы, то, как правило,
«пестрые», отражающие, например, различные СМИ или сознание различных социальных групп. Наконец, при всем разбираемом ниже разнообразии единиц контент-анализа наиболее популярными являются различные макроединицы: темы и/или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, да и новые макроединицы появляются не столь часто, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении». Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным.
Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени. Конкретное разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. (Классификация, приводимая ниже, построена с учетом типологии
К.Криппендорфа, однако отличается от нее весьма существенно.)
1.1. «Физические» единицы. Под таковыми понимаются сущности с четко очерченными физическими, геометрическими или временными границами, как, скажем, экземпляры книги, номера газет, экземпляры плакатов или листовок, фотографии и т.п. Идентификация и подсчет их не составляют особого труда, однако необходимость в таком подсчете возникает достаточно редко; подсчет, скажем, листовок или книг чаще всего осуществляется с целью оценки представленности какой-то тематики или оценки, т.е. реально используются единицы других, характеризуемых ниже типов единиц – обычно концептуальных, пропозициональных или тематических.
1.2. Структурно-семиотические единицы. Под таковыми имеются в виду основные
элементы семиотических систем (см. СЕМИОТИКА). В случае естественного языка
это:
– лексика языка (слова и их эквиваленты, например выражение железная дорога или термин контент-анализ, т.е. то, что фиксируется в словарях) и
– грамматические показатели (например, отрицательные частицы или показатели таких категорий, как, скажем, отглагольные имена).
Количественный подсчет встречаемости слов в тексте – это, пожалуй, самый простой вариант контент-анализа, который, однако, зачастую способен давать небезынтересные результаты. Чаще всего, конечно, подсчитываются
«интересные», или «ключевые» слова и/или словосочетания, например названия ценностных категорий типа свобода, стабильность, доверие, территориальная целостность; сценариев типа предательство или разочарование; достаточно однозначные обозначения тех или иных общественно значимых явлений, например коррупция, преступность или терроризм; значимые атрибуты наподобие жесткий, решительный; эмоционально окрашенная оценочная лексика типа разрушительный, неудержимый, подлый, кошмарный, человеконенавистнический; слова-пароли
(тоже зачастую эмоционально окрашенные) типа патриоты, коммунофашисты, мондиалисты или белопридурки; слова, сильно активизированные в конкретный момент времени, вроде «Семья» или «Мабетекс» в начале осени 1999 или все та же «Семья» и «Медиа-Мост» в конце весны 2000 в России, терроризм во множестве стран мира осенью 2001 и т.д.
Контент-анализ грамматических категорий представляет собой достаточно редкое исследовательское начинание, стимулом к которому является гипотеза
(весьма правдоподобная) о том, что употребление грамматических форм в меньшей степени, чем употребление лексики, контролируется автором текста и поэтому может послужить источником таких сведений о нем, которые он сам вовсе не собирался делать доступными своим читателям. В политической психологии существует специальная исследовательская методика, так называемый анализ когнитивной сложности, которая на основе фактически контент-аналитической процедуры позволяет делать выводы о том, насколько простым (или, напротив, сложным) является видение политической ситуации автором текста и как оно меняется со временем. Единицами контент-анализа, лежащего в основе оценки когнитивной сложности, являются, например, относимые обычно к служебной лексике категорические квантификаторы типа всегда, никогда, всякий, которым противостоят квантификаторы типа иногда, некоторый и т.п.; категорические (вроде знаменитого однозначно) оценки истинности в противоположность осторожным возможно или не исключено, что; языковые средства дифференцированного рассмотрения ситуации наподобие с одной стороны... с другой стороны; упоминания взаимодействия, баланса, взаимозависимости, компромисса и т.д. Известны и примеры контент-анализа чисто грамматических средств, например исследования соотношения глагольных форм, обозначающих, соответственно, процессы и результаты, исследование номинализованных (с отглагольными именами типа построение, усиление и т.п.) конструкций в языке партийных документов брежневского времени, отрицания в политическом тексте и др. Поскольку объектами контент-анализа могут быть не только вербальные (естественноязыковые), но и другие виды текстов
(например, карикатуры, фотоснимки, рекламные клипы), постольку в числе структурно-семиотических единиц контент-анализа могут присутствовать визуальные и звуковые (чаще всего музыкальные) образы и символы, которые могут анализироваться на тех же основаниях, что и единицы естественного языка.
1.3. Понятийно-тематические единицы. В большинстве случаев контент-аналитик
интересуется не словами как таковыми и тем более не грамматическими
категориями, а стоящими за словами значимыми для него понятиями, темами,
проблемами – иными словами, тем, что можно назвать понятийно-тематическими
единицами. Исследователь, интересующийся тем, какое место в общественном
сознании занимает, скажем, проблема преступности, обязан принимать во
внимание не только присутствие в анализируемом информационном массиве слова
преступность, но и упоминания заказных и всяких прочих убийств, бандитского
беспредела, «крыши», «братков», авторитетов, власти криминала и проч. Тот,
кого занимает проблема свободы, должен в своем анализе реагировать на
упоминания давления на прессу, чиновничьего произвола, контролируемости
СМИ, доступа к Internet и т.д. Интересующийся отношением общественного
сознания к каким-то реалиям должен принимать во внимание самый широкий
спектр позитивных, негативных и некоторых более конкретных оценок, которые
могут быть даны этим реалиям, причем эти оценки вовсе не обязательно должны
присутствовать в виде оценочных суждений.
1.4. Референциальные и квазиреференциальные единицы. К референциальным,
точнее, конкретно-референциальным единицам относятся обозначения реальных
личностей (как современных, так и исторических деятелей), событий, городов,
стран, организаций и т.д.; это, так сказать, «энциклопедический» блок
единиц анализа. Этот блок, особенно в части персоналий, весьма важен и
диагностичен, поскольку позволяет определять личностные рейтинги и, что не
менее существенно, оценивать идеологические системы с точки зрения
присутствующих в них референтных «знаковых» фигур, своего рода
«идеологических героев». Примером интересного исследования роли референтных
фигур в российском оппозиционном дискурсе 1996–1997 может послужить работа
А.В.Дуки. Способы обозначения в тексте конкретных фигур могут различаться
(В.В.Жириновский, Владимир Вольфович, Вольфыч, Жирик, сын юриста, лидер
ЛДПР, самый провосточный российский политик, главный либеральный демократ,
либералиссимус), однако конкретно-референтная единица здесь во всех случаях
одна. Квазиреференциальные единицы в политических текстах чаще всего бывают
представлены обозначениями всякого рода «сил» – коллективных актеров
политической сцены, референция которых может колебаться от реальной (типа
КПРФ) через обобщенную (коммунисты, либералы, Запад, исламисты) к
откровенно мифологизированной (мировая закулиса). Независимо от своей
референции все эти персонажи присутствуют в идеологическом пространстве, им
могут приписываться действия и оценки, и отношение к ним является
немаловажным политико-идеологическим фактором. Грань между
квазиреференциальными и некоторыми типами понятийно-тематических единиц
размыта в силу того, что некоторые политические понятия способны и даже
склонны (например, та же преступность) к метафорической персонификации.
1.5. Пропозициональные единицы и оценки. Их примеры приводились выше –
Карфаген должен быть разрушен или Россия задыхается без инвестиций.
Собственно говоря, это примеры высказываний, в основе которых лежат
пропозиции – описания конкретных положений дел (ситуаций) безотносительно к
их модальности (в первом примере – требование, во втором – констатация).
Наряду с пропозициями для контент-анализа могут представлять (и очень часто
представляют) большой интерес оценки (Это очень опасное решение). С
логической точки зрения они обладают важными отличиями от пропозиций,
однако для целей контент-анализа как собственно пропозиция, так и оценка
могут рассматриваться как результат связывания некоторого объекта с
некоторым атрибутом. Изучение динамики оценочных суждений, высказываемых в
адрес тех или иных лиц, событий, институтов, – весьма распространенный тип
контент-аналитического исследования.
1.6. Макроструктурные единицы. Под макроструктурными единицами понимаются достаточно сложные понятийные конструкции, образующие «верхние этажи» человеческих представлений о мире и, в частности, идеологических систем.
Эти конструкции, как правило, носят характер сценариев и описывают стереотипные модели развития, с которыми сопряжены ожидания будущего, соображения о прошлом, эмоциональные ассоциации и т.д. Часто эти конструкции имеют литературные или фольклорные прототипы, что отражается в их названиях. Все они в очень сильной степени претендуют на объяснение действительности. Для обозначения таких конструкций чаще всего используется термин «идеологема»; в различных дисциплинах говорят также о мифологемах, кочующих образах и т.д. Среди подобного рода конструкций, присутствующих в общественном сознании современной России (и распределенных, порою причудливо, по разным идеологическим системам), имеются, например, следующие: Заговор, Оргия коррупции / Криминальная революция / Беспередел,
Ограбление / Конверсия власти в собственность, Страна дураков / Город
Глупов, «Нет, ребята, все не так», «Возвращение в цивилизацию» и др.
Некоторые еще недавно значимые идеологемы (скажем, Борьба за власть,
Естественный распад или Тотальная некомпетентность) в последние полтора-два года по различным причинам вышли из фокуса внимания средств массовой информации, а отчасти и населения.
1.7. Единицы, представляющие результаты концептуальных операций. Их довольно много, однако наибольший интерес для контент-анализа представляют метафоры, примеры и аналогии, которые в общем плане уже были охарактеризованы выше. Некоторые из метафор активно используются в политических текстах, и их использование считается диагностичным для характеристики как индивидуального сознания автора текста, так и состояния общественного сознания. Например, в политических текстах часто встречается упоминавшаяся «военная метафора» в варианте ПОЛИТИЧЕСКОЕ ПРОТИВОСТОЯНИЕ –
ЭТО ВОЙНА, проявляющаяся в таких выражениях, как война с бедностью, удар по губернатору, атака со стороны оппозиции, разгромная публикация и т.д. При использовании такой метафоры политическое противостояние, независимо от того, в какой форме оно реально ведется, переживается как война, что может, кстати, иметь последствия и для реальных форм политического взаимодействия.
Между тем «военная метафора» – это не единственный способ описания политического процесса (и, шире, жизни вообще); они могут описываться с помощью, например, «транспортной метафоры» и/или связанной с ней «метафоры пути» (Мы все вместе вступили на трудную дорогу), «архитектурной метафоры»
(государственное строительство, выстраивание властной вертикали) и ряда других. Метафорика политических текстов достаточно подробно изучалась
Дж.Лакоффом и его последователями, в том числе и в рамках контент- аналитической методологии (работы А.Н.Баранова); было показано, что, например, возрастание частотности военной метафоры является одним из коррелятов усиления напряженности в обществе.
Не менее диагностичным может быть исследование динамики примеров и аналогий
– так, в российских политических текстах до недавнего времени настойчиво повторялась аналогия (принадлежащая В.Янову), в рамках которой Россия сравнивалась с Веймарской республикой.
1.8. «Поэтические» единицы. Под таковыми имеются в виду допускающие
количественное измерение средства художественной выразительности –
например, каламбуров, аллитераций и т.п.
2. ЧАСТОТНЫЕ И СИСТЕМНЫЕ ХАРАКТЕРИСТИКИ В КОНТЕНТ-АНАЛИЗЕ
2.1 Единицы, категории и признаки. При том, что контент-анализ является в своей основе количественным методом, в нем, как уже говорилось, почти всегда присутствует и значительная качественная составляющая. В принципе это верно уже постольку, поскольку единицы контент-анализа, как видно из предыдущего раздела, чаще всего все же являются содержательными и их выделение основывается на семантических (смысловых) критериях; многие из единиц представляют собой обобщенные категории (это относится прежде всего к темам и идеологемам). Иными словами, контент-аналитик занимается количественным анализом качественных категорий. Но этим дело не исчерпывается. Во многих контент-аналитических проектах осуществляется не только оценка степени представленности в тексте тех или иных единиц, но и одновременная оценка этих единиц по тем или иным градуированным качественным шкалам. В частности, это могут быть предложенные Ч.Осгудом шкалы абстрактности (фактически – трудности для восприятия) того или иного содержания; расстояния до индивидуума (какие-то содержательные компоненты могут непосредственно касаться читателя или читателей, а какие-то могут представлять лишь досужий интерес). В сочетании с результатами собственно контент-анализа оценка использованных единиц анализа (тематических) по указанным шкалам дает трехмерную схему типа, например, той, что была предложена французским культурологом А.Молем. Очевидно, что при анализе могут быть использованы и другие шкалы, кроме того, единицы контент-анализа могут объединяться в различные более широкие категории.
2.2 «Фронтальный» и «рейдовый» контент-анализ. Контент-аналитические исследования можно разделить на два больших класса, которые, пользуясь вышеупомянутой «военной метафорой», можно назвать фронтальными и рейдовыми.
Задачей фронтального контент-аналитического исследования является составление максимально более полного представления об информационном потоке – либо на моментальном срезе, либо на протяжении некоторого периода с целью оценки динамики. Это, так сказать, попытка получить объективизированный ответ на вопрос «Что пишут?» Единицы такого анализа в принципе могут быть любыми, но чаще всего в таковом качестве выступают либо тематические единицы, либо ключевые слова, реже оценки и пропозиции и еще реже макроструктурные единицы. Такой анализ обычно носит сугубо прикладной характер и ведется в режиме мониторинга. Поскольку целью его является составление общего представления о содержании СМИ и через него – об общественном сознании, он должен в идеале стремиться к возможно более широкому охвату информационного потока. На практике, однако, полный охват чаще всего бывает невозможен, да зачастую и не нужен. Тем самым на повестку дня контент-аналитического исследования встает проблема составления репрезентативной выборки – традиционная проблема эмпирического социологического исследования, которая при неудачном решении может полностью дискредитировать его результаты. Решается она в случае контент- анализа традиционными социологическими методами.
Рейдовый анализ, в противоположность фронтальному, ориентирован на решение частных и порой довольно экзотических задач, вытекающих, как правило, из каких-то скорее исследовательских, нежели прикладных интересов, и применительно к нему проблема выборки решается в связи формулировкой этих исследовательских целей и определением единиц анализа. Обоснование выборки при этом производится с учетом стандартных социологических критериев, но может допускать и их нарушение; важно лишь, чтобы факт этого нарушения осознавался и необходимость нарушения специальным образом обосновывалась.
2.3 Обработка, презентация и интерпретация результатов. Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. (Проблема подготовки кодировщиков, очень важная в практическом плане, в настоящей статье не затрагивается.)
Эта элементарная схема может быть усложнена многими разными способами.
Прежде всего, наборы единиц с сопоставленными им количественными оценками, как правило, сопоставляются с другими количественными оценками тех же единиц. Это могут быть, например, результаты подсчета частотности упоминания одних и тех же тем для различных выпусков одного и того же печатного издания или одной и той же регулярно выходящей в эфир новостной программы (временные ряды); результаты аналогичного подсчета для различных изданий/программ или, скажем, обобщенных категорий изданий. Очевидно, что такие данные могут быть представлены с помощью разнообразных графических средств – диаграмм, графиков и т.д., обеспечивающих наглядность.
Наглядность, следует заметить, важна не только для аналитика: наглядная диаграмма или впечатляющий график обладают большим потенциалом воздействия, особенно в обществе, привыкшем с почтением относиться к естественнонаучному инструментарию. Классификации зачастую бывают многомерными, и для представления это также могут использоваться различные формальные средства.
На практике результаты контент-анализа чаще всего представляются рядами диаграмм, столбчатых или круговых, хотя понятно, что в распоряжении контент- аналитика имеется все разнообразие средств представления количественных данных. А также и качественных: для отображения отношений между единицами контент-анализа и результатов их категоризации используются такие стандартные средства отображения структур, как различные графы.
Квантификация данных, естественно, создает необходимые предпосылки для применения к ним средств математического анализа. Помимо анализа частотного распределения, к ним относится анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ.
Разумеется, весь этот инструментарий должен применяться корректно. Если при определении единиц контент-анализа и идентификации их в тексте добиться полной объективности возможно лишь в некоторых (как правило, не самых интересных) случаях, то при экспликации и обработке данных обеспечить следование строгим стандартам вполне возможно. Содержательная интерпретация результатов зависит от целей анализа; она является прежде всего творческим актом, результаты которого во многом предопределены политологической квалификацией и интуицией аналитиков. В ходе контент-аналитического исследования как для анализа текста, так и для последующей обработки его результатов может использоваться вычислительная техника. Второй тип использования не вызывает особых проблем: после квантификации, т.е. перевода данных в числовую форму, их математическая и, в частности, статистическая обработка может осуществляться многими разными программными средствами, в том числе стандартными статистическими пакетами типа SPSS.
При анализе текста и последующем сохранении результатов этого анализа в базах данных могут использоваться специальные программы, предназначенные для целей лингвистических исследований. В частности, анализ метафорики в русских политических текстах велся с помощью разработанной в Институте русского языка РАН программы Dialex, способной осуществлять составление частотных словарей и конкордансов, а также поиск лексических единиц с их контекстами и сохранять его результаты в базе данных; в настоящее время завершается работа над более совершенной системой, предназначенной для решения тех же задач. Некоторая подсистема контент-анализа входит составной частью в отечественную систему прикладного анализа текстов ВААЛ. Имеется также ряд зарубежных контент-аналитических компьютерных систем, а также систем, потенциально применимых для целей контент-анализа – такова, в частности, система KEDS, разработанная Ф.Шродтом в Канзасском университете и используемая для анализа потока политических событий, отображаемых на ленте информационного агентства «Рейтер».
ЛИТЕРАТУРА
Моль А. Социодинамика культуры. М., 1973
Мангейм Дж., Б. Рич Р.К. [и др.]. Политология: методы исследования. М.,
1997
Дука А.В. Политический дискурс оппозиции в современной России. – Журнал социологии и социальной антропологии. 1998, т. 1
Серио П. Русский язык и анализ советского политического дискурса: анализ номинаций. – Квадратура смысла: французская школа анализа дискурса. М.,
1999
Баранов А.Н. Введение в прикладную лингвистику. М., 2000