О контент-анализе

Контент-анализ

Это первая статья на моём блоге о контент-анализе, и она даёт общее представление о методе контент-анализа. Перевод с английского мой. Приятного прочтения.

Бернард Р Берелсон (1912-1979)


Нижеследующая информация представляет собой краткий обзор блестящей и глубокой работы по контент-анализу, написанной Майком Палмквист (Mike Palmquist) – сотрудником государственного университета Колорадо. Он преподаёт курсы по методам исследований и их теории.

Бернард Берелсон определил контент-анализ как «исследовательскую технику для объективного, систематического и количественного отражения коммуникаций». Контент-анализ представляет собой инструмент, опирающийся на внешнее содержание контента и изучающий внутреннюю семантику содержания СМИ. Метод используется для определения степени присутствия определённых слов, мыслей, тем, фраз, букв или предложений в изучаемом тексте или массиве текстов. Реализуется он посредством объективного подсчёта частотности этих объектов. Текстами могут являться книги, главы книг, эссе, интервью, диалоги, основные заголовки газет и газетных статей, исторические документы, речи выступлений, дискуссии, рекламные материалы, театральные тексты, тексты неформальных дискуссий или любое другое проявление языковых коммуникаций. [На самом деле, применение контент-анализа распространяется шире, чем анализ только лишь текстов. Объектами анализа могут являться и материалы в видео или аудио формате, массивы фотографий в СМИ, массивы носителей информации и многое другое ] Для реализации текстового контент-анализа, тексты кодируются, разбиваются на части для удобства оперирования и в соответствии с используемой исследователем системой категорий. Варьируются «уровни» анализа: словарный, слово-семантический, фразовый, уровень предложений или тем. Далее материал подвергается обработке с использованием основных подходов контент-анализа: концептуального или корреляционного. Результаты контент-анализа используются для определения выводов о роли и значимости отдельных сообщений внутри изучаемого текстового массива с учётом задаваемых автором, аудиторией, культурой и временем рамок и особенностей. Например, контент-анализ способен определить уместность [конгруэнтность коммуникационной ситуации] или представленность [полноту или недостаток] различных эмоциональных и содержательных элементов авторов текстов и участников коммуникаций, их предрассудков, намерений, идентифицировать ошибки и недосказанности.

Контент-анализ – это детище эры электроники. Вместе с тем контент-анализ регулярно проводился уже в 1940-е года и ещё стал более часто используемым и пользующимся доверием методов с середины 1950-х годов, когда исследователи стали опираться не на слова, а на оперирование отдельными тематико-семантическими структурами, их стали интересовать связи между этими смыслами [корреляции], а не простое присутствие слов в массивах текстов.


Области использования контент-анализа.

Благодаря тому, что контент-анализ может быть использован для изучения любого по содержанию и форме текста или массива текстов или другой форме записи коммуникации, метод применяется в самых разных областях, например в сфере маркетинга и области изучения СМИ, литературе и риторике, этнографии и культурологи, в дисциплинах, изучающих гендерн и возраст, социологии и политологии, психологии и когнитивных науках и в других исследовательских областях знания и науках. Также контент-анализ тесно связан с социо- и психолингвистикой, он играет ключевую интегральную роль в системах разработки искусственного интеллекта. Нижеследующий список, опирающийся на труды Берелсона, описывает и другие категории сфер применения контент-анализа:

  • Даёт возможность понять интернациональные различия в коммуникациях
  • Определяет присутствие материалов пропагандистского характера
  • Идентифицирует намерения и тенденции в индивидуальной или групповой коммуникации
  • Описывает поведенческие реакции в рамках коммуникаций
  • Определяет психологический и эмоциональный фон отдельных индивидов и групп

Типы контент-анализа

Существуют две основные категории контент-анализа: концептуальный (понятийный) [в русскоязычных материалах его принято называть количественным, независимо от семантического неравенства терминов] и корреляционный. Концептуальный ориентирован на идентификацию присутствия и частоту появления этих концептуальных единиц [единиц счёта]. Корреляционный анализ ориентирован на идентификацию связей между отдельными единицами счёта в рамках текста.

Концептуальный контент-анализ

Традиционно контент-анализ рассматривался только в качестве концептуального его варианта. В концептуальном анализе концепция [единица счёта] выбрана как средство изучения текста с помощью подсчёта частоты её появления в тексте. Поскольку единицы счёта могут проявляться как эксплицитно так и имплицитно перед началом квантификации единиц важно заранее чётко определить и зафиксировать варианты имплицитного проявления единиц счёта. Для того чтобы избежать субъективности в определении объектов в качестве единиц счёта на данном этапе принято использовать специальные словари контент-анализа [тезаурусы].

Как и во многих других методах, концептуальный контент-анализ начинается с определения ключевых вопросов исследования и выборки или выборок. Будучи выбранным для анализа текст должен быть закодирован в рамках установленной исследователем системы категорий. Процесс кодирования представляет собой процесс сокращения объёма материала, являющийся основной идеей контент-анализа. Разделение массива текста на отдельные тематически целостные и релевантные категориальному аппарату единицы информации позволяет идентифицировать определённые характеристики материала, анализировать и интерпретировать их.

Примером концептуального анализа может являться изучение текста посредством подсчёта встречаемости кодов входящих в словарь контент-анализа кодов. В рамках анализа исследователь должен, например, ставить вопрос о том, как часто в тексте встречаются слова, подтверждающие ту или иную позицию, и как часто встречаются слова, её опровергающие. Исследователь должен быть заинтересован только лишь в подсчёте этих слов, но не в идентификации семантических и тематических связей между ними, что характерно для корреляционного анализа. В концептуальном анализе исследователь изучает только присутствие объектов релевантных вопросам исследования, то есть определяет – что в большей мере представлено в тексте – подтверждение той или иной гипотезы или гипотез или её (их) опровержение.

Корреляционный контент-анализ

Как уже было сказано выше, корреляционный контент-анализ базируется на принципах концептуального контент-анализа, изучая связи между единицами счёта (концепциями, позициями). И как в случае с другими типами исследований, данный подход базируется на определении выборки и категорий анализа, операционализированных словарём контент-анализа, что и определяет дальнейших ход исследования. Для корреляционного контент-анализа определить какие типы позиций (единиц счёта) будут эксплуатироваться в рамках исследования. Проводились исследования с использованием всего нескольких таких позиций (concepts) и проводились с использованием более 500 категорий концепций. Очевидно, что слишком большое число категорий может дать некорректные результаты исследования, так как с увеличением числа категорий и единиц счёта растёт и сложность анализа. Такое же утверждение характерно и для слишком маленьких категориальных аппаратов и словарей, дающих при использовании ненадёжные и потенциально некорректные результаты. Таким образом, при создании словарей и категориальных аппаратов важно опираться на особенности анализируемого массива и на конкретные задачи замера.

Существует большое количество методик проведения корреляционного контент-анализа, что определяет гибкость и популярность метода. Исследователи могут самостоятельно разрабатывать собственные методики проведения корреляционного контент-анализа в соответствии с задачами конкретного исследования. Когда разработанная процедура в достаточной мере доказала свою эффективность и объективность, она может быть принята и распространена среди других исследователей. Процесс проведения корреляционного контент-анализа достиг высокого уровня развития в компьютерной среде – среде автоматизации расчетов, но, даже не зависимо от этого, как и многие другие методы исследований, он является весьма длительным, требующим массу времени на реализацию. Вероятно, самым серьёзным требованием к этом методу является необходимость соответствия строгим статистическим нормам при условии сохранения богатства материала, выраженного в отдельных деталях, требующих качественного подхода для анализа.

Вопросы надёжности и верификации

Вопросы надёжности и верификации актуальны и в рамках данного метода. Надёжность результатов контент-анализа опирается на однородность процесса изучения, его стабильность (stability), умении кодировщиков и интерпретаторов оперировать данными единым образом на протяжении всего исследования; воспроизводимость или умение группы кодировщиков классифицировать материал в соответствии с заданным категориальным аппаратом единым образом; высокая статистическая точность классификации материала в соответствии с заданными категориями.

Ключевой проблемой концептуального контент-анализа является проблема получения спорных, сомнительных результатов, что является следствием использования самих процедур метода. Главный вопрос в данном контексте – какой объём и уровень заложенного в тексты смысла объективно доступен для идентификации, или, другими словами, являются ли полученные данные результатом использования исключительно введённого инструментария либо они получены и при участии других факторов, повлиявших на результаты исследования? При этом едва ли можно представить себе различные варианты толкования, например, числа 99 в точных науках. Объективные результаты исследования можно получить при использовании только основных [репрезентативных тематически, релевантных теме замера] материалов, массивов текстов, но и при этом, вопрос об объективности и возможности верификации и обоснования результатов остаётся открытым и злободневным.

Обобщения, заключения исследователей во многом зависимы от того, как конкретно исследователь определяет для себя значение той или иной категории, равно как актуальна и надёжность самого категориального аппарата. Исследователь обязательно должен точно определить категории и единицы счёте которые позволят объективно замерить исследуемый объект. Аналогично, точнейшим образом необходимо создать объективную системы правил и инструкция для исследования. Разработка правил, которые позволят всем кодировщикам и интерпретаторам следовать единым стандартам в работе, одинаковым образом кодировать материал, жизненно важна для успеха в проведении концептуального контент-анализа. Воспроизводимость [объективный выбор инструментов анализа, в случае необходимости выбранный идентично в рамках аналогичного исследования] и точность, не только категорий анализа и единиц счёта, но и ключевых подходов к анализу материала, позволяют получать более корректные и надёжные результаты.

Один из первых трудов по контент-анализу: Б.Берелсон "Формирование политических предпочтенией на президенских выборах"

Преимущества контент-анализа

Контент-анализ имеет ряд серьёзных преимуществ перед другими методами и просто очевидных достоинств. Среди них стоит выделить:

  • Изучает непосредственно саму коммуникацию через анализ текстов, что позволяет исследователю взаимодействовать с первичным средством коммуникаций в социуме
  • Работает как с качественными, так и с количественными данными
  • Может дать ценную историческую/культурологическую информацию, описывающую разные исторические периоды, опираясь только на анализ текста
  • Позволяет получать информацию близкую по форме изложения [текст], хотя степень такой близости варьируется в зависимости от используемого инструментария
  • Может быть использован для анализа материала, необходимого как средства развития тех или иных систем
  • «Ненавязчивый» способ анализа коммуникаций [участники коммуникации в данном случае не испытывают при анализе никакого дискомфорта, так как метод не вмешивается непосредственно в коммуникации]
  • Комплексно, интегрально и вдумчиво, глубинно подходит к изучению моделей человеческих мыслей и языка
  • Если метод используется корректно, то он расценивается в качестве объективного (базируется на реальных фактах, в отличие от дискурсивного анализа)

Недостатки контент-анализа

  • Контент-анализ также имеет и ряд недостатков, как теоретического так и прикладного характера:
  • Может потребовать очень много времени на проведение замера
  • Потенциально опасный для допущения ошибки, в особенности если используется корреляционный анализ, ориентированный на идентификацию глубинных данных
  • Часто не имеет теоретической базы в рамках различных методик проведения, либо, ради достижения важных для исследования результатов, может игнорировать теоретические научные ориентиры
  • По своей природе – редуктивен, то есть ориентирован на игнорирование слабо проявленной информации, в особенности, если производится анализ сложных по содержанию текстов
  • Часто ориентирован на упрощение результатов, так как опирается на простой подсчёт слов
  • Нередко игнорируется контекст содержания единиц счёта (слов), либо нивелируется значимость последующих слов
  • Может быть непрост для применения компьютерных технологий и автоматизации исследования

Оригинал статьи находится по следующему адресу: http://www.gslis.utexas.edu/~palmquis/courses/content.html

(перевод Алексея Рюмина)

Print Friendly, PDF & Email

О контент-анализе: 16 комментариев

  1. Алексей, здравствуйте!
    Скажите, а можете ли Вы оформить индивидуальное обучение качественному контент-анализу (для религиоведческих исследований) в качестве курса повышения квалификации, с выдачей соответствующего удостоверения? Допустим, я занимаюсь с Вами 4 часа очно в Н. Новгороде, и еще 32 часа — работаю самостоятельно с программой Lekta или с одной из рекомендованных Вами бесплатных программ(с консультационой поддержкой с Вашей стороны)? Сколько будет стоить такое обучение? И сколько стоит программа Lekta?

    1. Здравствуйте, Елена! Идея с сертификатами интересная — думал уже об этом ранее, но так и не реализовал этот атрибут обучения. То есть официально оформить обучение не смогу. ЛЕКТА стоила 6000 около года назад.

      1. Жаль. А сколько стоит индивидуальное обучение без сертификата? И где можно купить программу — на кафедре? Можно ли в этом случае получить чек или какую-либо справку о покупке (для бухгалтерии)?

        1. Здравствуйте! Извините, что долго не отвечал. Сейчас у меня очень много работы — просто не смогу выкроить время для обучения. А по поводу приобретения ЛЕКТА стоит писать на nisoc.ru (может быть закупят ключи). Может быть вам не Лекта стоит использовать, а подобрать бесплатный софт. Ну, или платный, но другой. Какие массивы планируете обрабатывать?

Обсуждение закрыто.