Пример классического контент-анализа. Часть вторая

Здравствуйте, уважаемые читатели блога о контент-анализе! В этой статье я продолжу описывать алгоритм проведения простейшего контент-анализа текста. Не прочитавшим предыдущую статью, рекомендую ознакомиться с ней по этой ссылке: Пример классического контент-анализа. Часть первая.

Напомню, что в ходе кодирования микросюжетов  мы с Вами получили следующую матрицу:

1001010

Как же мы будем работать с ней в первую очередь? Вначале можем отсеять неинформативные текстовые фрагменты — высказывания респондентов, в которых не звучит ни одного из параметров, вошедших в наш перечень. Для этого просто подсчитаем автосумму по строкам. Можете воспользоваться формулой =СУММ(диапазон значений) либо нажать на соответствующий значок в панели инструментов. Соответственно, для подсчёта автосуммы надо кликнуть по ячейке, следующей за последней ячейкой в диапазоне, после этого подсчитать автосумму.

summ     summsign

Подсчитаем автосуммы для всех строк. Для этого кликнем два раза по правому нижнему уголку ячейки с уже подсчитанной автосуммой. В ячейках, где сумма по строке равна 0, содержатся фрагменты текстов, не включающие ни одного из выделенных нами микросюжетов. Отсортировав значения по возрастанию, мы увидим, что наверху окажутся «неактуальные» текстовые фрагменты. Мы можем просто удалить эти строки. Однако, вы можете этого не делать, так как в перспективе может появиться необходимость расширить набор параметров анализа, что может задействовать «неактуальные» текстовые фрагменты.

nonactual   del

Аналогичным образом мы можем поступить и с микросюжетами, не отражёнными в высказываниях респондентов. Также можно удалить из матрицы слабовыраженные микросюжеты то есть удалить  некоторые малоактуальные столбцы из матрицы. Точно таким же образом подсчитываем автосуммы по столбцам. На рисунке ниже мы находимся в самом низу матрицы — не удивляйтесь результатам вычисления автосумм — просто шапка матрицы закреплена и опускается вместе с движением экрана вниз.


На рисунке синим цветом представлены неактуальные параметры — кандидаты на удаление из матрицы. Красным отмечены параметры, доминирующие в информационном пространстве изучаемого предмета. Им стоит уделить особое внимание при анализе. Также стоит просмотреть, не принадлежат ли все высказывания, относящиеся к тому или иному доминирующему параметру, одним и тем же людям (здесь нам как раз поможет столбец с кодами фрагментов). Если это так, едва ли можно говорить о количественной интерпретации такого материала. Более того, если уж мы заговорили о количественной составляющей, всегда стоит помнить о репрезентативности выборки. Учитывая то, что в нашем случае мы разбираем глубинные интервью, репрезентативности  выборки добиться весьма проблематично. Однако, всё же можно учитывать и количественную составляющую, при этом помня о возможной статистической ошибке.

actualparam

Следующим шагом будет построение своеобразного каркаса нашей будущей записки — аналитического отчёта по результатам контент-анализа. Сейчас нам нужно выбрать все актуальные параметры и сгруппировать их в отдельные блоки — более крупные темы. Каждой из тем надо дать осмысленное название.

groups

В нашем примере только 2 группы. Однако, в рамках проведения реальных замеров групп больше, равно как больше и параметров (20-35). Сразу оговорюсь — для нашей будущей записки название темы — глава, название параметра — параграф. Сами же параметры, безусловно, можно объединять в рамках параграфов, если есть такая необходимость.

Далее всё довольно просто, если не копать глубоко. Предположим, мы начнём наш анализ с параграфа про «наркоманию и молодёжь». Сортируем данные в соответствующем столбце, так чтобы наверху оказались наибольшие значения (в нашем примере это единицы). Из первого столбца копируем все текстовые фрагменты, соответствующие ненулевому значению (представленные в высказываниях респондентов).

sort

Сам анализ мы можем проводить, например, в Microsoft Word или его аналогах, а простейший его подход заключается в обобщении мыслей высказываний респондентов, в идентификации особенностей интерпретации ими тех или иных микросюжетов. Здесь важно обращать внимание именно на особенности деталей описания предмета обсуждения, а не на степень их представленности. Если респондент говорит о распространении наркомании среди молодёжи, важно интерпретировать особенности его отношения к проблеме. Простой пример:

Респондент 1 (м, 16 лет) «У меня нет опасений за российскую молодёжь. Каждый сам волен выбирать, как ему жить. Если подросток намеренно травит себя наркотиками, значит это всё на что он способен. Пусть травит дальше. Мне нет до него дела. Общество станет только чище, наркоманов меньше, меньше уличных воров, собирающих себе на дозу…»

Здесь всё просто. Мы можем сделать вывод о том, что если для молодёжи и актуальна эта проблема как социальный недуг, то беспокойство главным образом вызывает именно преступность, порождаемая наркоманией. Молодые люди чаще всего попадают под удар таких преступных элементов, что и беспокоит их в данном отношении. Сами же наркоманы воспринимаются ими конгруэнтно юношескому максимализму — наркоманы лишние в обществе и от них стоит избавляться любыми способами, не гнушаться жестокостью и насилием. Другими словами, ориентируясь на молодёжь как на целевую аудиторию, государство, организующее кампании борьбы с наркоманией, может позволить решительные и жёсткие действия — молодёжь, как целевую аудиторию, они устроят. Такие выводы можно сделать при анализе этого высказывания и других. Важно учитывать не одно высказывание, а постоянно верифицировать его другими высказываниями. Если звучат противоположные позиции, важно отметить точки их соприкосновения и ключевые различия. Надо описывать каждую деталь, и, самое важное, не просто перечислять их, а делать выводы, рассуждать, и ещё раз верифицировать, дабы не сделать ложных выводов. Как Вы сами понимаете пример выше необъективен, так как не является элементов реального замера.

Таким образом Вы поступаете с каждым высказыванием. Анализируете, пишите выводы в соответствующем разделе записки, цитируете респондентов, что является неотъемлемым атрибутом отчёта — в нём обязательно должен содержаться иллюстративный материал. В начале параграфа будет правильно написать некоторое небольшое введение в микротему, вначале главы — экскурс в тему — и только после это приступить к анализу материала. В конце параграфа правильнее будет сделать выводы по параграфу и также представить их читателю.

Подчеркну, что с помощью наших кодов высказываний структуру изложения можно строить, например, опираясь на гендерный признак: вначале описать мужскую позицию в отношении той же проблемы распространения наркомании среди молодёжи, а потом женскую, сравнить их. С помощью этого можно понять как лучше работать с мужской аудиторией, реализуя соответствующую кампанию борьбы с наркоманией, и как работать с женской аудиторией. Также это может быть возрастная дифференциация: вначале описывать мнение респондентов младше 18 лет, далее от 19 до 25 и так далее. Такое простое сегментирование поможет лучше сориентироваться использующему итоговый отчёт для реализации той или иной кампании. Точно также структуру изложения нашей аналитики мы можем строить и на других социальных или, например, профессиональных квотах. Подчеркну, что это совсем не обязательно социологический замер и государственная кампания. Этим методом можно проводить и замеры отношения к услуге, продукту, оценивать внутрикорпоративный психосоциальный климат и т.д.

Таков простейший вариант качественного контент-анализа. Для того, чтобы его несколько усложнить, можно ввести несколько дополнительных параметров. Например, таких как рациональность и эмоциональность и оценивать каждое высказывание по ним. При этом мы можем продолжать работать с отдельными сегментами — гендерными, возрастными, просто сортируя высказывания по столбцу кодов. Допустим мы можем отдельно оценить особенности эмоций и рациональных доводов, звучащих в высказываниях женщин нужного возраста, и отдельно, мужчин. Такая сегментация даёт массу хорошо структурированной информации.Параметры могут быть любыми, градации могут содержать как массу элементов, так и всего несколько.  Непосредственно ТЗ определяет необходимость использовать тот или иной набор дополнительных параметров для качественной интерпретации материала. Вариантов использования того или иного набора параметров может быть масса, думаю, это тема для отдельной статьи.

qual

Такой анализ, как Вы уже поняли занимает массу времени. Происходит это главным образом из-за необходимости заниматься ручным определением принадлежности высказывания той или иной микротеме (параметру). Этот вопрос при условии работы с относительно большим массивом текстов (от 70-100 страниц) решён в программе ЛЕКТА. Для определения тематических групп используется факторный анализ, а в качестве параметров — наиболее часто встречающиеся слова, обладающие чёткой семантикой, и их словоформы. Идентификация таких тематических блоков с возможностью их дальнейшей качественной интерпретации займёт уже не несколько дней, а у опытного пользователя ЛЕКТА 1-2 часа. Оговорюсь сразу, что наиболее удобно в программе работать именно с большим массивом текстов. При работе с малым массивом придётся заняться кодированием высказываний. Я работал с самыми разными по объёму массивами — от 25 страниц до 57 тысяч страниц. Везде своя специфика работы и, безусловно, опыт здесь играет немалую роль. Но… о Лекте поговорим в другой статье.

Что ж… Думаю основы основ проведения качественного контент-анализа я изложил, пример проведения контент-анализа привёл, а значит задачу выполнил. Если Вам было что-то непонятно — пишите в комментариях — обязательно отвечу.

Всего доброго!

Print Friendly, PDF & Email

Автор

Алексей Рюмин

Здравствуйте, уважаемый гость блога! Меня зовут Алексей Рюмин. На этом блоге мне хочется поделиться с Вами материалами о контент-анализе. Надеюсь, они окажутся полезными и интересными Вам. Приятного прочтения блога!

Пример классического контент-анализа. Часть вторая: 3 комментария

  1. Первый раз столкнулась с понятием «контент-анализа» (по необходимости), случайно нашла Ваш блог, всё изложено предельно ясно и на простом и доступном языке! Спасибо Вам!

  2. Здравствуйте!
    Где можно приобрести программу Лекта?
    Сколько стоит?

Обсуждение закрыто.