Контент-анализ в ЛЕКТА. Интерпретация матриц факторного анализа и написание отчёта. Часть шестая

Здравствуйте, уважаемые читатели блога о контент-анализе! Это завершающая статья цикла о контент-анализе в программе ЛЕКТА. Сейчас я расскажу вам, как работать с матрицами факторного анализа, получаемыми в ходе контент-анализа. Напомню ещё раз, что я описываю предыдущую версию программы, функционал которой несколько менее полон — в ней нет модуля факторного анализа, что немного осложняет работу. В новой версии факторизация происходит намного быстрее и удобнее.

Итак.

Структура будущей аналитической записки

Возможно, Вы уже догадались, как работать с полученными матрицами. Напомню, что матрицы представлены факторами, а факторы — это тематические блоки, каждый из которых и предстоит описать. Учитывая то, что факторы представлены наиболее часто встречающимися лексемами, мы можем предположить, что и сами факторы описывают наиболее популярные (актуальные) в изучаемом информационном пространстве тематические блоки. Давайте просто посмотрим на нашу матрицу factor loadings. (скачать её можно здесь)

Посмотрим на первый фактор (колонка F1 или столбец B  в примере). Отсортируем значения, отмеченные красным, так, чтобы вверху оказались наибольшие по модулю значения. В данном случае вверху оказываться значение 0,74 . Как мы видим, все значения отрицательны. Условно будем называть фактор отрицательным. Однако,это не значит, что фактор носит какой-либо негативный оттенок. Если бы все значения были в плюсе, фактор бы можно было классифицировать как положительный, что опять же не говорит о его позитивности. Если бы были и отрицательные и положительные значения, фактор можно было бы назвать поляризованным. Поляризованный фактор представляет не один тематический блок, а два. Положительный или отрицательный факторы отражают только один тематический блок. (строго говоря, это не так — какие-то микротемы могут «привязаться» к фактору, расширяя его тематический диапазон).

f1

Как мы видим, фактор представлен следующим набором переменных:

Минина
Пожарского
Чкалову
памятник
Площадь
Горький
горького
лестница
история
ГАЗ
завод
войны
связи

Лексемы, имеющие наибольший коэффициент играют большую роль в факторе и лучше его описывают. Лексемы, имеющие малый коэффициент, часто можно просто исключить, так как они описывают периферийные темы, а не тематические доминанты. Просто посмотрев на набор лексем мы можем сделать вывод, что первый фактор описывает достопримечательности Нижнего Новгорода, главные исторические улицы, памятники. Не всем знакомы достопримечательности Нижнего Новгорода, поэтому давайте посмотрим на любой другой фактор.

Далеко ходить не будем. Давайте взглянем на второй фактор.

f2

Снова сортируем значения. Вверху оказываются наиболее значимые переменные.

автобусы
маршрутки
транспорта
проезд
добираться
общественном
езжу
пересадками
остановки
работу
утром
пешком
такси
молодежи

Легко понять, что фактор описывает функционирование транспортной системы Нижнего Новгорода. Фактор положительный. Однако, мы видим, что в факторе присутствует одна переменная со знаком +. Это лексема молодёжь. Исключаем её — сама по себе она нас мало интересует. Лексемы представляют интерес при наличии выраженной в факторе корреляции. По одиночке рекомендую их игнорировать.


Как мы поступаем далее? Всё довольно просто. Каждому из факторов мы даём название. Например, второму можно дать название «функционирование транспортной инфраструктуры» или что-то похожее. Дав название каждому из факторов, подумаем, как можно их сгруппировать в более крупные блоки. Можно назвать их темами.В итоге получим 3-7 тем.

Тема 1

фактор a

фактор b

фактор c

Тема 2

фактор  d

фактор  e

фактор  f

Тема 3

фактор  g

фактор  h

фактор  i

Каждой из тем также даём название. Поясню на всякий случай — факторы группируются исходя из тематичности, а не их порядковых номеров. То есть мы просто находим более общие темы и интегрируем факторы в крупные блоки.

Сама эта структура может стать основой аналитической записки. Тема = глава. Фактор = параграф. Факторы, разумеется, в случае их схожести также можно объединять между собой.

Аналитическая записка по результатам контент-анализа

Что же мы делаем дальше… Набор тематических групп, представляющих наибольшую популярность в информационном пространстве, выраженном массивом текстов, нас, безусловно, интересует. Однако он даёт сравнительно мало информации. Эта информация сугубо количественна. Мы же планируем перейти к качественному этапу интерпретации текстов.

Допустим, мы продолжаем работу со вторым фактором, описывающим транспортную действительность Нижнего Новгорода. Открываем текстовый редактор, например, MS Word. Вставляем туда группу лексем второго фактора.

автобусы
маршрутки
транспорта
проезд
добираться
общественном
езжу
пересадками
остановки
работу
утром
пешком
такси

f2lexemsword

В голове держим мысль о том, что фактор отрицательный. Открываем вторую матрицу — Factor Scores — находим столбец F2, сортируем значения так, чтобы вверху оказались отрицательные значения, то есть по возрастанию.Опускаемся вниз до значений по модулю в столбце не менее 1.

f2scores

Напомню — последний столбец этой матрицы — фрагменты текстов. Соответственно при сортировке и его содержимое также отсортировалось. Чтобы было понятнее, скажу по-проще: нас интересует сильно нагруженные темой транспорта фрагменты текстов. В них будут часто встречаться вместе лексемы, представляющие фактор — то есть те лексемы, которые содержатся в первой матрице. Фрагменты текстов, имеющие коэффициент менее 1 будут содержать мало этих слов, соответственно разговор в них будет идти уже на смежные или иные темы. Нам же при работе с анализом фактора о транспорте, имеет смысл анализировать текстовые фрагменты только о транспорте — ничего лишнего нам не нужно. Итак, двигаемся в конец второй матрицы и копируем тексты, имеющие коэффициент как минимум 1. Чтобы было понятнее, я скрою почти все столбцы, оставив последний и несколько столбцов факторов.

fragmentscopyВ общем, копируем все текстовые фрагменты до самого верха. Вставляем их в текстовый редактор ниже фрагментов текстов.

Теперь нам надо отметить лексемы фактора в тексте и желательно разными цветами. Соответственно через функцию поиск (Ctrl F) раскрашиваем лексемы, а точнее их основные части без окончаний, так как наши лексемы, как Вы помните — фильтры, включающие в себя наборы словоформ.

wordswordНу, дальше всё просто. Дальше идёт качественная интерпретация — описываем, как конкретно преподносится каждый из тематических блоков, отвечая на вопросы КАК, ПОЧЕМУ, ЗАЧЕМ и т.д. Оцениваем тексты по заданному набору параметров — оцениваем мотивации, эмоции и что угодно. Можем сгруппировать тексты с точки зрения оценки прдмета обсуждения фактора — например, закрасив положительные высказывания жёлтым, нейтральные серым, негативные красным. Далее их можно сгруппировать, перетащив в единые блоки и работать с ними по очереди, также определив, какие оценки доминируют в пространстве фактора, подсчитав соотношение оценок.  Интерпретация качественного характера уже была описана на блоге. Если не хотите сильно заморачиваться — просто обобщайте материал каждого из факторов, передавайте в записке основные мысли, эмоциональные особенности их преподнесения, оценки обсуждаемого предмета авторами текстов, пигите выводы в конце параграфа.

На этом про ЛЕКТА всё. Кстати, если уж речь идёт о качественной интерпретации, то хочу отметить — следующих цикл статей будет о программе ATLAS.TI — мощном инструменте качественного контент-анализа. Соответственно обе программы можно использовать вместе на разных этапах для получения более качественного результата.

Спасибо!

Print Friendly, PDF & Email

Автор

Алексей Рюмин

Здравствуйте, уважаемый гость блога! Меня зовут Алексей Рюмин. На этом блоге мне хочется поделиться с Вами материалами о контент-анализе. Надеюсь, они окажутся полезными и интересными Вам. Приятного прочтения блога!

Контент-анализ в ЛЕКТА. Интерпретация матриц факторного анализа и написание отчёта. Часть шестая: 2 комментария

  1. Алексей, спасибо за сайт.

    Скажите, а как получить доступ к Лекте? На сайте НИСОЦ (разработчики?) нет никакой информации о доступе, цене и т.д., только руководство пользователя.

  2. Добрый день, Сергей.
    НИСОЦ — действительно разработчик ЛЕКТА.
    Я Вам на почту отправил e-mail руководителя НИСОЦ — с ним можете обсудить вопросы приобретения ЛЕКТА

Обсуждение закрыто.