Здравствуйте, уважаемые читатели блога о контент-анализе!
Сегодня микропост — очень общий, но для начинающих может оказаться полезным. Да и в принципе — алгоритм работы проведения контент-анализа стоит любому исследователю всегда держать в голове (это перевод небольшой статьи о контент-анализе).
Сам алгоритм следующий:
Шаг 1. Определите исследовательские задачи. Контент-анализ может быть очень времязатратной процедурой, включающей в себя чтение и перечитывание больших объемов текстов (или других материалов). Понимание того, чего вы хотите достигнуть в ходе исследования, поможет вам сфокусироваться на решении именно этих — актуальных задач. Например, вы планируете сравнить объемы публикуемых материалов о нескольких кандидатах в президенты в канун выборов.
Шаг 2. Определите выборку, с которой будете проводить работу. Это тот массив материала, который вы будете читать и перечитывать, сокращать и приводить в формат более удобный для анализа в частности посредством метода категоризации. Например, это могут быть все публикации за месяц в 10 ведущих федеральных СМИ.
Шаг 3. Прочтите часть материалов входящих в вашу выборку. Перед началом качественного или количественного анализа данных важно предварительно ознакомиться с данными в общем, определить их пригодность для дальнейшего анализа. Контент-анализ не является исключением.
Шаг 4. Определите единицы анализа и систему категорий. Единицами анализа могут быть отдельные слова, предложения, абзацы, целые статьи. Например, единицами анализа могут быть специфические слова, которые в нашем примере с кандидатами отражают негативную или позитивную тональность. Безусловно, для такой работы может потребоваться специализированный словарь слов и выражений, показывающих тональность описания объекта. В данном случае категориальный аппарат представляет собой группы схожих слов и/или выражений для тональностей (или, например, для каких-либо тематик).
Шаг 5. Закодируйте тексты вашего массива, выделяя графически или иным способом слова из вашего словаря и категории, их включающие. Удобно будет использовать разные цвета для маркирования каждой из категорий. Достаточно важно сделать процесс кодирования максимально удобным для вас, так как он может показаться весьма утомительным. Лучше использовать специализированный софт для этой работы. На блоге описаны различные программы для кодирования и интерпретации контента (посмотрите в сайдбаре справа ссылки на программное обеспечение).
Как уже было сказано, возможно, вам потребуется прочитать тексты более одного раза, чтобы обнаружить всю актуальную лексику и маркировать ее. Далее нужно подсчитать встречаемость лексики из каждой категории, используемого вами категориального аппарата.
Шаг 6. Последний этап — интерпретация выявленных частотных распределений представленности категорий и отдельных кодов. Контент-анализ материалов может быть качественным и/или количественным. В зависимости от ваших задач можете прибегнуть к одному из этих подходов или к обоим сразу в рамках интерпретации результатов. На блоге они описаны достаточно подробно.
Спасибо! Успехов в проведении ваших исследований методом контент-анализа
Здравствуйте, Алексей! Меня как новичка ничего не знающего пока о кодировании интересует доступность словарей с определенными категориями, с помощью которых можно распределить по темам (общественный порядок, спорт, коррупция, здравоохранение, занятость и т.д.) большой массив материалов электронных СМИ. Есть ли такие в общем доступе? Как они отличаются между собой? Можете что-то посоветовать для моей задачи
Здравствуйте, Алексей. К сожалению, не было необходимости искать такие словари.