Здравствуйте, уважаемые читатели блога о контент-анализе!
Сегодня решил, что пора начать небольшую серию статей про контент-анализ газет, журналов и других текстовых СМИ (ну или печатных, хотя с печатными лучше не путать — сейчас актуальнее работать с электронными СМИ, печатные никто уж не читает почти…)
Поступить решил банальнейшим образом — снова перевести иностранную публикацию по теме. Не всю. Всю лень, да и ни к чему 🙂 Пропущу вступления, приложения и всё остальное лирическое или неактуальное. Итак — публикация носит название «Analysing newspaper content. A how to guide». Авторы Stacy Lynch и Limor Peer. У второго и докторская имеется 🙂 Опубликовано в 2002 году… Это довольно теоретический материал — но, в общем, норм. Язык перевода почти как из под гугл переводчика. Не пугайтесь, я и не писатель 🙂
Итак ПЕРЕВОД: поехали!!!
[ладно… переведу микро введение]
Введение: зачем замерять контент?
Эта инструкция предназначена для тех, кто поставил себе цель объективно проанализировать новости или другую информацию, публикуемую в СМИ, узнать какова она, и в каких объёмах и пропорциях появляется.
Работа актуальна далеко не только в академическом плане, но и при решении бизнес задач. Это хороший способ узнать, что «по данной теме мы публикуем слишком много», а «по этой явно недостаточно». Это отличный способ сравнить свою газету или журнал с изданиями конкурентов.
Контент-анализ СМИ поможет лучше проанализировать распределение ресурсов.
В рамках одного из замеров Readership Institute провёл беспрецедентный по объёму выборки замер — контент-анализ 100 газет, 47000 публикаций на 700 различных тем. Работа над исследованием позволила верифицировать адекватность методик, описанных в данном руководстве.
Контент-анализ не предполагает кропотливой работы по тщательному изучению каждой из единиц анализа (например, заголовка/целой статьи) на протяжении длительного периода времени. Если вы будете следовать указаниям этого руководства, вы легко получите адекватные и валидные данные для принятия взвешенных решений.
Часть первая. Приступая к работе над контент-анализом СМИ
Оценка временных затрат
Независимо от того, что сама методика проведения контент-анализа не является сложной и заумной, вы должны быть готовы уделить достаточно много времени исследованию и найти людей, способных на протяжении этого времени прилежно выполнять достаточно однообразные действия.
Всем процессом проведения контент-анализа от его продумывания до завершения замера должен заниматься ответственный человек. Руководитель проекта должен максимально ответственно относиться к качеству данных, а также быть очень скрупулёзным исследователем. Самая главная задача руководителя проекта организовать процесс так, чтобы каждый из исследователей обрабатывал данный одинаковым образом, следуя единым правилам и стандартам. В этой работе руководитель проекта должен взять на себя функции контролера, так как даже понимание всех требований участниками проекта не гарантирует их выполнения, при отсутствии надлежащего контроля работы.
Мы рекомендуем собирать команду из 5-10 человек (в зависимости от величины газеты) под руководством руководителя проекта. Контент-анализ — это методика, владение которой совершенствуется только с опытом, поэтому было бы неплохо собрать команду из уже опытных специалистов в области контент-анализа. Чем больше текучка специалистов в рамках одного и того же проекта, тем выше риск получить в итоге не соответствующие реальности результаты. При этом хорошими кодировщиками, интерпретаторами могут быть и студенты, и люди, никак не связанные со СМИ. Не стоит себя ограничивать в данном случае в выборе кадров.
Время, которое необходимо будет затратить на контент-анализ газет зависит от их размера. Чем больше новостей, статей, рекламных материалов опубликовано в газете, тем дольше будет идти анализ. Скорость кодирования увеличивается с получением опыта работы над замером. Другими словами, если кто-то может уделить 10 часов кодированию, оно пройдёт быстрее, чем если бы 2 кодировщика работали по 5 часов.
Прежде всего просто подготовьте сам массив газет — на это может уйти 2-3 часа, и эта работа может показаться даже излишней. Однако, она необходима. Анализ текстовых публикаций в СМИ требует более всего времени. Нормальная скорость кодирования материала — 15 статей за 45 минут без перерыва. Профессиональный кодировщик способен работать быстрее и кодировать по одной статье в минуту, при условии достаточного времени уже потраченного на данный проект.
Анализ оглавления, рекламных материалов, общей структуры газеты требует около 2-3 часов на издание.
Также, потребуется уделить время на первоначальную подготовку кодировщиков. Мы рекомендуем потратить на эту работу около 3 часов. Это, пожалуй, наиболее ценное и ответственное время за весь проект. Дальше мы расскажем, как правильно готовить кодировщиков.
Безусловно, немало времени надо потратить и на общую организацию процесса. Этим, как уже ранее говорилось, должен заниматься руководитель проекта.
В зависимости от степени необходимой точности замера, время, уделяемое на составление таблиц контент-анализа, кодирование и анализ, может сильно варьироваться. Общий анализ может быть реализован приблизительно за 10 часов. При этом проект может длиться и сотни часов, в случае необходимости тщательной детализации анализа.
Постановка целей и введение категорий и параметров
Постановка целей
Прежде чем начать замер, четко определите цели исследования. Что конкретно вы хотите получить в результате вашей работы? Есть ли элементы информационного пространства, на которых вы хотели бы в первую очередь сконцентрировать ваше внимание? Насколько детализированную информацию вы хотите получить? Вас интересуют средние показатели за неделю, или вы хотели бы получить детализированные результаты за конкретный день недели? Вы хотели бы получить аналитику по конкретной теме или по всему разбросу тем в выборке источников? Ответы на эти вопросы в частности будут определять величину выборки, с которой вам предстоит работать.
Следуя инструкциям в этой серии статей вы сможете определить, насколько актуальны материалы, публикуемые вами, по сравнению с материалами других изданий. Данные материалы помогут вам «измерить» информационное пространство в рамках следующих параметров:
- Тематики публикаций
- Географические характеристики контента
- Жанры, стили
- Источники и формат контента
- Визуальные характеристики
- Разнообразие контента
- Структура газеты (журнала и пр.)
- Особенности продвижения
- Перечни материалов (оглавления и пр.)
В комплексе ответы на эти вопросы дадут вам информацию о том, насколько активно обсуждается та или иная тема в местных изданиях в сравнении с национальными изданиями, дадут сведения об особенностях размещения визуального контента в изданиях, сводную информацию об источниках публикаций и пр. Вы получите массу полезной информации, анализируя контент так, как описано в данной статье. Если вам потребуется больше информации, вы всегда можете расширить спектр вопросов, выйдя за пределы параметров, описанных в статье. О том, как конкретно создать композицию актуальных для замера вопросов будет описано дальше.
Введение параметров анализа
Если цели вашего исследования отличаются от связанных с приведенными выше вопросами, то вы можете расширить спектр вопросов. Вы можете акцентировать внимание на исследовании контента местных СМИ, полностью или частично игнорируя материалы федеральных или международных СМИ. Возможно, актуальная для вас тема заявляется только в местных СМИ. Любые вариации вопросов и площадок возможны.
Прежде чем приступить к исследованию, очень тщательно продумайте, какие СМИ войдут в выборку. Лучше всего применять методики контент-анализа, фокусируясь лишь на нескольких ключевых аспектах, источниках и т.д. Также учтите, что создание списка вопросов для анализа может явиться весьма трудоемкой задачей. Убедитесь, что цель замера максимальна конкретна, вопросы связаны с ней и только с ней. Цель должна быть настолько понятна и проста, что можно объяснить ее в одном предложении. Если сделать этого не представляется возможным, вероятно, вы пошли по ложному пути.
Обязательно надо помнить о том, что интересующие вас параметры должны быть объективно измеримы. В информационном поле может присутствовать множество интересных параметров, работа с которыми может склонить исследователя к весьма субъективным выводам, что недопустимо. Зачастую проблема может заключаться в неверно составленной кодировальной матрице. Хорошим примером является кодирование позитива и негатива. Несмотря на кажущуюся простоту категории, определение позитива и негатива может быть очень сильно детализировано, а детализация может быть весьма «необычной», что может затруднить работу кодировщиков и увеличить стоимость и продолжительность работы.
Также изначально очень важно определить, является ли кодируемый контент видимым или латентным. Видимый контент реально проявляется в тексте — например, вы хотите подсчитать сколько раз встречается то или иное слово в тексте, может быть, чьи-то фамилии. Латентный контент не подразумевает присутствие таких очевидных индикаторов. Его кодирование является более трудоемким процессом, а присутствие категории идентифицируется только при внимательном анализе материала — невозможно, например, автоматизированно закодировать контент, пользуясь простым поиском слов по документу. Латентным контентом может являться, например, стиль изложения — в ходе контент-анализа вы идентифицируете стиль написания документа или стиль изображения, жанр музыки и пр. Если вам необходимо, является ли стиль изложения «живым» (неформализованным), то трудно предположить, какие конкретно слова должны войти в словарь контент-анализа (какие слова вы будете искать в тексте). В целом, чаще всего, латентный контент намного труднее идентифицировать, нежели видимый. При работе с латентным контентом всегда стоит производить проверку полученных результатов.
Намного более трудоемкой задачей является создание категориального аппарата. Этому вопросу посвящено множество книг, [не на русском, увы. В оригинале статьи в приложении D можете посмотреть список] но здесь будет приведено всего несколько ключевых правил создания категориального аппарата:
- Категории должны быть взаимоисключающими. Убедитесь в том, что категории не связаны межу собой, не «пересекаются»
- Внутри категорий значения должны быть «равнозначными» и однозначно определяемыми. Например, в определении географии работы газеты не должно быть ряда значений вроде «национальная» (газета), «местная», «скорее местная». Кодировщики не поймут, как работать со значением «скорее местная» (газета).
- Ваш категориальный аппарат должен включать в себя категории для всех возможных случаев, иначе кодировщики будут вынуждены кодировать контент неверными кодами в силу нехватки корректных.
- Создавайте категории только для контента, встречающегося часто. Не надо сразу же создавать новую категорию при появлении, например, новой еженедельной колонки в газете. Ваша цель заключается в кодировании 95% материалов газеты (или другого контента) с помощью имеющегося категориального аппарата. Всегда будет появляться трудноклассифицируемый контент. Для этих 5% нестандартного контента можете создать категорию «другое».
Всегда стоит соблюдать баланс — категорий должно быть минимум, но и не слишком мало, чтобы не включать в категории нерелевантный им контент. Просто дайте прочитать материал 10 людям и закодировать его самостоятельно. Как минимум 75% закодированного материала должно совпадать. Если различия в результатах кодирования выше, вам стоит откорректировать категориальный аппарат — уменьшить количество категорий или напротив — операционализировать имеющиеся. Проверить, взаимоисключаемые ли категории включены в аппарат. Также возможно вы ставите перед собой некорректную задачу — поставленная вами цель в принципе не решается с помощью контент-анализа, и это является причиной неудач в кодировании материалов.
Продолжение в следующих статьях!
Бай 🙂
Обсуждение закрыто.