Здравствуйте, уважаемые читатели блога о контент-анализе!
Сегодня вспомнил, что не так давно проводил пилотный замер для начального погружения в тему и для тестирования DEDOOSE. Пилотный замер проведен, увы, дальше пилотного замера дело не пошло по причине прекращения общения с заинтересованным человеком. Но вот данные сохранились кой какие, и я решил их опубликовать очень кратко.
В очередной раз ступил и не сохранил исходные данные и файлы экспорта кодов, мемо, корпуса, цитат да и всего остального рабочего материала. Дело в том, что я хочу создать базу данных, в которой будут храниться все материалы исследований, которые я провел (ну или не только я). Формат БД пока не определил (как и формат многого другого задуманного для этого блога…). Потому что ленюсь, что абсолютно непростительно! Это не оправдание.
Авось, какие-то материалы всё ж найду и выложу-таки. Но не хочется формировать просто облако на дропбоксе или аналогах. Хочется вокруг облака что-то еще…
Кароче. Результаты пилотного замера по теме коррупции в полиции России.
Сразу говорю — я не демонстрирую своей позиции в отношении полиции России, а лишь транслирую чужое мнение, взятое с твиттера и обобщенное с помощью контент-анализа. Мое отношение, наверное, нейтральное. Голова забита другим 🙂
Замер был такой (еще раз подчеркиваю — замер пилотный, а также незавершенный, формат описания — получерновой):
Описание замера: в августе 2014 года с площадки микроблоггинга twitter.com был скачен массив твитов о коррупции в российской полиции на русском и английском языках.
Выборка: 699 твитов на русском языке за 25-30 августа 2014 года и английском языке (за более долгий период)
Был создан следующий категориальный аппарат:
Объект: Полиция / Полицейский
Согласие получения взятки: Согласился / Отказал / Результат неизвестен / Не берут взяток в принципе
Роль объекта в твите: Активная роль / Пассивная роль / Роль неизвестна
Тональность в отношении объекта: Негативный тон / Нейтральный тон / Позитивный тон
Цель сообщения: Призыв/мотивирование / Информирование
Сбор: Сбор был произведен на twitter.com вручную с помощью запросов:
Полиция OR полиции OR полицией OR полицию OR полицейский OR полицейского OR полицейскому OR полицейским OR полицейские OR полицейским OR полицейских OR полицейскими взятка OR взятки OR взятку OR взятке OR взяткой OR взятками OR взяток OR взятках OR коррупция OR коррупции OR коррупцию OR коррупцией OR коррупционер OR коррупционера OR коррупционеру OR коррупционером OR коррупционный
И
Russian OR Russian Police OR policeman OR policemen bribes OR bribe
(Russian OR Russian OR Moscow OR Petersburg) (Police OR policeman OR policemen) (bribes OR bribe)
Программное обеспечение:
Для кодирования и анализа была использована программа для качественного анализа и mixed-methods — Dedoose
РЕЗУЛЬТАТЫ:
СРАВНЕНИЕ МЕЖДУ ЯЗЫКОВЫМИ ГРУППАМИ:
Предварительно стоит представить распределение кодов без учета их языка. Можно визуализировать распределение в виде облака кодов:
Ниже таблица представленности кодов для языков твитов (без нормализации значений):
Полиция | Полицейский | Согласился | Отказал | Реультат неизвестен | Не берут взяток в принципе | |
rus | 7 | 365 | 162 | 45 | 161 | 4 |
eng | 27 | 159 | 106 | 55 | 19 | 8 |
Активная роль | Пассивная роль | Роль неизвестна | Негативный тон | Нейтральный тон | Позитивный тон | |
rus | 14 | 235 | 120 | 18 | 351 | 3 |
eng | 68 | 85 | 35 | 7 | 176 | 5 |
Позитивный тон | Призыв/ мотивирование |
Информирование | |
rus | 3 | 5 | 362 |
eng | 5 | 4 | 184 |
Обсуждая проблему коррупции в правоохранительных органах России о полиции в целом говорят главным образом англоязычные пользователи твиттера, а о сотрудниках полиции – русскоязычные пользователи.
При этом полиция в целом, как объект, упоминается реже, чем сотрудники полиции на обоих языках. На рисунке ниже показано распределение упоминания объектов внутри языковых выборок:
Англоязычные пользователи твиттера заметно чаще русскоязычных говорят об отказе сотрудника полиции принять взятку. При этом неизвестный результат (в твите не говорится о согласии или отказе принять взятку) чаще звучит в русскоязычных твитах. О согласии в равной степени говорят и на русском и на английском языках.
Об активной роли, выраженной вербально, российского полицейского, уличенного в коррупции (не ему дали взятку, а он сам взял ее, потребовал) в большей мере говорится в англоязычных твитах. В русскоязычном массиве твитов в данном контексте полицейский обычно пассивен. Однако, это может быть обусловлено особенностями языка. Неизвестна роль полицейского чаще всего в русскоязычных твитах.
Критика сотрудников полиции, а также нейтральная оценка в данном контексте более характерна для русскоязычных твитов. При этом более позитивно полицейский оценивается англоязычной аудиторией.
Англоязычная аудитория в несколько большей степени склонна не просто информировать, а призывать к каким-либо действиям в отношении актуальной проблемы. Русскоязычная – просто информировать. Доля «призывов» во всём массиве текстов невелика, следовательно, эти данные требуют верификации.
[А вот еще недоделанная майнд карта по замеру:]
Делаю выводы: так писать нельзя. Абсолютно неинтересно пишу, а на момент написания даже не предпринимал никаких шагов, чтобы улучшить читабельность своих текстов. Теперь чуть-чуть стал работать над вопросами копирайтинга, но, пожалуй, топчусь на месте, а не двигаюсь вперед.
Еще важный момент — замеры надо завершать. Этот завершен не был по некоторым причинам, но эти причины не оправдывают меня.
Есть также сомнения по поводу того, корректно ли был произведен количественный анализ. Вдумываться сейчас уже не хочу… Кстати, до качественной составляющей руки так и не дошли — всё завершилось на майнд карте… А ведь там столько всего интересного…
Утеряны экспорты таблиц с кодами, мемо и пр. Это недопустимо — теперь уже не проверить результаты, не использовать материалы повторно… Ничего уже не сделать. Сохранились только исходные тексты — таблицы с твитами. Посему я решил, что все рабочие файлы уже пора хранить в единой базе данных. На странице БД кое какие задумки, появившиеся давно, описаны. Но ничего не сделано. Поэтому пусть пока что будет банальный дропбокс, в котором буду хранить материалы замеров. И думать, как сделать БД лучше, удобнее, а может для кого-то — и полезнее.
В общем пока что делаю базу на этом облаке и загружаю файлы по этому замеру (а потом и по другим) в открытый доступ на страницу блога БД. Если у вас есть какие-то предложения по хранению данных замеров — буду рад их прочитать — пожалуйста, напишите их в форме ниже. Спасибо
Бай!
Цифры прозвучали на встрече Путина с учителями, когда президент вытянул из педагога сведения о его зарплате. 26, тысяч рублей. Путин не поверил и даже немного обиделся.Это лучший, а просто прапорщик на должности старшины управления южного округа получает тогда сколько если квартиры и машины покупает по несколько миллионов за год, сколько тогда генералитет получает?