Коррупция в российской полиции. Контент-анализ твитов на русском и английском языках

Здравствуйте, уважаемые читатели блога о контент-анализе!

Сегодня вспомнил, что не так давно проводил пилотный замер для начального погружения в тему и для тестирования DEDOOSE. Пилотный замер проведен, увы, дальше пилотного замера дело не пошло по причине прекращения общения с заинтересованным человеком. Но вот данные сохранились кой какие, и я решил их опубликовать очень кратко.

В очередной раз ступил и не сохранил исходные данные и файлы экспорта кодов, мемо, корпуса, цитат да и всего остального рабочего материала. Дело в том, что я хочу создать базу данных, в которой будут храниться все материалы исследований, которые я провел (ну или не только я). Формат БД пока не определил (как и формат многого другого задуманного для этого блога…). Потому что ленюсь, что абсолютно непростительно! Это не оправдание.

bribessss

Авось, какие-то материалы всё ж найду и выложу-таки. Но не хочется формировать просто облако на дропбоксе или аналогах. Хочется вокруг облака что-то еще…

Кароче. Результаты пилотного замера по теме коррупции в полиции России.

Сразу говорю — я не демонстрирую своей позиции в отношении полиции России, а лишь транслирую чужое мнение, взятое с твиттера и обобщенное с помощью контент-анализа. Мое отношение, наверное, нейтральное. Голова забита другим 🙂

Замер был такой (еще раз подчеркиваю — замер пилотный, а также незавершенный, формат описания — получерновой):

 

Описание замера: в августе 2014 года с площадки микроблоггинга twitter.com был скачен массив твитов о коррупции в российской полиции на русском и английском языках.

Выборка: 699 твитов на русском языке за 25-30 августа 2014 года и английском языке (за более долгий период)

Был создан следующий категориальный аппарат:

Объект: Полиция / Полицейский

Согласие получения взятки: Согласился / Отказал / Результат неизвестен / Не берут взяток в принципе

Роль объекта в твите: Активная роль / Пассивная роль / Роль неизвестна

Тональность в отношении объекта: Негативный тон / Нейтральный тон / Позитивный тон

Цель сообщения: Призыв/мотивирование / Информирование

 

Сбор: Сбор был произведен на twitter.com вручную с помощью запросов:

Полиция OR полиции OR полицией OR полицию OR полицейский OR полицейского OR полицейскому OR полицейским OR полицейские OR полицейским OR полицейских OR полицейскими взятка OR взятки OR взятку OR взятке OR взяткой OR взятками OR взяток OR взятках OR коррупция OR коррупции OR коррупцию OR коррупцией OR коррупционер OR коррупционера OR коррупционеру OR коррупционером OR коррупционный

И

Russian OR Russian Police OR policeman OR policemen bribes OR bribe

(Russian OR Russian OR Moscow OR Petersburg) (Police OR policeman OR policemen) (bribes OR bribe)

 

Программное обеспечение:

Для кодирования и анализа была использована программа для качественного анализа и mixed-methods — Dedoose

 

РЕЗУЛЬТАТЫ:

СРАВНЕНИЕ МЕЖДУ ЯЗЫКОВЫМИ ГРУППАМИ:

Предварительно стоит представить распределение кодов без учета их языка. Можно визуализировать распределение в виде облака кодов:

bribes1

Ниже таблица представленности кодов для языков твитов (без нормализации значений):

Полиция Полицейский Согласился Отказал Реультат неизвестен Не берут взяток в принципе
rus 7 365 162 45 161 4
eng 27 159 106 55 19 8

 

Активная роль Пассивная роль Роль неизвестна Негативный тон Нейтральный тон Позитивный тон
rus 14 235 120 18 351 3
eng 68 85 35 7 176 5

 

Позитивный тон Призыв/
мотивирование
Информирование
rus 3 5 362
eng 5 4 184

Обсуждая проблему коррупции в правоохранительных органах России о полиции в целом говорят главным образом англоязычные пользователи твиттера, а о сотрудниках полиции – русскоязычные пользователи.

bribes2

При этом полиция в целом, как объект, упоминается реже, чем сотрудники полиции на обоих языках. На рисунке ниже показано распределение упоминания объектов внутри языковых выборок:

bribes3

Англоязычные пользователи твиттера заметно чаще русскоязычных говорят об отказе сотрудника полиции принять взятку. При этом неизвестный результат (в твите не говорится о согласии или отказе принять взятку) чаще звучит в русскоязычных твитах. О согласии в равной степени говорят и на русском и на английском языках.

bribes4

Об активной роли, выраженной вербально, российского полицейского, уличенного в коррупции (не ему дали взятку, а он сам взял ее, потребовал) в большей мере говорится в англоязычных твитах. В русскоязычном массиве твитов в данном контексте полицейский обычно пассивен. Однако, это может быть обусловлено особенностями языка. Неизвестна роль полицейского чаще всего в русскоязычных твитах.

bribes5

Критика сотрудников полиции, а также нейтральная оценка в данном контексте более характерна для русскоязычных твитов. При этом более позитивно полицейский оценивается англоязычной аудиторией.

bribes6

Англоязычная аудитория в несколько большей степени склонна не просто информировать, а призывать к каким-либо действиям в отношении актуальной проблемы. Русскоязычная – просто информировать. Доля «призывов» во всём массиве текстов невелика, следовательно, эти данные требуют верификации.

bribes7[А вот еще недоделанная майнд карта по замеру:]

bribesДелаю выводы: так писать нельзя. Абсолютно неинтересно пишу, а на момент написания даже не предпринимал никаких шагов, чтобы улучшить читабельность своих текстов. Теперь чуть-чуть стал работать над вопросами копирайтинга, но, пожалуй, топчусь на месте, а не двигаюсь вперед.

Еще важный момент — замеры надо завершать. Этот завершен не был по некоторым причинам, но эти причины не оправдывают меня.

Есть также сомнения по поводу того, корректно ли был произведен количественный анализ. Вдумываться сейчас уже не хочу… Кстати, до качественной составляющей руки так и не дошли — всё завершилось на майнд карте… А ведь там столько всего интересного…

Утеряны экспорты таблиц с кодами, мемо и пр. Это недопустимо — теперь уже не проверить результаты, не использовать материалы повторно… Ничего уже не сделать. Сохранились только исходные тексты — таблицы с твитами. Посему я решил, что все рабочие файлы уже пора хранить в единой базе данных. На странице БД кое какие задумки, появившиеся давно, описаны. Но ничего не сделано. Поэтому пусть пока что будет банальный дропбокс, в котором буду хранить материалы замеров. И думать, как сделать БД лучше, удобнее, а может для кого-то — и полезнее.

В общем пока что делаю базу на этом облаке и загружаю файлы по этому замеру (а потом и по другим) в открытый доступ на страницу блога БД. Если у вас есть какие-то предложения по хранению данных замеров — буду рад их прочитать — пожалуйста, напишите их в форме ниже. Спасибо

Бай!

Print Friendly, PDF & Email

Автор

Алексей Рюмин

Здравствуйте, уважаемый гость блога! Меня зовут Алексей Рюмин. На этом блоге мне хочется поделиться с Вами материалами о контент-анализе. Надеюсь, они окажутся полезными и интересными Вам. Приятного прочтения блога!

Один комментарий к “Коррупция в российской полиции. Контент-анализ твитов на русском и английском языках”

  1. Цифры прозвучали на встрече Путина с учителями, когда президент вытянул из педагога сведения о его зарплате. 26, тысяч рублей. Путин не поверил и даже немного обиделся.Это лучший, а просто прапорщик на должности старшины управления южного округа получает тогда сколько если квартиры и машины покупает по несколько миллионов за год, сколько тогда генералитет получает?

Обсуждение закрыто.