Здравствуйте, уважаемые читатели блога о контент-анализе!
Сегодня пост — обзор программы для контент-анализа CONCORDANCE. Программка довольно известная. Ознакомиться с ней на английском языке можно на официальном сайте ТУТ. Полнофункциональная демо версия программы предоставляется бесплатно на 30 дней.
Этот обзор будет неполным — опишу только то, что счёл наиболее актуальным для работы по проведению контент-анализа. Если видите еще какие-то интересные варианты ее применения — пожалуйста, напишите в комментариях под постом.
Итак, ключевой функционал программы заключается в поиске контекстов употребления слов, заданных вами или выбранных вами из наиболее частотных.
НО. В первую очередь про установку. У меня на Windows 8 Concordance устанавливается с ошибкой. Программа запускается, но работать невозможно. Поэтому, если вы столкнулись с предупреждающими об ошибке окнами, появляющимися после каждого вашего действия в программе, выйдите из нее, далее нажмите на ярлык правой кнопкой мыши, выберите опцию «исправление проблем с совместимостью», дальше, когда проблема будет устранена, сохраните результат устранения проблемы. Точных названий опций не помню, но в общем, всё будет очень интуитивно-понятно. Это я написал к тому, чтобы сразу после появления ошибок вы не спешили удалять concordence с компьютера.
Так вот. Программка с загруженными текстами выглядит вот так:
Берем абсолютно рандомный текст, найденный в соцмедиа. Называется «психология бедности». Загружаем его в программу Concordance, предварительно сохранив файлик в TXT. Для этого идем в меню File/make full concordance/From files
Дальше выбираем опцию ADD FILES и ищем наши файлы. Потом нажимаем Make Full Concordance:
И снова видим то, что есть на первом скриншоте в этом посте.
Но пока посмотрим на последний скрин выше — мы видим кнопочку EDIT STOP LIST. Неожиданно — это редактор стоп-листа, куда входят слова, которые вы не хотите видеть в результатах работы Concordence. Например, вы не хотите видеть все контексты использования предлогов, союзов, междометий и пр. В общем это обычный стоп лист. Откроем его, нажав на эту кнопочку, и увидим следующее:
Как мы видим, список стоп-слов на английском… Чего и следовало ожидать от программы для англоязычных пользователей, обрабатывающих тексты на английском языке. В списке есть несколько слов на русском языке, которые добавил я. После добавления нажимаем FILE/SAVE, ну, или FILE/SAVE AS, если хотите сделать отдельный файл с отдельным списком стоп слов.
После этого снова можно нажать MAKE FULL CONCORDANCE и в частнотном распределении слов в левой части экрана мы уже не увидим частот добавленных нами стоп слов. Например, союза И. На первом скрине поста видно, что частота И представлена. Ниже, после добавления стоп слов — ее уже нет:
Чтобы отсортировать слова по частоте, надо нажать на название столбца, что в общем можно было и не уточнять 🙂
Увы, как и в другом софте для английского языка, словоформы слов русского языка не учитываются… То есть, например, вы можете увидеть, что слово «бедности» встречается 13 раз, а «бедность» 8 и т.д. В принципе, это не беда. Для английского языка в программе есть механизм лемматизации — для русского он, естественно, неактуален. Поскольку текст у нас на русском — функционал лемматизации не смотрел.
Так вот. Чтобы прочитать все контексты, в которых используются слова, отображаемые с их частотой в левой части окна программы, надо нажать на слово — справа появятся контексты их использования:
Чтобы увидеть весь текст, в котором используется слово, можно нажать на строку, в которой произведен поиск контекстов — то есть на актуальную строку в правой части экрана программы (нажал на самую первую, она выделилась серым цветом):
Собственно это и есть наиболее важный функционал Concordance.
Так мы можем провести качественный контент-анализ в самом распространенном его варианте — поиске тематик в тексте/массиве текстов. Ну и проинтерпретировать это тем или иным образом, визуализировать связи между структурой тематик и пр. Например, в каком-то таком формате можно это сделать:
Еще немного про функционал Concordance.
Можно задавать актуальные для вас слова либо правила встречаемости слов и делать конкорданс только по этим словам.
Для этого идем в меню FILE/MAKE SELECTIVE CONCORDANCE/FROM FILES.
Слева внизу видим различные варианты поиска контекстов. Рассмотрим первый «PICK LIST». Нажав Edit, можем ввести список актуальных слов (можем использовать * и ? для более быстрого поиска). Вводим слова и сохраняем список (FILE/SAVE)
Далее нажимаем MAKE SELECTIVE CONCORDANCE. Получаем возможность смотреть контексты использования слов из нашего списка:
В предыдущем меню есть опция поиска фраз (не только слов из списка). Опция phrases:
Снова нажимаем MAKE SELECTIVE CONCORDANCE:
Еще вариант поиска контекстов с заданием максимального расстояния между операндами. Зададим расстояние между словами страх* и психолог* максимум в 3 слова:
Остальные опции поиска контекстов, типа поиска, начиная не с первого, а с n-го слова и заканчивая m-ным, или заданного количества слов в рандомной части текста, мне особо не приглянулись. Это делает опция SAMPLES. Регулярные выражения (опция REGEX) тоже не будем рассматривать.
Ну и еще… Можно посмотреть частотное распределение слов, находящихся на определенном расстоянии «слева» и «справа» от выбранного слова. Кликаем правой кнопкой мыши по слову и выбираем опцию COLLOCATIONS:
То есть, например, видим, что слово «бедности» 8 раз встречается справа от слова Психологией. Полагаю, что эта функция актуальна только при работе с большим массивом текстов и с использованием механизма лемматизации.
Вот такая программка 🙂 Больше ничего интересного в ней не обнаружил, но дополнительных опций в общем немало.
Всего хорошего!
Очень понятный и хорошо продуманный блог! Я учусь на втором курсе института, нам надо было провести анализ текстов в этой программе и благодаря Вашему блогу я смогла быстро разобраться, что и как делать в данной программе. Спасибо за помощь:)
Рад был помочь, Екатерина 🙂
ochen vse xorosho i ponjatno napisno, y menja tolko odin vopros v kakoi kodifikazii vu soxranjaete text, a to y menja abrakadabra pojavljaeetsja.
ja probovala i Unicode UTF8 i Cirilico windows, no ni odin ne podxodit
Ольга, добрый день! К сожалению, уже не вспомню, какая кодировка была у файлов.
Попробуйте альтернативную прграммку для конкорданса — http://content-analysis.ru/index.php/soft/sdelal-programmku-dlya-konkordansa-konkordans-menedzher-1-0/