Concordance — программа для конкорданс :-) Поиск контекстов актуальной лексики

Здравствуйте, уважаемые читатели блога о контент-анализе!

Сегодня пост — обзор программы для контент-анализа CONCORDANCE. Программка довольно известная. Ознакомиться с ней на английском языке можно на официальном сайте ТУТ. Полнофункциональная демо версия программы предоставляется бесплатно на 30 дней.

conc19

Этот обзор будет неполным — опишу только то, что счёл наиболее актуальным для работы по проведению контент-анализа. Если видите еще какие-то интересные варианты ее применения — пожалуйста, напишите в комментариях под постом.

Итак, ключевой функционал программы заключается в поиске контекстов употребления слов, заданных вами или выбранных вами из наиболее частотных.

НО. В первую очередь про установку. У меня на Windows 8 Concordance устанавливается с ошибкой. Программа запускается, но работать невозможно. Поэтому, если вы столкнулись с предупреждающими об ошибке окнами, появляющимися после каждого вашего действия в программе, выйдите из нее, далее нажмите на ярлык правой кнопкой мыши, выберите опцию «исправление проблем с совместимостью», дальше, когда проблема будет устранена, сохраните результат устранения проблемы. Точных названий опций не помню, но в общем, всё будет очень интуитивно-понятно. Это я написал к тому, чтобы сразу после появления ошибок вы не спешили удалять concordence с компьютера.

Так вот. Программка с загруженными текстами выглядит вот так:

conc1

Берем абсолютно рандомный текст, найденный в соцмедиа. Называется «психология бедности». Загружаем его в программу Concordance, предварительно сохранив файлик в TXT. Для этого идем в меню File/make full concordance/From files

conc2

Дальше выбираем опцию ADD FILES и ищем наши файлы. Потом нажимаем Make Full Concordance:

conc3

И снова видим то, что есть на первом скриншоте в этом посте.

Но пока посмотрим на последний скрин выше — мы видим кнопочку EDIT STOP LIST. Неожиданно — это редактор стоп-листа, куда входят слова, которые вы не хотите видеть в результатах работы Concordence. Например, вы не хотите видеть все контексты использования предлогов, союзов, междометий и пр. В общем это обычный стоп лист. Откроем его, нажав на эту кнопочку,  и увидим следующее:

conc4

Как мы видим, список стоп-слов на английском… Чего и следовало ожидать от программы для англоязычных пользователей, обрабатывающих тексты на английском языке. В списке есть несколько слов на русском языке, которые добавил я. После добавления нажимаем FILE/SAVE, ну, или FILE/SAVE AS, если хотите сделать отдельный файл с отдельным списком стоп слов.

После этого снова можно нажать MAKE FULL CONCORDANCE и в частнотном распределении слов в левой части экрана мы уже не увидим частот добавленных нами стоп слов. Например, союза И. На первом скрине поста видно, что частота И представлена. Ниже, после добавления стоп слов — ее уже нет:

conc5

Чтобы отсортировать слова по частоте, надо нажать на название столбца, что в общем можно было и не уточнять 🙂

Увы, как и в другом софте для английского языка, словоформы слов русского языка не учитываются… То есть, например, вы можете увидеть, что слово «бедности» встречается 13 раз, а «бедность» 8 и т.д. В принципе, это не беда. Для английского языка в программе есть механизм лемматизации — для русского он, естественно, неактуален. Поскольку текст у нас на русском — функционал лемматизации не смотрел.

Так вот. Чтобы прочитать все контексты, в которых используются слова, отображаемые с их частотой в левой части окна программы, надо нажать на слово — справа появятся контексты их использования:

conc6

Чтобы увидеть весь текст, в котором используется слово, можно нажать на строку, в которой произведен поиск контекстов — то есть на актуальную строку в правой части экрана программы (нажал на самую первую, она выделилась серым цветом):

conc7

Собственно это и есть наиболее важный функционал Concordance.

Так мы можем провести качественный контент-анализ в самом распространенном его варианте — поиске тематик в тексте/массиве текстов. Ну и проинтерпретировать это тем или иным образом, визуализировать связи между структурой тематик и пр. Например, в каком-то таком формате можно это сделать:

conc8

Еще немного про функционал Concordance.

Можно задавать актуальные для вас слова либо правила встречаемости слов и делать конкорданс только по этим словам.

Для этого идем в меню FILE/MAKE SELECTIVE CONCORDANCE/FROM FILES.

conc9

Слева внизу видим различные варианты поиска контекстов. Рассмотрим первый «PICK LIST». Нажав Edit, можем ввести список актуальных слов (можем использовать * и ? для более быстрого поиска). Вводим слова и сохраняем список (FILE/SAVE)

conc10

Далее нажимаем MAKE SELECTIVE CONCORDANCE. Получаем возможность смотреть контексты использования слов из нашего списка:

conc11

В предыдущем меню есть опция поиска фраз (не только слов из списка). Опция phrases:

conc12

Снова нажимаем MAKE SELECTIVE CONCORDANCE:

conc13

Еще вариант поиска контекстов с заданием максимального расстояния между операндами. Зададим расстояние между словами страх* и психолог* максимум в 3 слова:

conc14conc15Остальные опции поиска контекстов, типа поиска, начиная не с первого, а с n-го слова и заканчивая m-ным, или заданного количества слов в рандомной части текста, мне особо не приглянулись. Это делает опция SAMPLES. Регулярные выражения (опция REGEX) тоже не будем рассматривать.

Ну и еще… Можно посмотреть частотное распределение слов, находящихся на определенном расстоянии «слева» и «справа» от выбранного слова. Кликаем правой кнопкой мыши по слову и выбираем опцию COLLOCATIONS:

conc17conc18

То есть, например, видим, что слово «бедности» 8 раз встречается справа от слова Психологией. Полагаю, что эта функция актуальна только при работе с большим массивом текстов и с использованием механизма лемматизации.

Вот такая программка 🙂 Больше ничего интересного в ней не обнаружил, но дополнительных опций в общем немало.

Всего хорошего!

 

Print Friendly, PDF & Email

Автор

Алексей Рюмин

Здравствуйте, уважаемый гость блога! Меня зовут Алексей Рюмин. На этом блоге мне хочется поделиться с Вами материалами о контент-анализе. Надеюсь, они окажутся полезными и интересными Вам. Приятного прочтения блога!

Concordance — программа для конкорданс :-) Поиск контекстов актуальной лексики: 4 комментария

  1. Очень понятный и хорошо продуманный блог! Я учусь на втором курсе института, нам надо было провести анализ текстов в этой программе и благодаря Вашему блогу я смогла быстро разобраться, что и как делать в данной программе. Спасибо за помощь:)

  2. ochen vse xorosho i ponjatno napisno, y menja tolko odin vopros v kakoi kodifikazii vu soxranjaete text, a to y menja abrakadabra pojavljaeetsja.
    ja probovala i Unicode UTF8 i Cirilico windows, no ni odin ne podxodit

Обсуждение закрыто.