Программа для качественного контент-анализа Global QDA. часть 1

Здравствуйте, уважаемые читатели блога о контент-анализе!

Долго тянул, но пора уже написать обзор программки Global QDA, благо, первая, сыроватая версия в итоге готова. Понял для себя, что к настоящему моменту приоритеты выстроились следующим образом: мне нравится делать софт для аналитики, немного лень писать обзоры софта для аналитики и вообще слабовато тянет заниматься самой аналитикой… Так уж вот как-то само собой сложились предпочтения…

Как бы то ни было, решил начать писать. Ведь пол года делал программку в свободное время…

Итак, в прошлой статье на блоге я написал, для чего предназначается программа. В общем и целом: для кодирования текстов и получения некоторых статистических данных о текстах, базирующихся на частотах кодов. Ну и несколько сомнительное (и как я понял, не особо востребованное) основное предназначение QDA программок — получение некоторой качественной информации о текстах… Об этом много пишут, но всё очень и очень сомнительно… Качественный анализ данных вызывает массу вопросов… Иногда и сам процесс кодирования называют качественным анализом данных. Брррр.

Читать далее Программа для качественного контент-анализа Global QDA. часть 1

Global QDA — запустил в открытое плавание beta-версию

Здравствуйте, уважаемые читатели блога о контент-анализе!

Сегодня закончил доработку программы для качественного анализа данных — Global QDA (Qda — это Qualitative data analysis — качественный анализ данных, Global, потому что база данных проектов открыта для всех).

Разрабатывать проект начал в январе 2016 года, то есть около пол года назад. В общем-то — это первый мой большой проект. До этого была еще Даздраперма — но это уж совсем было очень кривенько. Global QDA тоже внутри (да и снаружи) кривоват, но уже по-лучше. Смотрю код: сейчас бы уже всё по другому сделал…. Но так и должно быть — программированием начал заниматься тоже только год назад — зато развитие заметно.

done Читать далее Global QDA — запустил в открытое плавание beta-версию

Сделал генератор поисковых запросов для твиттера

Здравствуйте, уважаемые читатели блога о контент-анализе!

Эта заметка — наверное, просто на память и для сохранности моей библиотеки и графической реализации ее использования на java swing. Библиотека позволяет из исходного поискового запроса для твиттера, где не учтена возможная морфология слов, получить массив таких же по логической структуре поисковых запросов, но уже с учетом возможной морфологии. Если словоформ сгенерировалось мало — можно добавить свою лексику. Если есть что-то лишнее — это лишнее можно убрать. Дело в том, что поисковик твиттера сам не будет искать все словоформы — найдет твиты со словами в тех формах, что заданы в вашем поисковом запросе. Словоформы придется указать вручную. Однако, всегда можно что-то забыть указать или нужно сделать ОЧЕНЬ много запросов, а времени или желания прописывать в них все словоформы просто нет.

ts Читать далее Сделал генератор поисковых запросов для твиттера

Поисковик абзацев текстов схожих с искомых. Кластеризация абзацев

Здравствуйте, уважаемые читатели блога о контент-анализе!

Закончил работу над новой программкой на JAVA — программка сугубо учебная (пару дней назад закончился третий месяц моего изучения JAVA и по сути — вообще программирования), полезностью, вероятно, особой не обладает, но если вы найдете ей применение — отлично. Программка позволяет ввести в поиск фрагмент текста и найти все похожие на него фрагменты. Также она позволяет кластеризовать по темам все абзацы загруженных текстов.

ff

Скачать ее можно ТУТ. Для запуска надо установить JAVA, если она еще не установлена и далее запустить файл FindFrags.jar — или двойным кликом или через командную строку командой: java -jar FindFrags.jar, находясь в нужном каталоге или задав путь до файла jar. Читать далее Поисковик абзацев текстов схожих с искомых. Кластеризация абзацев

«Закончил» работу над Dazdraperma v0.2 (веб-приложение для контент-анализа текста)

Здравствуйте, уважаемые читатели блога о контент-анализе!

Давно пора было это сделать, но сделал только сейчас — чуть-чуть доделав, прекратил развитие проекта Dazdraperma. На этом проекте хотел сделать браузерное приложение для ручного неавтоматизированного анализа текстов. Начал делать его на процедурном PHP, чтобы потом перейти на объектно-ориентировнный PHP фреймвок, на Yii. Но забил, так как увлекся JAVA, а само приложение буду делать десктопным, не браузерным и делать буду на JAVA. Не знаю, насколько это правильное решение, но пока что решил вот так.

Снимок

Читать далее «Закончил» работу над Dazdraperma v0.2 (веб-приложение для контент-анализа текста)

Сделал программку для конкорданса — конкорданс менеджер 1.0

Здравствуйте, уважаемые читатели блога о контент-анализе!

Сегодня хочу поделиться описанием бесплатной программы для извлечения контекстов употребления слов в массиве текстов. Программку дописал вчера. Для использования понадобится установить JAVA и MYSQL сервер (не стоит пугаться — это не сложно).

Суть конкорданса в получении фрагментов текстов, в которой употреблена актуальная лексика. Например, у вас есть огромный массив текстов, в каждом из которых озвучивается какая-то интересная вам тема. При этом текст не обязательно посвящен только этой теме. Для того, чтобы получить фрагменты текстов, в которых звучит нужная вам тема и отсеять неактуальные фрагменты текстов используются софт для конкорданса. В самом простом виде пользователь вводит в поиск слово, и программа показывает ему каждый из фрагментов, где это слово употребляется.

Снимок Читать далее Сделал программку для конкорданса — конкорданс менеджер 1.0