Здравствуйте, уважаемые читатели блога о контент-анализе! Сегодня пост будет небольшим. Мы поговорим об итоговой обработке полученных матриц факторного анализа. На этом этапе мы определим содержание факторов — тематических групп, выраженных набором переменных (лексем) и наборами фрагментов текстов.
Мы продолжим работу с теми же матрицами. Скачать их можно по этой ссылке.
Для начала скопируем шапку (F1,F2…F26) и вставим её справа. Далее один столбец назовём max и вставим шапку ещё раз. Чтобы было понятнее, ниже привожу скриншоты:
Итого у нас в матрице factor loadings три одинаковых шапки Теперь немножко посчитаем. В столбце фактора F1 под второй шапкой пишем формулу — ABS(самое первое значение в матрице — в примере это B2). Протягиваем формулу по длине всей второй шапки и вниз до упора. В общем получаем абсолютные значения всей матрицы, создавай её дубль под второй шапкой.
Теперь в столбце max напишем формулу =МАКС(диапазон абсолютных значений с первого по 26 факторы). У нас в примере формула будет выглядеть как =МАКС(AB2:BA2). Дальше протягиваем формулу по всей высоте матрицы.
И последняя формула. Пишем под третьей шапкой. Делим первое абсолютное значение на максимальное в строке. У нас в примере это будет выглядеть как =AB2/$BB2 . Далее соответственно протягиваем формулу по всей длине третьей шапки и высоте матрицы.
Далее сортируем значения в столбце F1 под третьей шапкой, так, чтобы вверху оказались единицы.
Теперь после строк, содержащих единицы, вставим пустую строку.
Переходим к столбцу F2. Также применяем сортировку по убыванию, получаем несколько единиц вверху и также как и ранее добавляем пустую строку после них. Так «лесенкой» движемся вниз до столбца 26 включительно.
Теперь, рекомендую закрепить самую первую строку матрицы. Так всегда будет видно с каким фактором ведётся работа. Также покрасим красным значения факторов как в примере, двигаясь лесенкой вниз.
Результат смотрим здесь: готовые матрицы
Собственно это на сегодня всё. Посмотрите на то, что вышло в итоге, и, думаю, вы догадаетесь к чему всё идёт, и зачем мы проводили все эти манипуляции с данными.
Всего хорошего!
Здравствуйте! а в основе этой матрицы рассчитанный коэффициент Яниса или нет?
Кристина, нет. Коэффициент Яниса нужен для работы с тональностью текста
Здравствуйте, подскажите пожалуйста что прочесть по математическому обоснованию многомерного анализа текста?