Здравствуйте, уважаемые читатели блога о контент-анализе. Это первый для сайта обзор программного обеспечения для проведения контент-анализа. Я не стал долго выбирать программу – остановился на первой попавшей мне в поле зрения. Эта программа называется Site Content Analyzer 3. Она предназначена для проведения количественного контент-анализа сайта.
Функционал её довольно прост, незамысловат. Однако она может оказаться полезной для общей оценки контента сайта. Оценка производится не в онлайн режиме – работа ведётся со скаченными на жёсткий диск файлами сайта. В этой связи анализ небольшого сайта, безусловно, будет проведён быстро. Большого же, на несколько тысяч страниц, вынудит набраться терпения. Программа представлена в 2-х вариантах – может работать в бесплатном демо-режиме в течении 30 дней и, соответственно, в платном, снимающем некоторые ограничения её работы. Я использовал стандартную бесплатную версию программы.
Итак, давайте смотреть, для чего можно использовать Site Content Analyzer 3 и как его использовать. Думаю, процесс установки программы стоит пропустить. Скажу только, что во время этого этапа вам будет предложено приобрести лицензию программы. Для того, чтобы опробовать работу Site Content Analyzer 3 нажмите кнопку «evaluate».
Начало работы
Чтобы приступить к проведению анализа сайта, как уже было сказано, необходимо скачать его. В Site Content Analyzer 3 за создание нового проекта отвечает соответствующая кнопка «create new project», находящаяся в левой верхней части программы. Также можно использовать комбинацию Ctrl N.
Нажимаем. Видим, что система предлагает нам две альтернативы нашего проекта – онлайн проект и оффлайн проект. В первом случае речь идёт о загрузке сайта на жёсткий диск компьютера после прохождения нескольких следующих пунктов меню. Такую работу проведёт сама программа. Во втором случае предлагается анализировать уже имеющиеся на компьютере, заблаговременно скачанные файлы сайта. Мы выберем первый вариант – будем качать… Сразу предупреждаю – этот процесс происходит не так быстро, как хотелось бы.
Дальше нам предлагают ввести адрес интересующего нас сайта или адрес выборочной страницы. Вводим… Я введу адрес блога content-analysis.ru
Дальше нам предлагают установить некоторые опции загрузки сайта. В первом поле «Simultaneous downloading threads» впишем количество одновременных потоков загрузки страниц. Нас предупреждают, что чем больше число потоков, тем выше скорость загрузки, однако, это в свою очередь увеличивает и нагрузку на сервер, на котором размещён анализируемый сайт. Во втором поле «link depth to follow» предлагается ввести глубину просмотра ссылок сайта, то есть удаленность ссылок от введённого нами изначального адреса. Например, Главная/Обзор программного обеспечения для контент-анализа/ Анализ сайта: Site Content Analyzer 3. Количественный контент-анализ. В данном случае – глубина статьи – 2, при условии, что на главной странице нет ссылки на саму статью. Чем больше сайт, чем больше контента он включает, тем выше вероятность необходимости установить в этом поле большее число. Например, это актуально при анализе крупных веб форумов или новостных порталов.
Дальше нас предупреждают, что Site Content Analyzer 3 обладает системой загрузки сайтов, но при этом, с такой задачей лучше справляется другая программа – Offline Explorer. Нам предлагают приобрести её, но мы попробуем воспользоваться Site Content Analyzer 3 для решения этой задачи. Нажимаем на кнопку «Use Site Content Analyzer» и начинается загрузка сайта… С нетерпением ждём результата.
Готово. Сайт скачан. Давайте пройдёмся по интерфейсу программы и посмотрим самые основы. Начнём с верхнего меню.
Закладка меню PROJECT отвечает за сохранение, загрузку проектов, можно выйти в опции проекта, установить слова, входящие в «белый» и «чёрный» списки наших замеров. То есть наборы слов, которые будут игнорироваться и наоборот учитываться при анализе контента. Для того, чтобы провести такую настройку, зайдите в меню PROJECT и дальше SETTINGS. Далее закладки BLACK LIST и WHITE LIST. Здесь же в закладке NOTES вы можете оставлять комментарии к исследованию контента сайта. Закладка COMPOSITE WORDS отвечает за введение в словарь контент-анализа словосочетаний, которые в рамках анализа будут рассматриваться системой как единые единица счёта – то есть не рассматриваемые как 2-3 отдельных слова, а считаемые единым объектом.
Это может быть, например, название города «Нижний Новгород» — если мы напишем его в полях этой закладки, то система будет расценивать это словосочетание как одну единицу счёта. Здесь же мы видим 2 поля. Левое GLOBAL COMPOSITE WORDS отвечает за такие единицы счёта, актуальные для любого вашего проекта. Правое поле – LOCAL COMPOSITE WORDS отвечает только за нужды текущего проекта.
Также в самом верхнем меню есть кнопочка HELP – соответственно, здесь можно перейти к мануалу к программе, здесь есть ссылка на форум поддержки, здесь же можно сообщить об обнаруженных багах, оставить свой отзыв о программе, ввести ключ для получения доступа ко всем функциям программы. Отмечу, что мануал, как вы понимаете, не на русском языке… В меню ниже, реализованном в виде 6-ти иконок самая правая также отвечает за справку – это белый знак вопроса в зелёном круге – здесь также можно перейти к мануалу. Стоит отметить, однако, что мануал написан лаконично и по делу. Чуть левее находится кнопочка с буквами CSV – она отвечает за выгрузку результатов анализа в документ с расширением CSV, открываемый, например, EXCEL. При этом, в бесплатной версии программы, можно выгрузить только 10 строк результатов вычислений. Ещё левее находится кнопка GENERATE REPORT (надпись появится при наведении на неё курсора). С помощью неё можно сгенерировать отчёт по анализу для последующей печати. Лично у меня такой отчёт загружался несколько минут – тормозит неприлично сильно. Ещё левее кнопочка с изображением дискеты – это кнопка сохранения проекта. Левее кнопка загрузки уже ранее сохранённого проекта и первая слева кнопка – создание нового проекта.
Вертикальное меню слева дублирует функционал уже только что описанных кнопок программы. Зелёный кружок со стрелочкой в этом меню отвечает за начало загрузки сайта. Также эту кнопку можно использовать для обновления материалов проекта – догрузки нового контента.
Результаты анализа сайта
Итак, что же мы получили?
Начнём с результатов анализа в первой закладке FILES (выбор закладки располагается слева внизу программы). Изначально посмотрим на материалы, отображаемые в разделе KEYWORDS MODE – «режим ключевых слов».
Как мы видим, слева находится перечень всех наших файлов. Безусловно, с ними намного удобнее работать, если на сайте используется ЧПУ. У меня на сайте ссылки не имеют осмысленного вида, так скажем, поэтому не очень удобно работать с такими материалами. Кликнув по любому из наименований файлов мы в таблице справа мы можем посмотреть общую информацию по этому файлу – результаты контент-анализа этой страницы. В столбце WORD, как ни странно, мы видим слово – нажав на само слово WORD, можем отсортировать слова по алфавиту. Столбец TOTAL показывает частотность слова на странице – частоту его употребления – в абсолютном формате и в процентном отношении по отношению к частотности других слов (в скобках). В столбце TITLE указано абсолютное и относительно число слов в названии страницы. В столбце HEADINGS указана та же информация, но уже в отношении заголовков на странице. В ANCHOR TEXT – информация о ключевых словах, представленных в формате ссылок. ALT TEXT – альтернативный текст (слова, единицы счёта) для мультимедийных файлов. Есть ещё и другие параметры – программа, например, анализирует курсив (ITALIC), полужирный (BOLD) шрифт и представляет данные в таком же формате. Нажав на название любого столбца, можно произвести сортировку.
Двигаемся дальше и переходим на закладку KEYPHRASES MODE – режим работы с ключевыми фразами – словосочетаниями.
Здесь как и ранее, для удобства работы мы можем произвести сортировку словосочетаний по алфавиты, хотя такая функция едва ли может пригодиться на практике. В этой закладке мы можем производить анализ материала по 3-м параметрам, также используя сортировку: WEIGHT, COUNT и DENSITY. Первый параметр отражает важность, весомость словосочетания для поисковых машин. Например, если словосочетание content-analysis находится в названии страницы (тег title) или представляет собой заголовок, то его вес (WEIGHT) будет больше, чем этого же словосочетания в простом тексте на странице. Такие данные, по заверению разработчиков программы, представляют собой ключевую важность для SEO.
Параметр COUNT отражает частоту встречаемости этого словосочетания на анализируемой странице. Соответственно, так можно узнать наиболее популярные микротемы, выраженные словосочетаниями, фигурирующие на странице.
Параметр DENSITY (плотность, густота, концентрированность) отражает то, насколько часто словосочетание проявляет себя относительно других словосочетаний. Если параметр COUNT выражен абсолютной шкалой, то DENSITY относителен и высчитывается так:
DENSITY=COUNT(выбранное словосочетание)/TOTAL COUNT(вся совокупность словосочетаний)*100%
Двигаемся дальше. Следующая закладка называется KEYWORD DENSITY AND WEIGHT MODE – концентрация слов и «весовой» режим. Здесь мы видим те же параметры – частота встречаемости, вес и концентрированность. При этом частота отображена в графическом режиме. Суть же параметров прежняя, но в данном случае речь уже идёт об анализе отдельных слов, а не словосочетаний. Как и ранее значения очень хорошо сортируются, что может нам пригодиться при проведении работы.
Да, кстати, забыл сказать, что здесь нам пригодится режим экспорта в CSV файл. Для этого используется уже ранее упомянутая кнопка с соответствующим названием.
Нажав её, мы видим, что нам предлагают выбрать значения параметров для экспорта – то есть мы можем выбрать, например, не все, а только часть данных, интересных нам. В бесплатной демо версии можно выгрузить только 10 строк таблицы. Безусловно, в нашем случае актуальнее работать просто в самой программе.
Двигаемся к следующей закладке – linked pages. Здесь отображаются все гиперссылки, находящиеся на анализируемой странице. Актуально может быть при сопоставлении доли внешних и внутренних ссылок, при просмотре общего числа ссылок на странице, отдельно внешних и внутренних.
Далее в закладке INFORMATION MODE мы видим несколько иные сводные данные по странице – объём страницы в килобайтах (PAGE SIZE), её относительный вес по отношению к другим страницам сайта (AVERAGE WEIGHT), число слов на странице (WORDS COUNT), Число внешних (EXTERNAL LINKS COUNT) и внутренних (INTERNAL LINKS COUNT) ссылок на странице, число картинок на странице (IMAGES COUNT), перечень всех ссылок на странице (LINKS IN THE FILE).
Ниже находится параметр RECOMMENDED KEYWORDS – система сама предлагает набор ключевых слов для страницы и соответствующий готовый html код для вставки на страницу.
Последняя закладка – keyword cloud. В формате облака она представляет ключевые слова страницы. Довольно интересно…
Идём к следующей закладке WORDS в нижнем меню закладок. Здесь мы можем просмотреть все слова, встречающиеся на всех страницах сайта, просмотреть частоту их встречаемости (COUNT), концентрированность относительно всей совокупности слов на сайте (SITEWIDE DENSITY), и их среднюю «весомость» для всего сайта (AVERAGE WEIGHT). Кстати, кликнув правой кнопкой мыши по любому из слов, мы можем добавить их в наши белые и чёрные списки, упомянутые ранее, чтобы исключить их или добавить в аналитические материалы.
Кликнув по любому из слов, в правой части программы мы можем просмотреть по нему некоторые данные – уже знакомые нам «количество», «плотность», «вес» и ранее не фигурировавшее «распределение» DISTRIBUTION. Оно представлено в виде диаграмм, отражающих данные по каждому из файлов. Красным отмечены верхние позиции на странице, синим – нижние (например, footer сайта). Соответственно в середине диаграмм – параметры, отображающие центральные позиции на площади страницы.
Последняя третья закладка нижнего меню закладок – PHRASES. Интерфейс аналогичен второй закладке. Здесь мы можем посмотреть частотность и вес словосочетаний на отдельных страницах сайта.
Последняя актуальная функция – generate report. Работает очень медленно, лично у меня, поэтому отчёт сгенерируем максимально сокращённый.
Вначале нам напомнят, что поскольку мы не приобрели платной версии программы, объём отчёта будет ограничен только 10-тью первыми файлами. На следующем шаге мы сможем выбрать их. В общем, наживаем кнопку NO (если, разумеется, вы не намерены приобрести программу).
Собственно выбираем нужные файлы… Я оставлю только 2 первых, чтобы не утруждать свой компьютер.
Из тех же соображений на следующем шаге оставлю только 3 параметра для включения в отчёт. Этого будет вполне достаточно для демонстрации функционала.
На следующем шаге выбираем сколько наиболее частотных слов (параметр COUNT) войдёт в наш отчёт. Я поставлю 5.
Дальше нам предлагают ввести название будущего отчёта (REPORT TITLE), название отчёта, отображаемое вверху каждой страницы (REPORT HEADER) – что-то вроде верхнего колонтитула в Microsoft Word, аналогично для низа страницы (REPORT FOOTER), имя автора (CREATED BY) и имя (название) клиента (CREATE FOR). Потом FINISH и распечатываем на любимом принтере наш отчёт J думаю, скриншоты отчёта приводить особого смысла нет – там всё стандартно и понятно.
ВЫВОД
Готово… Ну вот собственно и всё… Надеюсь вам было интересно узнать о функциях SITE CONTENT ANALYZER 3. Мне бы пригодились далеко не все, но часто возникают совершенно неожиданные задачи, где и могут пригодиться эти функции. Надеюсь, и для вас они также будут актуальны.
Спасибо!
P.S. Здесь вы можете приобрести программу, а также ознакомиться с материалами по ней более подробно. Также режим онлайн покупки доступен и из меню HELP.
Долго читала, честно. И как в итоге мне проверить мою страничку — так и не поняла (((
Так это все можно делать на функциональных сайтах, и не нужно ставить программу.
Стоит попробовать прогу, ведь внутренняя оптимизация сейчас важнее чем ссылочная масса
По ходу умер сайт программы и теперь ее даже не купить!