Проведение контент-анализа (или умная и точная исследовательская одиссея по вашему сайту)

Джефри Виин. Перевод с английского.

Последний год я [Джефри Виин] провёл, активно работая с клиентами в области изучения архитектуры информации и проблем дизайна. Основной проблемой, с которой мне довелось столкнуться, явилось отсутствие всякой работы компаний по организации системы управления контентом. Я общался с людьми, удостоившимися быть в сотне лучших по версии Fortune и их собственные топовые веб ресурсы, находятся на статичных html станицах [статья достаточно старая – 2002 год, однако актуальна не этим введением]. Они прекрасно понимают, что их сайты уже давно переводить в динамичный формат баз данных и гибких систем, работающих на основе динамичных php шаблонов. Их первый вопрос мне всегда один: «так с чего же всё-таки стоит начать?».

Если вы находитесь в такой же ситуации, имеет смысл внимательно посмотреть, чем вы обладаете, какой контент находится в вашем распоряжении. Этот вид работы носит название «исследования контента» (content inventory). Эта работа довольно проста в реализации и заключается в кликах по внутренним ссылкам вашего сайта и структурированной записи результатов броузинга по вашему сайту. Мы разработали простую таблицу для записи такого материала, снабжённую дополнительными рекомендациями по такой работе.
Начните с вашей главной страницы сайта. Определите главные разделы вашего сайта. Например на adaptivepath.com мы определили такие разделы: команда, услуги, семинары, публикации и контакты. Если бы я проводил исследование этого сайта, я кликнул бы по ссылке одного из разделов и просмотрел какие материалы входят в него. Для каждого из материалов я оставил бы запись в таблице в соответствующих колонках. Я бы проследовал по каждой из ссылок на сайте, так глубоко, как это было бы необходимо, чтобы убедиться в полноте полученной информации.
Ниже представлен пример такой таблицы.

Link ID (идентификатор ссылки) – когда мы производим контент-анализ содержания сайта мы вводим систему нумерации изучаемых материалов и включаем её в наш реестр материалов — таблицу. Как показано в примере в таблице Excel раздел продукты (products) является вторым разделом сайта, и страницы под страницей «продукты» также соответственным образом пронумерованы. Такая сводная таблица материалов может оказаться бесценной, если будет проводиться работа по функциональной трансформации сайта или по изменениям, затрагивающим дизайн или архитектуру сайта.

Link Name – (имя ссылки). Материал, который вы исследуете, должен носить какое-либо название. Обычно мы используем содержимое тега title в html коде страницы либо, если он неуникален для всей совокупности материалов, можно использовать первые фразы текста страницы. Эти слова должны быть уникальны и информативны – передавать суть содержимого.
Link – (ссылка) может оказаться очень полезным фиксировать адрес изучаемого материала в нашем реестре. Вы не только сможете использовать эту ссылку для быстрого перехода к нужному материалу непосредственно из реестра, но и получите информацию о фактическом расположении материала на сервере. Ссылка не носит символического характера, а указывает точный путь к директории на сервере.
Document type — (тип документа). Какой тип имеет контент, или какой тип он должен иметь? Это страница продукта, юридического документа или пресс-релиза? Каждый сайт включает в себя разные типы документов, но часть типов преобладает, часть слабо представлена.
Topics, Keywords – (темы, ключевые слова). О чём ваш контент? Откройте исходный код вашей страницы и посмотрите на тег keywords (ключевые слова). Что он содержит? Неплохо создать словарь используемых слов, описывающих ваш контент. Это не только поможет вам выбирать наиболее подходящие для описания контента слова, но и также позволит лучше работать с самими метатегами. Это поможет избежать ситуации, когда часть вашего контента описана с помощью слова «локомотив», часть с помощью «поезд».
Owner – (владелец, автор). Кто является владельцем этого контента? Кто его поддерживает? Если вы анализируете небольшой сайт – можно проигнорировать этот параметр. При работе с нашими корпоративными клиентами мы обязательно используем этот параметр.
ROT – (мусор). Аббревиатура расшифровывается так: избыточный, устаревший или тривиальный. Этот параметр мы вводим для обозначения контента, который явно должен быть удалён с сайта. Есть ли где-либо аналогичный или идентичный материал? Он уже не актуален? Может быть, его не стоило публиковать на самом видном месте? Если сайт уже не содержит страницы с контентом – стоит сделать отметку об этом в реестре. Может быть, этот контент не стоило бы переносить на новый модифицированный сайт?
Notes – (заметки). Сюда стоит писать дополнительно всё актуальное по контенту, что не вошло в предыдущие столбцы. Сюда, например, можно включить информацию о не отображающихся иллюстрациях на странице или других ошибках html кода. В общем, просто пишите туда все актуальные заметки по исследованию, чтобы не утерять ценную информацию.

Если вы заполнили несколько строк таблицы, вам обязательно придёт в голову мысль о возможности автоматизации процесса такой работы. На самом деле современные технологии могут помочь ускорить процесс анализа. Однако, самое стоящее, чего мы смогли добиться – с помощью программирования мы получили таблицу, содержащую URL адреса контента изучаемого сайта. При этом мы точно знаем, что не потеряли ни одной страницы сайта. Но, даже при включении программного обеспечения в такую работу, далее весь анализ производится «вручную». Контент-анализ, очевидно, – работа для человека, а не для машины. Часто, мы понимаем, что сам процесс проведения контент-анализа оказывается не менее важным, чем сам результат в виде таблицы данных. Если вы проводите тщательную работу по исследованию всего контента вашего сайта или значительной его части, то по завершению этого замера вы, абсолютно точно, уже будете экспертом в устройстве изучаемого ресурса. Такое знание является просто бесценным при условии необходимости модификации актуального сайта.

оригинал статьи — здесь

Проведение контент-анализа (или умная и точная исследовательская одиссея по вашему сайту)

Автор

Алексей Рюмин