Доброго времени суток!
Сегодня небольшая публикация — небольшая, но довольно актуальная. Не знаю почему так происходит, но когда встаёт речь о сборе текстов для проведения контент-анализа, возникает некоторый ступор: где их взять. Вопрос предельно простой, но почему-то ответ знают не все. Самое элементарное решение при отсутствии доступа до таких служб, как например, EAST VIEW (платная база публикаций в СМИ с возможностью скачивать по 20 статей, соответствующих запросу в поиске, за раз со страницы в архив и набивать папку кучей архивов) — это Google и Яндекс. Но, здесь имеет смысл задуматься перед началом поиска, а нормально ли будет скачивать все статьи, заявленные в результатах поисковой выдачи, находящиеся на самых разных по форме площадках? Я бы не рекомендовал так поступать — уже есть отрицательный опыт такого мартышкиного труда.
Читать далее Где взять тексты для контент-анализа? Yandex, Google, Teleport VLX