Если вам нужно получить какой-то массив текстов из интернет СМИ, то сейчас это можно сделать с помощью небольшого веб приложения, находящегося ВОТ ТУТ. Там работает полнотекстовый поиск с учетом морфологии русского языка и операторов поиска типа OR, AND, NOT и других. Есть экспорт в xlsx и txt, фильтры по сми, датам публикации, расположению текста (заголовок, тело, описание из RSS).
Если нужен сбор текстов / извлечение данных (фио, адреса, даты, организации и пр) из этих и других ресурсов — открыт к предложениям.