Датасет содержит потоковые текстовые сообщения о чрезвычайных происшествиях, собранные из неофициальных источников: социальных сетей, локальных чатов, пабликов, комментариев, пользовательских репостов и сообщений очевидцев. В данных упоминаются пожары, ДТП, отключения инфраструктуры, подозрительные ситуации, локальные аварии, стихийные бедствия и другие инциденты, которые часто появляются в сети раньше, чем в официальных сводках.
Все сообщения анонимизируются, очищаются и структурируются по типу происшествия, географии, времени публикации, характеру источника и уровню достоверности. Набор предназначен для задач раннего выявления ЧП, мониторинга городской среды, построения тревожных уведомлений, анализа информационных волн и классификации ложных или недостоверных сообщений.