Блог → Московское метро как источник исследований Big data

Каждое действие, производимое в городской среде, будь то телефонный звонок, переход улицы или поездка в метро, навсегда отпечатывается в ткани города. С развитием цифровых технологий отпечатки ваших действий тоже становятся цифровыми, а их количество растет невероятными темпами, трансформируясь впоследствии в то, что называют "большими данными" (от англ. big data). Слово "большой" в данном случае говорит не только о размере базы данных, но и о больших возможностях, позволяющих по- новому взглянуть на вопросы взаимодействия людей с городской средой. Неудивительно, что "большие данные" находят поддержку у бизнеса, в Маркетинге и в медицине, в структурах городского управления, однако потенциал больших данных для развития городов нам ещё только предстоит осознать. Исследовательский эксперимент по изучению данных о московском метро — попытка приблизиться к пониманию этого потенциала.

Москву невозможно представить без метро: линии метрополитена пронизывают большую часть города, около 80% москвичей из разных социальных слоев регулярно пользуются подземкой.
Поездки в метре подразумевают взаимодействие с различными технологиями — как активное (проход через турникеты, поездки на эскалаторах, использование колонн экстренного вызова), так и пассивное (проход под камерами наблюдения и др.). Более того, технологии играют основополагающую роль в организации работы метрополитена, обеспечивая его транспортную эффективность. Можно сказать что метро представляет собой "лабораторную среду" для сбора и анализа данных, совмещая в себе весьма разнообразнее окружение с достаточно строгим регулированием происходящих в нём процессов. Это делает его интересным "полигоном" для исследования.

Исследование базируется на разных типах данных - официальной статистике, данных социальных медиа и информации, генерируемой непосредственно людьми. Статистика - один из базовых и на сегодня уже "старейших" видов информации, который имеет широчайшее применение. Статданные, например, рассказывают нам о количестве пассажиров, перевезенных поездами метрополитена за последние несколько лет, - и это позволяет оценить, сколько предположительно будет перевезено в ближайшие годы. Однако статистика, к сожалению, не отражает происходящего в текущий момент (ситуация на станциях, заполненность вагонов), что, конечно же, видится более актуальной информацией, нежели "отпечаток прошлого".

Социальные сети аккумулируют другую информацию - так называемые пользовательские данные (от англ. user-generated data), получившие особо широкое распространение с развитием цифровых коммуникаций и Интернета. Сегодня любой, высказав мнение, совершив то или иное виртуальное действие, или даже просто присутствуя в городе, имеет возможность внести свой вклад в "глобальную базу данных". В этом смысле интересным примером является Foursquare - геолокационная социальная сеть, позволяющая пользователям обмениваться информацией о своем текущем местоположении, делиться впечатлениями о посещаемых местах и составлять рейтинги мест на основе всей информации. Анализ сервиса Foursquare, помимо прочего, показал, что люди регулярнее "чекинятся" (от англ. check-in – отметиться) на станциях, которые находится в спальных районах (Бутово, Новогиреево и др.). Этот факт может указывать на феномен "привязанности к месту": у горожан вырабатывается определенная связь с часто посещаемыми местами, которая затем транслируется в социальные сети - в данном случае через частые "чекины".

Поскольку основный производители данных - это сами горожане, то необходимо принимать во внимание и ту информацию, которую генерирует непосредственно человеческое тело (bio-data). Специально для исследования было разработано устройство из нескольких сенсоров, которое замеряет и оцифровывает сразу несколько параметров - уровень стресса в организме, температуру кожи и окружающей среды, влажность воздуха, шум, освещенность. После проведения эксперимента на Сокольнической линии метро, все данные были визуализированы.

Получившаяся диаграмма продемонстрировала, где и в каких условиях эмоциональное состояние пассажира реагировало на различного рода изменения в окружающем пространстве: пассажир испытывает стресс при входе в метро, при взаимодействии с другими пассажирами, в ситуациях, когда место, в котором он находится, вызывает у него достаточно сильные личные ассоциации с чем-либо. Для более основательных выводов необходимо провести серию подобных экспериментов на различных маршрутах, в разное время суток и с большим количеством испытуемых.

Комбинируя разные категории данных, можно получить множество альтернативных точек зрения на процессы, происходящие в метро и - более глобально - в городском пространстве вообще. Пространство метро при этом становится своего рода "информационной лабораторией", где при помощи встроенных технологий и сенсоров собираются данные о пассажирах, которые впоследствии они могут быть использованы для мониторинга здоровья населения в различных районах, обеспечения безопасности, изучения экономических процессов и принятия решений, влияющих на развитие города.