Construir matrices orígenes destino con la tarjeta SUBE

I-Introducción

Los sistemas de recaudo electrónico — SRE o ADC por sus siglas en inglés (automated fare collection) son un sistema utilizado en ciudades en todo el mundo en virtud de sus beneficios para el transporte urbano. Utilizados originalmente con el fin de facilitar el recaudo de la tarifa, representan una fuente continua, precisa e íntegra de datos sobre la demanda de transporte. Estos datos, disponibles en forma abundante y con el nivel de detalle de cada transacción, permiten una amplia gama de estudios y aplicaciones.

Los usuarios se registran (con la posibilidad de cargar datos personales y sociodemográficos) y cargan saldos en los centros de distribución del sistema. Las transacciones son realizadas en el momento en que el usuario aproxima la tarjeta a un validador, dispositivo físico presente en los modos de transporte. Cada transacción almacena básicamente datos sobre la validación (fecha y horario de inicio del viaje o transbordo), sobre la tarjeta (usuario, número consecutivo de viaje de la tarjeta), sobre la tarifa aplicada (tarifa vigente, tipo de tarifa pagada, subsidio) y sobre el servicio (estación, línea, sentido, vehículo, etc.), todo lo cual varía de acuerdo a la implementación del sistema (Tenenbaum de Olivera et al, 2015).

La tarjeta SUBE (Sistema Único de Boleto Electrónico) es un sistema SRE para el sistema de transporte urbano del Aglomerado Gran Buenos Aires (AGBA) en sus diferentes modos (tren, subte, colectivo, etc.) instaurado en febrero de 2009. Al mismo tiempo puede utilizarse para los peajes de algunas autopistas. Es un sistema similar a los que se han implementado a lo largo de muchas ciudades del mundo (Pelletier, 2011). Las ventajas de estos sistemas son numerosas. Por un lado facilitan el proceso de movilidad en sí mismo al acelerar los tiempos de pago, permiten aplicar tarifas diferenciales según zonas mientras que al mismo tiempo relevan al conductor de realizar dicha tarea, etc. (Pelletier, 2011). Pero por otro lado, su implementación permite la recopilación de una masiva cantidad de datos administrativos de dichas transacciones cuyo potencialidad puede ser explotada a partir de un proceso de inteligencia de datos para mejorar la movilidad a partir de mejor entendimiento de patrones de viajes y operaciones sobre el sistema de transporte (Calabrese, Colonna, Lovisolo, Parata, & Ratti, 2011; Mondschein, 2014).

En el caso de Argentina, llevar adelante un proceso de inteligencia de datos sobre la SUBE podría incrementar la eficiencia del sistema en su conjunto como así también producir insights muy valiosos para elaborar políticas futuras.

Es importante distinguir entre las transacciones en el sistema SRE y los viajes. Un viaje es un movimiento desde un punto de origen a un punto de destino (Ortúzar y Willumsen, 2011). El origen y el destino son lugares en que las necesidades de los usuarios son satisfechas por la realización de actividades (Munizaga et al., 2014). Cada viaje es compuesto por una o más etapas, consideradas estas como un grupo de uno o más movimientos en un modo en particular. Los puntos de abordaje y descenso son las posiciones en que la etapa comienza y termina, respectivamente (Munizaga y Palma, 2012). Un viaje puede estar constituido por más de una etapa. Se puede caminar hasta la estación de origen del transporte público, descender en la estación de destino y caminar hasta el trabajo. También pueden tomarse más de un vehículo o modo. En este caso se consideran transbordos para designar la continuidad entre las etapas en el contexto de un mismo viaje. Estos son consecuencia de la interacción entre la red de transporte y la satisfacción de la necesidad de los usuarios (Munizaga et al., 2014). Los sistemas SRE pueden no detectar todas las etapas del viaje, con lo cual no dan cuenta del conjunto del mismo. A su vez, un mismo viaje puede estar constituido por más de una transacción en el SRE en caso de transbordos entre modos que utilicen dicho sistema.

El primer abordaje de un viaje puede ser llamado abordaje inicial; los abordajes siguientes pueden ser llamados abordajes intermedios. Similarmente, el descenso más cercano al destino del viaje será llamado descenso final y las bajadas anteriores, descensos intermedios. Durante el procesamiento, la detección acertada a partir de los datos de las transacciones entre abordajes iniciales o transbordos es altamente relevante para agrupar las etapas de los viajes y para una caracterización de la demanda que sea representativa de la realidad (Tenenbaum de Olivera et al, 2015).

El objetivo principal de este trabajo será obtener la distribución de viajes para el área de cobertura de la SUBE en la forma de una matriz origen-destino (matrix O-D). Este proceso es el segundo de los cuatro pasos del clásico modelo de “4-pasos” (four-step algorithm) en los modelos de planificación de transporte (Ortuzar et al, 2011). Posterior a la generación de viajes y anterior a las asignaciones de modos y rutas. En el mismo, se unen en parejas cada uno de los viajes producidos en las diferentes zonas con alguno de los diferentes lugares de atracción de viajes en otras zonas o en la misma zona. El resultado de este paso es una tabla de viajes entre las diferentes zonas del modelo, conocida como matriz origen-destino o matriz O-D. La matriz muestra la cantidad de viajes desde cada uno de los orígenes “i” hasta cada uno de los destinos “j”. En las filas se observan los viajes producidos o los orígenes, mientras que en las columnas los atractores o destinos. La matriz final tiene dimensiones n x n, donde n = el número de áreas. En resumen, el objetivo principal es obtener la matriz O-D para el área de cobertura de la SUBE.

Ejemplo de matriz origen destino

II- Antecedentes

Existen diversas fuentes para realizar una matriz de similares características. Una de ellas es la Encuesta de Movilidad Domiciliaria (ENMODO) realizada en 2009–2010 por la Secretaría de Transporte del Gobierno Nacional (Movilidad en el Área Metropolitana de Buenos Aires). Enmarcada dentro de las llamadas “Encuestas de Movilidad Domiciliarias” que utilizan la mayoría de las ciudades para conocer los patrones de movilidad de la población. Esta encuesta se aplica a una muestra de hogares de todo un área y se consulta sobre los viajes realizados en un día de referencia (generalmente el encuestado responde sobre sus viajes del día anterior) y se entrevista a todos los integrantes del hogar.

Por otro lado la Universidad Tecnológica Nacional (UTN) en el marco de su Centro Tecnológico de Transporte, Tránsito y Seguridad Vial pública una matriz O-D en base a la Investigación de Transporte Urbano Público de Buenos Aires (INTRUPUBA) realizada por la Secretaría de Transporte de la Nación durante los años 2006 y 2007.

Las ventajas que tendría una matriz O-D basada en datos de tarjetas inteligentes como la SUBE son numerosas (Gordon et al, 2014; Pettelier et al, 2011;Tenenbaum de Olivera et al, 2015):

  • Alcance: cobertura espacial y temporal extensiva del sistema de transporte público, en contraste con el sistema de levantamientos de campo, que son concentrados generalmente en períodos o recorridos específicos. Días de fin de semana, de grandes eventos y de tiempo meteorológico atípico, así como líneas de transporte poco utilizadas son monitoreadas de forma total y efectiva
  • Exactitud: los datos son recolectados automáticamente, siendo posible, por ejemplo, entrar en el detalle de hora-minutos-segundos exacto de la realización de la transacción. En los métodos tradicionales, en el caso de transbordo entre etapas, puede haber contabilización de dos viajes o de dos usuarios diferentes
  • Tiempo de procesamiento: con el soporte de herramientas de procesamiento y análisis, los datos pueden ser procesados rápidamente
  • Interferencia Humana: dependencia menor del encuestador en campo o del usuario, lo que puede minimizar errores de declaración
  • Escala Individual: métodos tradicionales realizan conteos agregados de pasajeros

En las desventajas puede citarse (Pettelier et al, 2011;Tenenbaum de Olivera et al, 2015; Munizaga y Palma,2012; Munizaga et al, 2014); Chu y Chapleau, 2008).

  • Estructura de datos: organizar los datos para su uso requiere tiempo dentro de una investigación. Necesidad de agregación de las etapas para definir el viaje completo
  • Validación exógena: existe la necesidad de realizar encuestas para confirmar los análisis y el uso de las premisas adoptadas
  • Posibles sesgos: la evasión tarifaria no es captada por el SRE. Una misma persona utilizando diferentes tarjetas, más de una persona utilizando la misma tarjeta (viaje en grupo) y tarjetas transferibles pueden inducir sesgos en los datos. El poseedor de una tarjeta puede, ocasionalmente, utilizar otro medio de pago
  • Error sistemático: mal funcionamiento de un validador o de una transmisión puede generar problemas de captación y procesamiento de los datos;
  • Eventos aleatorios y problemas de seguridad pública: estos tipos de eventos causan desvíos operativos que podrían confundir los análisis realizados
  • Ausencia de datos extra-transacción: no siempre existe información socioeconómica sobre el usuario. No hay información sobre el motivo del viaje. Transbordos entre las etapas del viaje y el destino final del viaje no son informados, aunque existen métodos para deducirlos, pudiendo ser evitado en “sistemas cerrados”, con control de entrada y salida

El problema con el que nos enfrentamos a la hora de construir una matriz OD con datos de la SUBE es precisamente este último. La SUBE es un sistema tap-in o tap-on únicamente, es decir, solamente activamos la tarjeta al subir al medio de transporte, no al descender del mismo. Si bien esto no es cierto para algunos trenes, sí lo es para los subtes y colectivos del Área Gran Buenos Aires (AGBA). Esto plantea un problema. Para cada viaje podemos saber el origen del mismo, pero no su destino. Otros sistemas de tarjetas inteligentes utilizan el sistema tap-in/tap-out o tap-on/tap-off para los subtes también, como la Oyster card de Londres SmarTrip de Washington DC. Sin embargo, no es así para los colectivos en ninguno de esos casos. Por otro lado, el sistema de subterráneos de la ciudad de Nueva York con la Metrocard, tampoco implementa un sistema de ese tipo, debiendo utilizar la tarjeta solo al entrar al sistema.

La creciente adopción de sistemas automatizados de recolección de datos, sin embargo, está proporcionando a los operadores de tránsito grandes set de datos desagregados, que pueden ser procesados para revelar información de viaje desde la perspectiva del pasajero. Sin embargo, esta destilación de información centrada en el pasajero no es trivial, ya que la mayoría de los sistemas automatizados de recolección de datos -como la recolección automatizada de tarifas (AFC por sus siglas en inglés automated fare collection) y la localización automatizada de vehículos (AVL por sus siglas en inglés automated vehicle location) han sido diseñados para otros fines (Gordon et al, 2014). Dada esta situación, se han planteado algunas metodologías para construir una matriz O-D a partir de tarjetas inteligentes en otros países.

Dado que otros países tienen sistemas similares para buses (Oyster Card en Londres, SmartCard en Washington, Metrocard en NYC), existen algunos trabajos con soluciones propuestas para este problema.

El trabajo de Barry (2012) para la Metrocard en la ciudad de Nueva York sienta dos supuestos fundamentales para los trabajos subsiguientes:

  • Closest stop: un alto porcentaje de pasajeros/as parten de la estación final de su viaje anterior para comenzar el siguiente
  • Daily symmetry rules: un alto porcentaje de pasajeros/as finalizan su último viaje del día en la estación donde comenzaron el primer viaje del dia

Estos supuestos fueron validados con encuestas de viajes y se validó que el 90% de los usuarios cumplían con estos supuestos. Hanft y otros (2015) por su parte, utilizaron estas metodologías para la misma tarjeta en un análisis de las rutas de los buses vinculados a Co-op City en el barrio del Bronx.

Gordon y otros (2013) utilizan estos supuestos para un análisis de la Oyster Card de Londres y agrega datos de una aplicación llamada iBus que registra los tiempos de llegada de los buses a las paradas. Agregan algunas complejidades adicionales al algoritmo como por ejemplo, eliminar casos cuyo registro siguiente en la tarjeta se encuentra en un lugar ubicado en la dirección contraria al sentido del viaje del bus inmediatamente anterior. También a la hora de decidir entre dos paradas de destino posibles por estar cerca de la parada donde se origina el viaje siguiente, calculan el tiempo de viaje a pie para cada una de las candidatas y eligen la que minimiza el tiempo de caminata. Finalmente, frente a criterios de corte absolutos en tiempo, plantea condiciones espaciales y temporales para determinar si un viaje constituye una mera etapa dentro de un viaje que incluye un transbordo, o si lo que sucede entre viajes es una actividad que generó y es el motivo detrás del viaje.

En estudios de la región, se pueden mencionar los estudios de Farzin (2008) para San Pablo, Brasil y de Munizaga y Palma (2012) para Santiago de Chile.

III- Metodología

La creación de la matriz OD para la SUBE puede construirse a partir de las metodologías citadas en los Antecedentes y tomando como válidos los supuestos utilizados en ellas y validados en numerosas investigaciones (parada más cercana y simetría diaria). Sin embargo, como primera tarea, debería proceder a validar dichos supuestos en base a la información de encuestas como la ENMODO. En segundo lugar, deben considerarse algunas particularidades de la red de transporte del AMBA y de la implementación local del sistema SRE hecha en la SUBE. Para ello ofrecemos una clarificación conceptual y exponemos las dificultades para cada modo.

Se define un Viaje como un desplazamiento entre un Origen y un Destino. El mismo puede ser realizado en un único Tramo, en tal caso el Origen y el Destino del Tramo coinciden con el del viaje. Pero también puede suceder que un mismo Viaje se realice en más de un tramo. Si hay dos tramos, tenemos

Viaje = Tramo_1 + Tramo_2 + … + Tramo_n

Tramon = Origen_n — Destino_n

En caso de que haya un solo tramo y no haya trasbordos:

Viaje = Tramo_1 = Origen_1 — Destino_1

Cuando existe un trasbordo

Viaje = Tramo_1 + Tramo_2 = Origen_1-Destino_1 + Origen_2- Destino_2 = Origen_1-Destino_2

Cada origen y destino del tramo tiene una coordenada en el espacio y en el tiempo. Para trasbordos se asume que Destinon + Origenn+1 son cercanos tanto en tiempo como en espacio. Esta presunción permite eliminar los tramos vinculados a trasbordos. Esto es necesario ya que se deben considerar las transferencias y desarrollar un método descontarlas, ya sea un rango absoluto en tiempo, distancia, una combinación de ellas o un criterio basado en los datos observados. Este criterio varía de acuerdo al modo, dado que tren, colectivo y subte tienen informacion disponible diferente para los Origenes y Destinos de cada tramo.

El tren es la situación ideal ya que se trata de estaciones fijas y un sistema cerrado con información de origen y destino en la transacción. A su vez, la disposición radial de la red y la poca interconectividad en la misma hace suponer que los transbordos dentro de dicho modo son prácticamente nulos. Aunque es una presunción a corroborar y verificar con los datos.

El subte es una situación intermedia donde se tienen puntos de origen fijos, pero se desconoce el punto de destino. Puede haber transbordos hacia el interior del subte (combinación entre líneas) que no quedan registradas en la SUBE, pero uno puede tratarlas como un único modo y hacer caso omiso de las diferentes líneas, o una vez inferido el destino dentro del modo subte, calcular el posible recorrido. Dada la configuración de la red, no hay muchas variantes posibles. Solamente la línea H tiene un trazado transversal alejada de la zona central presuntamente atractora de viaje. La línea C hace un recorrido transversal pero en un punto donde la separación de las estaciones de las diferentes líneas es de 3 cuadras para las líneas de mayor cantidad de pasajeros B, D y A.

El colectivo es la situación más precaria desde el punto de vista de disponibilidad de datos, al menos en lo que se presupone es la estructura de datos de la SUBE. Hasta no poseer la estructura final, esta es la presunción con la que trabajamos. En primer lugar comparte con el subte la situación de no conocer el destino. En segundo lugar, los datos de localización no refieren a una parada fija, sino al vehículo en movimiento con lo cual debe matchearse una posición del vehículo con una ubicación de una parada cercana. De modo que por cada proceso de tap-in de la tarjeta, obtenemos una coordenada espacio-temporal del vehículo, no de la parada. Por lo tanto, tenemos un Origen Observado y un Origen a estimar en base a cercanía en el espacio.

A continuación observamos cómo se realizaría el proceso de inferencia de Destinos para cada modo bajo la presunción de no trasbordos (que un viaje equivale a un tramo) y solo dos viajes por día.

III.a- Dos viajes por día y sin trasbordos

Tren

Para el tren conocemos la ubicación de todas las estaciones. A su vez en el tren, la SUBE funciona como tap-in/tap-out. Dada la configuración radial de la red, la posibilidad de trasbordo es mínima. En caso de verificarse deberá aplicarse algún criterio para determinar los mismos y eliminarlos. Acto seguido, construir la matriz en base a las estaciones de origen y destino agregadas para cada estación. La misma puede construirse para cualquier rango de tiempo. El problema existente puede ser que, dado que para algunos usuarios la tarifa ya es la máxima, estos no tengan estímulo a a realizar la operación tap-out. Esta situación es similar a la del subte y se resolverá utilizando la metodología del subte.

Subte

En el caso del subte, conocemos la ubicación de todas las estaciones. Sin embargo, no existe operación tap-out para salir del sistema. Por lo tanto la estación de destino debe ser inferida. Se procederá a utilizar el supuesto de simetría diaria de los viajes y analizar para cada usuario sus primeros y últimos viajes diarios en el tiempo, observando si se registra cierta regularidad en este comportamiento y asignar para cada usuario la estación más frecuente del primer viaje diario como origen, y la estación más frecuente del último viaje diario como el destino. Una vez identificado un patrón regular en origen y destino, se puede estimar la media para los tiempos de origen y destino y construir una Matriz OD para cualquier rango de tiempo.

Colectivo

La situación del colectivo es la que presenta mayor complejidad en la medida en que permite transbordos más complejos (dada la complejidad de la red) y las coordenadas geográficas del punto de origen no están basadas en un punto fijo dado que no conocemos las estaciones. En primer lugar debe realizarse un matcheo espacial de la coordenada registrada (Origen 1 observado) a la parada de la línea de colectivo más cercana (Origen 1 inferido). El mismo no es trivial dado que puede haber dos paradas relativamente equidistantes, de acuerdo al tiempo en que haya tardado el usuario esde que sube al vehículo hasta que realiza el tap-in. Dicho proceso puede extenderse significativamente durante horas pico donde los colectivos funcionan a capacidad saturada. Una vez obtenido dicho matcheo, se vuelve a trabajar con el supuesto de simetría diaria de los viajes

Como dificultad adicional, la información sobre paradas de colectivos existentes y su calidad es una incógnita especialmente para áreas alejadas del centro urbano consolidado aunque existen fuentes no oficiales de donde se pueden consultar (Google Maps, Open Street Maps, Open Access Map, etc.).

También se deben identificar, en la medida de lo posible, para cada linea sentido del viaje y el set de posibles estaciones siguientes como destino para validar que el destino inferido tenga sentido. Por ejemplo si un usuario se toma un colectivo de Almagro con dirección al centro de acuerdo al recorrido de esa línea y su siguiente transacción como ingreso aparece en una parada en Villa Ortuzar, debemos asumir el uso de un modo que no utilice la SUBE en el medio.

III.b-Más de dos viajes por día y sin cambios modales

Tren

En este escenario tenemos una persona que por la mañana viaja a Retiro desde Tigre para trabajar a la mañana, luego va a Belgrano a estudiar por la tarde y finalmente vuelve a su casa en Tigre por la noche.

El mismo recorrido puede ser fácilmente reconstruido con los datos de la SUBE dada la disponibilidad de datos previamente descrita.

Modelo de viaje Más de dos viajes por día y sin cambios modales — TREN

Subte

El siguiente caso presenta un escenario similar, solo que en subte. Una persona que por la mañana viaja al Microcentro desde Belgrano para trabajar a la mañana, luego va a la Zona de facultades a estudiar por la tarde y finalmente vuelve a su casa en Belgrano por la noche. Observamos 3 viajes (V1, V2, V3).

Modelo de viaje Más de dos viajes por día y sin cambios modales — SUBTE

En este caso asumimos que solo tendremos los siguientes datos

1–1–2016 Tap-in 8 hs estación Juramento

1–1–2016 Tap-in 18 hs estación Catedral

1–1–2016 Tap-in 21 hs estación Facultad de Medicina

2–1–2016 Tap-in 8 hs estación Juramento

2–1–2016 Tap-in 18 hs estación Catedral

2–1–2016 Tap-in 21 hs estación Facultad de Medicina

En este caso el principio de Closest stop nos permite inferir a partir del tap-in 18 hs en estación Catedral como el Destino1. Lo mismo de el tap-in 21 hs de estación Facultad de Medicina como Destino2. Finalmente el tap-in al dia siguiente en Juramento, en coincidencia con el del primer día, para inferir como Destino3. También el principio de Daily symmetry rules permitiría presumir que el último destino del día coincide con el primero.

La dificultad está en Facultad de Medicina. Sabemos el ingreso al subte a las 18hs en Catedral y el ascenso a las 21 hs en Facultad de Medicina. Asumimos que ese fue la estación de destino de su primer viaje, y dado que los tiempos de viaje en subte son relativamente homogéneos, no puede haber tardado más de 30 minutos de viaje entre ambos puntos. Por lo tanto pasó un tiempo neto de 2 horas 30 minutos en esa zona. Esa ventana de tiempo ofrece un razón suficiente para asumir que se trata de dos viajes diferentes entre dos propósitos o tareas diferentes. Aquí asumimos puede ser estudio, pero puede ser cualquiera. No se trata de un trasbordo en virtud de la distancia en el tiempo. La distancia en espacio también es pequeña, de hecho es nula, dado que asumimos que se toma la misma línea de subte, en la misma estación (presumiblemente, podría haber bajado en Callao y caminado hasta un bar a mitad de camino y luego tomar a la vuelta a casa en Facultad). En virtud de esas distancias espacio-temporales breves, por debajo de determinado límite de tolerancia a establecer, se considera como dos viajes separados, con motivos específicos vinculados a actividades diferentes.

Colectivo

El escenario siguiente supone un recorrido similar para el colectivo de la línea 24.

Modelo de viaje Más de dos viajes por día y sin cambios modales — COLECTIVO

1–1–2016 Tap-in 8 hs lat, long en Cid Campeador

1–1–2016 Tap-in 18 hs lat, long en Microcentro

1–1–2016 Tap-in 21 hs lat, long en Once

2–1–2016 Tap-in 8 hs lat, long en Cid Campeador

2–1–2016 Tap-in 18 hs lat, long en Microcentro

2–1–2016 Tap-in 21 hs lat, long en Once

La diferencia en relación al subte es que a partir de una coordenada debemos inferir la parada de dicha línea de colectivo más cercana a la coordenada del vehículo al momento en que sube, lo cual observamos que puede inferirse con determinado margen de error en virtud del tiempo que tarda el usuario entre subir a la unidad y realizar el tap-in. Esto complica la medición de distancias en tiempo y espacio entre paradas de colectivos.

En el tren uno conocía el momento y lugar del ascenso y descenso del usuario y sabía que dicha coordenada coincide siempre con una estación conocida. Mientras que en el subte uno asumía el descenso en base al siguiente ascenso, siempre operaba con estaciones cuya posición conoce para el ascenso e infiere para el descenso en base al ascenso conocido siguiente. Pero en el colectivo también se infiere la posición concreta de la estación de ascenso. Individualmente para este caso no es problema. Dado que toma la misma línea que su viaje anterior y considera que no hay trasbordo (dado la ventana de tiempo) por lo tanto uno infiere la estación en Once y simplemente asume que fue esa misma estación el destino del viaje 2. Sin embargo, esto se propaga a la hora de considerar trasbordos.

En lo referente a la distancia temporal, la dispersión en los tiempos de viaje es mayor. Con lo cual esa ventana entre el el tap-in de las 18hs y el de las 21hs es también más incierta. Es decir, no solo el tiempo de viaje en colectivo es más difícil de predecir, si hubo un accidente o mucho tránsito, podría haber llegado a Once tanto en horarios muy disímiles, puede haber hecho rápido y llegar a las 18:30hs como a las 19:00hs o incluso más tarde.

III.c-Escenarios con cambios modales

Consideramos trasbordo al cambio entre dos modos. En este escenario, la persona que desciende de un modo lo hace solo para poder combinar con otro. Su destino final no es el la parada de descenso del modo 1, sino la del modo 2 o el modo n final si hay más de un trasbordo. El criterio a determinar esto es si existe o no una actividad legítima que haya atraído al usuario a ese lugar (Ortúzar y Willumsen, 2011; Munizaga et al., 2014;Munizaga y Palma, 2012).

Los transbordos hay que netearlos de las matrices origen destino. Son tramos de un viaje, no viajes en sí mismos. Cuando no hay cambio modal, los transbordos son más sencillos de determinar. Nadie desciende del modo en el que se transporta para volver a tomarse el mismo si no hay un motivo legítimo para ello. Si uno cambia de modo esto puede deberse a un trasbordo (el modo 1 no llevaba al destino final y debo pasar de modo 1 al modo 2) o que no hay transbordo, tome el modo 1 para ir de una actividad a otra y el modo 2 para ir de esta última actividad a mi hogar por ejemplo.

¿Cómo determinar esto a partir de datos de la tarjeta inteligente? Uno puede operacionalizar el trasbordo si asume que entre el descenso del modo 1 y el ascenso del modo 2 no media una distancia significativa tanto en tiempo como espacio. En tiempo porque una actividad legítima consume un determinado tiempo. Pero también puede ser que no sea el caso, que sea una actividad que consume poco tiempo, pero que implica un traslado a pie de mayores distancia (por ejemplo realizar un trámite o tarea administrativa que consume poco tiempo). En este caso, entre la estación de descenso del modo 1 y la del ascenso del modo 2, habrá una distancia en espacio mucho mayor que la que habría si fuese un mero trasbordo, donde el usuario busca minimizar esa distancia. Si hay una actividad que atrajo al usuario a esa zona, la estación de descenso del modo 1 se establecerá en función de dicha actividad y no de la estación de ascenso del modo 2.

Tren

El transbordo de tren a tren es poco probable. Las líneas entre sí están muy separadas y coinciden en el centro. Es posible un descenso en Estación Belgrano R del ramal Mitre — Retiro / Suarez / Mitre para subirse en Belgrano C del ramal Mitre — Retiro / Tigre. Pero es muy improbable, el destino de ambos es Retiro.

De tren a subte es más probable. Uno puede tomar como ejemplo la Estación Carranza. En ese caso el escenario es sencillo ya que sabemos el descenso (en tiempo y espacio) en Carranza del Mitre por el tap-out y un inmediato tap in en Carranza de la Línea D.

De tren a colectivo uno conoce el descenso en tiempo y espacio en la estación de tren, y dado que conoce la ubicación de la unidad del colectivo, la línea y el momento del tap-in (más/menos el tiempo que tarde desde que sube a hacer tap-in) uno puede asumir con relativa sencillez la localización espacial de la parada donde el usuario ascendió al colectivo. Se trata de reducir las paradas posibles del colectivo al que el usuario se subió primero partiendo del sentido que la unidad se encuentra recorriendo, para luego basado en el tiempo transcurrido entre el tap-out del tren y el tap-in del colectivo y una velocidad de caminata media, las paradas accesibles en ese rango para esa linea de colectivo con el recorrido en ese sentido.

Subte

De subte a tren, desconocemos el tiempo y espacio del descenso, pero sabemos tiempo y espacio del ascenso en la estación de tren. Eso limita el rango posible de paradas de descenso del subte. Sabemos con mayor precisión cuanto tarda en llegar el subte de la estación de origen a cualquier estación. Por lo tanto, dado que conocemos con alta probabilidad la ubicación espacial de la estación de subte donde se descendió, podemos calcular la ventana de tiempo que hubo entre el descenso del subte y el ascenso al tren y determinar si se trata de un mero trasbordo o un viaje con propósito legítimo en sí mismo.

Subte a subte, en la medida en que podemos considerar a toda la red de subte como un único modo, podemos no considerarlo trasbordo. Además no hay tap-in para ingresar a otra línea dentro del subte. Puede darse caso de una persona que por ejemplo vive en Flores y trabaja en Villa Urquiza. Sube en San Pedrito de la línea A hasta Castro Barros, camina hasta Medrano de la línea B y desciende en Juan Manuel de Rosas. Sólo en este caso registraríamos dos tap in en un corto plazo. Sin embargo esta es una situación poco probable, pero que de todos modos se comporta de modo similar al trasbordo subte-tren.

Subte a colectivo. En este caso conocemos el tiempo, espacio y sentido de la unidad de colectivo a la que se asciende. Asumiendo que no hay un lag significativo entre momento de ascenso a la unidad y el tap-in, se puede determinar la posición de la parada de la unidad en base a la línea y el sentido. En base a esta parada de ascenso al colectivo, podemos ubicar la parada más cercana de subte. Conociendo tiempo y espacio de la estación de origen del subte, y estimando con relativa precisión el tiempo de viaje de la estación a otra en subte, podemos conocer también la ventana de tiempo entre el descenso del subte y el ascenso al colectivo, para determinar si se trata de un trasbordo o son dos viajes separados por dos motivos y actividades diferentes.

Colectivo

Colectivo a tren. Conocemos con precisión el tiempo y espacio del ascenso al tren. Conocemos el tiempo, espacio y sentido de la unidad del colectivo al momento del ascenso, pero no del descenso. Dado el ascenso del tren, uno puede ubicar en el espacio las estaciones de esa linea de colectivo para el sentido que tenía la unidad en la que se subió el usuario. Con eso, uno puede estimar con mayor dificultad que el subte, el tiempo de viaje en colectivo desde la parada de origen a esas paradas posibles. Uno puede tomar la de menor distancia a la estación de tren como la de mayor probabilidad. Si la ventana de tiempo es pequeña, uno puede considerar esta situación como un trasbordo y asumir que la estación de destino del colectivo era la más cercana a la estación de tren. Asumimos que el usuario intenta minimizar la distancia de caminata entre ambas. Sin embargo, si la ventana de tiempo es amplia entre el descenso estimado del colectivo y el ascenso conocido del tren, esto significa que hay una actividad que atrajo al usuario a la zona. Por lo tanto, uno no puede asumir que la parada de descenso del colectivo fue la más cercana a la parada de tren.

Colectivo a subte. Dado que tanto para tren como para subte, la información disponible es la misma, podemos aplicar el mismo método para ambos casos.

Colectivo a colectivo. Esta es la situación de mayor incertidumbre dado que no conocemos con precisión ni el tiempo ni el lugar de descenso del primer colectivo, no conocemos con precisión el tiempo de viaje en colectivo, y hasta podemos asumir un cierto lag temporal entre el ascenso a la unidad del segundo colectivo y el tap-in efectivo en dicha unidad.

En el ejemplo de cambio de modo sin trasbordo, donde el usuario se tomaba el 24 como colectivo de V2 y como colectivo de V3, se podía asumir la misma parada de ascenso del segundo viaje como la de descenso del primer viaje. Se tomaba el 24 en Lavalle para volver al Cid y usábamos la estación de Lavalle como de destino de V2 y de origen de V3. Al haber tomado la misma línea en el mismo sentido implica que hubo una actividad que lo obligó a descender. Entendemos que no hay un transbordo allí.

Ahora asumamos que se toma el 106 en avenida Córdoba en la plaza. Puede ser un trasbordo o no. En un punto, ambas líneas son alternativas competitivas entre sí con respecto al destino que asumimos en este ejemplo, el Cid. El usuario podría haber continuado en el 24 en lugar de descender y tomar el 106. Sabiendo el destino final a partir del supuesto de que el último destino del día equivale al primero del día, podemos asumir que esta situación no se trata de un trasbordo, si no que hubo una actividad legítima entre ambos viajes. Pero eventualmente podemos abstraernos de la línea de colectivo en sí y procurar determinar de tiempo y espacio entre ambos viajes o trayectos. Asumiendo que en V3 no hay lag de tiempo entre el ascenso al colectivo y tap-in, y que por lo tanto la distancia en tiempo y espacio entre la unidad de colectivo y la parada de esa línea para ese sentido es mínima, podemos saber con relativa precisión el tiempo y espacio de la estación de origen de V3. Asumiendo lo mismo para la estación V2, ahora se trata de estimar un tiempo de viaje en colectivo desde la estación de origen V2 a la estación de origen V3. Esta situación se vuelve similar al trasbordo con el subte o tren. Si descontando ese tiempo de viaje, la ventana de tiempo restante es muy corta, uno asume que hay un trasbordo, que no hay actividad legítima mediando y que la parada de destino V2 será la que minimice la distancia de caminata con la estación V3, es decir la estación de la línea de colectivo (para el sentido en el que se lo tomó el usuario en V2) más cercana a la estación de origen de V3.

En caso de que esa ventana de tiempo sea más amplia, la inversa crece. Dado que en esa zona había una actividad legítima que atrajo al usuario a la misma, con lo cual ese supuesto de estación más cercana a la estación de origen de V3, ya no es tal. En nuestro ejemplo el usuario puede haberse bajado en las paradas de la línea 24 en sentido Oeste de Lavalle al 2000 o al 2300 o estaciones aledañas.

Para reducir estas incertezas, para colectivos vamos a asumir que no existe lag entre ascenso a la unidad y tap-in. Es decir que la distancia en tiempo y espacio entre la unidad y la estación de origen al momento del tap-in tiende a 0. Con lo cual, se imputará como estación de origen la estación más cercana para esa línea en el sentido en que la unidad se dirigía al momento del tap-in. Esto convierte el escenario del colectivo en un escenario de estaciones fijas y conocidas, asimilable al subte. Con lo cual, uno puede determinar la estación de destino en base a los supuestos antes mencionados Closest stop y Daily symmetry rules. Para el ejemplo mencionado previamente, se asumirá que la parada de destino de V2 es la más cercana a la estación de origen de V3, haya o no trasbordo, haya o no ventana amplia de tiempo.

IV- Referencias

Alsger, A., Mesbah, M., Ferreira, L., Safi, H. (2015) Public Transport Origin-Destination Estimating Using Smart Card Fare Data. Presented at 94th Annual Meeting of the Transportation Research Board, Washington, D.C., 2015.

Banks J. (1998) Introduction to transportation Engineering. Mc Graw-Hill

Barry, J.J., Newhouser, R., Rahbee, A., Sayeda, S. (2002) Origin and Destination Estimation in New York City with Automated Fare System Data. Transportation Research Record: Journal of the Transportation Research Board №1817,183–187

Barry, J. J., R. Freimer, and H. L. Slavin. (2009) Use of Entry-Only Automatic Fare Collection Data to Estimate Linked Transit Trips in New York City. In Transportation Research Record: Journal of the Transportation Research Board, №2112, Transportation Research Board of the National Academies, Washington, D.C., 2009, pp. 53–61.

Calabrese, F., Colonna, M., Lovisolo, P., Parata, D., & Ratti, C. (2011). Real-time urban monitoring using cell phones: A case study in Rome. Intelligent Transportation Systems, IEEE Transactions on, 12(1), 141–151.

Chu, K. K. A., and R. Chapleau (2010). Augmenting Transit Trip Characterization and Travel Behavior Comprehension: Multiday Location-Stamped Smart Card Transactions. In Transportation Research Record: Journal of the Transportation Research Board, №2183, Transportation Research Board of the National Academies, Washington, D.C., 2010, pp. 29–40. https://trid.trb.org/view.aspx?id=910384

Cui, A. (2006) Bus Passenger Origin-Destination Matrix Estimation Using Automated Data Collection Systems. Tesis de Maestría. Massachusetts Institute of Technology, USA.

Farzin, J. M. (2008) Constructing an Automated Bus Origin–Destination Matrix Using Farecard and Global Positioning System Data in São Paulo, Brazil. In Transportation Research Record: Journal of the Transportation Research Board, №2072, Transportation Research Board of the National Academies, Washington, D.C., 2008, pp. 30–37. http://trrjournalonline.trb.org/doi/abs/10.3141/2072-04

Gordon, J; Koutsopoulos, H.; Wilson, N. & Attanucci, J. (2013) Automated Inference of Linked Transit Journeys in London Using Fare-Transaction and Vehicle Location Data. Transportation Research Record: Journal of the Transportation Research Board, Volume 2343, ISSN 0361–1981, http://dx.doi.org/10.3141/2343-03

Hanft, J.; Lyer, S. ; Levine, B. & Reddy, A. (2015) A novel approach for transforming bus service planning using 2 integrated electronic AFC & AVL data at MTA in New York City Presented at 95th Annual Meeting of the Transportation Research Board, Washington, D.C., 2016.

Lu, Alex, and A.V. Reddy (2011). Algorithm to Measure Daily Bus Passenger Miles Using Electronic Farebox Data for National Transit Database Section 15 Reporting. In Transportation Research Record: Journal of the Transportation Research Board 2216, pp. 19–32 (2011).

Mondschein, A. (2014) Re-Programming Mobility. Literature Review. Rudin Center for Transportation Policy and Management. NYU. United States. Disponible en: http://reprogrammingmobility.org/wp-content/uploads/2014/09/ReProgrammingMobility-LitReview-08.04.2014.pdf

Munizaga, M., & C. Palma (2012) Estimation of a Disaggregate Multimodal Public Transport Origin-Destination Matrix from Passive Smartcard Data from Santiago, Chile. Transport Research Part C: Emerging Technologies, Vol. 24, 2012, pp. 9–18.

http://www.sciencedirect.com/science/article/pii/S0968090X12000095?via%3Dihub

Munizaga, M., Devillaine, F., Navarrete, C., Silva, D. (2014) Validating travel behavior estimated from smartcard data. Transportation Research Part C Emerging Technologies 44, 70–79. http://www.sciencedirect.com/science/article/pii/S0968090X14000801?via%3Dihub

Navick, D. S., and P. G. Furth (2002). Estimating Passenger Miles, Origin-Destination Patterns, and Loads with Location-Stamped Farebox Data. In Transportation Research Record: Journal of the Transportation Research Board, №1799, Transportation Research Board of the National Academies, Washington, D.C., 2002, pp. 107–113.

Ortuzar, J. D. D., & Willumsen, L. G. (2011). Modelling transport.John Wiley & Sons.

Pelletier, M.P., Trépanier, M. & Morency C. (2011), Smart card data use in public transit: A literature review, Transportation Research Part C: Emerging Technologies, Volume 19, Issue 4, 2011, Pages 557–568, ISSN 0968–090X, http://dx.doi.org/10.1016/j.trc.2010.12.003. (http://www.sciencedirect.com/science/article/pii/S0968090X1000166X)

Reddy, Alla V., A. Lu, S. Kumar, V. Bashmakov, and S. Rudenko (2009). Entry-Only Automated Fare-Collection System Data Used to Infer Ridership, Rider Destinations, Unlinked Trips, and Passenger Miles. In Transportation Research Record: Journal of the Transportation Research Board, №2110, Transportation Research Board of the National Academies, Washington, D.C., 2009, pp. 128–136.

Trépanier, M., Chapleau, R. (2006) Destination estimation from public transport smart card data. In: The 12th IFAC symposium on Information Control Problems in Manufacturing, Saint-Etienne, France

Trépanier, M., N. Tranchant, and R. Chapleau (2007). Individual Trip Destination Estimation in a Transit Smart Card Automated Fare Collection System. Journal of Intelligent Transportation Systems, Vol. 11, №1, 2007, pp. 1–14.

Tenenbaum de Olivera, G. & Nassi, C.D. (2015) Estimación de matriz origen-destino a partir de datos de tarjetas inteligentes: una revisión bibliográfica. Ingeniería de transporte, Volumen 19, Nº 01, 73–86. Universidad Federal de Rio de Janeiro / Programa de Engenharia de Transportes / COPPE, Brasil

Disponible en: http://www.ingenieriadetransporte.org/index.php/sochitran/article/view/144. Consultado el 12/09/2017

Zhao, J., A. Rahbee, and N. H. M. Wilson (2007). Estimating a Rail Passenger Trip Origin-Destination Matrix Using Automatic Data Collection Systems. Computer-Aided Civil and Infrastructure Engineering, Vol. 22,№5, 2007, pp. 376–387.

--

--

Urban Data Scientist Twitter: @lephcero. Github: /alephcero

Love podcasts or audiobooks? Learn on the go with our new app.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store