Estimación de intenciones de cruce mediante modelos basados en grafos y datos de cámaras de tráfico globales
Sistemas en Tiempo Real - Sistemas Embebidos
Predicción de intenciones de cruce por parte de peatones en el mundo
Descripción
Este proyecto tiene como objetivo desarrollar un sistema predictivo capaz de estimar la intención de cruce de peatones utilizando como fuente de datos cámaras de tráfico instaladas en diferentes entornos viales del mundo. El trabajo se centrará en entrenar y comparar modelos de predicción a partir de imágenes reales obtenidas de flujos de vídeo en tiempo real, con el fin de analizar posibles diferencias culturales en el comportamiento de cruce. Como parte del proyecto será necesario construir una base de datos propia a partir de secuencias capturadas desde webcams públicas, lo que incluirá la extracción, selección y etiquetado de los ejemplos relevantes. Para acelerar el proceso de anotación se podrán emplear modelos preentrenados de detección, como YOLO, que servirán de apoyo para generar etiquetas iniciales y refinar posteriormente el dataset. El proyecto explorará el uso de Redes Neuronales en Grafos (Graph Neural Networks, GNN) y/o Knowledge Graphs (KG) para mejorar la predicción mediante la integración de información contextual, espacial y visual.
Requisitos
- Conocimientos básicos machine-learning/AI.
- Programación en Linux (100%).
- Conocimientos previos necesarios: Programación en Python, uso de Git, manejo de PyTorch.
Lo que aprenderás
- Procesamiento de señales en tiempo real para aplicaciones de seguridad.
- Diseño de sistemas orientados a la asistencia en la conducción.
- Conceptos de redes neuronales basadas en grafos aplicadas a detección e inferencia.
- Aplicaciones avanzadas de machine learning en el análisis de comportamiento humano.
🇬🇧 English Version
Real-Time Systems - Embedded Systems
Estimation of Crossing Intentions Using Graph‑Based Models and Global Traffic‑Camera Data
Description
This project aims to develop a predictive system capable of estimating pedestrian crossing intention using traffic cameras installed in different road environments around the world as the primary data source. The work will focus on training and comparing prediction models based on real images obtained from real‑time video streams, with the goal of analyzing potential cultural differences in crossing behavior. As part of the project, it will be necessary to build a custom database from sequences captured through public webcams, including the extraction, selection, and annotation of relevant examples. To accelerate the labeling process, pretrained detection models such as YOLO may be used to generate initial annotations that can later be refined to improve dataset quality. The project will explore the use of Graph Neural Networks (GNNs) and/or Knowledge Graphs (KGs) to enhance prediction by integrating contextual, spatial, and visual information.
Requirements
- Basic knowledge of machine learning and AI.
- Programming in Linux (100%).
- Required prior knowledge: Python programming, Git usage, and experience with PyTorch.
What You’ll Learn
- Real‑time signal and image processing for safety‑related applications.
- Design of systems oriented toward driver‑assistance technologies.
- Concepts of graph‑based neural networks applied to detection and inference.
- Advanced machine learning techniques for analyzing human behavior.