Skip to content

Methodologie

Isabelle Eysseric edited this page Sep 10, 2024 · 5 revisions

Base de données

La base de données choisie pour l'entraînement préalable du réseau à convolution provient d'allemagne et s'appelle the German Traffic Sign Recognition Benchmark (GTSRB) et elle contient quarante 43 et plus de 50 000 images.



Figure 1: Base de données allemandes

Pour l'apprentissage par transfert on avait besoin d'une petite base de données de panneaux québécois. Puisqu'il n'en existait pas publiquement, on a dû créer notre propre échantillon d'images de panneaux québécois avec l'application Google Earth dans Street View. On a maintenant plus de 450 images et 25 classes comparables à celle de GTSRB.



Figure 2: Base de données québécoises


Outils

Nous avons utilisé GitHub afin de réunir tout notre matériel à une seule place c'est-à-dire la base de données, le code et le fichier de présentation. Aussi l'application Colaboratory de Google a été choisie afin de bénéficier gratuitement du GPU et de travailler sur le même document en même temps. Ça permet également de sauver notre modèle sur le Drive et de synchroniser le tout avec GitHub. Nous utilisons la librairie PyTorch pour ce projet.


Figure 3: Les outils de développement.


Analyse

En ouvrant les fichiers avec l'extension csv, on constate que les images n'ont pas toutes la même dimension. Aussi, le jeu de données est biaisé car la répartition des données par classe est bien trop variable. Il va donc falloir avant tout réduire le nombre de classes et uniformiser la taille des images.

Figure 4: Analyse des données avec de gauche à droite le fichier csv, le contenu du dossier GTSRB et le graphique avec le nombre d'images par classe des données allemandes.


Prétraitement

En prétraitement, nous avons finalement uniformisé la taille des images à 64x64, normalisée en mettant les données à l'échelle en fonction de la moyenne et l'écart type. Aussi puisque nous avons trop peu de données dans certaines classes et qu'elles n'apparaissent pas dans notre jeu de données du Québec, nous avons gardé une dizaine de classes dont la limitation de vitesse, la priorité, le céder le passage, l'arrêt, le passage interdit, les écoliers, le tourner à droite ou à gauche.

Ensuite nous avons enchaîné plusieurs transformations dont certaines aléatoires afin de rendre notre modèle plus robuste et d'autres pour avoir le format nécessaire à notre modèle.


Figure 5: Prétraitement des données.


Clone this wiki locally