Spécialisé dans l'annotation de l'IA physique — Robotique, systèmes autonomes et données de formation en IA incarnée

Spécialisé dans l'annotation de l'IA physique

Transformez le développement de votre véhicule autonome en maîtrisant ces meilleures pratiques d'annotation des données.

3 juil. 2024

Transformez le développement de vos véhicules autonomes en maîtrisant ces meilleures pratiques d'annotation de données - En-tête de blog
Transformez le développement de vos véhicules autonomes en maîtrisant ces meilleures pratiques d'annotation de données - En-tête de blog
Transformez le développement de vos véhicules autonomes en maîtrisant ces meilleures pratiques d'annotation de données - En-tête de blog

Bonjour, camarades IA et passionnés de véhicules autonomes!

Vous vous êtes déjà demandé comment ces voitures autonomes futuristes "voient" réellement le monde? Eh bien, prenez un café et installez-vous, car je vais vous révéler un des secrets les mieux gardés de l'industrie : l'annotation des données.

Ayant suivi de près le développement des véhicules autonomes pendant des années, je peux dire avec confiance que la bonne annotation des données est le héros méconnu de chaque projet réussi. Ce n'est peut-être pas l'aspect le plus glamour, mais c'est là que la vraie magie opère.

Pourquoi devriez-vous vous soucier de l'annotation des données?

D'accord, imaginez ceci : Vous roulez dans une rue animée dans une voiture autonome (c'est plutôt cool, non ?) quand soudain, un enfant surgit de nulle part. À ce moment-là, votre voiture doit repérer l'enfant, deviner où il se dirige, et prendre une décision en une fraction de seconde pour garder tout le monde en sécurité. Et vous savez ce qui rend tout cela possible ? Vous l'avez deviné – des données correctement annotées.

Pensez à l'annotation des données comme à l'enseignement à votre voiture de voir. Nous étiquetons littéralement des images et des images vidéo pour montrer à la voiture, "Hé, voici un piéton ; ça, c'est un panneau d'arrêt, et attention à ce cycliste !"

Je me souviens d'avoir travaillé avec cette startup – ils pensaient pouvoir faire des économies sur l'annotation. Grosse erreur. Leur prototype confondait constamment de petits enfants avec des hydrants. Aïe ! Ce n'est pas exactement le genre de confusion que vous voulez quand des vies sont en jeu, n'est-ce pas ?

Les détails de l'annotation des données

Maintenant, explorons un peu plus en profondeur l'annotation des données. Ce n'est pas seulement une question de coller des étiquettes sur des images. Nous parlons de marquer méticuleusement chaque objet important dans une scène.

Par exemple, dans une scène de rue typique, nous pourrions avoir besoin d'étiqueter :

– Véhicules (voitures, camions, bus, motos)
– Piétons (marchant, courant, debout)
– Cyclistes
– Feux de circulation et leur état actuel
– Panneaux de signalisation
– Marquages de chaussée
– Bâtiments
– Arbres et autres végétaux
– Obstructions sur la route

Et ce n'est qu'une première étape. Nous devons également considérer des choses comme :

– La direction dans laquelle les objets se déplacent
– Leur vitesse
– Leur distance par rapport à la voiture
– Toutes obstructions partielles

C'est beaucoup, n'est-ce pas ? Cependant, ces détails sont cruciaux pour aider un véhicule autonome à comprendre son environnement et prendre des décisions sécuritaires.

Alors, comment pouvons-nous faire cela correctement ?

1. La cohérence est la clé

Tout d'abord, nous devons nous assurer que tout le monde est sur la même longueur d'onde. Lorsque nous étiquetons des objets, nous avons besoin de règles claires. Par exemple, nous nous contentons-nous de décrire la partie visible d'un piéton, ou devinons-nous où se trouve le reste de son corps derrière cette voiture garée ? Quoi que nous décidions, nous y restons – pas d'exceptions.

Cette cohérence est super importante, car nos modèles d'IA apprennent à partir de modèles. Si nous sommes incohérents, nous enseignons essentiellement à notre voiture à être confuse, et une voiture confuse n'est pas quelque chose que vous voulez sur la route !

2. Variez les situations

Voici une erreur de débutant que je vois tout le temps : former des voitures sur des routes californiennes parfaites et ensoleillées. Petite nouvelle : le monde n'est pas toujours ensoleillé ! Nous devons inclure toutes sortes de conditions météorologiques, différents moments de la journée, divers lieux. Votre voiture devrait se sentir tout aussi à l'aise dans une rue enneigée de New York que sur une autoroute poussiéreuse du Texas.

J'ai une fois lu à propos d'un projet où ils ont réalisé que leur performance nocturne était terrible. 90 % de leurs données d'entraînement provenaient d'une conduite de jour. Une fois qu'ils ont équilibré cela, leur voiture a soudainement eu des lunettes de vision nocturne !

3. Attendez-vous à l'inattendu

Vous vous rappelez ce moment où vous avez vu une voiture avec un sapin de Noël fixé au toit ? Ou ce gars en costume de T-Rex traversant la rue ? Ces situations bizarres ne se produisent pas souvent, mais quand elles se produisent, votre voiture doit être prête. Nous appelons cela des "cas limites", et ils sont super importants.

En fait, ces cas limites représentent le véritable défi du développement des véhicules autonomes. Il est facile de gérer les choses quotidiennes, mais ces scénarios rares et inattendus distinguent les bons véhicules autonomes des grands.

4. Utilisez les bons outils

Imaginez que vous essayiez de peindre un chef-d'œuvre avec une brosse à dents. Frustrant, n'est-ce pas ? Il en va de même pour l'annotation. Les tâches simples pourraient n'avoir besoin que d'outils essentiels, mais lorsque nous traitons des choses complexes en 3D, nous avons besoin des gros outils. J'ai vu des équipes doubler leur vitesse simplement en mettant à niveau leur logiciel.

Il existe des tonnes d'outils d'annotation, allant des options open-source comme celles que nous avons partagées dans un précédent article de blog intitulé Top 10 des outils d'annotation de données open source pour la vision par ordinateur à des logiciels commerciaux haut de gamme. La clé est de trouver celui qui correspond le mieux à vos besoins spécifiques. Soyez audacieux et essayez quelques options différentes avant de vous fixer sur une.

5. Vérifiez tout deux fois

Même les meilleurs d'entre nous font des erreurs. C'est pourquoi nous devons toujours, toujours revérifier notre travail. Dans un projet dont j'avais entendu parler, les erreurs ont été réduites de 30 % simplement en ayant des personnes qui révisaient le travail des autres. Pas mal ! Ce contrôle qualité rigoureux est crucial lorsque nous travaillons avec une technologie qui pourrait littéralement sauver des vies.

Il serait préférable de toujours envisager de mettre en place un processus de révision en plusieurs étapes :

1. Annotation initiale
2. Révision par les pairs
3. Révision par un expert
4. Vérifications aléatoires

Cela peut sembler excessif, mais quand vous travaillez avec une technologie qui pourrait littéralement sauver des vies, vous ne pouvez pas être trop prudent.

La touche humaine dans un monde d'automatisation

Vous pensez peut-être, "Ne pouvons-nous pas simplement automatiser tout cela ?" Bien sûr, il existe d'excellents outils d'annotation assistés par IA comme LabelBox ou Prodi.gy. Ils peuvent accélérer les choses. Mais voici la chose : nous avons toujours besoin de cette touche humaine.

Pourquoi ? Parce que les humains sont encore meilleurs pour comprendre le contexte et prendre des décisions dans des situations délicates. Une IA pourrait étiqueter une personne portant un grand miroir comme deux personnes, mais un humain comprendrait ce qui se passe réellement.

De plus, avoir des humains dans la boucle nous aide à repérer ces cas limites bizarres que j'ai mentionnés plus tôt. Les outils d'IA sont excellents pour des tâches routinières, mais les humains sont essentiels pour repérer et étiqueter correctement l'inattendu.

Élargir : Comment gérer des ensembles de données massifs

Un des plus grands défis dans le développement des véhicules autonomes est la quantité énorme de données que nous devons traiter. Nous parlons de millions d'images et d'images vidéo. Comment pouvez-vous annoter tout cela sans devenir fou (ou ruiné) ?

Voici quelques stratégies que j'ai vues fonctionner efficacement :

1. Priorisez vos données : Toutes les données ne sont pas égales. Concentrez vos efforts d'annotation les plus détaillés sur des scénarios divers et difficiles.

2. Utilisez l'apprentissage actif : C'est une technique cool où votre modèle d'IA vous aide à choisir quelles données annoter ensuite. L'apprentissage actif peut réduire considérablement la quantité de données que vous devez étiqueter.

3. Utilisez la pré-annotation : Créez des étiquettes initiales en utilisant des modèles existants, puis faites-les affiner par des humains. Cela peut faire gagner énormément de temps.

4. Externalisez judicieusement : De nombreuses entreprises externalisent l'annotation des données. Si vous optez pour cette solution, assurez-vous simplement d'avoir des mesures de contrôle qualité robustes en place. Si l'externalisation vous intéresse, assurez-vous de consulter nos pages de services d'annotation de données et de labellisation de données, car nous sommes fièrement partenaires de nombreuses entreprises qui nous font confiance avec leurs données sensibles.

Vérité : Comment cela se passe dans le monde réel

Laissez-moi vous raconter une petite histoire. J'étais en discussion avec une entreprise de véhicules autonomes qui rencontrait des difficultés avec leur conduite urbaine. Leurs voitures étaient excellentes sur les autoroutes, mais perdues en ville. Ils ont approfondi le sujet et ont découvert que leurs données d'entraînement avaient besoin d'être améliorées dans des scénarios urbains.

Ainsi, ils ont retroussé leurs manches et se sont mis au travail. Ils ont collecté des tonnes de nouvelles données provenant de zones urbaines animées et se sont assurés qu'elles étaient toutes parfaitement étiquetées. Le résultat ? Leurs voitures sont devenues 40 % meilleures pour naviguer dans les rues de la ville, et le nombre de fois où un humain devait intervenir a diminué de 25 %. Nous parlons d'années d'économisées sur leur calendrier de développement. Plutôt cool, non ?

Mais il ne s'agissait pas seulement d'ajouter plus de données. Ils devaient vraiment se concentrer sur la qualité et la diversité. Ils ont veillé à inclure des intersections délicates, des zones de construction et des endroits très fréquentés par les piétons. Ils ont même envoyé des équipes collecter des données durant les heures de pointe et tard dans la nuit pour capturer différents schémas de circulation.

Le côté éthique de l'annotation des données

Voici un sujet dont nous devons discuter davantage dans le monde des véhicules autonomes : les implications éthiques de notre travail. Lorsque nous annotons des données, nous enseignons essentiellement aux voitures comment interpréter le monde, et cela implique beaucoup de responsabilités.

Nous devons être très prudents quant aux biais dans nos données. Si toutes nos données piétonnes proviennent d'un seul groupe démographique, nos voitures pourraient également ne pas reconnaître les piétons d'autres groupes. Ce n'est pas seulement mauvais pour les affaires, c'est carrément dangereux.

J'encourage les équipes à réfléchir de manière critique à leurs sources de données et à leurs pratiques d'annotation. Représentons-nous une gamme diversifiée de personnes et de scénarios ? Introduisons-nous involontairement des biais dans nos systèmes ? Ce sont des questions difficiles, mais elles sont cruciales pour développer des véhicules autonomes sûrs et équitables pour tous.

En résumé

Je sais que l'annotation des données n'est pas la partie la plus sexy de la construction de voitures autonomes. Cela ne fera pas la une des journaux comme un nouveau capteur ou un algorithme d'IA flashy. Mais croyez-en quelqu'un qui a de l'expérience – c'est la base de tout ce que nous faisons.

La qualité de vos données annotées a un impact direct sur la performance de votre voiture sur la route (et sa sécurité). Il ne s'agit pas seulement de tracer des boîtes sur des images. Il s'agit de poser les bases d'une technologie qui changera notre façon de nous déplacer.

Alors, qu'en dites-vous ? Prêt à améliorer votre jeu en IA et en véhicules autonomes ? Commencez par examiner sérieusement la manière dont vous gérez actuellement l'annotation. Où pouvez-vous vous améliorer ? Quelles nouvelles techniques pouvez-vous essayer ? Croyez-moi, votre futur moi vous remerciera lorsque vos voitures navigueront en douceur dans le trafic aux heures de pointe comme des pros.

Rappelez-vous, chaque annotation que vous faites est un pas vers des véhicules autonomes plus sûrs et plus intelligents. Cela ne semble peut-être pas toujours glamour, mais votre travail façonne l'avenir du transport IA. Alors continuez, restez curieux et n'arrêtez jamais d'apprendre. La révolution des voitures autonomes est là, et vous êtes au cœur de celle-ci !