Technique

Qu’est-ce qu’une donnée et comment interagit-elle avec l’intelligence artificielle ?

Une donnée est la description élémentaire d’une chose, d’un événement, d’une transaction… Les données peuvent prendre de très nombreuses formes et ne sont pas forcément numériques : les mentions reprises dans un contrat papier sont également des données.

En informatique, les données (ou « data ») ont une très grande importance. C’est le carburant à partir duquel des programmes informatiques peuvent fonctionner, en les traitant grâce à leurs algorithmes.

On distingue les données selon leur caractère structuré ou non :

• Les données structurées sont des données qui ont été organisées et formatées pour être rassemblées dans un même format. Elles peuvent être intégrées dans des bases de données. C’est, par exemple, une feuille de calcul Excel ou un code-barres. Ce sont plutôt des données quantitatives, c’est-à-dire des chiffres.

• Les données non structurées sont des données dont le format d’origine a été conservé et qui n’ont pas été traitées. Elles ont donc des formats très variables et sont qualitatives. Cela peut être des e-mails, des images satellites, des données récupérées par des capteurs, des posts sur les réseaux sociaux, etc.

Jusqu’à un passé pas si lointain, seules les données structurées pouvaient être traitées par des outils informatiques car leur nature précise et organisée les rend facilement gérables. Néanmoins, les données non structurées représentent également une mine d’or et c’est vers elles que les dernières innovations se tournent.

C’est en effet là que l’intelligence artificielle intervient. Les algorithmes d’IA ont besoin de données pour mener à bien leur apprentissage et devenir efficaces dans leur fonctionnement. 

La quantité et le type de données nécessaires varient en fonction de la méthode d’apprentissage :

• Dans le cas de l’apprentissage automatique traditionnel, c’est-à-dire le machine learning, l’IA sera bien plus efficace et à l’aise avec des données déjà structurées. Pour entraîner l’algorithme, une action humaine sera nécessaire pour lui définir quelles variables bien précises analyser et pour lui indiquer si le résultat obtenu s’est révélé correct ou non.

• En revanche, les méthodes d’apprentissage profond, c’est-à-dire le deep learning, permettent aux algorithmes d’IA de gérer des données non structurées. Sans nécessité d’action humaine pour les entraîner une fois l’apprentissage lancé, ils ont d’ailleurs besoin de quantités gigantesques de données pour arriver au niveau d’intelligence espéré.

Cela tombe bien car les données, qu’elles soient structurées ou non, sont justement de plus en plus nombreuses ces dernières années. Toutes les interactions (chats, transactions, vidéos…) que nous avons sur internet sont des données exploitables. Tous les objets connectés qui s’installent dans notre quotidien privé (smartphones, montres, frigos, vêtements, voitures…) et dans les entreprises (capteurs divers, machines connectées…) sont également générateurs de données. Enfin, les interactions que tous ces objets ont entre eux, via internet, créent elles-mêmes de nouvelles données : c’est « l’internet des objets »

Pour qualifier cette quantité exponentielle de données, inexploitables par des moyens classiques, les spécialistes ont d’ailleurs trouvé un nom : le « big data ». C’est son existence et son début d’exploitation qui sont à l’origine de l’essor actuel de l’intelligence artificielle et particulièrement du deep learning.

Cliquez sur le micro et énoncez votre question
Chatbot
Visitez notre FAQ pour découvrir la réponse à toutes vos questions.
La fonction vocale n'est pas disponible sur votre navigateur. Veuillez utiliser un navigateur plus récent.