Goût et couleur : comment apprendre aux robots à se sentir comme des humains

Depuis que les robots ont été inventés, les humains ont essayé de les rendre aussi semblables à eux-mêmes que possible. Être humain signifie percevoir le monde qui nous entoure d'une certaine manière, mais nos logiciels contiennent des codes difficiles à casser. Imiter la perception humaine avec l'électronique est devenu l'une des tâches les plus difficiles. Aujourd'hui, c'est aussi une pierre d'achoppement majeure dans la création de systèmes d'intelligence artificielle et le développement d'interfaces homme-machine. Ils veulent de plus en plus de polyvalence de la part des robots.

Robots détecteurs - robots de deuxième génération

Les premières générations créées de robots utilisés dans la fabrication ne disposaient pas des moyens techniques pour recevoir des informations sur l'environnement. Ils étaient dépourvus de vision et d'intelligence. Par conséquent, tout objet ou personne qui se trouvait sur leur chemin pouvait être victime d'une collision ou d'un impact programmé automatiquement par le robot. Ou la machine intelligente elle-même pouvait souffrir d'une telle interaction.

Les robots de première génération ne sont pas en mesure de fonctionner avec des objets inconnus situés arbitrairement et non orientés et nécessitent des dispositifs supplémentaires pour l'organisation particulière de la zone de travail. Tout cela rend l'automatisation plus compliquée et plus coûteuse, et moins flexible. Il est possible d'éviter ces conséquences désagréables des limitations sensorielles et intellectuelles des robots de première génération en élargissant considérablement la gamme et la nature des capteurs de mesure de l'information et des programmes de commande. C'est ainsi que sont apparus les robots de deuxième génération - les robots intelligents.

Ces robots se distinguent des robots de première génération par un assortiment essentiellement plus étendu d'organes sensoriels artificiels. Il s’agit tout d’abord de capteurs sensoriels tactiles, visuels, sonores et autres. Les organes sensoriels des robots de deuxième génération servent à introduire des informations sur les conditions du robot et de l’environnement dans le système de commande, qui ne se limite plus à une mémoire et à un dispositif de programmation, comme dans les robots de première génération, mais nécessite un ordinateur de commande pour sa mise en œuvre. C'est précisément la détection combinée à un logiciel suffisamment parfait et diversifié de l'ordinateur de commande qui permet aux robots de deuxième génération de travailler avec des objets non orientés de forme arbitraire, d'assembler et de monter des structures selon le dessin, d'interagir avec l'environnement extérieur, d'exécuter la séquence d'opérations (programmée) requise dans un climat changeant. Ainsi, la détection des robots est une condition préalable nécessaire à l'augmentation de leur fonctionnalité.

Le système de mesure de l'information des robots sensibles, c'est-à-dire leur système d'organes sensoriels, se compose de capteurs d'informations externes et internes. La corrélation entre les capteurs d'information et leur interaction dans ces robots diffère considérablement de celle des robots logiciels. Il est important de noter que pour les robots sensibles, un rôle important est joué par les capteurs d'informations externes pour la perception, l'analyse, la reconnaissance et le contrôle des conditions environnementales. En particulier, les capteurs utilisés dans les robots de première génération peuvent être utilisés comme des capteurs d'information internes.

Exigences et principales caractéristiques des capteurs d'informations externes

En fonction de l'objectif d'un robot sensible, ses capteurs d'informations externes doivent simuler le toucher, la vision, l'audition, etc. En outre, il existe des capteurs pour mesurer la radioactivité, la pression, l'humidité, la température et d'autres quantités physiques. Ces capteurs doivent être très précis, fiables, rapides, de petite taille, légers et économiques.

Il convient de noter que des capteurs et des gadgets beaucoup plus sensibles que nos sens sont actuellement créés. Une cellule photoélectrique voit une grande partie du spectre mieux que l'œil, et un microphone entend mieux que l'oreille humaine. Un sismographe est plus sensible que notre sens du toucher, et la sensation de température n'est pas aussi bonne qu'un thermomètre, bien sûr.

Et un seul sens, l'odorat, c'est-à-dire la détection et la détermination de petites quantités d'impuretés de la matière organique chez l'homme et l'animal, est plus complet que les instruments existants. À cet égard, il convient de souligner que les organes olfactifs comptent parmi les sens les plus compliqués, la nature du phénomène sur lequel ils opèrent étant encore inconnue. Par conséquent, "rattraper le sens de l'odorat du chien" est l'un des problèmes actuels de la détection robotique.

L'expérience acquise dans l'étude des organes sensoriels humains et animaux contient de nombreuses informations qui peuvent être utilisées comme conditions préalables au développement d'organes sensoriels artificiels. Dans les systèmes vivants, tous les organes des sens sont équipés de leurs propres organes de mouvement, qui sont à leur tour richement dotés de récepteurs kinesthésiques. Lors de la perception, un rôle essentiel revient tant aux récepteurs individuels qu'aux champs réceptifs et aux détecteurs locaux, permettant de distinguer certaines caractéristiques élémentaires des objets. Lors de l'analyse de l'environnement et de l'état interne, le traitement coordonné conjoint des signaux sensoriels de différents types joue un rôle important, en tenant compte des actions effectuées.

L'interaction de l'homme avec l'environnement extérieur repose principalement sur le traitement des informations visuelles, audio et tactiles-kinesthésiques. Il existe également des situations où seules les sensations tactiles et kinesthésiques peuvent donner des informations correctes sur les caractéristiques de l'environnement. Ces situations se présentent, par exemple, lorsqu'il est nécessaire d'effectuer des micro-mouvements des doigts pour déterminer la forme et la qualité de la surface des objets environnants et dans les cas où il existe des obstacles au contrôle visuel.

Les principaux types de "sens artificiels" ; &ndash ; capteurs

Capteurs tactiles et kinesthésiques

La création de capteurs dotés d'une sensibilité tactile et kinesthésique était nécessaire pour résoudre plusieurs problèmes liés à la recherche d'objets, à leur saisie et à leur déplacement. Un capteur de contact est le type le plus élémentaire de ce type de capteur. Il s’agit de minuscules interrupteurs qui détectent le contact d’un objet avec eux.

Les capteurs tactiles répondent au toucher et détectent la pression à l'endroit où le capteur rejoint (touche) un objet. Ils sont souvent fixés aux pare-chocs des robots de transport ou aux poignées des robots de manipulation. Ces capteurs sont utilisés pour détecter des objets individuels, éviter de les endommager et d'endommager le robot lui-même, et reconnaître l'environnement externe par le toucher et le tâtonnement.

Les capteurs kinesthésiques enregistrent la position et le mouvement des actionneurs (par exemple, les doigts de la poignée d'un manipulateur) et les forces qu'ils exercent.

Une caractéristique essentielle des capteurs tactiles et kinesthésiques est de fonctionner dans presque tous les environnements. En particulier, ces capteurs sont indispensables pour les robots sous-marins, car le canal de retour télévisuel ou optique cesse de fonctionner lorsque l'eau est trouble.

Capteurs visuels

La perception et l'analyse intuitives de scènes tridimensionnelles nécessitent un équipement spécial qui, par essence, doit imiter le travail fonctionnel de l'œil. Il doit apporter des solutions à des problèmes tels que la recherche active d'objets en modifiant l'orientation du capteur visuel, la mise au point automatique de l'image, la mesure de la distance aux objets, l'ajustement de la sensibilité du capteur en fonction des changements de conditions d'éclairage, la mise en évidence des caractéristiques de l'image (couleur, texture, contours, taille, forme, etc.).

Dans la détection visuelle des robots, la télévision et les capteurs optiques sont les sources d'information. Un capteur de télévision ("œil de télévision" ;) est une caméra de télévision. L'image entière ou un fragment est enregistré en mémoire comme une projection matricielle bidimensionnelle d'une scène tridimensionnelle réelle. Cependant, l'image de télévision est plate, contrairement aux objets eux-mêmes, qui ont trois dimensions. Elle prive l’homme et le robot de la perception tridimensionnelle et de l’effet de présence qui lui est associé. C’est pourquoi les moyens de l’holographie, qui permettent d’enregistrer et de reconstruire non pas la dimension bidimensionnelle mais l’onde lumineuse émanant d’un objet, avec tous ses détails, revêtent une grande importance pour la perception des robots. Les robots utilisent des cellules photoélectriques, des photodiodes, des filtres de lumière, des guides de lumière et d'autres éléments ainsi que des sources de lumière pour déterminer la couleur des objets.

Le principal inconvénient des capteurs visuels est leur inadaptation en l'absence de sources lumineuses ou dans des conditions de diffusion ou d'absorption solide de la lumière, comme sous l'eau ou dans l'espace.

Capteurs de son

Les capteurs sonores comprennent toutes sortes de microphones et de capteurs à ultrasons. Les microphones sont utilisés pour capter les commandes appropriées lors de la commande vocale d'un robot. Les capteurs à ultrasons se composent d'un émetteur de signaux et d'un récepteur de signaux. Ils peuvent utiliser le signal ultrasonique réfléchi par les objets pour les détecter et déterminer leur distance.

Par rapport aux capteurs optiques, les capteurs à ultrasons présentent les avantages suivants : ils peuvent détecter des objets transparents ; leurs relevés ne dépendent pas des conditions d'éclairage et sont très peu sensibles aux changements des propriétés physiques de l'environnement (poussière, vapeur, milieu liquide) ; la durée de vie des générateurs d'oscillations est presque illimitée, etc. Cependant, en raison de la directionnalité floue des vibrations ultrasonores, la précision de la détermination des distances aux objets de ces capteurs est faible. En outre, ils ne peuvent pas détecter des objets de dimensions minuscules en raison de la longueur relativement importante des ondes ultrasonores.

Comment les sens humains diffèrent-ils des systèmes sensoriels des robots modernes ?

Dans un sens, les robots essaient de copier les sentiments qu'éprouvent les humains ou les animaux. Mais les robots disposent souvent de systèmes beaucoup plus avancés. Par exemple, l'appareil vestibulaire humain enregistre les changements de position du corps ou de la tête. En revanche, aucun organe ne peut nous dire combien de minutes d'angle notre genou ou notre coude est plié ou à quelle distance de nous se trouve un objet, au micron près. Les humains n’en ont pas besoin, mais dans le paradigme actuel du développement de la robotique, ces informations peuvent aider les machines intelligentes.

Les robots peuvent être divisés en deux types : la locomotion et la manipulation. La tâche principale du premier type est de déplacer une charge utile ou une personne sur des distances importantes, comme le font les drones, les voitures sans conducteur ou les bateaux. Dans cette situation, la tâche principale des capteurs est de détecter la position du robot dans l’espace ainsi que sa position par rapport aux objets proches. Nous pouvons également ajouter des capteurs d'accélération linéaire et angulaire, qui fournissent un sens de l'équilibre, c'est-à-dire une orientation dans le champ gravitationnel.

La tâche des robots de manipulation, qui doivent imiter fonctionnellement les mains, est d'effectuer diverses opérations avec des objets. C'est là qu'intervient la détection kinesthésique, qui fournit un sens de la position, du mouvement et de la force. En d'autres termes, nous avons besoin de capteurs capables de déterminer la configuration actuelle et la vitesse des différentes parties du robot, ainsi que de capteurs tactiles et de pression. Ces derniers sont particulièrement demandés pour assurer une préhension fiable des objets manipulés, ainsi que pour contrôler les forces d'interaction avec les objets, l'environnement et les humains, afin, par exemple, d'effectuer une opération de contact de qualité et de ne pas endommager le robot ou blesser une personne se trouvant à proximité ou en contact direct.

Bien entendu, pour tous les robots énumérés ci-dessus, un nombre considérable de capteurs auxiliaires peut être utilisé, en fonction de l'application spécifique. Certains d'entre eux fournissent des informations sur l'état interne du système, d'autres sur l'environnement. Il convient de souligner que les capteurs destinés aux interactions homme-robot sont essentiels dans ce contexte.

Tendances de la sensorique des robots

L'une des tendances actuelles en matière de détection des robots est le développement de capteurs tactiles. Les progrès s'orientent vers la création de robots capables de travailler efficacement et en toute sécurité dans un environnement dynamique et non structuré. Il est impossible de tout mettre en place de manière stricte une fois pour toutes et d'être en contact étroit avec les humains.

À cet égard, de plus en plus de nouveaux types de compteurs apparaissent. Par exemple, des capteurs distribués appelés "peau artificielle" sont en cours de développement et de test. L'orientation de l'haptique - le contrôle par retour de force - connaît une forte croissance aux États-Unis, en Suisse, en Allemagne, en Corée, en Chine et au Japon, où de grands laboratoires travaillent dans ce domaine.

Le concept de conception fonctionnelle intégrée, ou co-conception, de tous les composants du robot, évolue également dans la conception des systèmes robotiques, où la conception, les capteurs, les alimentations, les plates-formes informatiques, l'algorithme et le logiciel sont développés simultanément, en fonction de la fonctionnalité finale du système dans son ensemble.

En raison du développement de la robotique personnelle, les capteurs pour l'interaction humaine multimodale, y compris, par exemple, les capteurs combinés pour la lecture simultanée d'informations audio et visuelles pour le traitement ultérieur du langage naturel (traitement du langage naturel), devraient devenir plus largement utilisés.

Robots détecteurs : ce que peut faire une machine dotée de la vue et de l'ouïe

Certaines machines intelligentes sont dotées d'analyseurs de gaz et de liquides, analogues à nos organes de l'odorat et du goût, avec lesquels elles peuvent détecter des odeurs et des goûts, même si ce n'est pas dans la même mesure que nous. Depuis des décennies, ces "nez électroniques" aident les douaniers à détecter les substances dangereuses et interdites. Les laboratoires les utilisent pour analyser les denrées alimentaires afin d'en déterminer la fraîcheur et les impuretés non documentées. Ils aident les médecins à diagnostiquer les premiers stades de la gastrite et à détecter les fuites de gaz explosifs dans les pipelines.

En parlant d'audition, à titre d'exemple, les assistants vocaux Siri pour iOS ou autres. - Ce sont des exemples d'"oreilles électroniques" qui perçoivent votre discours et "comprennent" ce que vous avez dit. La reconnaissance de la parole naturelle est une tâche difficile, aussi la création de tels systèmes implique-t-elle des connaissances dans différents domaines de la linguistique, des mathématiques et de l'informatique.

En tant qu'analogue de la vision humaine (deux yeux et ces biomécanismes formés dans notre cerveau dès la naissance), nous pouvons citer une branche entière de l'informatique - la vision par ordinateur (ou machine). Les systèmes de vision par ordinateur résolvent toutes les tâches attribuées à la réalité visible et vont parfois au-delà si l'on parle de la vision dans le domaine de l'infrarouge, des microscopes électroniques et des radiographies. De tels systèmes reconnaissent l'écriture manuscrite et autorisent l'accès à des systèmes protégés par la rétine ou l'iris. Permettent de déceler des signes subtils d'anomalies sur les radiographies. Permettent la saisie de données par le suivi des mouvements oculaires pour les personnes handicapées.

Supposons que l'on dispose de plusieurs images d'un objet prises avec des paramètres différents. Dans ce cas, il peut s'agir de l'angle de rotation, de l'éclairage ou d'autres paramètres. La tâche des systèmes d'IA consiste à reconstruire une scène tridimensionnelle, un modèle de l'objet pris. C'est le genre de tâche que nous faisons tous les jours. Par exemple, nous regardons quelque part et estimons la distance des objets et leur forme, et nous remarquons les parties saillantes. C'est ce que notre cerveau fait en arrière-plan.

Les algorithmes modernes de vision par ordinateur sont suffisamment rapides pour obtenir des données tridimensionnelles à partir d'images, même celles provenant de deux caméras, en quelques fractions de seconde. Dans ce cas, on peut parler d'algorithmes d'imagerie stéréo en temps réel. Un tel robot équipé d'une ou plusieurs caméras peut se diriger en temps réel dans un espace inconnu, construire un modèle de cet espace et l'envoyer à un humain.

L'application pratique de tels systèmes semble évidente. Supposons que ce robot soit un bathyscaphe, un quadcoptère, une plate-forme à roues ou un appareil de marche. Dans ce cas, il peut être envoyé dans un endroit difficile à atteindre, comme une zone contaminée par des radiations, voire la Lune ou le fond de l'océan, et il construira un modèle de l'environnement et trouvera son chemin sans intervention humaine.

Les médecins utilisent également la vision par ordinateur pour analyser les images médicales, les entomologistes pour identifier les différents types d'arthropodes, et même les chimistes utilisent la vision par ordinateur pour enregistrer les résultats des expériences.

Par exemple, les dentistes peuvent utiliser une caméra spéciale pour prendre des photos de dents ébréchées sous différents angles et construire un modèle tridimensionnel de la dent ébréchée. Le patient peut alors voir sur l'écran un modèle de cette cassure et un modèle de la dent naturelle. Le programme peut les combiner, un algorithme spécial soustrait les volumes, et un modèle tridimensionnel est produit pour la fabrication. Ce modèle peut être imprimé sous forme de fichier, la machine fabrique la partie manquante de la dent, et celle-ci s'adapte parfaitement à l'emplacement prévu.

Il existe également un exemple d'application diagnostique. Si un médecin dispose de coupes IRM du cerveau ou d'autres organes, il peut en tirer une image tridimensionnelle qui lui permettra de connaître le volume et l'étendue d'un processus particulier dans les organes du patient.

À l'heure actuelle, les technologies de reconstruction tridimensionnelle sont souvent utilisées pour la navigation et la cartographie. Il existe des modules autonomes, dont les voitures, équipés de nombreux capteurs, notamment des radars, des lidars, des sonars et des caméras. La tâche de tous ces dispositifs est d'obtenir une image complète de ce qui se trouve autour de la voiture. Avec leur aide, le véhicule peut effectuer des manœuvres de stationnement et de déplacement automatique en suivant les lignes de marquage. Ces technologies sont déjà mises en œuvre et utilisées dans le cadre de la conduite automatisée ou de la conduite autonome (dans les voitures sans conducteur). Si l'on monte plus haut dans les airs, leurs systèmes de vision par ordinateur résolvent les problèmes de cartographie aérospatiale. Sur des principes similaires, en utilisant des images dans les domaines du visible, de l'infrarouge et de l'ultraviolet, les systèmes de vision par ordinateur capturent la topographie de la Terre, que les satellites survolent.

Le balayage non destructif de haute précision se retrouve dans la cinématographie, l'animation par ordinateur et les applications médicales. La création de modèles des objets les plus réalistes - visages de personnes, d'animaux, etc. - est presque impossible sans technologies de reconstruction rapide. Les outils de transfert de haute précision de choses naturelles dans des scènes virtuelles sont basés sur des algorithmes avec illumination structurée.

Certaines entreprises sont spécialisées dans les technologies destinées à la cinématographie et à l'animation. Leurs solutions permettent à un projecteur et à une caméra haute résolution de scanner des visages humains. Les modèles obtenus permettront de créer des personnages réalistes pour l'animation et de remplacer les acteurs réels au cinéma. D'autres sociétés sont spécialisées dans la création d'hologrammes interactifs d'objets macroscopiques (quartiers, centrales électriques, centres d'affaires) - elles doivent également recourir à la vision par ordinateur pour prendre les dimensions des choses existantes.


Ainsi, les robots d'aujourd'hui sont plus "humains" que jamais. Certains prédisent que les robots seront très bientôt capables de percevoir tout ce qui les entoure. Mais les machines ont encore un très long chemin à parcourir. Il devrait donc améliorer leur "autonomie comportementale," ; ce qui permettra aux robots d'interagir plus facilement avec les humains et de résoudre les tâches quotidiennes et les conflits qui surviennent dans le processus.