Vision Pro : que promet le masque de réalité mixte d'Apple ?
Comme prévu, Apple a bien annoncé son masque de réalité mixte lors de sa conférence WWDC 2023. Si le concentré de technologies embarquées a de quoi faire tourner la tête, les usages proposés posent de véritables questions sur l'avenir de l'informatique.
Comme prévu depuis des mois, Apple a profité de sa conférence des développeurs, la fameuse WWDC, pour faire son entrée dans le monde de la réalité virtuelle. Pas moins de 45 minutes ont été réservées à la fin de la Keynote pour un de ces fameux "One More Thing" (encore une chose) chers à Apple pour présenter le Vision Pro, le masque de réalité mixte signé par la Pomme. Mieux vaut parler de masque effectivement, plutôt que de casque, tellement le Vision Pro ressemble, comme prévu aussi, à un gros masque de ski, avec un seul bandeau passant derrière la tête, très large et d'apparence très confortable, même s'il faudra le vérifier à l'usage naturellement. Pas besoin donc de bandeau de soutien passant au-dessus de la tête : le masque est suffisamment léger. Normal, puisque contrairement aux casques MetaQuest de Meta/Facebook par exemple, le Vision Pro d'Apple n'embarque pas de batterie : on l'utilise soit branché à la prise, soit branché à sa petite batterie externe que l'on garde dans sa poche. Au final, le Vision Pro présenté ce 5 juin correspond quasiment dans tous les détails à tout ce que nous avaient dévoilé le journaliste de Bloomberg Mark Gurman, au fur et à mesure des mois qui ont précédé l'annonce officielle.
Vision Pro : les premiers pas de l'informatique spatiale
Plus que de réalité virtuelle, on parle bien d'ailleurs de réalité mixte, comme l'expliquait très bien Mark Gurman, invité du podcast iWeek La semaine Apple (épisode 135 du 4 mai 2023) : « Les deux principales réalités, sont la réalité virtuelle et la réalité augmentée. La réalité virtuelle, c'est celle dans laquelle on est complètement enfermé. Ce sont des écrans uniquement. La réalité augmentée, c'est celle que l'on voit au travers de verres transparents, un peu comme les Google Glass. Avec de l'information projetée en surimpression de ce que l'on voit naturellement. La réalité mixte, c'est d'abord de la VR à la base, mais avec un mode de réalité augmentée intégrée. J'appelle ça de la fausse réalité augmentée parce qu'au lieu d'utiliser directement vos yeux, au travers de verres transparents, vous utilisez des caméras, qui reproduisent ce qui se trouve devant vous et c'est ce qui caractérise la réalité mixte, cette possibilité de passer de la VR à l'AR, à tout moment ». Ce mode de réalité mélangée se contrôle à l'aide d'un molette au design quasiment identique à celui de la couronne digitale de l'Apple Watch. Située sur la droite de la tranche supérieure du masque, cette molette permet donc soit de s'isoler totalement du monde extérieur, soit d'afficher à l'intérieur du casque, donc devant les yeux de son utilisateur, l'image captée par les caméras extérieures du casque. En poussant donc le molette à fond, c'est comme si le masque devenait transparent.
Effectivement, à la base de la face avant du casque, celle tournée vers l'extérieur donc, des caméras filment en permanence ce qui se passe devant vous et peuvent afficher sur les écrans devant vos yeux la pièce dans laquelle vous vous trouvez : vous pouvez donc vous déplacer sans crainte de vous cogner contre les meubles par exemple.
Ces caméras sont complétées par un lidar et des capteurs de profondeurs, qui permettent au masque de calculer avec précision tous les objets, meubles et murs qui vous entourent, pour placer en surimpression les objets virtuels affichés par les écrans que vous avez devant les yeux.
Ainsi, lorsque vous afficherez la fenêtre d'une application par exemple (voir plus loin), elle semblera flottée dans les airs au-dessus de votre table basse par exemple, en projetant une ombre sur cette dernière : les objets virtuels interagissent avec les objets réels dans la pièce.
23 millions de pixels devant les yeux
À l'intérieur du masque, deux écrans micro-OLED viennent se placer naturellement devant vos yeux. Malgré leur surface réduite, chaque écran concentre plus de pixels que dans un écran 4K, dont la résolution est de 3840 x 2160, soit un total d'un peu plus de 8 millions de pixels ! C'est, selon Apple, le minimum pour assurer une qualité suffisante notamment pour que les pixels ne soient plus discernables à cette distance et permettre la lecture confortable de texte. À titre ce comparaison, Apple indique que dans la surface occupée par un pixel sur un iPhone, le masque en place 64 ! Cela va bien au-delà de ce que propose aujourd'hui tous les autres casques VR des concurrents. Pour les porteurs de lunettes, Apple a fait appel à la célèbre marque Zeiss pour des inserts optiques qui s'ajoutent magnétiquement à l'intérieur du masque pour adapter les écrans à votre vue.
Vision Pro : quelles fonctions ?
Comme dans d'autres domaines, celui des smartphones par exemple, Apple n'est pas la première à présenter un casque de VR/AR. Meta, la maison-mère de Facebook, propose depuis plusieurs années ses casques Meta Quest permettant notamment de visiter son métavers, c'est-à-dire son univers virtuel en 3D mais, il faut bien avouer, sans vraiment convaincre. Et c'est bien pour ça qu'Apple a passé beaucoup de temps pendant la Keynote à décrire de multiples cas d'usage. Assez pour convaincre ? Seul l'avenir nous le dira.
Dès sa sortie au début de l'année prochaine (voir plus loin), le Vision Pro sera compatible avec des centaines de milliers d'applications en provenance directe de l'App Store habituel d'Apple. Normal finalement, puisque que grâce à son processeur M2 intégré, le masque pourra directement faire tourner quasiment toutes les applications iPhone et iPad dont vous placerez les fenêtres tout autour de vous. Vous n'êtes plus limité par l'écran physique que vous avez devant vous, ou même au deuxième écran branché à votre MacBook : vous disposez les fenêtres des applis comme bon vous semble dans l'espace.
Parmi les autres usages évoqués par Apple, il y a aussi les conversations FaceTime. On comprend facilement que vous verrez les images de votre ou vos correspondants s'afficher directement devant vos yeux. Mais, eux, que verront-ils ? Il y a bien de caméras à l'intérieur du casque dirigés vers vos yeux, mais elles ne servant pas à reproduire votre visage, ce serait impossible. Pendant la Keynote, Apple a brièvement montré que lors du premier démarrage du casque il vous sera demandé de prendre le casque dans vos mains et d'en placer la face avant devant vous. De cette façon, les caméras et capteurs de profondeur pourront créer une représentation en 3D de votre visage. Et c'est cet avatar de vous-même qui sera envoyé à vos correspondants. De manière animée bien sûr. On a hâte de voir ce que cela donne et notamment de voir si le résultat est convaincant.
Notons que c'est cette même représentation 3D de la partie de votre visage cachée par le masque qui sera reproduite sur l'écran situé en face avant du masque lorsque vous voudrez interagir avec une personne physique qui se trouverait dans la même pièce que vous. Grâce aux caméras extérieures, vous la verrez. Et la personne en question pourra également vous parler naturellement sans avoir à s'adresser à un masque "aveugle". Cela risque de faire bizarre tout de même, surtout au début.
Et pour vous reposer de tous ces efforts, vous n'aurez plus qu'à vous affaler sur votre canapé pour profiter d'une séance de ciné comme si vous y étiez où, là encore, le casque sera capable de simuler un immense écran de cinéma devant vous. Et vous pourrez profiter su son spatialisé diffusé par les petits haut-parleurs intégrés au bandeau. Avec tout de même une différence de taille avec une vraie salle de ciné, c'est que vous y serez tout·e seul·e.
Quel processeur pour le Vision Pro ?
Pour que vous puissiez vous déplacer où bon vous semble avec le casque, celui-ci est conçu pour être autonome, en ce sens qu'il n'a pas besoin d'être branché par un câble à un ordinateur ou un smartphone pour fonctionner. Il embarque toute la puissance de calcul nécessaire pour gérer l'affichage et tous les calculs 3D nécessaires pour vous immerger dans un monde en réalité virtuelle ou mixte. Le Vision Pro s'appuie pour cela sur deux processeurs. Un M2 tout d'abord, identique à celui que l'on trouve dans les Mac ou iPad, en charge de faire tourner les applications. Et un tout nouveau processeur dit R1 chargé lui de tout coordonner afin de réduire au maximum les délais de latence entre les images recueillies par les caméras et leur affichage devant vos yeux. Apple a indiqué que cette latence serait de l'orde de 12 ms maximum, suffisamment courte pour éviter les effets nauséeux que l'on peut facilement ressentir lorsque l'on utilise un casque VR.
Vision Pro : quelle autonomie ?
On l'a vu plus haut, le Vision Pro est également capable de fonctionner deux heures sur batterie externe, que l'on place dans sa poche. Deux heures, cela peut paraître court, notamment si l'on veut se servir du casque pour regarder un film qui en ferait trois. Dans ce cas, on peut tout de même le brancher au secteur, ce qui ne posera pas de problème puisqu'on est souvent assis sans bouger lorsque l'on regarde un film. Reste le problème de regarder un long film pendant un voyage en avion.
Vision Pro : quelles commandes ?
Comme on s'y attendait, le masque de VR/AR d'Apple est livré sans manette. Autrement dit, toutes les manipulations des objets ou des menus que l'on aura devant les yeux se feront directement avec les mains, sans passer par un accessoire. Des caméras externes pointant vers le bas sont donc chargées de capter précisément les mouvements de vos mains et de vos doigts pour vous permettre de saisir un objet virtuel, de taper sur un clavier virtuel ou tout simplement de pointer et d'appuyer sur un élément de menu. L'approche serait donc très différente de celle proposée par le Meta Quest qui est fourni avec deux manettes pour toutes les manipulations.
Comme on l'a évoqué plus haut, des caméras situées à l'intérieur du masque filment vos yeux en permanence. Grâce à elles, vous pouvez effectuer un certain nombre de manipulation sans les mains, simplement en regardant un endroit précis. Par exemple, il vous suffira de regarder une zone de saisie pour pouvoir commencer à dicter vos mots clés de recherche. Vous pourrez aussi faire défiler une page yeux, simplement avec vos yeux.
Vision Pro : quelle date de sortie ?
Ne le commandez pas au père Noël, le masque Vision Pro d'Apple ne sera disponible qu'au début de 2024, sans date précise. Qui plus est, il ne sera proposé que sur le marché américain, d'autres pays venant s'ajouter à la liste… plus tard. Visiblement, Apple n'a pas encore de vision très claire de ce tout nouveau marché ni, surtout, de ses capacités de fabrication. Il faut dire que les technologies utilisées sont à la pointe de la pointe. Selon un analyste de la société Morgan Stanley, la production ne commencerait qu'à partir de fin octobre prochain et n'atteindrait une production de masse qu'en décembre. Et, malgré cela, on sera sûrement très loin des dizaines de millions d'iPhone produits chaque trimestre.
Vision Pro : quel prix ?
C'est un des rares détails sur lequel les rumeurs s'étaient toutes trompées. Alors que l'on s'attendait à un prix d'environ 3000 dollars, c'est en réalité 3500 dollars qu'il faudra débourser pour s'offrir le Vision Pro ! Et n'oublions pas que les prix américains sont toujours annoncés hors taxe, vu que la taxe ajoutée est différente dans chaque état. Autrement dit, on peut s'attendre à un prix d'au moins 4200 euros TTC en France ! Et comme il faut aussi prévoir les aléas des taux de change, il y a fort à parier que le prix sera plutôt de 4499 euros TTC. Décidément, le masque VR/AR d'Apple sera effectivement réservé aux professionnels au début. Et il faudra attendre au moins 2025, si ce n'est 2026, pour espérer voir une version non-Pro un peu moins chère.
Réalité mixte : quelle vision d'avenir pour l'informatique ?
Sans conteste, la prouesse technologique du masque de réalité mixte d'Apple est sans précédent et surpasse de la tête, des épaules et du reste tout ce qu'a pu proposé la concurrence jusqu'à présent. Mais il faut bien avouer qu'Apple a tout de même eu du mal à nous convaincre du pourquoi elle s'était donnée tant de mal à résoudre des problèmes que nous n'avions peut-être pas. Le tout en proposant une vision (oui, le jeu de mot est assumé) de l'informatique dite spatiale qui semble en passe de nous isoler encore plus du monde réel qui nous entoure.
Car, ne nous trompons pas, le Vision Pro n'est pas qu'un simple masque de réalité mixte, c'est un ordinateur complet, autonome en ce sens qu'il peut se suffire à lui-même pour aujourd'hui remplacer un Mac et un iPad et, à terme, un iPhone pourquoi pas. Mais dans sa version actuelle, cela implique de « chausser » un masque encore encombrant et lourd et qui, malgré les efforts d'Apple pour nous démontrer le contraire, nous coupe du monde extérieur en nous le faisant voir au travers de caméras plutôt qu'avec nos propres yeux. Et, via la molette, on peut même à tout moment décider de s'extraire totalement du monde extérieur en éteignant lesdites caméras. Que deviennent dès lors la communication directe, les échanges interpersonnels ? Drôle d'outil de communication que celui qui est obligé de reproduire numériquement son visage (voir plus haut) pour tenter de communiquer les multiples émotions que nous humains sommes capables de détecter dans les moindres micro-mouvements du visage et que le système d'Apple, aussi perfectionné soit-il, ne parviendra pas à reproduire.
Que dire aussi de l'exemple montré dans la vidéo de la Keynote de ce père de famille en train de filmer en 3D l'anniversaire de son enfant à l'aide du masque ? Lui, il regarde la fête des enfants au travers des caméras et les enfants voient, de leur côté, un être étrange et hybride composé en partie d'un père et en partie d'un écran reproduisant artificiellement la zone du visage masquée. Quel est le souvenir de partage produit dans ses conditions ?
Fidèle à sa dénomination Pro, le masque Vision d'Apple a aussi été montré comme un outil de travail permettant tout à la fois d'utiliser son « vrai » Mac et d'ajouter des écrans virtuels flottants dans l'espace. On comprend l'intérêt de pouvoir disposer de multiples écrans virtuels qui, une fois éteints, ne prennent plus de place sur la table. Mais, même si grâce à la réalité mixte on peut continuer à interagir avec les autres personnes physiques dans la pièce, on reste seul face à ses écrans. Et si l'on veut montrer quelque chose justement à une des personnes dans la pièce, comment fait-on ? Faut-il que l'autre enfile également son masque, alors qu'il serait si facile de simplement pointer du doigt sur un élément affiché sur le « vrai » écran devant soi ? Bref, cette informatique spatiale nous condamne-t-elle à nous isoler du monde pour mieux nous rejoindre ?
Il est évidemment bien trop tôt pour répondre à ces questions philosophiques et sociologiques posées par la nouvelle proposition informatique d'Apple. Mais il semble terriblement important de nous les poser sans tarder pour que ces nouveaux outils se mettent à notre service plutôt que le contraire.
Et pour alimenter la réflexion, ajoutons un détail que nous laisserons à chacun le soin de déterminer s'il est signifiant ou non. Alors qu'à chaque démonstration d'un nouvel appareil (iPhone, iPad, montre), on a toujours vu un ou plusieurs dirigeants d'Apple le prendre en main ou le porter à son poignet, on n'en a vu aucun porter le Vision Pro sur sa tête. Avaient-ils peur du ridicule ?