Vidéo : Espaces vectoriels abstraits

Grant Sanderson • 3Blue1Brown • Boclips

Espaces vectoriels abstraits

16:45

Transcription de vidéo

J’aimerais revenir sur une question faussement simple que j’ai posée dans la toute première vidéo de cette série : qu’est-ce qu’un vecteur ? Qu’est-ce qu’un vecteur à deux dimensions, par exemple, fondamentalement une flèche sur un plan plat que nous pouvons décrire avec des coordonnées pour plus de commodité, ou est-ce fondamentalement cette paire de nombres réels qui est simplement bien visualisée comme une flèche sur un plan plat, ou ces deux manifestations sont justes quelque chose de plus profond ?

D’une part, définir les vecteurs comme étant principalement une liste de nombres est clair et sans ambiguïté. Cela fait en sorte que des vecteurs à quatre dimensions ou à 100 dimensions ressemblent à de vraies idées concrètes avec lesquelles vous pouvez travailler. Sinon, une idée comme quatre dimensions n’est qu’une vague notion géométrique qu’il est difficile de décrire sans bouger un peu les mains. Mais d’un autre côté, une sensation commune chez ceux qui travaillent réellement avec l’algèbre linéaire, en particulier au fur et à mesure que vous changez plus facilement de base, est que vous avez affaire à un espace qui existe indépendamment des coordonnées que vous lui donnez et que Les coordonnées sont en fait quelque peu arbitraires, en fonction de ce que vous choisissez comme vecteurs de base.

Les sujets de base en algèbre linéaire, tels que les déterminants et les vecteurs propres, semblent indifférents au choix des systèmes de coordonnées. Le déterminant vous indique à quel point une transformation met à l’échelle des aires, et les vecteurs propres sont ceux qui restent sur leur propre direction pendant une transformation, mais ces deux propriétés sont intrinsèquement spatiales et vous pouvez modifier librement votre système de coordonnées sans modifier les valeurs sous-jacentes de l’une ou l’autre. Mais si les vecteurs ne sont pas fondamentalement des listes de nombres réels, et si leur essence sous-jacente est quelque chose de plus spatial, cela pose simplement la question de savoir ce que les mathématiciens veulent dire quand ils utilisent un mot comme espace ou spatial.

Pour avancer jusqu’à ce que cela se passe, j’aimerais en fait passer l’essentiel de cette vidéo à parler de quelque chose qui n’est ni une flèche ni une liste de nombres mais qui a aussi des qualités vectorielles, les fonctions. Vous voyez, il y a un sens dans lequel les fonctions ne sont en réalité qu’un autre type de vecteur. De la même façon que vous pouvez ajouter deux vecteurs ensemble, il y a aussi une notion raisonnable pour ajouter deux fonctions, 𝑓 et 𝑔, pour obtenir une nouvelle fonction, ainsi que 𝑓 𝑔. C’est un de ces trucs où vous savez déjà un peu ce que ça va être, mais en fait c’est très compliqué. Le résultat de cette nouvelle fonction à une entrée donnée, comme le nombre moins quatre, est la somme des résultats de 𝑓 et de 𝑔, lorsque vous les évaluez chacun sur la même entrée, le nombre moins quatre. Ou, plus généralement, la valeur de la fonction de somme à tout 𝑥 d’entrée donné est la somme des valeurs de 𝑓 de 𝑥 plus 𝑔 de 𝑥.

Ceci est assez similaire à l’ajout de vecteurs coordonnée par coordonnée ; c’est simplement qu’il y a, dans un sens, une infinité de coordonnées à traiter. De même, il existe une notion judicieuse pour redimensionner une fonction en fonction d’un nombre réel : il suffit de redimensionner toutes les sorties en fonction de ce nombre. Et encore une fois, ceci est analogue à la mise à l’échelle d’une coordonnée vectorielle par coordonnée ; on a l’impression qu’il y a une infinité de coordonnées. Maintenant, étant donné que la seule chose que les vecteurs puissent réellement faire est de s’additionner ou d’être mise à l’échelle, il semble que nous devrions pouvoir utiliser les mêmes concepts utiles et techniques de résolution de problèmes de l’algèbre linéaire, qui avaient été pensés à l’origine dans le contexte des flèches. l’espace et les appliquer également aux fonctions.

Par exemple, il existe une notion parfaitement raisonnable de transformation linéaire des fonctions, quelque chose qui prend une fonction et la transforme en une autre. Un exemple familier vient de l’Analyse, la dérivée. C’est quelque chose qui transforme une fonction en une autre. Parfois, dans ce contexte, vous entendez parler d’opérateurs au lieu de transformations, mais le sens est le même. Une question naturelle que vous voudrez peut-être poser est de savoir ce que cela signifie pour une transformation de fonctions linéaires. La définition formelle de la linéarité est relativement abstraite et dictée symboliquement par rapport à la façon dont j’en ai parlé pour la première fois au chapitre trois de cette série, mais la récompense de l’abstraction est que nous obtiendrons quelque chose d’assez général pour s’appliquer aux fonctions, ainsi que des flèches.

Une transformation est linéaire si elle satisfait à deux propriétés, communément appelées additivité et homogénéité. Additivité signifie que si vous ajoutez deux vecteurs, 𝐕 et 𝐖, puis appliquer une transformation à leur somme, vous obtenez le même résultat que si vous avez ajouté les versions transformées de 𝐕 et 𝐖. La propriété d’homogénéité est que lorsque vous mettez à l’échelle un vecteur 𝐕 par un nombre puis que vous appliquez la transformation, vous obtenez le même vecteur ultime que si vous mettez à l’échelle la version transformée de 𝐕 par le même nombre. Vous entendrez souvent dire que les transformations linéaires préservent les opérations d’addition vectorielle et de multiplication scalaire. L’idée des lignes de la grille qui restent parallèles et régulièrement espacées, dont j’ai parlé dans les vidéos précédentes, n’est en réalité qu’une illustration de ce que signifient ces deux propriétés dans le cas spécifique des points dans l’espace 2D.

L’une des conséquences les plus importantes de ces propriétés qui rendent possible la multiplication matrice-vecteur est qu’une transformation linéaire est complètement décrite en prenant les vecteurs de base. Comme tout vecteur peut être exprimé en redimensionnant et en ajoutant les vecteurs de base, trouver la version transformée d’un vecteur revient à redimensionner et ajouter les versions transformées des vecteurs de base de la même manière. Comme vous le verrez dans un instant, ceci est aussi vrai pour les fonctions que pour les flèches. Par exemple, les étudiants en Analyse utilisent toujours le fait que la dérivée est additive et possède la propriété d’homogénéité, même s’ils ne l’ont pas entendue de la sorte. Si vous ajoutez deux fonctions, puis prenez la dérivée, c’est la même chose que de prendre la dérivée de chacune d’elles séparément, puis d’ajouter le résultat. De même, si vous redimensionnez une fonction puis prenez la dérivée, cela revient à prendre d’abord la dérivée, puis à redimensionner le résultat.

Pour vraiment explorer le parallèle, voyons à quoi ça pourrait ressembler de décrire la dérivée avec une matrice. Ce sera un peu délicat, car les espaces de fonctions ont tendance à être de dimensions infinies, mais je pense que cet exercice est en réalité assez satisfaisant. Nous allons nous limiter aux polynômes, des choses comme 𝑥 au carré plus trois 𝑥 plus cinq ou quatre 𝑥 aux cinq septièmes moins 𝑥 carré. Chacun des polynômes de notre espace n’aura que très peu de termes, mais l’espace complet inclura des polynômes de degré arbitraire. La première chose à faire est de donner des coordonnées à cet espace, ce qui nécessite de choisir une base. Comme les polynômes sont déjà écrits comme la somme des puissances mises à l’échelle de la variable 𝑥, il est assez naturel de choisir juste les puissances pures de 𝑥 comme fonctions de base. En d’autres termes, notre première fonction de base sera la fonction constante, 𝑏 zéro de 𝑥 est égal à un. La deuxième fonction de base sera 𝑏 un de 𝑥 égal 𝑥, puis 𝑏 deux 𝑥 égal 𝑥 au carré, puis 𝑏 trois 𝑥 égal 𝑥 au cube, et ainsi de suite. Le rôle joué par ces fonctions de base sera similaire aux rôles de 𝑖 chapeau, 𝑗 chapeau et 𝑘 chapeau dans le monde des vecteurs en tant que flèches.

Puisque nos polynômes peuvent avoir un degré arbitrairement grand, cet ensemble de fonctions de base est infini. Mais ce n’est pas grave, cela signifie simplement que lorsque nous traitons nos polynômes comme des vecteurs, ils auront une infinité de coordonnées. Un polynôme tel que 𝑥 carré plus trois 𝑥 plus cinq, par exemple, serait décrit avec les coordonnées cinq, trois, un, puis un nombre infini de zéros. Pensez que cela signifiait que c’était cinq fois la première fonction de base plus trois fois cette deuxième fonction de base plus une fois la troisième fonction de base, puis aucune des autres fonctions de base ne devrait être ajoutée à partir de ce moment. Le polynôme quatre 𝑥 puissance sept moins cinq 𝑥 au carré aurait les coordonnées zéro, zéro, moins cinq, zéro, zéro, zéro, zéro, quatre, puis une chaîne infinie de zéros. En général, étant donné que chaque polynôme individuel ne comporte qu’un nombre fini de termes, ses coordonnées seront une chaîne finie de nombres avec une queue infinie de zéros.

Dans ce système de coordonnées, la dérivée est décrite avec une matrice infinie qui est généralement pleine de zéros, mais dont les entiers positifs apparaissent sur cette diagonale secondaire. Je parlerai de la façon dont vous pourriez trouver cette matrice dans un instant, mais la meilleure façon de vous en faire une idée est de la regarder en action. Prenez les coordonnées représentant le polynôme 𝑥 au cube plus cinq 𝑥 carré plus quatre 𝑥 plus cinq, puis mettre ces coordonnées sur la droite de la matrice. Le seul terme qui contribue à la première coordonnée du résultat est un fois quatre, ce qui signifie que le terme constant dans le résultat sera quatre. Cela correspond au fait que la dérivée de quatre 𝑥 est la constante quatre. Le seul terme contribuant à la seconde coordonnée du produit matrice-vecteur est deux fois cinq, ce qui signifie que le coefficient devant 𝑥 dans la dérivée est dix. Celui-ci correspond à la dérivée de cinq 𝑥 au carré. De même, la troisième coordonnée dans le produit matrice-vecteur revient à prendre trois fois un. Celui-ci correspond à la dérivée de 𝑥 au cube soit trois 𝑥 au carré. Et après cela, ce ne sera plus que des zéros. Ce qui rend cela possible, c’est que la dérivée est linéaire. Et pour ceux d’entre vous qui aiment faire une pause et réfléchir, vous pouvez construire cette matrice en prenant la dérivée de chaque fonction de base et en plaçant les coordonnées des résultats dans chaque colonne.

Ainsi, de manière surprenante, la multiplication matrice-vecteur et le calcul d’une dérivée, qui semblent à première vue être des choses complètement différentes, sont vraiment les membres de la même famille. En fait, la plupart des concepts dont j’ai parlé dans cette série en ce qui concerne les vecteurs comme des flèches dans l’espace, des éléments comme le produit scalaire ou les vecteurs propres, ont des analogues directs dans le monde des fonctions. Bien que parfois ils portent des noms différents, des choses comme produit interne ou fonction propre. Donc, revenons à la question de ce qu’est un vecteur. Ce que je veux dire ici, c’est qu’il y a beaucoup de choses vectorielles en maths. Tant que vous avez affaire à un ensemble d’objets pour lesquels il existe une notion raisonnable de redimensionnement et d’addition, qu’il s’agisse d’un ensemble de flèches dans l’espace, de listes de nombres, de fonctions ou de tout autre élément fou que vous choisissez de définir, tous les éléments les outils développés en algèbre linéaire en ce qui concerne les vecteurs, les transformations linéaires, etc., devraient pouvoir s’appliquer.

Prenez un moment pour vous imaginer maintenant en tant que mathématicien développant la théorie de l’algèbre linéaire. Vous voulez que toutes les définitions et découvertes de votre travail s’appliquent à toutes les choses vectorielles en toute généralité, et pas seulement à un cas spécifique. Ces ensembles d’éléments vectoriels, tels que des flèches ou des listes de nombres ou de fonctions, s’appellent des espaces vectoriels, et ce que vous, mathématicien, voudriez faire, c’est dire : « Salut tout le monde ! Je ne veux pas penser à tous les différents types d’espaces vectoriels fous que vous pourriez tous créer ». Vous devez donc établir une liste de règles que l’addition et la mise à l’échelle de vecteurs doivent respecter. Ces règles sont appelées axiomes et, dans la théorie moderne de l’algèbre linéaire, tout espace vectoriel doit respecter huit axiomes si toute la théorie et les constructions que nous avons découvertes doivent s’appliquer.

Je les laisse à l’écran ici pour quiconque souhaite faire une pause et réfléchir, mais il ne s’agit en fait que d’une liste de contrôle permettant de s’assurer que les notions d’addition vectorielle et de multiplication scalaire agissent comme vous le souhaitez. Ces axiomes ne sont pas tellement des règles fondamentales de la nature, ils constituent une interface entre vous, le mathématicien découvrant les résultats et d’autres personnes susceptibles de vouloir appliquer ces résultats à de nouveaux types d’espaces de vecteurs. Si, par exemple, quelqu’un définit un type fou d’espace vectoriel, comme l’ensemble de toutes les créatures 𝜋, avec une définition de l’addition et la mise à l’échelle des créatures, ces axiomes sont comme une liste des choses dont il a besoin pour vérifier ses définitions avant de commencer à appliquer les résultats de l’algèbre linéaire.

Et vous, en tant que mathématicien, n’avez jamais à penser à tous les espaces vectoriels fous que les gens pourraient définir. Vous devez simplement prouver vos résultats en fonction de ces axiomes afin que toute personne dont les définitions satisferont ces axiomes puisse appliquer avec joie les résultats obtenus, même si vous n’avez jamais pensé à leur situation. En conséquence, vous auriez tendance à formuler tous vos résultats de façon assez abstraite, c’est-à-dire uniquement en fonction de ces axiomes, plutôt que de vous concentrer sur un type de vecteur spécifique, tel que des flèches dans l’espace ou des fonctions. Par exemple, c’est la raison pour laquelle presque tous les manuels que vous trouverez définiront des transformations linéaires en termes d’additivité et d’échelle, plutôt que de parler de lignes de grille restant parallèles et espacées de manière uniforme, même si cette dernière est plus intuitive, du moins à mon avis, plus utile pour les nouveaux apprenants, même si cela est spécifique à une situation.

Donc, la réponse du mathématicien à « Que sont les vecteurs ? » consiste à ignorer la question. Dans la théorie moderne, la forme que les vecteurs prennent ne compte pas vraiment, des flèches, des listes de numéros, des fonctions, des créatures 𝜋, il peut être vraiment quoi que ce soit tant qu’il y a une idée d’ajouter et de mise à l’échelle des vecteurs qui suit ces règles. C’est comme demander ce que le nombre trois est vraiment. Chaque fois que cela se pose concrètement, c’est dans le contexte d’un triplet de choses. Mais en maths, il est traité comme une abstraction de tous les triplés possibles et vous permet de raisonner sur tous les triplés possibles en utilisant une seule idée. Il en va de même pour les vecteurs, qui ont de nombreux modes de réalisation, mais les mathématiques les résument tous en une seule notion intangible d’espace vectoriel.

Mais, comme le savent tous ceux qui regardent cette série, je pense qu’il est préférable de commencer à raisonner sur les vecteurs dans un cadre concret et visualisable, comme un espace 2D avec des flèches enracinées à l’origine. Mais au fur et à mesure que vous apprendrez l’algèbre linéaire, sachez que ces outils s’appliquent de manière beaucoup plus générale et que c’est la raison sous-jacente pour laquelle les manuels et les cours ont tendance à être formulés, de manière abstraite. Donc, avec ces gens, je pense que je vais appeler cela la fin de cette essence de la série sur l’algèbre linéaire. Si vous avez regardé et compris les vidéos, je pense vraiment que vous avez une base solide dans les intuitions sous-jacentes de l’algèbre linéaire. Ce n’est pas la même chose qu’apprendre le sujet au complet, bien sûr, c’est quelque chose qui ne peut vraiment venir que de résoudre des problèmes, mais l’apprentissage que vous menez peut être considérablement plus efficace si vous avez les bonnes intuitions en place. Amusez-vous donc à appliquer ces intuitions et profitez de votre futur apprentissage.

Nagwa utilise des cookies pour vous garantir la meilleure expérience sur notre site. En savoir plus sur notre Politique de Confidentialité.