Transcription de la vidéo
J’aimerais revenir sur une question faussement simple que j’ai posée dans
la toute première vidéo de cette série : qu’est-ce qu’un
vecteur ? Qu’est-ce qu’un vecteur à deux dimensions, par exemple, fondamentalement
une flèche sur un plan plat que nous pouvons décrire avec des
coordonnées pour plus de commodité, ou est-ce fondamentalement cette
paire de nombres réels qui est simplement bien visualisée comme une
flèche sur un plan plat, ou ces deux manifestations sont justes
quelque chose de plus profond ?
D’une part, définir les vecteurs comme étant principalement une liste de
nombres est clair et sans ambiguïté. Cela fait en sorte que des vecteurs à quatre dimensions ou à 100
dimensions ressemblent à de vraies idées concrètes avec lesquelles
vous pouvez travailler. Sinon, une idée comme quatre dimensions n’est qu’une vague notion
géométrique qu’il est difficile de décrire sans bouger un peu les
mains. Mais d’un autre côté, une sensation commune chez ceux qui travaillent
réellement avec l’algèbre linéaire, en particulier au fur et à
mesure que vous changez plus facilement de base, est que vous avez
affaire à un espace qui existe indépendamment des coordonnées que
vous lui donnez et que Les coordonnées sont en fait quelque peu
arbitraires, en fonction de ce que vous choisissez comme vecteurs de
base.
Les sujets de base en algèbre linéaire, tels que les déterminants et les
vecteurs propres, semblent indifférents au choix des systèmes de
coordonnées. Le déterminant vous indique à quel point une transformation met à
l’échelle des aires, et les vecteurs propres sont ceux qui restent
sur leur propre direction pendant une transformation, mais ces deux
propriétés sont intrinsèquement spatiales et vous pouvez modifier
librement votre système de coordonnées sans modifier les valeurs
sous-jacentes de l’une ou l’autre. Mais si les vecteurs ne sont pas fondamentalement des listes de nombres
réels, et si leur essence sous-jacente est quelque chose de plus
spatial, cela pose simplement la question de savoir ce que les
mathématiciens veulent dire quand ils utilisent un mot comme espace
ou spatial.
Pour avancer jusqu’à ce que cela se passe, j’aimerais en fait passer
l’essentiel de cette vidéo à parler de quelque chose qui n’est ni
une flèche ni une liste de nombres mais qui a aussi des qualités
vectorielles, les fonctions. Vous voyez, il y a un sens dans lequel les fonctions ne sont en réalité
qu’un autre type de vecteur. De la même façon que vous pouvez ajouter deux vecteurs ensemble, il y a
aussi une notion raisonnable pour ajouter deux fonctions, 𝑓 et 𝑔,
pour obtenir une nouvelle fonction, ainsi que 𝑓 𝑔. C’est un de ces trucs où vous savez déjà un peu ce que ça va être, mais
en fait c’est très compliqué. Le résultat de cette nouvelle fonction à une entrée donnée, comme le
nombre moins quatre, est la somme des résultats de 𝑓 et de 𝑔,
lorsque vous les évaluez chacun sur la même entrée, le nombre moins
quatre. Ou, plus généralement, la valeur de la fonction de somme à tout 𝑥
d’entrée donné est la somme des valeurs de 𝑓 de 𝑥 plus 𝑔 de
𝑥.
Ceci est assez similaire à l’ajout de vecteurs coordonnée par
coordonnée ; c’est simplement qu’il y a, dans un sens, une infinité
de coordonnées à traiter. De même, il existe une notion judicieuse pour redimensionner une fonction
en fonction d’un nombre réel : il suffit de redimensionner toutes
les sorties en fonction de ce nombre. Et encore une fois, ceci est analogue à la mise à l’échelle d’une
coordonnée vectorielle par coordonnée ; on a l’impression qu’il y a
une infinité de coordonnées. Maintenant, étant donné que la seule chose que les vecteurs puissent
réellement faire est de s’additionner ou d’être mise à l’échelle, il
semble que nous devrions pouvoir utiliser les mêmes concepts utiles
et techniques de résolution de problèmes de l’algèbre linéaire, qui
avaient été pensés à l’origine dans le contexte des flèches.
l’espace et les appliquer également aux fonctions.
Par exemple, il existe une notion parfaitement raisonnable de
transformation linéaire des fonctions, quelque chose qui prend une
fonction et la transforme en une autre. Un exemple familier vient de l’Analyse, la dérivée. C’est quelque chose qui transforme une fonction en une autre. Parfois, dans ce contexte, vous entendez parler d’opérateurs au lieu de
transformations, mais le sens est le même. Une question naturelle que vous voudrez peut-être poser est de savoir ce
que cela signifie pour une transformation de fonctions
linéaires. La définition formelle de la linéarité est relativement abstraite et
dictée symboliquement par rapport à la façon dont j’en ai parlé pour
la première fois au chapitre trois de cette série, mais la
récompense de l’abstraction est que nous obtiendrons quelque chose
d’assez général pour s’appliquer aux fonctions, ainsi que des
flèches.
Une transformation est linéaire si elle satisfait à deux propriétés,
communément appelées additivité et homogénéité. Additivité signifie que si vous ajoutez deux vecteurs, 𝐕 et 𝐖, puis
appliquer une transformation à leur somme, vous obtenez le même
résultat que si vous avez ajouté les versions transformées de 𝐕 et
𝐖. La propriété d’homogénéité est que lorsque vous mettez à l’échelle un
vecteur 𝐕 par un nombre puis que vous appliquez la transformation,
vous obtenez le même vecteur ultime que si vous mettez à l’échelle
la version transformée de 𝐕 par le même nombre. Vous entendrez souvent dire que les transformations linéaires préservent
les opérations d’addition vectorielle et de multiplication
scalaire. L’idée des lignes de la grille qui restent parallèles et régulièrement
espacées, dont j’ai parlé dans les vidéos précédentes, n’est en
réalité qu’une illustration de ce que signifient ces deux propriétés
dans le cas spécifique des points dans l’espace 2D.
L’une des conséquences les plus importantes de ces propriétés qui rendent
possible la multiplication matrice-vecteur est qu’une transformation
linéaire est complètement décrite en prenant les vecteurs de
base. Comme tout vecteur peut être exprimé en redimensionnant et en ajoutant
les vecteurs de base, trouver la version transformée d’un vecteur
revient à redimensionner et ajouter les versions transformées des
vecteurs de base de la même manière. Comme vous le verrez dans un instant, ceci est aussi vrai pour les
fonctions que pour les flèches. Par exemple, les étudiants en Analyse utilisent toujours le fait que la
dérivée est additive et possède la propriété d’homogénéité, même
s’ils ne l’ont pas entendue de la sorte. Si vous ajoutez deux fonctions, puis prenez la dérivée, c’est la même
chose que de prendre la dérivée de chacune d’elles séparément, puis
d’ajouter le résultat. De même, si vous redimensionnez une fonction puis prenez la dérivée, cela
revient à prendre d’abord la dérivée, puis à redimensionner le
résultat.
Pour vraiment explorer le parallèle, voyons à quoi ça pourrait ressembler
de décrire la dérivée avec une matrice. Ce sera un peu délicat, car les espaces de fonctions ont tendance à être
de dimensions infinies, mais je pense que cet exercice est en
réalité assez satisfaisant. Nous allons nous limiter aux polynômes, des choses comme 𝑥 au carré plus
trois 𝑥 plus cinq ou quatre 𝑥 aux cinq septièmes moins 𝑥
carré. Chacun des polynômes de notre espace n’aura que très peu de termes, mais
l’espace complet inclura des polynômes de degré arbitraire. La première chose à faire est de donner des coordonnées à cet espace, ce
qui nécessite de choisir une base. Comme les polynômes sont déjà écrits comme la somme des puissances mises
à l’échelle de la variable 𝑥, il est assez naturel de choisir juste
les puissances pures de 𝑥 comme fonctions de base. En d’autres termes, notre première fonction de base sera la fonction
constante, 𝑏 zéro de 𝑥 est égal à un. La deuxième fonction de base sera 𝑏 un de 𝑥 égal 𝑥, puis 𝑏 deux 𝑥
égal 𝑥 au carré, puis 𝑏 trois 𝑥 égal 𝑥 au cube, et ainsi de
suite. Le rôle joué par ces fonctions de base sera similaire aux rôles de 𝑖
chapeau, 𝑗 chapeau et 𝑘 chapeau dans le monde des vecteurs en tant
que flèches.
Puisque nos polynômes peuvent avoir un degré arbitrairement grand, cet
ensemble de fonctions de base est infini. Mais ce n’est pas grave, cela signifie simplement que lorsque nous
traitons nos polynômes comme des vecteurs, ils auront une infinité
de coordonnées. Un polynôme tel que 𝑥 carré plus trois 𝑥 plus cinq, par exemple, serait
décrit avec les coordonnées cinq, trois, un, puis un nombre infini
de zéros. Pensez que cela signifiait que c’était cinq fois la première fonction de
base plus trois fois cette deuxième fonction de base plus une fois
la troisième fonction de base, puis aucune des autres fonctions de
base ne devrait être ajoutée à partir de ce moment. Le polynôme quatre 𝑥 puissance sept moins cinq 𝑥 au carré aurait les
coordonnées zéro, zéro, moins cinq, zéro, zéro, zéro, zéro, quatre,
puis une chaîne infinie de zéros. En général, étant donné que chaque polynôme individuel ne comporte qu’un
nombre fini de termes, ses coordonnées seront une chaîne finie de
nombres avec une queue infinie de zéros.
Dans ce système de coordonnées, la dérivée est décrite avec une matrice
infinie qui est généralement pleine de zéros, mais dont les entiers
positifs apparaissent sur cette diagonale secondaire. Je parlerai de la façon dont vous pourriez trouver cette matrice dans un
instant, mais la meilleure façon de vous en faire une idée est de la
regarder en action. Prenez les coordonnées représentant le polynôme 𝑥 au cube plus cinq 𝑥
carré plus quatre 𝑥 plus cinq, puis mettre ces coordonnées sur la
droite de la matrice. Le seul terme qui contribue à la première coordonnée du résultat est un
fois quatre, ce qui signifie que le terme constant dans le résultat
sera quatre. Cela correspond au fait que la dérivée de quatre 𝑥 est la constante
quatre. Le seul terme contribuant à la seconde coordonnée du produit
matrice-vecteur est deux fois cinq, ce qui signifie que le
coefficient devant 𝑥 dans la dérivée est dix. Celui-ci correspond à la dérivée de cinq 𝑥 au carré. De même, la troisième coordonnée dans le produit matrice-vecteur revient
à prendre trois fois un. Celui-ci correspond à la dérivée de 𝑥 au cube soit trois 𝑥 au
carré. Et après cela, ce ne sera plus que des zéros. Ce qui rend cela possible, c’est que la dérivée est linéaire. Et pour ceux d’entre vous qui aiment faire une pause et réfléchir, vous
pouvez construire cette matrice en prenant la dérivée de chaque
fonction de base et en plaçant les coordonnées des résultats dans
chaque colonne.
Ainsi, de manière surprenante, la multiplication matrice-vecteur et le
calcul d’une dérivée, qui semblent à première vue être des choses
complètement différentes, sont vraiment les membres de la même
famille. En fait, la plupart des concepts dont j’ai parlé dans cette série en ce
qui concerne les vecteurs comme des flèches dans l’espace, des
éléments comme le produit scalaire ou les vecteurs propres, ont des
analogues directs dans le monde des fonctions. Bien que parfois ils portent des noms différents, des choses comme
produit interne ou fonction propre. Donc, revenons à la question de ce qu’est un vecteur. Ce que je veux dire ici, c’est qu’il y a beaucoup de choses vectorielles
en maths. Tant que vous avez affaire à un ensemble d’objets pour lesquels il existe
une notion raisonnable de redimensionnement et d’addition, qu’il
s’agisse d’un ensemble de flèches dans l’espace, de listes de
nombres, de fonctions ou de tout autre élément fou que vous
choisissez de définir, tous les éléments les outils développés en
algèbre linéaire en ce qui concerne les vecteurs, les
transformations linéaires, etc., devraient pouvoir s’appliquer.
Prenez un moment pour vous imaginer maintenant en tant que mathématicien
développant la théorie de l’algèbre linéaire. Vous voulez que toutes les définitions et découvertes de votre travail
s’appliquent à toutes les choses vectorielles en toute généralité,
et pas seulement à un cas spécifique. Ces ensembles d’éléments vectoriels, tels que des flèches ou des listes
de nombres ou de fonctions, s’appellent des espaces vectoriels, et
ce que vous, mathématicien, voudriez faire, c’est dire : « Salut
tout le monde ! Je ne veux pas penser à tous les différents types d’espaces vectoriels
fous que vous pourriez tous créer ». Vous devez donc établir une liste de règles que l’addition et la mise à
l’échelle de vecteurs doivent respecter. Ces règles sont appelées axiomes et, dans la théorie moderne de l’algèbre
linéaire, tout espace vectoriel doit respecter huit axiomes si toute
la théorie et les constructions que nous avons découvertes doivent
s’appliquer.
Je les laisse à l’écran ici pour quiconque souhaite faire une pause et
réfléchir, mais il ne s’agit en fait que d’une liste de contrôle
permettant de s’assurer que les notions d’addition vectorielle et de
multiplication scalaire agissent comme vous le souhaitez. Ces axiomes ne sont pas tellement des règles fondamentales de la nature,
ils constituent une interface entre vous, le mathématicien
découvrant les résultats et d’autres personnes susceptibles de
vouloir appliquer ces résultats à de nouveaux types d’espaces de
vecteurs. Si, par exemple, quelqu’un définit un type fou d’espace vectoriel, comme
l’ensemble de toutes les créatures 𝜋, avec une définition de
l’addition et la mise à l’échelle des créatures, ces axiomes sont
comme une liste des choses dont il a besoin pour vérifier ses
définitions avant de commencer à appliquer les résultats de
l’algèbre linéaire.
Et vous, en tant que mathématicien, n’avez jamais à penser à tous les
espaces vectoriels fous que les gens pourraient définir. Vous devez simplement prouver vos résultats en fonction de ces axiomes
afin que toute personne dont les définitions satisferont ces axiomes
puisse appliquer avec joie les résultats obtenus, même si vous
n’avez jamais pensé à leur situation. En conséquence, vous auriez tendance à formuler tous vos résultats de
façon assez abstraite, c’est-à-dire uniquement en fonction de ces
axiomes, plutôt que de vous concentrer sur un type de vecteur
spécifique, tel que des flèches dans l’espace ou des fonctions. Par exemple, c’est la raison pour laquelle presque tous les manuels que
vous trouverez définiront des transformations linéaires en termes
d’additivité et d’échelle, plutôt que de parler de lignes de grille
restant parallèles et espacées de manière uniforme, même si cette
dernière est plus intuitive, du moins à mon avis, plus utile pour
les nouveaux apprenants, même si cela est spécifique à une
situation.
Donc, la réponse du mathématicien à « Que sont les vecteurs ? » consiste
à ignorer la question. Dans la théorie moderne, la forme que les vecteurs prennent ne compte pas
vraiment, des flèches, des listes de numéros, des fonctions, des
créatures 𝜋, il peut être vraiment quoi que ce soit tant qu’il y a
une idée d’ajouter et de mise à l’échelle des vecteurs qui suit ces
règles. C’est comme demander ce que le nombre trois est vraiment. Chaque fois que cela se pose concrètement, c’est dans le contexte d’un
triplet de choses. Mais en maths, il est traité comme une abstraction de tous les triplés
possibles et vous permet de raisonner sur tous les triplés possibles
en utilisant une seule idée. Il en va de même pour les vecteurs, qui ont de nombreux modes de
réalisation, mais les mathématiques les résument tous en une seule
notion intangible d’espace vectoriel.
Mais, comme le savent tous ceux qui regardent cette série, je pense qu’il
est préférable de commencer à raisonner sur les vecteurs dans un
cadre concret et visualisable, comme un espace 2D avec des flèches
enracinées à l’origine. Mais au fur et à mesure que vous apprendrez l’algèbre linéaire, sachez
que ces outils s’appliquent de manière beaucoup plus générale et que
c’est la raison sous-jacente pour laquelle les manuels et les cours
ont tendance à être formulés, de manière abstraite. Donc, avec ces gens, je pense que je vais appeler cela la fin de cette
essence de la série sur l’algèbre linéaire. Si vous avez regardé et compris les vidéos, je pense vraiment que vous
avez une base solide dans les intuitions sous-jacentes de l’algèbre
linéaire. Ce n’est pas la même chose qu’apprendre le sujet au complet, bien sûr,
c’est quelque chose qui ne peut vraiment venir que de résoudre des
problèmes, mais l’apprentissage que vous menez peut être
considérablement plus efficace si vous avez les bonnes intuitions en
place. Amusez-vous donc à appliquer ces intuitions et profitez de votre futur
apprentissage.