Transcription de la vidéo
Voici ce que nous allons ajouter à cette vidéo : une certaine approche
animée pour réfléchir à une idée extrêmement importante issue des
mathématiques, la transformation de Fourier. Pour ceux qui ne sont pas familiers avec cela, mon objectif premier est
simplement que la vidéo soit une introduction à ce sujet. Mais même pour ceux d’entre vous qui le connaissent déjà, je pense
toujours qu’il est amusant et enrichissant de voir à quoi
ressemblent réellement toutes ses composantes.
L’exemple central, pour commencer, va être un classique, la décomposition
des fréquences du son. Mais après cela, je veux aussi vraiment montrer comment cette idée
s’étend bien au-delà du son et de la fréquence dans de nombreux
domaines apparemment disparates des mathématiques et même de la
physique. Vraiment, il est fou à quel point cette idée est omniprésente. Plongeons dedans.
Ce son ici est un pur A, 440 battements par seconde. Cela signifie que vous devez mesurer la pression atmosphérique juste à
côté de votre casque ou de votre haut-parleur en fonction du
temps. Elle oscillerait de haut en bas autour de son équilibre habituel dans
cette onde, en produisant 440 oscillations chaque seconde. Une note plus grave, comme un D, a la même structure, à peine moins de
battements par seconde. Et quand on joue en même temps, à quoi ressemble le graphique de la
pression en fonction du temps qui en résulte ? Eh bien, à tout instant, cette différence de pression sera la somme de ce
qu’elle serait pour chacune de ces notes individuellement. Ce qui, avouons-le, est un peu compliqué à penser.
En certains instants, les pics se rejoignent, ce qui crée une très forte
pression. En d’autres instants, ils ont tendance à s’annuler. Et dans l’ensemble, vous obtenez un graphique vague-pression-contre-temps
qui n’est pas une onde sinusoïdale pure. C’est quelque chose de plus compliqué. Et à mesure que vous ajoutez d’autres notes, la vague devient de plus en
plus compliquée. Mais pour l’instant, il s’agit d’une combinaison de quatre fréquences
pures. Cela semble donc inutilement compliqué compte tenu de la faible quantité
d’informations qui y sont contenues. Un microphone enregistrant n’importe quel son détecte la pression
atmosphérique en différents instants. Il ne voit que la somme finale. Donc, notre question centrale va être, comment vous pouvez prendre un
signal comme celui-ci et le décomposer dans les fréquences pures qui
le composent ? Très intéressant, non ?
Additionner ces signaux les mélange vraiment tous ensemble. En les séparant, on a l’impression de mélanger plusieurs couleurs de
peinture mélangées. La stratégie générale va être de construire pour nous-mêmes une machine
mathématique qui traite des signaux avec une fréquence différente
donnée de la façon dont il traite les autres signaux. Pour commencer, envisagez simplement de prendre un signal pur, par
exemple avec un faible trois battements par seconde, afin que nous
puissions le tracer facilement. Et limitons-nous à regarder une partie finie de ce graphique. Dans ce cas, la partie comprise entre zéro seconde et 4.5 secondes. L’idée principale sera de prendre ce graphique et de l’enrouler autour
d’un cercle.
Concrètement, voici ce que je veux dire par là. Imaginez un petit vecteur en rotation où chaque instant sa longueur est
égale à la hauteur de notre graphique pour ce temps. Ainsi, les points hauts du graphique correspondent à une plus grande
distance de l’origine. Et les points faibles se retrouvent plus près de l’origine. Et pour le moment, je le dessine de telle manière qu’avancer de deux
secondes correspond à une seule rotation autour du cercle. Notre petit vecteur dessinant ce graphe enroulé tourne à un demi-cycle
par seconde. Donc, c’est important. Il y a deux fréquences différentes en jeu ici. Il y a la fréquence de notre signal, qui va et vient, trois fois par
seconde. Et puis, séparément, il y a la fréquence à laquelle nous enroulons le
graphique autour du cercle. Ce qui correspond pour le moment à une demi-rotation par seconde.
Mais nous pouvons ajuster cette seconde fréquence comme bon nous
semble. Peut-être que nous voulons en faire plus vite ou peut-être en faire plus
lentement. Et ce choix de fréquence d’enroulement détermine l’aspect du graphe
enroulé. Certains des diagrammes qui en résultent peuvent être assez compliqués,
bien qu’ils soient très jolis. Mais il est important de garder à l’esprit que tout ce qui se passe ici,
c’est que nous entourons le signal autour d’un cercle. Les lignes verticales que je dessine en haut ne sont, par ailleurs, qu’un
moyen de suivre la distance sur le graphique d’origine qui
correspond à une rotation complète autour du cercle. Ainsi, des lignes espacées de 1.5 secondes signifient qu’il faut 1.5
secondes pour effectuer un tour complet.
Et à ce stade, nous pourrions avoir une sorte de vague impression que
quelque chose de spécial se produira lorsque la fréquence
d’enroulement correspondra à la fréquence de notre signal, trois
battements par seconde. Tous les points forts du graphique se trouvent à droite du cercle. Et tous les points bas se produisent à gauche. Mais comment pouvons-nous en tirer parti dans notre tentative de
construire une machine à séparer les fréquences ? Eh bien, imaginez que ce graphique ait une sorte de masse, comme un fil
métallique. Ce petit point va représenter le centre de masse de ce fil. Au fur et à mesure que nous changeons la fréquence et que le graphique
tourne différemment, ce centre de masse vacille un peu. Et pour la plupart des fréquences sinueuses, les pics et les creux sont
tous espacés le long du cercle de manière à ce que le centre de
masse reste assez proche de l’origine.
Mais, lorsque la fréquence d’enroulement est la même que la fréquence de
notre signal, dans ce cas trois cycles par seconde, tous les pics
sont à droite et toutes les creux sont à gauche. Ainsi, le centre de masse est exceptionnellement loin à droite. Ici, pour capturer cela, dessinons une sorte d’intrigue qui garde la
trace de ce centre de masse pour chaque fréquence d’enroulement. Bien sûr, le centre de masse est une chose en deux dimensions. Il a besoin de deux coordonnées pour maintenir complètement la trace. Mais pour le moment, gardons seulement une trace de la coordonnée 𝑥. Donc, pour une fréquence de zéro, quand tout est groupé à droite, cette
coordonnée 𝑥 est relativement élevée. Et puis, à mesure que vous augmentez la fréquence de bobinage et que le
graphique se balance autour du cercle, la coordonnée 𝑥 de ce centre
de gravité se rapproche de zéro. Et ça vacille un peu.
Mais ensuite, à trois battements par seconde, il y a une pointe alors que
tout s’aligne à droite. Ceci est la construction centrale. Résumons donc ce que nous avons jusqu’à présent. Nous avons ce graphique original d’intensité en fonction du temps. Et puis, nous avons la version enroulée de cela dans un plan
bidimensionnel. Troisièmement, nous avons un graphique montrant comment la fréquence des
enroulements influence le centre de gravité de ce graphique. Et au fait, regardons ces très basses fréquences proches de zéro. Ce pic important autour de zéro dans notre nouveau tracé de fréquence
correspond simplement au fait que toute l’onde cosinus est déplacée
vers le haut. Si j’avais choisi un signal qui oscille autour de zéro, plongeant dans
des valeurs négatives. Ensuite, alors que nous jouons avec différentes fréquences d’enroulement,
cette représentation graphique de la fréquence d’enroulement par
rapport au centre de masse n’aurait qu’un pic à la valeur de
trois.
Mais les valeurs négatives sont un peu bizarres et difficiles à analyser,
surtout pour un premier exemple. Donc, continuons simplement à penser en termes de graphique décalé. Je veux juste que vous compreniez que cette pointe autour de zéro ne
correspond qu’au changement. Notre objectif principal, en ce qui concerne la décomposition de
fréquence, est ce décalage à trois. Toute cette intrigue est ce que j’appellerai la « Quasi-transformation de
Fourier » du signal d’origine. Il y a quelques petites distinctions entre cette transformation et la
transformée de Fourier, à laquelle je reviendrai dans quelques
minutes. Mais déjà, vous pourrez peut-être voir comment cette machine nous permet
de choisir la fréquence d’un signal.
Juste pour jouer un peu plus, prenez un signal pur différent, disons avec
une fréquence inférieure de deux battements par seconde, et faites
la même chose. Enroulez-le autour d’un cercle. Imaginez différentes fréquences de bobinage potentielles. Et pendant que vous faites cela, gardez une trace de l’endroit où se
trouve le centre de masse de ce graphique. Et ensuite, tracez la coordonnée 𝑥 de ce centre de masse lorsque vous
ajustez la fréquence de bobinage. Tout comme auparavant, nous avons un pic lorsque la fréquence
d’enroulement est la même que la fréquence du signal, ce qui
correspond dans ce cas à deux cycles par seconde. Mais le vrai point fort, ce qui rend cette machine si agréable, c’est la
façon dont elle nous permet de prendre un signal composé de
plusieurs fréquences et de choisir ce qu’elles sont.
Imaginez que vous prenez les deux signaux que nous venons de voir, la
vague avec trois battements par seconde et la vague avec deux
battements par seconde, et que vous les additionnez. Comme je l’ai dit plus tôt, ce que vous obtenez n’est plus une belle
vague de cosinus pure. C’est quelque chose d’un peu plus compliqué. Mais imaginons de placer cela dans notre machine à fréquence
sinueuse. Il est certain que lorsque vous abordez ce problème, cela semble beaucoup
plus compliqué. Vous avez ce chaos et le chaos et le chaos et le chaos et puis WOOP ! Les choses semblent s’aligner très bien à deux cycles par seconde. Et à mesure que vous continuez, il y a de plus en plus de chaos et plus
de chaos et plus de chaos, chaos, chaos, chaos, WOOP ! Les choses s’harmonisent à nouveau à trois cycles par seconde. Et, comme je l’ai déjà dit, le graphique enroulé peut paraître complexe
et compliqué. Mais tout ce qu’il faut, c’est l’idée relativement simple d’enrouler le
graphique autour du cercle. C’est juste un graphique plus compliqué et une fréquence assez
rapide.
Maintenant, ce qui se passe ici avec les deux pics différents, c’est que
si vous deviez prendre deux signaux puis appliquer cette
transformation de quasi-Fourier à chacun d’eux individuellement,
puis additionner les résultats. Ce que vous obtenez est le même que si vous aviez d’abord additionné les
signaux, puis appliqué cette transformation de quasi-Fourier. Et les téléspectateurs attentifs parmi vous voudront peut-être faire une
pause et réfléchir et vous convaincre que ce que je viens de dire
est réellement vrai. C’est un assez bon test pour vérifier par vous-même que ce qui est
exactement mesuré à l’intérieur de cette machine est clair. Maintenant, cette propriété rend les choses vraiment utiles. Parce que la transformation d’une fréquence pure est presque nulle
partout sauf pour une pointe autour de cette fréquence. Ainsi, lorsque vous additionnez deux fréquences pures, le graphe de
transformation a simplement ces petits pics au-dessus des fréquences
qui y sont entrées.
Donc, cette petite machine mathématique fait exactement ce que nous
voulions. Elle tire les fréquences originales de leurs sommes confuses, démantelant
le seau mélangé de peinture. Et avant de poursuivre dans la plaine mathématique qui décrit cette
opération, nous allons obtenir juste un aperçu rapide d’un contexte
où cette chose est utile, le montage sonore. Disons que vous avez un enregistrement. Et il y a un son aigu gênant que vous voudriez filtrer. Eh bien, au début, votre signal arrive en fonction de différentes
intensités dans le temps, de tensions différentes données à votre
haut-parleur d’une milliseconde à l’autre. Mais nous voulons penser à cela en termes de fréquences. Alors, quand vous prenez la transformée de Fourier de ce signal, le son
aigu gênant va apparaître comme une pointe à une fréquence
élevée.. En filtrant cela en effaçant simplement la pointe, vous regardez la
transformation de Fourier d’un son qui ressemble à votre
enregistrement, mais sans cette haute fréquence.
Heureusement, il existe une notion de transformée de Fourier inverse qui
vous indique quel signal l’aurait produite en tant que transformée
de Fourier. Je parlerai de l’inverse beaucoup plus en détail dans la prochaine
vidéo. Mais pour faire court, appliquer la transformation de Fourier à la
transformation de Fourier vous restitue quelque chose de proche de
la fonction originale. C’est un peu un mensonge, mais c’est dans le sens de la vérité. Et la plupart des raisons pour lesquelles c’est un mensonge est que je
n’ai toujours pas dit ce qu’est la transformée de Fourier
réelle. Puisqu’il est un peu plus complexe que cette coordonnée 𝑥 de l’idée de
centre de masse.
Tout d’abord, ramenant ce graphique enroulé et regardant son centre de
masse, la coordonnée 𝑥 est vraiment seulement la moitié de
l’histoire, non ? Je veux dire, cette chose est en deux dimensions. Il y a aussi une coordinée 𝑦. Et, comme il est typique en maths, chaque fois que vous avez affaire à
quelque chose de bidimensionnel, il est élégant de le considérer
comme un plan complexe. Où ce centre de masse va devenir un nombre complexe qui comporte à la
fois une partie réelle et une partie imaginaire. Et la raison pour laquelle il faut parler en termes de nombres complexes
plutôt que de dire simplement qu’elle a deux coordonnées est que les
nombres complexes se prêtent à de très jolies descriptions de choses
concernant le bobinage et la rotation.
Par exemple, la formule d’Euler nous dit que si vous prenez e puissance
un nombre fois 𝑖. Vous allez atterrir sur le point que vous obtenez, si vous marchiez ce
nombre d’unités autour d’un cercle de rayon un dans le sens
anti-horaire, en commençant à droite. Alors, imaginez que vous vouliez décrire la rotation à un rythme d’un
cycle par seconde. Une chose que vous pouvez faire est de prendre l’expression 𝑒 de deux 𝜋
fois 𝑖 fois 𝑡, où 𝑡 est la quantité de temps qui s’est
écoulée. Étant donné que, pour un cercle de rayon un, deux 𝜋 décrit toute la
longueur de sa circonférence. Et c’est un peu vertigineux à regarder. Alors peut-être que vous voulez décrire une fréquence différente, quelque
chose de plus bas et de plus raisonnable. Et pour cela, il vous suffirait de multiplier ce temps 𝑡 dans l’exposant
par la fréquence, 𝑓.
Par exemple, si 𝑓 était égal à un dixième, alors ce vecteur effectue un
tour complet toutes les 10 secondes, car le temps 𝑡 doit augmenter
jusqu’à 10 avant que l’exposant complet ne ressemble à deux
𝜋𝑖. J’ai une autre vidéo donnant une intuition sur le comportement de 𝑒 à la
puissance 𝑥 pour les entrées imaginaires, si vous êtes curieux. Mais pour l’instant, nous allons le prendre pour acquis. Maintenant, pourquoi est-ce que je vous dis cela, vous pourriez
demander. Eh bien, cela nous donne un très bon moyen d’écrire l’idée de résumer le
graphique en une petite formule simple et serrée. Tout d’abord, la convention dans le contexte des transformées de Fourier
est de penser à tourner dans le sens des aiguilles d’une montre. Alors allons-y et plaçons un signe négatif dans cet exposant.
Maintenant, prenez une fonction décrivant une intensité de signal en
fonction du temps, comme cette onde pure cosinus que nous avions
avant, et l’appeler 𝑔 de 𝑡. Si vous multipliez cette fois exponentielle d’expression 𝑔 de 𝑡, cela
signifie que le nombre complexe de rotation est mis à l’échelle
selon la valeur de cette fonction. Vous pouvez donc penser que ce petit vecteur en rotation, dont la
longueur change, dessine le graphe enroulé. Alors réfléchis-y. C’est génial ! Cette expression vraiment petit est un moyen super élégant pour résumer
l’idée d’enrouler un graphique autour d’un cercle avec une fréquence
variable, 𝑓. Et rappelez-vous, ce que nous voulons faire avec ce graphe enroulé est de
suivre son centre de masse. Alors, pensez à ce que la formule va capturer de cela.
Eh bien, pour vous en approcher au moins, vous pouvez échantillonner de
nombreuses fois le signal d’origine, voir où ces points se
retrouvent sur le graphe enroulé, puis prendre une moyenne. Autrement dit, additionnez-les tous ensemble sous forme de nombres
complexes, puis divisez-les par le nombre de points
échantillonnés. Cela deviendra plus précis si vous échantillonnez plus de points
rapprochés. Et dans la limite, plutôt que de regarder la somme de tout un nombre de
points divisé par le nombre de points, vous prenez une intégrale de
cette fonction divisée par la taille de l’intervalle de temps
considéré. Maintenant, l’idée d’intégrer une fonction à valeurs complexes peut
sembler étrange, et pour quiconque est instable avec le calcul,
peut-être même intimidant. Mais la signification sous-jacente ne nécessite aucune connaissance en
calcul. L’expression entière n’est que le centre de masse du graphe enroulé.
Tellement bon ! Étape par étape, nous avons construit ce genre de compliqué, mais,
avouons - le, étonnamment petite expression pour toute
idée-bobineuse dont je parlais. Et maintenant, il n’y a qu’une dernière distinction à faire entre ceci et
la transformation de Fourier honnête en bonté. À savoir, il suffit de ne pas diviser par l’intervalle de temps. La transformée de Fourier n’en est que la partie intégrante. Ce que cela signifie, c’est qu’au lieu de regarder le centre de masse,
vous l’augmenteriez d’un peu. Si la partie du graphique d’origine que vous utilisiez s’étendait sur
trois secondes, vous multiplieriez le centre de masse par trois. S’il s’étendait sur six secondes, vous multiplieriez le centre de masse
par six. Physiquement, cela a pour effet que lorsqu’une certaine fréquence
persiste pendant une longue période, l’amplitude de la transformée
de Fourier à cette fréquence est augmentée de plus en plus.
Par exemple, ce que nous examinons ici, c’est comment, lorsque vous avez
une fréquence pure de deux battements par seconde et que vous
l’enroulez autour du graphique à deux cycles par seconde, le centre
de masse reste au même endroit, non ? Il faut tout simplement tracer la même figure. Mais plus le signal persiste, plus la valeur de la transformée de Fourier
est grande à cette fréquence. Pour d’autres fréquences cependant, même si vous l’augmentez juste un
peu, ceci est annulé par le fait que pendant des intervalles de
temps plus longs, vous donnez au graphe enroulé plus de chance de
s’équilibrer autour du cercle. Cela fait beaucoup de pièces mobiles différentes. Revenons donc en arrière et résumons ce que nous avons jusqu’à
présent.
La transformée de Fourier d’une fonction d’intensité en fonction du
temps, comme 𝑔 de 𝑡, est une nouvelle fonction qui n’a pas de
temps comme entrée. Mais au lieu de cela prend une fréquence, ce que j’ai appelé la fréquence
de bobinage. En termes de notation, la convention commune est d’appeler cette nouvelle
fonction 𝑔 chapeau, avec un petit circonflexe par-dessus. Maintenant, la sortie de cette fonction est un nombre complexe, un point
dans le plan 2D qui correspond à la force d’une fréquence donnée
dans le signal original. L’intrigue que j’ai pour la transformée de Fourier est juste la
composante réelle de cette sortie, la coordonnée 𝑥. Mais vous pouvez également représenter graphiquement la composante
imaginaire, séparément, si vous souhaitez une description plus
complète. Et tout cela est résumé dans la formule que nous avons élaborée.
Et hors contexte, vous pouvez imaginer à quel point voir cette formule
peut sembler décourageant. Mais si vous comprenez comment les exponentielles correspondent à la
rotation. Comment multiplier cela par la fonction 𝑔 de 𝑡 signifie dessiner une
version enroulée du graphique. Et comment une intégrale d’une fonction à valeurs complexes peut être
interprétée en termes d’une idée de centre de masse. Vous pouvez voir comment tout cela comporte une signification très riche
et intuitive. Et, en passant, une petite note rapide avant que nous puissions considéré
ceci comme fini. Même si en pratique, avec des choses comme l’édition sonore, vous allez
intégrer sur un intervalle de temps fini, la théorie des
transformées de Fourier est souvent énoncée où les bornes de cette
intégrale sont moins l’infini et plus l’infini.
Concrètement, cela signifie que vous considérez cette expression pour
tous les intervalles de temps finis possibles. Et vous demandez simplement quelle est sa limite lorsque cet intervalle
de temps se développe à l’infini ? Et mec, mec, il y a tellement plus à dire, tellement ! Je ne veux pas parler d’une propriété ici. Cette transformation s’étend aux coins des mathématiques bien au-delà de
l’idée d’extraire des fréquences du signal. Donc, la prochaine vidéo que je publie passera en revue quelques-unes
d’entre elles. Et c’est vraiment là que les choses commencent à devenir
intéressantes.