Vidéo : Mais quelle est la transformée de Fourier ? Une introduction visuelle

Grant Sanderson • 3Blue1Brown • Boclips

Mais quelle est la transformée de Fourier ? Une introduction visuelle

19:09

Transcription de vidéo

Voici ce que nous allons ajouter à cette vidéo : une certaine approche animée pour réfléchir à une idée extrêmement importante issue des mathématiques, la transformation de Fourier. Pour ceux qui ne sont pas familiers avec cela, mon objectif premier est simplement que la vidéo soit une introduction à ce sujet. Mais même pour ceux d’entre vous qui le connaissent déjà, je pense toujours qu’il est amusant et enrichissant de voir à quoi ressemblent réellement toutes ses composantes.

L’exemple central, pour commencer, va être un classique, la décomposition des fréquences du son. Mais après cela, je veux aussi vraiment montrer comment cette idée s’étend bien au-delà du son et de la fréquence dans de nombreux domaines apparemment disparates des mathématiques et même de la physique. Vraiment, il est fou à quel point cette idée est omniprésente. Plongeons dedans.

Ce son ici est un pur A, 440 battements par seconde. Cela signifie que vous devez mesurer la pression atmosphérique juste à côté de votre casque ou de votre haut-parleur en fonction du temps. Elle oscillerait de haut en bas autour de son équilibre habituel dans cette onde, en produisant 440 oscillations chaque seconde. Une note plus grave, comme un D, a la même structure, à peine moins de battements par seconde. Et quand on joue en même temps, à quoi ressemble le graphique de la pression en fonction du temps qui en résulte ? Eh bien, à tout instant, cette différence de pression sera la somme de ce qu’elle serait pour chacune de ces notes individuellement. Ce qui, avouons-le, est un peu compliqué à penser.

En certains instants, les pics se rejoignent, ce qui crée une très forte pression. En d’autres instants, ils ont tendance à s’annuler. Et dans l’ensemble, vous obtenez un graphique vague-pression-contre-temps qui n’est pas une onde sinusoïdale pure. C’est quelque chose de plus compliqué. Et à mesure que vous ajoutez d’autres notes, la vague devient de plus en plus compliquée. Mais pour l’instant, il s’agit d’une combinaison de quatre fréquences pures. Cela semble donc inutilement compliqué compte tenu de la faible quantité d’informations qui y sont contenues. Un microphone enregistrant n’importe quel son détecte la pression atmosphérique en différents instants. Il ne voit que la somme finale. Donc, notre question centrale va être, comment vous pouvez prendre un signal comme celui-ci et le décomposer dans les fréquences pures qui le composent ? Très intéressant, non ?

Additionner ces signaux les mélange vraiment tous ensemble. En les séparant, on a l’impression de mélanger plusieurs couleurs de peinture mélangées. La stratégie générale va être de construire pour nous-mêmes une machine mathématique qui traite des signaux avec une fréquence différente donnée de la façon dont il traite les autres signaux. Pour commencer, envisagez simplement de prendre un signal pur, par exemple avec un faible trois battements par seconde, afin que nous puissions le tracer facilement. Et limitons-nous à regarder une partie finie de ce graphique. Dans ce cas, la partie comprise entre zéro seconde et 4.5 secondes. L’idée principale sera de prendre ce graphique et de l’enrouler autour d’un cercle.

Concrètement, voici ce que je veux dire par là. Imaginez un petit vecteur en rotation où chaque instant sa longueur est égale à la hauteur de notre graphique pour ce temps. Ainsi, les points hauts du graphique correspondent à une plus grande distance de l’origine. Et les points faibles se retrouvent plus près de l’origine. Et pour le moment, je le dessine de telle manière qu’avancer de deux secondes correspond à une seule rotation autour du cercle. Notre petit vecteur dessinant ce graphe enroulé tourne à un demi-cycle par seconde. Donc, c’est important. Il y a deux fréquences différentes en jeu ici. Il y a la fréquence de notre signal, qui va et vient, trois fois par seconde. Et puis, séparément, il y a la fréquence à laquelle nous enroulons le graphique autour du cercle. Ce qui correspond pour le moment à une demi-rotation par seconde.

Mais nous pouvons ajuster cette seconde fréquence comme bon nous semble. Peut-être que nous voulons en faire plus vite ou peut-être en faire plus lentement. Et ce choix de fréquence d’enroulement détermine l’aspect du graphe enroulé. Certains des diagrammes qui en résultent peuvent être assez compliqués, bien qu’ils soient très jolis. Mais il est important de garder à l’esprit que tout ce qui se passe ici, c’est que nous entourons le signal autour d’un cercle. Les lignes verticales que je dessine en haut ne sont, par ailleurs, qu’un moyen de suivre la distance sur le graphique d’origine qui correspond à une rotation complète autour du cercle. Ainsi, des lignes espacées de 1.5 secondes signifient qu’il faut 1.5 secondes pour effectuer un tour complet.

Et à ce stade, nous pourrions avoir une sorte de vague impression que quelque chose de spécial se produira lorsque la fréquence d’enroulement correspondra à la fréquence de notre signal, trois battements par seconde. Tous les points forts du graphique se trouvent à droite du cercle. Et tous les points bas se produisent à gauche. Mais comment pouvons-nous en tirer parti dans notre tentative de construire une machine à séparer les fréquences ? Eh bien, imaginez que ce graphique ait une sorte de masse, comme un fil métallique. Ce petit point va représenter le centre de masse de ce fil. Au fur et à mesure que nous changeons la fréquence et que le graphique tourne différemment, ce centre de masse vacille un peu. Et pour la plupart des fréquences sinueuses, les pics et les creux sont tous espacés le long du cercle de manière à ce que le centre de masse reste assez proche de l’origine.

Mais, lorsque la fréquence d’enroulement est la même que la fréquence de notre signal, dans ce cas trois cycles par seconde, tous les pics sont à droite et toutes les creux sont à gauche. Ainsi, le centre de masse est exceptionnellement loin à droite. Ici, pour capturer cela, dessinons une sorte d’intrigue qui garde la trace de ce centre de masse pour chaque fréquence d’enroulement. Bien sûr, le centre de masse est une chose en deux dimensions. Il a besoin de deux coordonnées pour maintenir complètement la trace. Mais pour le moment, gardons seulement une trace de la coordonnée 𝑥. Donc, pour une fréquence de zéro, quand tout est groupé à droite, cette coordonnée 𝑥 est relativement élevée. Et puis, à mesure que vous augmentez la fréquence de bobinage et que le graphique se balance autour du cercle, la coordonnée 𝑥 de ce centre de gravité se rapproche de zéro. Et ça vacille un peu.

Mais ensuite, à trois battements par seconde, il y a une pointe alors que tout s’aligne à droite. Ceci est la construction centrale. Résumons donc ce que nous avons jusqu’à présent. Nous avons ce graphique original d’intensité en fonction du temps. Et puis, nous avons la version enroulée de cela dans un plan bidimensionnel. Troisièmement, nous avons un graphique montrant comment la fréquence des enroulements influence le centre de gravité de ce graphique. Et au fait, regardons ces très basses fréquences proches de zéro. Ce pic important autour de zéro dans notre nouveau tracé de fréquence correspond simplement au fait que toute l’onde cosinus est déplacée vers le haut. Si j’avais choisi un signal qui oscille autour de zéro, plongeant dans des valeurs négatives. Ensuite, alors que nous jouons avec différentes fréquences d’enroulement, cette représentation graphique de la fréquence d’enroulement par rapport au centre de masse n’aurait qu’un pic à la valeur de trois.

Mais les valeurs négatives sont un peu bizarres et difficiles à analyser, surtout pour un premier exemple. Donc, continuons simplement à penser en termes de graphique décalé. Je veux juste que vous compreniez que cette pointe autour de zéro ne correspond qu’au changement. Notre objectif principal, en ce qui concerne la décomposition de fréquence, est ce décalage à trois. Toute cette intrigue est ce que j’appellerai la « Quasi-transformation de Fourier » du signal d’origine. Il y a quelques petites distinctions entre cette transformation et la transformée de Fourier, à laquelle je reviendrai dans quelques minutes. Mais déjà, vous pourrez peut-être voir comment cette machine nous permet de choisir la fréquence d’un signal.

Juste pour jouer un peu plus, prenez un signal pur différent, disons avec une fréquence inférieure de deux battements par seconde, et faites la même chose. Enroulez-le autour d’un cercle. Imaginez différentes fréquences de bobinage potentielles. Et pendant que vous faites cela, gardez une trace de l’endroit où se trouve le centre de masse de ce graphique. Et ensuite, tracez la coordonnée 𝑥 de ce centre de masse lorsque vous ajustez la fréquence de bobinage. Tout comme auparavant, nous avons un pic lorsque la fréquence d’enroulement est la même que la fréquence du signal, ce qui correspond dans ce cas à deux cycles par seconde. Mais le vrai point fort, ce qui rend cette machine si agréable, c’est la façon dont elle nous permet de prendre un signal composé de plusieurs fréquences et de choisir ce qu’elles sont.

Imaginez que vous prenez les deux signaux que nous venons de voir, la vague avec trois battements par seconde et la vague avec deux battements par seconde, et que vous les additionnez. Comme je l’ai dit plus tôt, ce que vous obtenez n’est plus une belle vague de cosinus pure. C’est quelque chose d’un peu plus compliqué. Mais imaginons de placer cela dans notre machine à fréquence sinueuse. Il est certain que lorsque vous abordez ce problème, cela semble beaucoup plus compliqué. Vous avez ce chaos et le chaos et le chaos et le chaos et puis WOOP ! Les choses semblent s’aligner très bien à deux cycles par seconde. Et à mesure que vous continuez, il y a de plus en plus de chaos et plus de chaos et plus de chaos, chaos, chaos, chaos, WOOP ! Les choses s’harmonisent à nouveau à trois cycles par seconde. Et, comme je l’ai déjà dit, le graphique enroulé peut paraître complexe et compliqué. Mais tout ce qu’il faut, c’est l’idée relativement simple d’enrouler le graphique autour du cercle. C’est juste un graphique plus compliqué et une fréquence assez rapide.

Maintenant, ce qui se passe ici avec les deux pics différents, c’est que si vous deviez prendre deux signaux puis appliquer cette transformation de quasi-Fourier à chacun d’eux individuellement, puis additionner les résultats. Ce que vous obtenez est le même que si vous aviez d’abord additionné les signaux, puis appliqué cette transformation de quasi-Fourier. Et les téléspectateurs attentifs parmi vous voudront peut-être faire une pause et réfléchir et vous convaincre que ce que je viens de dire est réellement vrai. C’est un assez bon test pour vérifier par vous-même que ce qui est exactement mesuré à l’intérieur de cette machine est clair. Maintenant, cette propriété rend les choses vraiment utiles. Parce que la transformation d’une fréquence pure est presque nulle partout sauf pour une pointe autour de cette fréquence. Ainsi, lorsque vous additionnez deux fréquences pures, le graphe de transformation a simplement ces petits pics au-dessus des fréquences qui y sont entrées.

Donc, cette petite machine mathématique fait exactement ce que nous voulions. Elle tire les fréquences originales de leurs sommes confuses, démantelant le seau mélangé de peinture. Et avant de poursuivre dans la plaine mathématique qui décrit cette opération, nous allons obtenir juste un aperçu rapide d’un contexte où cette chose est utile, le montage sonore. Disons que vous avez un enregistrement. Et il y a un son aigu gênant que vous voudriez filtrer. Eh bien, au début, votre signal arrive en fonction de différentes intensités dans le temps, de tensions différentes données à votre haut-parleur d’une milliseconde à l’autre. Mais nous voulons penser à cela en termes de fréquences. Alors, quand vous prenez la transformée de Fourier de ce signal, le son aigu gênant va apparaître comme une pointe à une fréquence élevée.. En filtrant cela en effaçant simplement la pointe, vous regardez la transformation de Fourier d’un son qui ressemble à votre enregistrement, mais sans cette haute fréquence.

Heureusement, il existe une notion de transformée de Fourier inverse qui vous indique quel signal l’aurait produite en tant que transformée de Fourier. Je parlerai de l’inverse beaucoup plus en détail dans la prochaine vidéo. Mais pour faire court, appliquer la transformation de Fourier à la transformation de Fourier vous restitue quelque chose de proche de la fonction originale. C’est un peu un mensonge, mais c’est dans le sens de la vérité. Et la plupart des raisons pour lesquelles c’est un mensonge est que je n’ai toujours pas dit ce qu’est la transformée de Fourier réelle. Puisqu’il est un peu plus complexe que cette coordonnée 𝑥 de l’idée de centre de masse.

Tout d’abord, ramenant ce graphique enroulé et regardant son centre de masse, la coordonnée 𝑥 est vraiment seulement la moitié de l’histoire, non ? Je veux dire, cette chose est en deux dimensions. Il y a aussi une coordinée 𝑦. Et, comme il est typique en maths, chaque fois que vous avez affaire à quelque chose de bidimensionnel, il est élégant de le considérer comme un plan complexe. Où ce centre de masse va devenir un nombre complexe qui comporte à la fois une partie réelle et une partie imaginaire. Et la raison pour laquelle il faut parler en termes de nombres complexes plutôt que de dire simplement qu’elle a deux coordonnées est que les nombres complexes se prêtent à de très jolies descriptions de choses concernant le bobinage et la rotation.

Par exemple, la formule d’Euler nous dit que si vous prenez e puissance un nombre fois 𝑖. Vous allez atterrir sur le point que vous obtenez, si vous marchiez ce nombre d’unités autour d’un cercle de rayon un dans le sens anti-horaire, en commençant à droite. Alors, imaginez que vous vouliez décrire la rotation à un rythme d’un cycle par seconde. Une chose que vous pouvez faire est de prendre l’expression 𝑒 de deux 𝜋 fois 𝑖 fois 𝑡, où 𝑡 est la quantité de temps qui s’est écoulée. Étant donné que, pour un cercle de rayon un, deux 𝜋 décrit toute la longueur de sa circonférence. Et c’est un peu vertigineux à regarder. Alors peut-être que vous voulez décrire une fréquence différente, quelque chose de plus bas et de plus raisonnable. Et pour cela, il vous suffirait de multiplier ce temps 𝑡 dans l’exposant par la fréquence, 𝑓.

Par exemple, si 𝑓 était égal à un dixième, alors ce vecteur effectue un tour complet toutes les 10 secondes, car le temps 𝑡 doit augmenter jusqu’à 10 avant que l’exposant complet ne ressemble à deux 𝜋𝑖. J’ai une autre vidéo donnant une intuition sur le comportement de 𝑒 à la puissance 𝑥 pour les entrées imaginaires, si vous êtes curieux. Mais pour l’instant, nous allons le prendre pour acquis. Maintenant, pourquoi est-ce que je vous dis cela, vous pourriez demander. Eh bien, cela nous donne un très bon moyen d’écrire l’idée de résumer le graphique en une petite formule simple et serrée. Tout d’abord, la convention dans le contexte des transformées de Fourier est de penser à tourner dans le sens des aiguilles d’une montre. Alors allons-y et plaçons un signe négatif dans cet exposant.

Maintenant, prenez une fonction décrivant une intensité de signal en fonction du temps, comme cette onde pure cosinus que nous avions avant, et l’appeler 𝑔 de 𝑡. Si vous multipliez cette fois exponentielle d’expression 𝑔 de 𝑡, cela signifie que le nombre complexe de rotation est mis à l’échelle selon la valeur de cette fonction. Vous pouvez donc penser que ce petit vecteur en rotation, dont la longueur change, dessine le graphe enroulé. Alors réfléchis-y. C’est génial ! Cette expression vraiment petit est un moyen super élégant pour résumer l’idée d’enrouler un graphique autour d’un cercle avec une fréquence variable, 𝑓. Et rappelez-vous, ce que nous voulons faire avec ce graphe enroulé est de suivre son centre de masse. Alors, pensez à ce que la formule va capturer de cela.

Eh bien, pour vous en approcher au moins, vous pouvez échantillonner de nombreuses fois le signal d’origine, voir où ces points se retrouvent sur le graphe enroulé, puis prendre une moyenne. Autrement dit, additionnez-les tous ensemble sous forme de nombres complexes, puis divisez-les par le nombre de points échantillonnés. Cela deviendra plus précis si vous échantillonnez plus de points rapprochés. Et dans la limite, plutôt que de regarder la somme de tout un nombre de points divisé par le nombre de points, vous prenez une intégrale de cette fonction divisée par la taille de l’intervalle de temps considéré. Maintenant, l’idée d’intégrer une fonction à valeurs complexes peut sembler étrange, et pour quiconque est instable avec le calcul, peut-être même intimidant. Mais la signification sous-jacente ne nécessite aucune connaissance en calcul. L’expression entière n’est que le centre de masse du graphe enroulé.

Tellement bon ! Étape par étape, nous avons construit ce genre de compliqué, mais, avouons - le, étonnamment petite expression pour toute idée-bobineuse dont je parlais. Et maintenant, il n’y a qu’une dernière distinction à faire entre ceci et la transformation de Fourier honnête en bonté. À savoir, il suffit de ne pas diviser par l’intervalle de temps. La transformée de Fourier n’en est que la partie intégrante. Ce que cela signifie, c’est qu’au lieu de regarder le centre de masse, vous l’augmenteriez d’un peu. Si la partie du graphique d’origine que vous utilisiez s’étendait sur trois secondes, vous multiplieriez le centre de masse par trois. S’il s’étendait sur six secondes, vous multiplieriez le centre de masse par six. Physiquement, cela a pour effet que lorsqu’une certaine fréquence persiste pendant une longue période, l’amplitude de la transformée de Fourier à cette fréquence est augmentée de plus en plus.

Par exemple, ce que nous examinons ici, c’est comment, lorsque vous avez une fréquence pure de deux battements par seconde et que vous l’enroulez autour du graphique à deux cycles par seconde, le centre de masse reste au même endroit, non ? Il faut tout simplement tracer la même figure. Mais plus le signal persiste, plus la valeur de la transformée de Fourier est grande à cette fréquence. Pour d’autres fréquences cependant, même si vous l’augmentez juste un peu, ceci est annulé par le fait que pendant des intervalles de temps plus longs, vous donnez au graphe enroulé plus de chance de s’équilibrer autour du cercle. Cela fait beaucoup de pièces mobiles différentes. Revenons donc en arrière et résumons ce que nous avons jusqu’à présent.

La transformée de Fourier d’une fonction d’intensité en fonction du temps, comme 𝑔 de 𝑡, est une nouvelle fonction qui n’a pas de temps comme entrée. Mais au lieu de cela prend une fréquence, ce que j’ai appelé la fréquence de bobinage. En termes de notation, la convention commune est d’appeler cette nouvelle fonction 𝑔 chapeau, avec un petit circonflexe par-dessus. Maintenant, la sortie de cette fonction est un nombre complexe, un point dans le plan 2D qui correspond à la force d’une fréquence donnée dans le signal original. L’intrigue que j’ai pour la transformée de Fourier est juste la composante réelle de cette sortie, la coordonnée 𝑥. Mais vous pouvez également représenter graphiquement la composante imaginaire, séparément, si vous souhaitez une description plus complète. Et tout cela est résumé dans la formule que nous avons élaborée.

Et hors contexte, vous pouvez imaginer à quel point voir cette formule peut sembler décourageant. Mais si vous comprenez comment les exponentielles correspondent à la rotation. Comment multiplier cela par la fonction 𝑔 de 𝑡 signifie dessiner une version enroulée du graphique. Et comment une intégrale d’une fonction à valeurs complexes peut être interprétée en termes d’une idée de centre de masse. Vous pouvez voir comment tout cela comporte une signification très riche et intuitive. Et, en passant, une petite note rapide avant que nous puissions considéré ceci comme fini. Même si en pratique, avec des choses comme l’édition sonore, vous allez intégrer sur un intervalle de temps fini, la théorie des transformées de Fourier est souvent énoncée où les bornes de cette intégrale sont moins l’infini et plus l’infini.

Concrètement, cela signifie que vous considérez cette expression pour tous les intervalles de temps finis possibles. Et vous demandez simplement quelle est sa limite lorsque cet intervalle de temps se développe à l’infini ? Et mec, mec, il y a tellement plus à dire, tellement ! Je ne veux pas parler d’une propriété ici. Cette transformation s’étend aux coins des mathématiques bien au-delà de l’idée d’extraire des fréquences du signal. Donc, la prochaine vidéo que je publie passera en revue quelques-unes d’entre elles. Et c’est vraiment là que les choses commencent à devenir intéressantes.

Nagwa utilise des cookies pour vous garantir la meilleure expérience sur notre site. En savoir plus sur notre Politique de Confidentialité.