Vidéo pop :: Le paradoxe de la dérivée

Grant Sanderson • 3Blue1Brown • Boclips

Le paradoxe de la dérivée

16:50

Transcription de la vidéo

Le but ici est simple : expliquer ce qu’est une dérivée. Le problème, c’est qu’il y a une certaine subtilité dans ce sujet et un grand potentiel de paradoxes si vous ne faites pas attention. Le second but est donc de comprendre ce que sont ces paradoxes et comment les éviter.

Vous voyez, il est fréquent qu’on dise que la dérivée mesure un taux de variation instantané. Mais quand on y pense, cette phrase est en fait un oxymoron. La variation est quelque chose qui se produit entre des instants distincts. Et quand vous vous aveuglez à tout sauf un seul instant, il n’y a vraiment pas de place pour la variation. Vous verrez ce que je veux dire au fur et à mesure que nous avancerons. Mais quand vous comprenez qu’une phrase telle que « taux de variation instantané » n’a en fait aucun sens, je pense que cela vous aidera à comprendre à quel point les pères de l’analyse étaient intelligents à saisir l’idée que cette phrase est censée évoquer, mais avec une pièce de mathématiques parfaitement sensée : la dérivée.

Pour notre exemple central, je veux que vous imaginiez une voiture qui démarre d’un point A, accélère puis ralentit jusqu’à s’arrêter en un point B à 100 mètres. Et disons que tout se passe en 10 secondes. C’est la configuration à garder en tête lorsque nous définissons ce qu’est une dérivée. Nous pourrions représenter graphiquement ce mouvement, en représentant la distance parcourue sur l’axe vertical et le temps sur l’axe horizontal. Ainsi, à chaque instant 𝑡 représenté par un point sur cet axe horizontal, la hauteur du graphique nous indique la distance totale parcourue par la voiture après cette durée de temps.

Il est assez fréquent de nommer une fonction de distance ainsi, 𝑠 de 𝑡. J’aurais voulu utiliser la lettre 𝑑 pour la distance. Mais ce gars a déjà un autre travail à temps plein en analyse. Au départ, cette courbe est assez plate car la voiture est lente à démarrer. Pendant cette première seconde, la distance parcourue ne change pas vraiment. Ensuite, pendant les secondes qui suivent, alors que la voiture accélère, la distance parcourue en une seconde donnée augmente, ce qui correspond à une pente plus raide sur ce graphique. Et puis vers la fin, quand elle ralentit, cette courbe s’aplatit à nouveau.

Et si nous devions représenter graphiquement la vitesse de la voiture en mètres par seconde en fonction du temps, elle pourrait ressembler à cette courbe. Au début, la vitesse est très faible. Jusqu’au milieu du trajet, la voiture atteint une vitesse maximale, parcourant une distance relativement grande chaque seconde. Ensuite, elle ralentit vers la vitesse zéro. Et ces deux courbes sont vraiment liées l’une à l’autre, non ? Si vous modifiez la fonction de distance par rapport au temps, vous obtiendrez une différente fonction de vitesse par rapport au temps. Et ce que nous voulons comprendre, ce sont les détails de cette relation. Précisément, comment la vitesse dépend-elle d’une fonction distance-temps ?

Et pour ce faire, ça vaut la peine de prendre un moment pour réfléchir de manière critique à ce que signifie exactement « vitesse ». Intuitivement, nous pourrions tous savoir ce que signifie la vitesse à un moment donné. C’est ce que l’indicateur de vitesse de la voiture indique à cet instant. Et intuitivement, il peut sembler logique que la vitesse de la voiture soit plus élevée lorsque cette fonction de distance est plus raide, lorsque la voiture parcourt une plus grande distance par unité de temps. Mais ce qui est drôle, c’est que la vitesse à un moment donné n’a aucun sens. Si je vous montre la photo d’une voiture, juste un instantané en un instant, et vous demande à quelle vitesse elle roule, vous n’auriez aucun moyen de me le dire. Ce dont vous auriez besoin, c’est deux instants différents à comparer. De cette façon, vous pouvez calculer n’importe quelle variation de distance entre ces instants, divisée par la variation de temps, n’est-ce pas ? Je veux dire que c’est ça la vitesse. C’est la distance parcourue par unité de temps.

Alors, comment se fait-il que nous envisagions une fonction de vitesse qui ne prend qu’une seule valeur de 𝑡, un seul instantané dans le temps ? C’est bizarre, n’est-ce pas ? Nous voulons associer des instants particuliers à la vitesse. Mais en réalité, le calcul de la vitesse nécessite la comparaison de deux points distincts dans le temps. Si cela semble étrange et paradoxal, tant mieux ! Vous êtes aux prises avec les mêmes conflits que les pères de l’analyse. Et si vous voulez comprendre en profondeur les taux de variation, pas seulement pour une voiture en mouvement, mais pour toutes sortes d’activités scientifiques, il vous faudra résoudre cet apparent paradoxe.

Tout d’abord, je pense qu’il est préférable de parler du monde réel. Et ensuite, nous allons passer à une question purement mathématique. Réfléchissons à ce que fait probablement l’indicateur de vitesse de la voiture. À un instant donné, disons trois secondes après le début du trajet, le compteur de vitesse peut mesurer la distance parcourue par la voiture en très peu de temps, peut-être la distance parcourue entre trois secondes et 3,01 secondes. Ensuite, il pourrait calculer la vitesse en mètres par seconde comme étant la distance parcourue en mètres divisée par ce temps infime, 0.01 seconde. C’est-à-dire qu’une vraie voiture élude le paradoxe et ne calcule pas vraiment la vitesse à un instant donné. Elle calcule la vitesse pendant très peu de temps. Appelons donc cette différence de temps d𝑡, à laquelle vous pourriez penser dans ce cas comme 0.01 seconde. Et appelons cette différence de distance résultante d𝑠. Donc, la vitesse à un instant donné est d𝑠 divisée par d𝑡, la petite variation de distance sur la petite variation de temps.

Graphiquement, vous pouvez imaginer zoomer sur un point de ce graphique distance en fonction du temps au-dessus de 𝑡 égal à trois. Ce d𝑡 est un petit pas vers la droite puisque le temps est sur l’axe horizontal. Et ce d𝑠 est la variation résultant de la hauteur du graphique puisque l’axe vertical représente la distance parcourue. Donc, d𝑠 divisée par d𝑡 est ce que vous pouvez imaginer comme un coefficient directeur montée-avancée entre deux points très proches sur ce graphique. Bien sûr, il n’y a rien de spécial à propos de la valeur 𝑡 égale trois. Nous pourrions appliquer cela à n’importe quel autre instant. Nous considérons donc l’expression d𝑠 sur d𝑡 comme une fonction de 𝑡, où je peux vous donner un temps 𝑡. Et vous pouvez me rendre la valeur de ce rapport à cet instant-là, la vitesse en fonction du temps.

Ainsi, par exemple, lorsque l’ordinateur a dessiné cette courbe, celle représentant la fonction de vitesse, voici ce que l’ordinateur a effectivement fait. D’abord, j’ai choisi une petite valeur pour d𝑡. Je pense que dans ce cas, c’était 0.01. Ensuite, j’ai demandé à l’ordinateur de regarder toute une série d’instants 𝑡 entre zéro et 10, et de calculer la fonction de distance 𝑠 en 𝑡 plus d𝑡, puis soustraire la valeur de cette fonction en 𝑡. En d’autres termes, c’est la différence de distance parcourue entre le temps donné 𝑡 et le temps 0.01 seconde après. Ensuite, vous pouvez simplement diviser cette différence par la variation de temps, d𝑡. Et cela vous donne la vitesse en mètres par seconde autour de chaque point dans le temps.

Donc avec une formule comme celle-ci, vous pouvez donner à l’ordinateur n’importe quelle courbe représentant une fonction de distance, 𝑠 de 𝑡. Et il pourrait déterminer la courbe représentant la vitesse. Le moment est donc propice pour faire une pause, réfléchir, s’assurer que cette idée de relier la distance à la vitesse en observant de petites variations a du sens. Car ce que nous allons faire c’est aborder de front le paradoxe de la dérivée.

Cette idée de d𝑠 sur d𝑡, une variation minime dans la valeur de la fonction 𝑠 divisée par la variation minime dans l’entrée qui l’a causé, c’est presque ce qu’est une dérivée. Et même si le compteur de vitesse d’une voiture tient compte d’une variation concrète dans le temps, par exemple de 0.01 seconde, et même si le logiciel de dessin envisage ici une variation concrète dans le temps, en mathématiques pures, la dérivée n’est pas ce rapport d𝑠 d𝑡 pour un choix spécifique de d𝑡. Au lieu de cela, c’est ce que le rapport approche alors que la valeur de d𝑡 que vous avez choisie s’approche de zéro. Heureusement, il existe une très bonne compréhension visuelle de ce que signifie demander de quoi s’approche ce rapport.

Rappelez-vous, pour tout choix spécifique de d𝑡, ce rapport d𝑠 d𝑡 est le coefficient directeur d’une droite passant par deux points distincts du graphique, n’est-ce pas ? Eh bien, lorsque d𝑡 s’approche de zéro et que ces deux points s’approchent l’un de l’autre, le coefficient directeur de la droite s’approche du coefficient directeur d’une droite tangente à la courbe, quel que soit le point 𝑡 que nous envisageons. Ainsi, la véritable dérivée purement mathématique n’est pas le coefficient directeur montée-avancée entre deux points voisins sur la courbe. Elle est égale au coefficient directeur d’une droite tangente à la courbe en un point unique. Maintenant, remarquez ce que je ne dis pas. Je ne dis pas que la dérivée est ce qui arrive quand d𝑡 est infiniment petite, quoi que cela signifie, ni je dis que vous prenez zéro pour d𝑡. Ce d𝑡 est toujours une valeur finement petite et non nulle. C’est juste qu’elle s’approche de zéro, c’est tout.

Je pense que c’est vraiment intelligent. Même si la variation dans un instant n’a aucun sens, cette idée d’approcher d𝑡 de zéro est une façon vraiment rusée et détournée de parler raisonnablement du taux de variation en un instant donné. N’est-ce pas génial ?! C’est une sorte de flirt avec le paradoxe de variation en un instant sans jamais avoir besoin d’y toucher. Et cela vient aussi avec une si belle intuition visuelle, comme le coefficient directeur d’une tangente en un seul point de la courbe. Et puisque la variation en un instant n’a toujours aucun sens, je pense que c’est plus sain pour vous de penser à ce coefficient directeur non pas comme un taux de variation instantané, mais plutôt comme la meilleure approximation constante d’un taux de variation autour d’un point.

À propos, il convient de dire quelques mots sur la notation ici. Tout au long de cette vidéo, j’utilise d𝑡 pour faire référence à une variation minime de 𝑡 ayant une taille réelle, et d𝑠 pour faire référence à la variation minime résultant en 𝑠, qui a encore une taille réelle. Et c’est parce que c’est ainsi que je veux que vous y pensiez. Mais la convention en analyse est qu’à chaque fois que vous utilisez la lettre 𝑑 ainsi, vous êtes en quelque sorte en train d’annoncer votre intention de voir ensuite ce qui se passera lorsque d𝑡 s’approche de zéro. Par exemple, la dérivée purement mathématique est exprimée sous la forme d𝑠 divisée par d𝑡, même si techniquement ce n’est pas une fraction, proprement dite, mais quoi que cette fraction s’approche avec des coups de pouce de plus en plus petits dans 𝑡. Je pense qu’un exemple spécifique devrait aider ici.

Vous pourriez penser comment le calcul deviendra plus difficile si ce rapport s’approche de valeurs de plus en plus petites. Mais bizarrement, cela facilite les choses. Disons qu’on vous donne une fonction de la distance par rapport au temps qui est exactement 𝑡 au cube. Donc après une seconde, la voiture a parcouru un au cube, égale un mètre. Après deux secondes, elle a parcouru deux au cube, ou huit mètres, et ainsi de suite. Ce que je vais faire maintenant peut sembler un peu compliqué. Mais une fois la poussière retombée, ça sera vraiment plus simple. Et, plus important encore, c’est le genre de choses que vous ne devez faire qu’une seule fois en analyse.

Supposons que vous vouliez calculer la vitesse, d𝑠 divisée par d𝑡, à un moment donné, comme 𝑡 égale deux. Et pour l’instant, considérons que d𝑡 a une dimension réelle, un coup de pouce concret. Nous allons la laisser aller à zéro dans un instant. La variation minime de distance entre deux secondes et deux plus d𝑡 secondes, eh bien, c’est 𝑠 de deux plus d𝑡 moins 𝑠 de deux, et nous divisons cela par d𝑡. Puisque notre fonction est 𝑡 au cube, donc ce numérateur est deux plus d𝑡 au cube moins deux au cube. Et cela est quelque chose qu’on peut calculer algébriquement. Encore une fois, soyez patients. Il y a une raison pour laquelle je vous montre ces détails ici. Lorsque vous développez ce numérateur, vous obtenez deux au cube plus trois fois deux d𝑡 au carré plus trois fois deux fois d𝑡 au carré plus d𝑡 au cube. Et tout cela est moins deux au cube.

Maintenant, il y a beaucoup de termes. Et je veux que vous vous souveniez que ça ressemble à un gâchis, mais ça simplifie. Ces deux termes au cube s’annulent. Et puis tout ce qui reste ici comporte d𝑡. Et comme il y a d𝑡 au dénominateur, plusieurs d’entre eux s’annulent également. Cela signifie que le rapport, d𝑠 divisé par d𝑡, a été ramené à trois fois deux au carré, plus deux termes différents comportant chacun d𝑡. Donc, si nous demandons ce qui se passe lorsque d𝑡 s’approche de zéro, représentant l’idée d’envisager une variation de plus en plus petite dans le temps, nous pouvons simplement ignorer ces autres termes. En éliminant le besoin de penser à un d𝑡 spécifique, nous avons en fait éliminé beaucoup de complications dans toute l’expression ! Donc ce qui nous reste c’est ce joli trois fois deux au carré.

Vous pouvez penser que cela signifie que le coefficient directeur d’une tangente au point en 𝑡 égale deux de cette courbe est exactement trois fois deux au carré ou 12. Et bien sûr, il n’y a rien de spécial dans l’instant 𝑡 égale deux. On pourrait plus généralement dire que la dérivée de 𝑡 au cube en fonction de 𝑡 est trois fois 𝑡 au carré.

Maintenant, prenez du recul parce que cela est beau. Cette dérivée est cette idée insensée et compliquée. Nous avons des variations minimes de distance sur des variations minimes dans le temps. Mais au lieu de regarder l’une de celles-ci en particulier, nous parlons de quoi elles s’approchent. Je veux dire, il y a beaucoup à penser ! Et pourtant, nous en sortons avec une expression si simple, trois fois 𝑡 au carré. Et en pratique, vous ne parcourriez pas toute cette algèbre à chaque fois. Savoir que la dérivée de 𝑡 au cube est trois 𝑡 au carré est l’une de ces choses que tous les étudiants d’analyse apprennent à faire immédiatement sans avoir à la redéfinir à chaque fois.

Et dans la vidéo suivante, je vais vous montrer une bonne façon de penser à cette formule et à quelques autres formules pour la dérivée de manière géométrique vraiment amusante. Mais ce que je veux dire en vous montrant tous les trucs algébriques, c’est que, si vous considérez la très petite variation de distance causée par une petite variation dans le temps pour une valeur spécifique de d𝑡, alors vous aurez une sorte de gâchis. Mais lorsque vous considérez la valeur de laquelle ce rapport s’approche lorsque d𝑡 s’approche de zéro, cela vous permet de négliger une bonne partie de ce désordre. Et ça simplifie vraiment le problème. Ce droit est en quelque sorte le cœur de la raison pour laquelle l’analyse devient utile.

Une autre raison de vous montrer une dérivée concrète comme celle-ci est qu’elle prépare le terrain à un exemple du genre de paradoxes qui surviennent si l’on croit trop à l’illusion d’un taux de variation instantané. Pensons donc à la voiture roulant suivant cette fonction 𝑡 au cube par rapport à la distance. Et considérons son mouvement à l’instant 𝑡 égale zéro, juste au début. Maintenant demandez-vous si la voiture est en mouvement à cet instant-là. D’une part, nous pouvons calculer sa vitesse à ce point en utilisant la dérivée trois 𝑡 au carré, qui pour l’instant 𝑡 égale zéro, est égale à zéro.

Visuellement, cela signifie que la tangente à la courbe à cet endroit est parfaitement plate. Donc, entre guillemets, la « vitesse instantanée » de la voiture est zéro. Et cela donne à penser qu’évidemment elle ne bouge pas. Mais d’autre part, si elle ne commence pas son mouvement à l’instant zéro, alors quand commence-t-elle à bouger ? Vraiment, faites une pause et réfléchissez-y un instant. Est-ce que la voiture se déplace à l’instant 𝑡 égale zéro ?

Voyez-vous le paradoxe ? Le problème est que la question n’a aucun sens. Elle fait référence à l’idée de variation en un instant. Mais cela n’existe pas vraiment. Ce n’est tout simplement pas ce que les dérivées mesurent. Si la dérivée d’une fonction de distance égale zéro, alors cela signifie que la meilleure approximation constante de la vitesse de la voiture autour de ce point est zéro mètre par seconde. Par exemple, si l’on envisage une variation réelle dans le temps, disons entre zéro et 0.1 seconde, la voiture bouge. Elle se déplace de 0.001 mètre. C’est très petit. Et surtout, c’est très petit comparé à la variation de temps, étant donnée une vitesse moyenne de seulement 0.01 mètre par seconde.

Et rappelez-vous, ce que signifie que la dérivée de ce mouvement égale zéro, c’est que, pour les coups de pouce de plus en plus petits dans le temps, ce rapport en mètres par seconde s’approche de zéro. Mais cela ne veut pas dire que la voiture est statique. Rapprocher son mouvement avec une vitesse constante de zéro n’est après tout qu’une approximation. Ainsi, chaque fois que vous entendez parler de la dérivée comme un taux de variation instantané, une phrase intrinsèquement oxymore, je veux que vous considériez cela comme un raccourci conceptuel de la meilleure approximation constante du taux de variation.

Dans les deux prochaines vidéos, je parlerai davantage de la dérivée, à quoi elle ressemble dans différents contextes. Comment la calculer ? Pourquoi est-ce utile ? Des choses de ce genre, se concentrant sur l’intuition visuelle, comme toujours.

Vidéo pop :: Le paradoxe de la dérivée

Transcription de la vidéo

Rejoindre Nagwa Classes