Transcription de la vidéo
Le but ici est simple : expliquer ce qu’est une dérivée. Le problème, c’est qu’il y a une certaine subtilité dans ce sujet et un
grand potentiel de paradoxes si vous ne faites pas attention. Le second but est donc de comprendre ce que sont ces paradoxes et comment
les éviter.
Vous voyez, il est fréquent qu’on dise que la dérivée mesure un taux de
variation instantané. Mais quand on y pense, cette phrase est en fait un oxymoron. La variation est quelque chose qui se produit entre des instants
distincts. Et quand vous vous aveuglez à tout sauf un seul instant, il n’y a
vraiment pas de place pour la variation. Vous verrez ce que je veux dire au fur et à mesure que nous
avancerons. Mais quand vous comprenez qu’une phrase telle que « taux de variation
instantané » n’a en fait aucun sens, je pense que cela vous aidera à
comprendre à quel point les pères de l’analyse étaient intelligents
à saisir l’idée que cette phrase est censée évoquer, mais avec une
pièce de mathématiques parfaitement sensée : la dérivée.
Pour notre exemple central, je veux que vous imaginiez une voiture qui
démarre d’un point A, accélère puis ralentit jusqu’à s’arrêter en un
point B à 100 mètres. Et disons que tout se passe en 10 secondes. C’est la configuration à garder en tête lorsque nous définissons ce
qu’est une dérivée. Nous pourrions représenter graphiquement ce mouvement, en représentant la
distance parcourue sur l’axe vertical et le temps sur l’axe
horizontal. Ainsi, à chaque instant 𝑡 représenté par un point sur cet axe
horizontal, la hauteur du graphique nous indique la distance totale
parcourue par la voiture après cette durée de temps.
Il est assez fréquent de nommer une fonction de distance ainsi, 𝑠 de
𝑡. J’aurais voulu utiliser la lettre 𝑑 pour la distance. Mais ce gars a déjà un autre travail à temps plein en analyse. Au départ, cette courbe est assez plate car la voiture est lente à
démarrer. Pendant cette première seconde, la distance parcourue ne change pas
vraiment. Ensuite, pendant les secondes qui suivent, alors que la voiture accélère,
la distance parcourue en une seconde donnée augmente, ce qui
correspond à une pente plus raide sur ce graphique. Et puis vers la fin, quand elle ralentit, cette courbe s’aplatit à
nouveau.
Et si nous devions représenter graphiquement la vitesse de la voiture en
mètres par seconde en fonction du temps, elle pourrait ressembler à
cette courbe. Au début, la vitesse est très faible. Jusqu’au milieu du trajet, la voiture atteint une vitesse maximale,
parcourant une distance relativement grande chaque seconde. Ensuite, elle ralentit vers la vitesse zéro. Et ces deux courbes sont vraiment liées l’une à l’autre, non ? Si vous modifiez la fonction de distance par rapport au temps, vous
obtiendrez une différente fonction de vitesse par rapport au
temps. Et ce que nous voulons comprendre, ce sont les détails de cette
relation. Précisément, comment la vitesse dépend-elle d’une fonction distance-temps
?
Et pour ce faire, ça vaut la peine de prendre un moment pour réfléchir de
manière critique à ce que signifie exactement « vitesse ». Intuitivement, nous pourrions tous savoir ce que signifie la vitesse à un
moment donné. C’est ce que l’indicateur de vitesse de la voiture indique à cet
instant. Et intuitivement, il peut sembler logique que la vitesse de la voiture
soit plus élevée lorsque cette fonction de distance est plus raide,
lorsque la voiture parcourt une plus grande distance par unité de
temps. Mais ce qui est drôle, c’est que la vitesse à un moment donné n’a aucun
sens. Si je vous montre la photo d’une voiture, juste un instantané en un
instant, et vous demande à quelle vitesse elle roule, vous n’auriez
aucun moyen de me le dire. Ce dont vous auriez besoin, c’est deux instants différents à
comparer. De cette façon, vous pouvez calculer n’importe quelle variation de
distance entre ces instants, divisée par la variation de temps,
n’est-ce pas ? Je veux dire que c’est ça la vitesse. C’est la distance parcourue par unité de temps.
Alors, comment se fait-il que nous envisagions une fonction de vitesse
qui ne prend qu’une seule valeur de 𝑡, un seul instantané dans le
temps ? C’est bizarre, n’est-ce pas ? Nous voulons associer des instants particuliers à la vitesse. Mais en réalité, le calcul de la vitesse nécessite la comparaison de deux
points distincts dans le temps. Si cela semble étrange et paradoxal, tant mieux ! Vous êtes aux prises avec les mêmes conflits que les pères de
l’analyse. Et si vous voulez comprendre en profondeur les taux de variation, pas
seulement pour une voiture en mouvement, mais pour toutes sortes
d’activités scientifiques, il vous faudra résoudre cet apparent
paradoxe.
Tout d’abord, je pense qu’il est préférable de parler du monde réel. Et ensuite, nous allons passer à une question purement mathématique. Réfléchissons à ce que fait probablement l’indicateur de vitesse de la
voiture. À un instant donné, disons trois secondes après le début du trajet, le
compteur de vitesse peut mesurer la distance parcourue par la
voiture en très peu de temps, peut-être la distance parcourue entre
trois secondes et 3,01 secondes. Ensuite, il pourrait calculer la vitesse en mètres par seconde comme
étant la distance parcourue en mètres divisée par ce temps infime,
0.01 seconde. C’est-à-dire qu’une vraie voiture élude le paradoxe et ne calcule pas
vraiment la vitesse à un instant donné. Elle calcule la vitesse pendant très peu de temps. Appelons donc cette différence de temps d𝑡, à laquelle vous pourriez
penser dans ce cas comme 0.01 seconde. Et appelons cette différence de distance résultante d𝑠. Donc, la vitesse à un instant donné est d𝑠 divisée par d𝑡, la petite
variation de distance sur la petite variation de temps.
Graphiquement, vous pouvez imaginer zoomer sur un point de ce graphique
distance en fonction du temps au-dessus de 𝑡 égal à trois. Ce d𝑡 est un petit pas vers la droite puisque le temps est sur l’axe
horizontal. Et ce d𝑠 est la variation résultant de la hauteur du graphique puisque
l’axe vertical représente la distance parcourue. Donc, d𝑠 divisée par d𝑡 est ce que vous pouvez imaginer comme un
coefficient directeur montée-avancée entre deux points très proches
sur ce graphique. Bien sûr, il n’y a rien de spécial à propos de la valeur 𝑡 égale
trois. Nous pourrions appliquer cela à n’importe quel autre instant. Nous considérons donc l’expression d𝑠 sur d𝑡 comme une fonction de 𝑡,
où je peux vous donner un temps 𝑡. Et vous pouvez me rendre la valeur de ce rapport à cet instant-là, la
vitesse en fonction du temps.
Ainsi, par exemple, lorsque l’ordinateur a dessiné cette courbe, celle
représentant la fonction de vitesse, voici ce que l’ordinateur a
effectivement fait. D’abord, j’ai choisi une petite valeur pour d𝑡. Je pense que dans ce cas, c’était 0.01. Ensuite, j’ai demandé à l’ordinateur de regarder toute une série
d’instants 𝑡 entre zéro et 10, et de calculer la fonction de
distance 𝑠 en 𝑡 plus d𝑡, puis soustraire la valeur de cette
fonction en 𝑡. En d’autres termes, c’est la différence de distance parcourue entre le
temps donné 𝑡 et le temps 0.01 seconde après. Ensuite, vous pouvez simplement diviser cette différence par la variation
de temps, d𝑡. Et cela vous donne la vitesse en mètres par seconde autour de chaque
point dans le temps.
Donc avec une formule comme celle-ci, vous pouvez donner à l’ordinateur
n’importe quelle courbe représentant une fonction de distance, 𝑠 de
𝑡. Et il pourrait déterminer la courbe représentant la vitesse. Le moment est donc propice pour faire une pause, réfléchir, s’assurer que
cette idée de relier la distance à la vitesse en observant de
petites variations a du sens. Car ce que nous allons faire c’est aborder de front le paradoxe de la
dérivée.
Cette idée de d𝑠 sur d𝑡, une variation minime dans la valeur de la
fonction 𝑠 divisée par la variation minime dans l’entrée qui l’a
causé, c’est presque ce qu’est une dérivée. Et même si le compteur de vitesse d’une voiture tient compte d’une
variation concrète dans le temps, par exemple de 0.01 seconde, et
même si le logiciel de dessin envisage ici une variation concrète
dans le temps, en mathématiques pures, la dérivée n’est pas ce
rapport d𝑠 d𝑡 pour un choix spécifique de d𝑡. Au lieu de cela, c’est ce que le rapport approche alors que la valeur de
d𝑡 que vous avez choisie s’approche de zéro. Heureusement, il existe une très bonne compréhension visuelle de ce que
signifie demander de quoi s’approche ce rapport.
Rappelez-vous, pour tout choix spécifique de d𝑡, ce rapport d𝑠 d𝑡 est
le coefficient directeur d’une droite passant par deux points
distincts du graphique, n’est-ce pas ? Eh bien, lorsque d𝑡 s’approche de zéro et que ces deux points
s’approchent l’un de l’autre, le coefficient directeur de la droite
s’approche du coefficient directeur d’une droite tangente à la
courbe, quel que soit le point 𝑡 que nous envisageons. Ainsi, la véritable dérivée purement mathématique n’est pas le
coefficient directeur montée-avancée entre deux points voisins sur
la courbe. Elle est égale au coefficient directeur d’une droite tangente à la courbe
en un point unique. Maintenant, remarquez ce que je ne dis pas. Je ne dis pas que la dérivée est ce qui arrive quand d𝑡 est infiniment
petite, quoi que cela signifie, ni je dis que vous prenez zéro pour
d𝑡. Ce d𝑡 est toujours une valeur finement petite et non nulle. C’est juste qu’elle s’approche de zéro, c’est tout.
Je pense que c’est vraiment intelligent. Même si la variation dans un instant n’a aucun sens, cette idée
d’approcher d𝑡 de zéro est une façon vraiment rusée et détournée de
parler raisonnablement du taux de variation en un instant donné. N’est-ce pas génial ?! C’est une sorte de flirt avec le paradoxe de variation en un instant sans
jamais avoir besoin d’y toucher. Et cela vient aussi avec une si belle intuition visuelle, comme le
coefficient directeur d’une tangente en un seul point de la
courbe. Et puisque la variation en un instant n’a toujours aucun sens, je pense
que c’est plus sain pour vous de penser à ce coefficient directeur
non pas comme un taux de variation instantané, mais plutôt comme la
meilleure approximation constante d’un taux de variation autour d’un
point.
À propos, il convient de dire quelques mots sur la notation ici. Tout au long de cette vidéo, j’utilise d𝑡 pour faire référence à une
variation minime de 𝑡 ayant une taille réelle, et d𝑠 pour faire
référence à la variation minime résultant en 𝑠, qui a encore une
taille réelle. Et c’est parce que c’est ainsi que je veux que vous y pensiez. Mais la convention en analyse est qu’à chaque fois que vous utilisez la
lettre 𝑑 ainsi, vous êtes en quelque sorte en train d’annoncer
votre intention de voir ensuite ce qui se passera lorsque d𝑡
s’approche de zéro. Par exemple, la dérivée purement mathématique est exprimée sous la forme
d𝑠 divisée par d𝑡, même si techniquement ce n’est pas une
fraction, proprement dite, mais quoi que cette fraction s’approche
avec des coups de pouce de plus en plus petits dans 𝑡. Je pense qu’un exemple spécifique devrait aider ici.
Vous pourriez penser comment le calcul deviendra plus difficile si ce
rapport s’approche de valeurs de plus en plus petites. Mais bizarrement, cela facilite les choses. Disons qu’on vous donne une fonction de la distance par rapport au temps
qui est exactement 𝑡 au cube. Donc après une seconde, la voiture a parcouru un au cube, égale un
mètre. Après deux secondes, elle a parcouru deux au cube, ou huit mètres, et
ainsi de suite. Ce que je vais faire maintenant peut sembler un peu compliqué. Mais une fois la poussière retombée, ça sera vraiment plus simple. Et, plus important encore, c’est le genre de choses que vous ne devez
faire qu’une seule fois en analyse.
Supposons que vous vouliez calculer la vitesse, d𝑠 divisée par d𝑡, à un
moment donné, comme 𝑡 égale deux. Et pour l’instant, considérons que d𝑡 a une dimension réelle, un coup de
pouce concret. Nous allons la laisser aller à zéro dans un instant. La variation minime de distance entre deux secondes et deux plus d𝑡
secondes, eh bien, c’est 𝑠 de deux plus d𝑡 moins 𝑠 de deux, et
nous divisons cela par d𝑡. Puisque notre fonction est 𝑡 au cube, donc ce numérateur est deux plus
d𝑡 au cube moins deux au cube. Et cela est quelque chose qu’on peut calculer algébriquement. Encore une fois, soyez patients. Il y a une raison pour laquelle je vous montre ces détails ici. Lorsque vous développez ce numérateur, vous obtenez deux au cube plus
trois fois deux d𝑡 au carré plus trois fois deux fois d𝑡 au carré
plus d𝑡 au cube. Et tout cela est moins deux au cube.
Maintenant, il y a beaucoup de termes. Et je veux que vous vous souveniez que ça ressemble à un gâchis, mais ça
simplifie. Ces deux termes au cube s’annulent. Et puis tout ce qui reste ici comporte d𝑡. Et comme il y a d𝑡 au dénominateur, plusieurs d’entre eux s’annulent
également. Cela signifie que le rapport, d𝑠 divisé par d𝑡, a été ramené à trois
fois deux au carré, plus deux termes différents comportant chacun
d𝑡. Donc, si nous demandons ce qui se passe lorsque d𝑡 s’approche de zéro,
représentant l’idée d’envisager une variation de plus en plus petite
dans le temps, nous pouvons simplement ignorer ces autres
termes. En éliminant le besoin de penser à un d𝑡 spécifique, nous avons en fait
éliminé beaucoup de complications dans toute l’expression ! Donc ce qui nous reste c’est ce joli trois fois deux au carré.
Vous pouvez penser que cela signifie que le coefficient directeur d’une
tangente au point en 𝑡 égale deux de cette courbe est exactement
trois fois deux au carré ou 12. Et bien sûr, il n’y a rien de spécial dans l’instant 𝑡 égale deux. On pourrait plus généralement dire que la dérivée de 𝑡 au cube en
fonction de 𝑡 est trois fois 𝑡 au carré.
Maintenant, prenez du recul parce que cela est beau. Cette dérivée est cette idée insensée et compliquée. Nous avons des variations minimes de distance sur des variations minimes
dans le temps. Mais au lieu de regarder l’une de celles-ci en particulier, nous parlons
de quoi elles s’approchent. Je veux dire, il y a beaucoup à penser ! Et pourtant, nous en sortons avec une expression si simple, trois fois 𝑡
au carré. Et en pratique, vous ne parcourriez pas toute cette algèbre à chaque
fois. Savoir que la dérivée de 𝑡 au cube est trois 𝑡 au carré est l’une de
ces choses que tous les étudiants d’analyse apprennent à faire
immédiatement sans avoir à la redéfinir à chaque fois.
Et dans la vidéo suivante, je vais vous montrer une bonne façon de penser
à cette formule et à quelques autres formules pour la dérivée de
manière géométrique vraiment amusante. Mais ce que je veux dire en vous montrant tous les trucs algébriques,
c’est que, si vous considérez la très petite variation de distance
causée par une petite variation dans le temps pour une valeur
spécifique de d𝑡, alors vous aurez une sorte de gâchis. Mais lorsque vous considérez la valeur de laquelle ce rapport s’approche
lorsque d𝑡 s’approche de zéro, cela vous permet de négliger une
bonne partie de ce désordre. Et ça simplifie vraiment le problème. Ce droit est en quelque sorte le cœur de la raison pour laquelle
l’analyse devient utile.
Une autre raison de vous montrer une dérivée concrète comme celle-ci est
qu’elle prépare le terrain à un exemple du genre de paradoxes qui
surviennent si l’on croit trop à l’illusion d’un taux de variation
instantané. Pensons donc à la voiture roulant suivant cette fonction 𝑡 au cube par
rapport à la distance. Et considérons son mouvement à l’instant 𝑡 égale zéro, juste au
début. Maintenant demandez-vous si la voiture est en mouvement à cet
instant-là. D’une part, nous pouvons calculer sa vitesse à ce point en utilisant la
dérivée trois 𝑡 au carré, qui pour l’instant 𝑡 égale zéro, est
égale à zéro.
Visuellement, cela signifie que la tangente à la courbe à cet endroit est
parfaitement plate. Donc, entre guillemets, la « vitesse instantanée » de la voiture est
zéro. Et cela donne à penser qu’évidemment elle ne bouge pas. Mais d’autre part, si elle ne commence pas son mouvement à l’instant
zéro, alors quand commence-t-elle à bouger ? Vraiment, faites une pause et réfléchissez-y un instant. Est-ce que la voiture se déplace à l’instant 𝑡 égale zéro ?
Voyez-vous le paradoxe ? Le problème est que la question n’a aucun sens. Elle fait référence à l’idée de variation en un instant. Mais cela n’existe pas vraiment. Ce n’est tout simplement pas ce que les dérivées mesurent. Si la dérivée d’une fonction de distance égale zéro, alors cela signifie
que la meilleure approximation constante de la vitesse de la voiture
autour de ce point est zéro mètre par seconde. Par exemple, si l’on envisage une variation réelle dans le temps, disons
entre zéro et 0.1 seconde, la voiture bouge. Elle se déplace de 0.001 mètre. C’est très petit. Et surtout, c’est très petit comparé à la variation de temps, étant
donnée une vitesse moyenne de seulement 0.01 mètre par seconde.
Et rappelez-vous, ce que signifie que la dérivée de ce mouvement égale
zéro, c’est que, pour les coups de pouce de plus en plus petits dans
le temps, ce rapport en mètres par seconde s’approche de zéro. Mais cela ne veut pas dire que la voiture est statique. Rapprocher son mouvement avec une vitesse constante de zéro n’est après
tout qu’une approximation. Ainsi, chaque fois que vous entendez parler de la dérivée comme un taux
de variation instantané, une phrase intrinsèquement oxymore, je veux
que vous considériez cela comme un raccourci conceptuel de la
meilleure approximation constante du taux de variation.
Dans les deux prochaines vidéos, je parlerai davantage de la dérivée, à
quoi elle ressemble dans différents contextes. Comment la calculer ? Pourquoi est-ce utile ? Des choses de ce genre, se concentrant sur l’intuition visuelle, comme
toujours.