Vídeo: O Paradoxo da Derivada

Grant Sanderson • 3Blue1Brown • Boclips

O Paradoxo da Derivada

16:50

Transcrição do vídeo

O objetivo aqui é simples: explicar o que é uma derivada. O problema é que há alguma sutileza para este tópico e muito potencial para paradoxos, se você não for cuidadoso. Então, um objetivo secundário é que você tenha uma apreciação do que esses paradoxos são e como evitá-los.

Você sabe que é comum as pessoas dizerem que a derivada mede uma taxa instantânea de variação. Mas quando você pensa sobre isso, essa frase é na verdade um oximoro. Variação é algo que acontece entre pontos separados no tempo. E quando você não olha para todos, mas apenas um único instante, não há espaço para variação. Você entenderá o que quero dizer quando entrarmos mais nisso. Mas quando você olha para uma frase como “taxa instantânea de variação” é realmente absurda, eu acho que faz você apreciar o quão inteligente os pais do cálculo foram em captar a ideia que essa frase evoca, como uma peça perfeitamente sensata de matemática, a derivada.

Como nosso exemplo central, quero que você imagine um carro que começa em algum ponto A, acelera e depois desacelera até parar em algum ponto B a 100 metros de distância. E digamos que tudo aconteça ao longo de 10 segundos. Essa é a configuração que devemos ter em mente quando descrevemos qual é a derivada. Poderíamos representar graficamente esse movimento, deixando o eixo vertical representar a distância percorrida e o eixo horizontal representar o tempo. Então, a cada vez 𝑡, representado com um ponto neste eixo horizontal, a altura do gráfico nos diz o quanto o carro percorreu no total após esse período de tempo.

É muito comum nomear uma função de distância como essa, 𝑠 de 𝑡. Eu usaria a letra 𝑑 para a distância. Mas esse cara já tem outro emprego em tempo integral no cálculo. Inicialmente, esta curva é bastante superficial já que o carro está lento para começar. Durante esse primeiro segundo, a distância percorrida não muda muito. Então, pelos próximos segundos, à medida que o carro acelera, a distância percorrida em um determinado segundo aumenta, o que corresponde a uma inclinação mais acentuada neste gráfico. E então, no final, quando ele desacelera, essa curva diminui novamente.

E se fôssemos traçar a velocidade do carro em metros por segundo em função do tempo, poderia se parecer com esse solavanco. Nos primeiros segundos, a velocidade é muito pequena. Até o meio da jornada, o carro atinge uma velocidade máxima, cobrindo uma distância relativamente grande a cada segundo. Então, vai diminuindo a velocidade para zero. E essas duas curvas aqui estão definitivamente relacionadas uma com a outra, certo? Se você alterar a função específica de distância versus tempo, você terá uma função de velocidade versus tempo diferente. E o que queremos entender são as especificidades dessa relação. Exatamente, como a velocidade depende de uma função de distância versus tempo?

E para fazer isso, vale a pena pensar um pouco sobre o que exatamente significa velocidade aqui. Intuitivamente, todos nós podemos saber o que significa velocidade em um determinado momento. É o que quer que o velocímetro do carro mostre naquele momento. E intuitivamente, pode fazer sentido que a velocidade do carro seja maior quando a distância for maior, quando o carro percorre mais distância por unidade de tempo. Mas o engraçado é que a velocidade em um único momento não faz sentido. Se eu mostrar uma foto de um carro, apenas de um instante, e perguntar o quão rápido ele está indo, você não teria como me dizer. O que você precisa são dois pontos separados no tempo para comparar. Dessa forma, você pode calcular o que quer que seja a variação de distância entre os tempos, dividida pela variação do tempo, certo? Quero dizer, isso é a definição de velocidade. É a distância percorrida por unidade de tempo.

Então, como é que estamos olhando para uma função de velocidade que leva apenas um único valor de 𝑡, um único instante de tempo? É estranho, não é? Nós queremos associar pontos individuais no tempo com a velocidade. Mas, na verdade, calcular a velocidade requer a comparação de dois pontos separados em momentos. Se isso parece estranho e paradoxal, bom! Você está lidando com os mesmos conflitos que os pais do cálculo tiveram. E se você quer um entendimento profundo das taxas de variação, não apenas para um carro em movimento, mas para todos os tipos de ciência, você precisará resolver esse aparente paradoxo.

Primeiro, acho que é melhor falar sobre o mundo real. E então, nós vamos para um puramente matemático. Vamos pensar sobre o que o velocímetro do carro provavelmente está fazendo. Em algum momento, digamos, três segundos na jornada, o velocímetro pode medir a distância percorrida pelo carro em uma quantidade muito pequena de tempo, talvez a distância percorrida entre três segundos e 3.01 segundos. Então, poderia calcular a velocidade em metros por segundo como aquela pequena distância percorrida em metros dividida por aquele pequeno tempo, 0.01 segundo. Ou seja, um carro físico apenas evita o paradoxo e não calcula a velocidade em um único ponto no tempo. Calcula a velocidade durante um período de tempo muito pequeno. Então, vamos chamar essa diferença no tempo d𝑡, que você pode pensar neste caso como 0.01 segundo. E vamos chamar essa diferença resultante na distância d𝑠. Assim, a velocidade em algum ponto no tempo d𝑠 é dividida por d𝑡, a pequena variação na distância sobre a pequena variação no tempo.

Graficamente, você pode imaginar o zoom em algum ponto deste gráfico de distância versus tempo acima de 𝑡 igual a três. Esse d𝑡 é um pequeno passo à direita, pois o tempo está no eixo horizontal. E essa d𝑠 é a mudança resultante na altura do gráfico, uma vez que o eixo vertical representa a distância percorrida. Então, d𝑠 dividido por d𝑡 é algo que você pode imaginar como a inclinação de subida entre dois pontos muito próximos neste gráfico. Claro, não há nada especial sobre o valor 𝑡 igual a três. Poderíamos aplicar isso a qualquer outro ponto no tempo. Então, nós consideramos essa expressão d𝑠 sobre d𝑡 como uma função de 𝑡, algo em que eu posso lhe dar um tempo 𝑡. E você pode me devolver o valor dessa razão naquele momento, a velocidade como uma função do tempo.

Então, por exemplo, quando fiz o computador desenhar essa curva de solavanco aqui, aquela que representa a função velocidade, aqui está o que eu fiz no computador. Primeiro, escolhi um pequeno valor para d𝑡. Eu acho que neste caso foi de 0.01. Então, fiz o computador olhar várias vezes 𝑡 entre zero e 10 e calcular a função de distância 𝑠 de 𝑡 mais d𝑡 e depois subtrair o valor dessa função em 𝑡. Em outras palavras, essa é a diferença na distância percorrida entre o tempo dado, 𝑡, e o tempo 0.01 segundos depois disso. Então, você pode simplesmente dividir essa diferença pela variação no tempo, d𝑡. E isso dá a você a velocidade em metros por segundo em cada ponto no tempo.

Então, com uma fórmula como essa, você poderia dar ao computador qualquer curva representando qualquer função de distância, 𝑠 de 𝑡. E poderia descobrir a curva representando a velocidade. Portanto, agora seria um bom momento para pausar, refletir, certificar-se de que essa ideia de relacionar a distância com a velocidade, observando minúsculas variações, faz sentido. Porque o que vamos fazer é enfrentar o paradoxo da derivada de frente.

Essa ideia de d𝑠 sobre d𝑡, uma pequena variação no valor da função 𝑠 dividida pela pequena variação na entrada que a causou, é quase o que é uma derivada. E mesmo que o velocímetro de um carro realmente olhe para uma variação concreta no tempo, como 0.01 segundo, e mesmo que o programa de desenho esteja olhando para uma variação concreta no tempo, em matemática pura a derivada não é essa relação d𝑠 d𝑡 para uma escolha específica de d𝑡. Em vez disso, é ao que quer que essa razão se aproxime à sua escolha para d𝑡 se aproxima de zero. Felizmente, há uma compreensão visual muito boa para o que significa perguntar ao que essa razão se aproxima.

Lembre-se, para qualquer escolha específica de d𝑡, essa razão d𝑠 d𝑡 é a inclinação de uma reta passando por dois pontos separados no gráfico, certo? Bem, à medida que d𝑡 se aproxima de zero e esses dois pontos se aproximam, a inclinação da reta se aproxima da inclinação de uma reta que é tangente ao gráfico em qualquer ponto 𝑡 em que estamos olhando. Assim, a derivada matemática pura, verdadeira e honesta, não é a inclinação ascendente entre dois pontos próximos no gráfico. É igual à inclinação de uma reta tangente ao gráfico em um único ponto. Agora observe o que não estou dizendo. Eu não estou dizendo que a derivada é o que acontece quando d𝑡 é infinitamente pequeno, o que quer que isso signifique, nem estou dizendo que você substitua zero para d𝑡. Este d𝑡 é sempre um valor finitamente pequeno, diferente de zero. É só que se aproxima de zero, é tudo.

Eu acho isso muito inteligente. Mesmo que a variação em um instante não faça sentido, essa ideia de deixar d𝑡 aproximar a zero é uma maneira muito discreta de falar razoavelmente sobre a taxa de variação em um único ponto no tempo. Não é tão legal?! É como flertar com o paradoxo da variação em um instante sem precisar tocá-lo. E também vem com uma intuição visual tão agradável quanto a inclinação de uma reta tangente a um único ponto no gráfico. E como a variação em um instante ainda não faz sentido, acho que é mais saudável pensar nessa inclinação não como uma taxa instantânea de variação, mas como a melhor aproximação constante para uma taxa de variação em torno de um ponto.

A propósito, vale a pena dizer algumas palavras sobre a notação aqui. Ao longo deste vídeo, tenho usado d𝑡 para me referir a uma pequena alteração em 𝑡 com algum tamanho real e d𝑠 para me referir à pequena alteração resultante em 𝑠, que novamente tem um tamanho real. E isso é porque é assim que eu quero que você pense sobre eles. Mas a convenção no cálculo é que sempre que você está usando a letra 𝑑 assim, você está anunciando sua intenção de que eventualmente você verá o que acontece quando o d𝑡 se aproxima de zero. Por exemplo, a boa e verdadeira derivada matemática pura é escrita como d𝑠 dividido por d𝑡, mesmo que tecnicamente não seja uma fração, por exemplo, mas seja qual for essa fração se aproxima para valores cada vez menores em 𝑡. Eu acho que um exemplo específico deveria ajudar aqui.

Você pode pensar que perguntar sobre o que essa razão se aproxima para valores cada vez menores tornaria muito mais difícil de calcular. Mas, estranhamente, isso facilita as coisas. Digamos que você tenha uma determinada função de distância versus tempo que seja exatamente 𝑡 ao cubo. Então, depois de um segundo, o carro viajou um ao cubo que é igual a um metro. Após dois segundos, ele percorreu dois ao cubo ou oito metros e assim por diante. Agora, o que estou prestes a fazer pode parecer um pouco complicado. Mas uma vez que a poeira assente, é realmente mais simples. E mais importante, é o tipo de coisa que você só precisa fazer uma vez no cálculo.

Digamos que você queira calcular a velocidade, d𝑠 dividido por d𝑡, em algum momento específico, como 𝑡 é igual a dois. E, por enquanto, vamos pensar em d𝑡 tendo um tamanho real, algum empurrão concreto. Nós vamos deixar isso ir para zero apenas um pouco. A pequena variação na distância entre dois segundos e dois mais d𝑡 segundos, bem, isto é, 𝑠 de dois mais d𝑡 menos 𝑠 de dois e dividimos isso por d𝑡. Como nossa função é 𝑡 ao cubo, esse numerador se parece com dois mais d𝑡 ao cubo menos dois ao cubo. E isso, isso é algo que pode funcionar algebricamente. Mais uma vez, tenha paciência comigo. Há uma razão pela qual estou mostrando os detalhes aqui. Quando você expande esse numerador, o que você recebe é dois ao cubo mais três vezes dois ao quadrado d𝑡 mais três vezes dois vezes d𝑡 ao quadrado mais d𝑡 ao cubo. E tudo isso é menos dois ao cubo.

Agora há muitos termos. E quero que você se lembre de que mesmo parecendo uma bagunça, isso vai simplificar. Esses termos dois ao cubo se cancelam. E então tudo o que resta aqui tem um d𝑡 nele. E como há um d𝑡 no denominador, muitos deles também se cancelam. O que isto significa é que a razão, d𝑠 dividida por d𝑡, se resumiu em três vezes dois ao quadrado mais, bem, dois termos diferentes que cada um tem um d𝑡 neles. Então, se perguntarmos o que acontece quando d𝑡 se aproxima de 0, representando a ideia de olhar para uma variação cada vez menor do tempo, podemos simplesmente ignorar esses outros termos. Eliminando a necessidade de pensar em um d𝑡 específico, eliminamos muita complicação na expressão completa! Então, o que nos resta dessa bela limpeza é três vezes dois ao quadrado.

Você pode pensar nisso como significando que a inclinação de uma reta tangente ao ponto em 𝑡 igual a dois deste gráfico é exatamente três vezes dois ao quadrado ou 12. E, é claro, não há nada especial sobre o tempo 𝑡 igual a dois. Poderíamos dizer mais geralmente que a derivada de 𝑡 ao cubo em função de 𝑡 é três vezes 𝑡 ao quadrado.

Agora dê um passo para trás porque isso é lindo. Esta derivada é essa ideia complicada maluca. Temos pequenas variações na distância em relação a pequenas variações no tempo. Mas em vez de olhar para qualquer uma em específico, estamos falando sobre o que essa coisa se aproxima. Quero dizer, isso é muito para pensar! E, no entanto, o que nós temos é uma expressão tão simples, três vezes 𝑡 ao quadrado. E na prática, você não passaria por toda essa álgebra a cada vez. Sabendo que a derivada de 𝑡 ao cubo é três 𝑡 ao quadrado é uma daquelas coisas que todos os alunos de cálculo aprendem a fazer imediatamente, sem ter que derivar novamente a cada vez.

E no próximo vídeo, vou mostrar-lhe uma boa maneira de pensar sobre isso e algumas outras fórmulas derivadas, de forma geométrica, muito legais. Mas o ponto que quero chegar mostrando-lhe todas as entranhas algébricas aqui é que quando você considera a pequena variação na distância causada por uma pequena variação no tempo por algum valor específico de d𝑡, você teria uma espécie de confusão. Mas quando você considera ao que essa razão se aproxima quando d𝑡 se aproxima de zero, permite que você ignore muito dessa bagunça. E isso realmente simplifica o problema. Isso aí é o tipo de coração do porquê o cálculo se torna útil.

Outra razão para mostrar a você uma derivada concreta como essa é que ela prepara o terreno para um exemplo do tipo de paradoxo que acontece se você acredita demais na ilusão da taxa instantânea de variação. Então, pense sobre o carro real viajando de acordo com essa função 𝑡 ao cubo para a distância. E considere seu movimento no momento 𝑡 é igual a zero, logo no início. Agora pergunte a si mesmo se o carro está ou não se movendo naquele momento. Por um lado, podemos calcular sua velocidade nesse ponto usando a derivada, três 𝑡 ao quadrado, que para o tempo 𝑡 igual a zero resulta em zero.

Visualmente, isso significa que a reta tangente ao gráfico nesse ponto é perfeitamente plana. Assim, entre aspas a “velocidade instantânea” do carro é zero. E isso sugere que, obviamente, não está se movendo. Mas, por outro lado, se ele não começar a se mover no tempo zero, quando ele começará a se mover? Realmente, pare e pondere isso por um momento. O carro está se movendo no tempo 𝑡 é igual a zero?

Você vê o paradoxo? O problema é que a questão não faz sentido. Ela faz referência à ideia de variação em um momento. Mas isso não existe realmente. Isso não é o que a derivada mede. O que significa para a derivada de uma função de distância ser zero é que a melhor aproximação constante para a velocidade do carro em torno desse ponto é de zero metros por segundo. Por exemplo, se você observar uma variação real no tempo, digamos, entre o tempo zero e 0.1 segundo, o carro se move. Ele se move 0.001 metros. Isso é muito pequeno. E, mais importante, é muito pequeno em comparação com a variação no tempo, dando uma velocidade média de apenas 0.01 metros por segundo.

E lembre-se, o que significa que a derivada desse movimento é zero é que, para os movimentos cada vez menores de tempo, essa relação de metros por segundo se aproxima de zero. Mas isso não quer dizer que o carro é estático. Aproximando seu movimento com uma velocidade constante de zero é, afinal, apenas uma aproximação. Assim, sempre que você ouvir as pessoas se referirem à derivada como uma taxa instantânea de variação, uma frase que é intrinsecamente paradoxa, quero que você pense nisso como uma abreviação conceitual para a melhor aproximação constante para a taxa de variação.

Nos próximos vídeos, falarei mais sobre a derivada, como ela parece em diferentes contextos. Como você realmente calcula isso? Por que ela é útil? Coisas assim, focando na intuição visual como sempre.

A Nagwa usa cookies para garantir que você tenha a melhor experiência em nosso site. Saiba mais sobre nossa Política de privacidade.