Vídeo: Mas o Que é a Transformação de Fourier? Uma Introdução Visual

Grant Sanderson • 3Blue1Brown • Boclips

Mas o Que é a Transformação de Fourier? Uma Introdução Visual

19:09

Transcrição do vídeo

Aqui é o que vamos construir para este vídeo, uma certa abordagem animada para pensar em uma ideia super importante da matemática, a transformação de Fourier. Para quem não está familiarizado com o que é isso, meu objetivo número um aqui é apenas que o vídeo seja uma introdução a esse tópico. Mas mesmo para aqueles que já estão familiarizados com isso, ainda acho que há algo divertido e enriquecedor em ver como todos os seus componentes realmente se parecem.

O exemplo central, para começar, será o clássico, decompondo frequências do som. Mas depois disso, eu também quero realmente mostrar como essa ideia se estende muito além do som e da frequência em muitas áreas aparentemente diferentes da matemática e até da física. Realmente, é loucura o quão onipresente é essa ideia. Vamos mergulhar.

Esse som aqui é A puro, 440 batimentos por segundo. Ou seja, se você medisse a pressão do ar ao lado dos fones de ouvido ou do alto-falante em função do tempo. Oscilaria para cima e para baixo em torno de seu equilíbrio usual nessa onda, fazendo 440 oscilações a cada segundo. Uma nota de tom mais baixo, como um D, tem a mesma estrutura, apenas menos batidas por segundo. E quando os dois são reproduzidos ao mesmo tempo, como você acha o gráfico resultante da pressão versus tempo? Bem, a qualquer momento, essa diferença de pressão será a soma do que seria para cada uma dessas notas individualmente. O que, vamos encarar, é uma coisa complicada de se pensar.

Em alguns pontos, os picos se combinam, resultando em uma pressão muito alta. Em outros pontos, eles tendem a cancelar. E, em resumo, o que você obtém é um gráfico de pressão versus tempo que não é uma onda senoidal pura. É algo mais complicado. E conforme você adiciona outras notas, a onda fica cada vez mais complicada. Mas agora, tudo o que é, é uma combinação de quatro frequências puras. Portanto, parece desnecessariamente complicado, dada a baixa quantidade de informações inserida nele. Um microfone gravando qualquer som apenas capta a pressão do ar em muitos momentos diferentes. Apenas vê a soma final. Portanto, nossa pergunta central será: como você pode pegar um sinal como esse e decompô-lo nas frequências puras que o compõem? Muito interessante, certo?

A soma desses sinais realmente os mistura. Portanto, separá-los é como desmistificar várias cores de tinta que foram todas misturadas. A estratégia geral será construir para nós uma máquina matemática que trata os sinais com uma determinada frequência de maneira diferente da maneira como trata os outros sinais. Para começar, considere simplesmente pegar um sinal puro, digamos com três batimentos por segundo, para que possamos desenhá-lo facilmente. E vamos nos limitar a olhar para uma parte finita deste gráfico. Nesse caso, a parte entre zero segundos e 4.5 segundos. A ideia principal será pegar esse gráfico e envolvê-lo em um círculo.

Concretamente, eis o que quero dizer com isso. Imagine um pequeno vetor rotativo em que cada ponto no tempo é igual à altura do nosso gráfico para esse período. Portanto, os pontos altos do gráfico correspondem a uma distância maior da origem. E pontos baixos acabam mais perto da origem. E agora, eu estou desenhando de tal maneira que avançar dois segundos no tempo corresponde a uma única rotação ao redor do círculo. Nosso pequeno vetor que desenha esse gráfico acabado está girando a meio ciclo por segundo. Então, isso é importante. Existem duas frequências diferentes em jogo aqui. Existe a frequência do nosso sinal, que sobe e desce, três vezes por segundo. E então, separadamente, há a frequência com que estamos agrupando o gráfico ao redor do círculo. Que, no momento, é metade de uma rotação por segundo.

Mas podemos ajustar essa segunda frequência como quisermos. Talvez nós queremos enrolá-lo mais rápido ou talvez nós o enrolemos mais devagar. E essa escolha da frequência do enrolamento determina a aparência do gráfico final. Alguns dos diagramas resultantes disso podem ser bastante complicados, embora sejam muito bonitos. Mas é importante ter em mente que tudo o que está acontecendo aqui é que estamos envolvendo o sinal em um círculo. As linhas verticais que estou traçando no topo, a propósito, são apenas uma maneira de acompanhar a distância no gráfico original que corresponde a uma rotação completa ao redor do círculo. Portanto, linhas espaçadas em 1.5 segundos significam que são necessários 1.5 segundos para fazer uma revolução completa.

E, nesse ponto, podemos ter uma sensação vaga de que algo especial acontecerá quando a frequência do enrolamento corresponder à frequência do nosso sinal, três batidas por segundo. Todos os pontos altos do gráfico acontecem no lado direito do círculo. E todos os pontos baixos acontecem à esquerda. Mas com que precisão podemos tirar proveito disso em nossa tentativa de construir uma máquina que desmistifica a frequência? Bem, imagine que este gráfico esteja tendo algum tipo de massa, como um fio de metal. Este pontinho vai representar o centro de massa desse fio. À medida que mudamos a frequência e o gráfico termina de maneira diferente, esse centro de massa oscila um pouco. E para a maioria das frequências sinuosas, os picos e os vales estão todos espaçados ao redor do círculo, de modo que o centro de massa permaneça bem próximo da origem.

Mas, quando a frequência do enrolamento é a mesma do nosso sinal, neste caso três ciclos por segundo, todos os picos estão à direita e todos os vales à esquerda. Portanto, o centro de massa é extraordinariamente distante à direita. Aqui, para capturar isso, vamos desenhar algum tipo de gráfico que monitora onde está o centro de massa de cada frequência de enrolamento. Obviamente, o centro de massa é uma coisa bidimensional. Requer duas coordenadas para acompanhar completamente. Mas, por enquanto, vamos acompanhar apenas a coordenada 𝑥. Portanto, para uma frequência zero, quando tudo está agrupado à direita, essa coordenada 𝑥 é relativamente alta. E então, à medida que você aumenta a frequência do enrolamento e o gráfico se equilibra ao redor do círculo, a coordenada 𝑥 desse centro de massa fica mais próxima de zero. E isso meio que oscila um pouco.

Mas então, a três batidas por segundo, há um pico, pois tudo se alinha à direita. Isso aqui é a construção central. Então, vamos resumir o que temos até agora. Temos esse gráfico original de intensidade versus tempo. E então, temos a versão final disso em algum plano bidimensional. E então, como uma terceira coisa, temos um gráfico de como a frequência do enrolamento influencia o centro de massa desse gráfico. E, a propósito, vamos olhar para essas frequências realmente baixas perto de zero. Esse grande pico em torno de zero em nosso novo gráfico de frequência corresponde apenas ao fato de toda a onda cosseno ser deslocada. Se eu tivesse escolhido um sinal que oscila em torno de zero, mergulhando em valores negativos. Então, ao brincarmos com várias frequências de enrolamento, esse gráfico da frequência de enrolamento versus o centro de massa teria apenas um pico no valor de três.

Mas, valores negativos são um pouco estranhos e confusos, especialmente para um primeiro exemplo. Então, vamos continuar pensando em termos do gráfico alterado. Eu só quero que você entenda que esse pico em torno de zero corresponde apenas à mudança. Nosso foco principal, no que diz respeito à decomposição de frequências, é o aumento de três. Todo esse gráfico é o que chamarei de “Quase-Transformação de Fourier” do sinal original. Há algumas pequenas distinções entre essa e a transformação de Fourier real, que chegarei em alguns minutos. Mas já é possível ver como esta máquina permite escolher a frequência de um sinal.

Apenas para brincar um pouco mais, pegue um sinal puro diferente, digamos com uma frequência mais baixa de duas batidas por segundo e faça a mesma coisa. Enrole em um círculo. Imagine diferentes frequências potenciais de enrolamento. E, ao fazer isso, acompanhe onde está o centro de massa desse gráfico. E então, desenhe a coordenada 𝑥 desse centro de massa enquanto ajusta a frequência do enrolamento. Assim como antes, temos um pico quando a frequência do enrolamento é a mesma do sinal, que neste caso é igual a dois ciclos por segundo. Mas o verdadeiro ponto chave, o que torna esta máquina tão agradável é como ela nos permite captar um sinal que consiste em várias frequências e escolher o que são.

Imagine pegar os dois sinais que acabamos de ver, a onda com três batidas por segundo e a onda com duas batidas por segundo e somar. Como eu disse anteriormente, o que você recebe não é mais uma bela onda de cosseno puro. É algo um pouco mais complicado. Mas imagine jogar isso em nossa máquina de frequência de enrolamento. Certamente é o caso em que, ao envolver essa coisa, parece muito mais complicado. Você tem esse caos e caos e caos e caos e então WOOP! As coisas parecem se alinhar muito bem a dois ciclos por segundo. E enquanto você continua, é mais caos e mais caos e mais caos, caos, caos, caos, WOOP! As coisas se alinham bem novamente a três ciclos por segundo. E, como eu disse antes, o gráfico final pode parecer meio ocupado e complicado. Mas tudo o que é, é a ideia relativamente simples de envolver o gráfico ao redor do círculo. É apenas um gráfico mais complicado e uma frequência bastante rápida.

Agora, o que está acontecendo aqui com os dois picos diferentes é que, se você pegar dois sinais e aplicar essa Quase-Transformação de Fourier a cada um deles individualmente, adicione os resultados. O que você recebe é o mesmo que se você tivesse adicionado os sinais pela primeira vez e depois aplicado essa Quase-Transformação de Fourier. E os espectadores atentos entre vocês podem querer fazer uma pausa, refletir e se convencer de que o que eu acabei de dizer é realmente verdade. É um bom teste verificar por si mesmo que está claro o que exatamente está sendo medido dentro desta máquina de enrolamento. Agora, essa propriedade torna as coisas realmente úteis para nós. Porque a transformação de uma frequência pura é quase zero em todos os lugares, exceto por um pico em torno dessa frequência. Portanto, quando você soma duas frequências puras, o gráfico de transformação apenas apresenta esses pequenos picos acima das frequências inseridas nele.

Portanto, esta pequena máquina matemática faz exatamente o que queríamos. Ela retira as frequências originais das somas desordenadas, misturando o balde de tinta. E antes de continuar na matemática completa que descreve essa operação, vamos dar uma rápida olhada em um contexto em que isso é útil, edição de som. Digamos que você tenha alguma gravação. E tem um tom irritante que você gostaria de filtrar. Bem, a princípio, seu sinal está chegando em função de várias intensidades ao longo do tempo, diferentes voltagens dadas ao seu alto-falante de um milissegundo para o próximo. Mas queremos pensar nisso em termos de frequências. Então, quando você usa a transformação de Fourier desse sinal, o som irritante vai aparecer como um pico em alguma frequência alta. Para filtrar isso, basta diminuir o pico, o que você está vendo é a transformação de Fourier de um som que é igual à sua gravação, só que sem essa alta frequência.

Felizmente, existe a noção de uma transformação de Fourier inversa que indica qual sinal teria produzido isso como sua transformação de Fourier. Eu vou falar sobre o inverso muito mais detalhadamente no próximo vídeo. Mas para encurtar a história, aplicar a transformação de Fourier à transformação de Fourier fornece algo próximo à função original. Isso é um pouco mentiroso, mas está na direção da verdade. E a maior parte do motivo de ser uma mentira é que ainda tenho que lhe dizer qual é a transformação de Fourier real. Como é um pouco mais complexo que essa coordenada 𝑥 da ideia do centro de massa.

Primeiro, trazendo de volta esse gráfico acabado e olhando para o centro de massa, a coordenada 𝑥 é realmente apenas metade da história, certo? Quero dizer, isso está em duas dimensões. Tem uma coordenada 𝑦 também. E, como é típico em matemática, sempre que você lida com algo bidimensional, é elegante pensar nisso como o plano complexo. Onde esse centro de massa será um número complexo que tem uma parte real e uma parte imaginária. E a razão para falar em termos de números complexos, em vez de apenas dizer que tem duas coordenadas, é que números complexos se prestam a descrições realmente boas de coisas que têm a ver com enrolamento e rotação.

Por exemplo, a fórmula de Euler nos diz que, se você pegar 𝑒 algumas vezes 𝑖. Você chegará ao ponto que conseguir, se você caminhar esse número de unidades em torno de um círculo com raio um no sentido anti-horário, começando pela direita. Então, imagine que você queira descrever a rotação a uma taxa de um ciclo por segundo. Uma coisa que você pode fazer é pegar a expressão 𝑒 elevado a dois 𝜋 vezes 𝑖 vezes 𝑡, onde 𝑡 é a quantidade de tempo que passou. Como para um círculo com raio um, dois 𝜋 descreve todo o comprimento de sua circunferência. E isso é um pouco vertiginoso de se ver. Então, talvez você queira descrever uma frequência diferente, algo mais baixo e mais razoável. E para isso, você apenas multiplicaria esse tempo 𝑡 no expoente pela frequência 𝑓.

Por exemplo, se 𝑓 for um décimo, então esse vetor faz uma volta completa a cada 10 segundos, já que o tempo 𝑡 precisa aumentar até 10 antes que todo o expoente pareça dois 𝜋𝑖. Eu tenho outro vídeo que dá alguma intuição sobre porque esse é o comportamento de 𝑒 elevado a 𝑥 para entradas imaginárias, se você estiver curioso. Mas, por enquanto, apenas consideraremos isso um dado. Agora, porque estou lhe dizendo isso, você pode perguntar. Bem, isso nos dá uma maneira muito boa de escrever a ideia de encerrar o gráfico em uma única e pequena fórmula. Primeiro, a convenção no contexto das transformações de Fourier é pensar em girar no sentido horário. Então, vamos em frente e jogue um sinal negativo nesse expoente.

Agora, pegue alguma função que descreva a intensidade do sinal versus o tempo, como essa onda cosseno pura que tínhamos antes, e chame-a de 𝑔 de 𝑡. Se você multiplicar essa expressão exponencial vezes 𝑔 de 𝑡, isso significa que o número complexo rotativo está sendo escalado para cima e para baixo de acordo com o valor desta função. Assim, você pode pensar nesse pequeno vetor rotativo com seu comprimento variável desenhando o gráfico acabado. Então pense sobre isso. Isso é incrível! Essa expressão realmente pequena é uma maneira super elegante de envolver toda a ideia de enrolar um gráfico em torno de um círculo com uma frequência variável, 𝑓. E lembre-se, o que queremos fazer com esse gráfico acabado é rastrear seu centro de massa. Então pense em qual fórmula vai capturar isso.

Bem, para aproximá-lo, pelo menos, você pode coletar várias vezes o sinal original, ver onde esses pontos acabam no gráfico final e depois fazer uma média. Ou seja, adicione todos eles como números complexos e divida pelo número de pontos que você pegou de amostra. Isso se tornará mais preciso se você pegar mais pontos que estão mais próximos. E, no limite, em vez de olhar para a soma de um monte de pontos dividido pelo número de pontos, você adota uma integral dessa função dividida pelo tamanho do intervalo de tempo que estamos vendo. Agora, a ideia de integrar uma função de valor complexo pode parecer estranha e, para quem está instável com o cálculo, talvez até intimidadora. Mas o significado subjacente aqui realmente não requer nenhum conhecimento de cálculo. Toda a expressão é apenas o centro de massa do gráfico acabado.

Tão bom! Passo-a-passo, construímos esse tipo de complicação, mas, convenhamos, uma expressão surpreendentemente pequena para toda a ideia de máquina de enrolamento da qual falei. E agora, há apenas uma distinção final a ser destacada entre essa e a boa e honesta transformação real de Fourier. Ou seja, apenas não divida pelo intervalo de tempo. A transformação de Fourier é apenas parte integrante disso. O que isso significa é que, em vez de olhar para o centro de massa, você o aumentaria de alguma forma. Se a parte do gráfico original que você estava usando medisse três segundos, você multiplicaria o centro de massa por três. Se durasse seis segundos, você multiplicaria o centro de massa por seis. Fisicamente, isso tem o efeito de que, quando uma certa frequência persiste por um longo tempo, a magnitude da transformação de Fourier nessa frequência aumenta cada vez mais.

Por exemplo, o que estamos vendo aqui é como, quando você tem uma frequência pura de duas batidas por segundo e o gira em torno do gráfico a dois ciclos por segundo, o centro de massa permanece no mesmo local, certo? Está apenas traçando a mesma forma. Porém, quanto mais tempo esse sinal persistir, maior será o valor da transformação de Fourier nessa frequência. No entanto, para outras frequências, mesmo que você aumente um pouco, isso é cancelado pelo fato de que, por intervalos de tempo mais longos, você oferece ao gráfico de corda mais uma chance de se equilibrar ao redor do círculo. São muitas partes móveis diferentes. Então, vamos recuar e resumir o que temos até agora.

A transformação de Fourier de uma função de intensidade versus tempo, como 𝑔 de 𝑡, é uma nova função que não tem tempo como uma entrada. Mas, em vez disso, recebe uma frequência, o que eu tenho chamado de frequência de enrolamento. A propósito, em termos de notação, a convenção comum é chamar essa nova função de 𝑔-chapéu, com um pouco de circunflexo em cima. Agora, a saída dessa função é um número complexo, algum ponto no plano 2D que corresponde à força de uma determinada frequência no sinal original. O gráfico que tenho representado graficamente para a transformação de Fourier é apenas a componente real dessa saída, a coordenada 𝑥. Mas você também pode representar graficamente a componente imaginária, separadamente, se desejar uma descrição mais completa. E tudo isso está envolvido dentro dessa fórmula que construímos.

E fora do contexto, você pode imaginar como ver essa fórmula pareceria assustadora. Mas se você entender como os exponenciais correspondem à rotação. Como multiplicar isso pela função 𝑔 de 𝑡 significa desenhar uma versão acabada do gráfico. E como uma integral de uma função de valor complexo pode ser interpretada em termos de uma ideia de centro de massa. Você pode ver como tudo isso carrega consigo um significado muito rico e intuitivo. E, a propósito, uma pequena anotação antes que possamos encerrar. Embora na prática, com coisas como edição de som, você estará integrando sobre um intervalo de tempo finito, a teoria das transformações de Fourier é frequentemente redigida onde os limites dessa integral são menos infinito e infinito.

Concretamente, o que isso significa é que você considere essa expressão para todos os intervalos de tempo finitos possíveis. E você pergunta: qual é o seu limite quando esse intervalo de tempo cresce até o infinito? E cara, oh cara, há muito mais a dizer, muito! Eu não quero terminar aqui. Essa transformação se estende aos cantos da matemática muito além da ideia de extrair frequências de sinal. Então, o próximo vídeo que eu divulgarei vai passar por algumas delas. E é aí que as coisas começam a ficar interessantes.

A Nagwa usa cookies para garantir que você tenha a melhor experiência em nosso site. Saiba mais sobre nossa Política de privacidade.