Vídeo: Calculando e Interpretando a Equação de uma Regressão Linear num Diagrama de Dispersão

Mostramos como desenhar uma reta de regressão linear a olho num diagrama de dispersão e determinaremos a equação dessa reta. Em seguida, verá como interpretar os valores do declive e da interseção com O𝑦 na equação no contexto dos dados.

16:14

Transcrição do vídeo

Neste vídeo, analisaremos alguns dados apresentados num diagrama de dispersão e traçaremos uma reta de regressão linear. Em seguida, elaboraremos uma equação dessa reta e utilizá-la-emos para interpretar o significado da taxa de variação ou declive e o valor da interseção com O𝑦. As tarifas cobradas por alguns táxis para viagens de diferentes comprimentos são apresentadas na tabela de valores em baixo. E, em seguida, eu tenho uma tabela de valores que apresenta a distância em milhas e a tarifa em dólares dessas várias viagens diferentes dentro da cidade. Agora, isso não é realmente uma pergunta; é apenas uma afirmação. Mas o que vamos fazer é criar um gráfico de dispersão, e depois tentaremos encontrar a reta de regressão linear e, a seguir, tentaremos interpretar o significado dessa reta de regressão linear e falaremos sobre o assunto e interpretaremos os dados.

Então, primeiro vamos pensar nas nossas variáveis ​​ 𝑥 e 𝑦. De um modo geral, pensaremos que quanto mais viaja num táxi, mais vão cobrar. Então, pensamos que a distância será 𝑥, a variável independente, e a tarifa será 𝑦, a variável dependente. Então, é isso que vamos utilizar. Agora, com os dados que temos, a variável 𝑥 sobe para cerca de vinte e a variável 𝑦 sobe para cinquenta e cinco. Então, acabamos de desenhar alguns eixos e rotulamo-los: o 𝑦 é a tarifa e o eixo O𝑥 é a distância. Então, agora vamos tomar todos estes pontos individualmente e representá-los nos eixos.

Estamos apenas a considerar, para cada par ordenado, a considerar o valor de 𝑥 e o valor de 𝑦 e a utilizá-los como as nossas coordenadas em 𝑥 e em 𝑦 e a representá-los a todos. Agora, a distribuição destes pontos no diagrama sugere fortemente uma reta. Então, o que faremos é tentar criar uma reta que atravesse o maior número destes pontos ou o mais próximo possível destes, com uma distribuição bastante uniforme dos pontos acima e abaixo dessa reta. Então, acho que seria mais ou menos assim. Portanto, podemos utilizar essa reta para fazer previsões sobre as tarifas. Por exemplo, se tivéssemos uma viagem de cerca de oito quilómetros, se traçarmos uma reta que vai de cinco quilómetros até à nossa reta de regressão linear e depois fizermos correspondência com o eixo O𝑦, podemos ver que isso vai custar-nos cerca de dezoito dólares. E, de facto, da mesma forma, se tivéssemos quarenta dólares para gastar, até onde podemos chegar com quarenta dólares? Então, se passarmos de quarenta dólares para a reta de regressão linear e depois fizermos a correspondência com o eixo O𝑥, leva-nos cerca de 24 quilómetros. Portanto, o nosso diagrama aqui, a reta de regressão linear neste diagrama, tem um significado. Permite-nos fazer previsões sobre a tarifa do táxi, considerando o quão longe viajamos ou o quão longe podemos viajar, dada uma determinada tarifa.

Agora, o facto de estes dados não estarem exatamente nesta reta de regressão linear, são todos ligeiramente diferentes, diz-nos que esta reta de regressão linear não está a dar-nos um valor exato; está apenas a dar-nos uma aproximação. Portanto, a reta de regressão linear é uma regra aproximada que descreve a relação entre o número de milhas que viajamos e a tarifa real do táxi. Agora, o facto de os pontos estarem bem próximos desta reta diz-nos que parece representar uma boa aproximação à regra e que os números que vamos obter das previsões que vamos receber serão bastante boas aproximações. Mas lembre-se, é apenas com base nos dados que temos para viagens entre cinco e trinta quilómetros, e também com base em oito viagens reais de táxi, portanto não seria sensato esperar necessariamente que a mesma regra se aplicasse a viagens de cinquenta ou cem ou até mil milhas. Portanto, dentro das restrições que acabámos de falar. A tarifa do táxi parece seguir aproximadamente uma relação em reta, como mostramos neste diagrama. Agora, a outra coisa é que, quando utilizamos o gráfico para fazer as previsões, é bastante difícil ler os valores exatos. Então, o que faremos é calcular a equação desta reta e, em seguida, podemos colocar números na nossa equação e gerar números como resultados.

Agora, para calcular a equação desta reta, lembre-se de que precisamos de duas coisas: precisamos do declive da reta e da interseção com O𝑦. Agora, a interseção com O𝑦 é relativamente fácil de ver. Parece que será cerca de cinco. E o declive, lembre-se, é sempre que aumento a coordenada em 𝑥 uma unidade, em quanto a coordenada em 𝑦 aumenta. Agora, se eu realmente fizesse isso aqui, digamos qual é a distância entre aqui e aqui, isto é bastante difícil nestes eixos — nestes eixos em particular com as escalas que precisamos de fazer. Então, o que vou fazer é procurar pontos que estejam nos eixos exatos das coordenadas e que estejam o mais afastados possível, por isso vou considerar este aqui e este aqui. E vou utilizar a definição de declive que é a diferença nas coordenadas em 𝑦 dividida pela diferença nas coordenadas em 𝑥. Então, entre estes dois pontos, a coordenada em 𝑦 aumenta de dez aqui para cinquenta aqui, então a diferença será cinquenta menos dez. E para as coordenadas 𝑥, vamos subir de dois para dezoito aqui, então a diferença é dezoito menos dois. E isso torna-se quarenta sobre dezasseis, o que simplifica para cinco sobre dois. Então, isto significa que temos um declive de cinco sobre dois e temos uma interseção com O𝑦 de cinco. Como a relação é linear, temos um gráfico de uma reta, utilizaremos a forma geral da equação 𝑦 igual a 𝑚 𝑥 mais 𝑏, e o declive é cinco sobre dois e a interseção é cinco, então podemos inserir estes números. Agora, 𝑦 é a tarifa em dólares; então, na verdade, dizer que o multiplicador é de cinco sobre dois, é perfeitamente preciso. Quando falamos de dinheiro, provavelmente é melhor dizer que são dois dólares e cinquenta centavos ou dois pontos e cinco dólares, pelo que a nossa equação se torna 𝑦 igual a dois pontos cinco 𝑥 mais cinco. E a maneira como interpretamos estes números é a interseção sendo cinco; esta é a coordenada em 𝑦 quando 𝑥 é igual a zero. Isso significa que, para entrar no táxi, estes taxistas cobram cinco dólares, o que é uma espécie de taxa de início para sua viagem. E, a seguir, o declive indica o quanto estão a cobrar de cada vez que aumentam 𝑥 uma unidade, em que 𝑥 é o número de milhas que viaja no táxi. Então, basicamente, por cada quilómetro percorrido, estão a cobrar dois dólares e cinquenta centavos. Portanto, a nossa interpretação é que cada tarifa consiste numa taxa fixa de cinco dólares mais dois dólares cinquenta por milha. Agora, isto é apenas uma aproximação, como dissemos; nenhuma das tarifas coincide exatamente com os pontos porque nenhum dos pontos pertence exatamente à reta, mas estão todos muito próximos desta. Esta é a regra geral que seguem aproximadamente.

E agora temos a equação; podemos utilizá-la provavelmente com mais facilidade do que o gráfico para fazer previsões sobre quanto custaria cada viagem. Então, no gráfico, se estivéssemos a percorrer oito milhas, teríamos que subir no gráfico até aqui e, de certa forma, deparar-nos com um palpite é que seria vinte e cinco, vinte e quatro, vinte e seis dólares. Mas se colocarmos o número diretamente na equação, podemos ver que o custo será de dois ponto cinco vezes oito mais cinco. E é vinte e cinco, que é vinte e cinco dólares. Portanto, é mais fácil obter respostas mais precisas utilizando a equação. Agora, para utilizar a equação para fazer previsões na outra direção, digamos que recebemos 35 dólares e queremos saber até onde chegaremos com os nossos 35 dólares, teremos que reorganizar esta equação para insolar 𝑥. Então, o que vou fazer aqui é subtrair cinco dos dois membros desta equação, o que nos dá 𝑦 menos cinco no primeiro membro e dois ponto cinco 𝑥 no segundo membro, porque cinco menos cinco não é nada. E agora, se dividir os dois membros por dois ponto cinco, saberei a quanto é 𝑥 igual. Portanto, a distância que posso percorrer para uma determinada tarifa é de 𝑦 menos cinco sobre dois ponto cinco. Então, digamos que tínhamos trinta e cinco dólares, podemos colocar trinta e cinco no 𝑦. Então 𝑥, o número de milhas que podemos percorrer será de trinta e cinco menos cinco; são trinta sobre dois ponto cinco, ou seja, doze milhas.

Portanto, no gráfico, ficaria assim, mas acho que é mais fácil obter uma resposta mais precisa quando está a trabalhar com equações e números. Então, revemos o processo. Começámos com uma tabela de valores por aqui. A partir disso, traçámos o gráfico. No gráfico, calculámos esta equação e vimos como poderíamos utilizá-la para fazer previsões de tarifas com base em quão longe viajamos ou a que distância podemos chegar com uma determinada quantia de dinheiro. Também interpretámos esta equação para que soubéssemos que cinco nos diz qual é a taxa fixa para cada viagem, e o declive dois pontos cinco nos diz que cobram dois dólares cinquenta aproximadamente por milha que percorremos. Agora, a única coisa que não considerámos em tudo isto é para esta função específica, esta equação que representa a função da relação entre a distância e a tarifa, qual seria um domínio adequado? Agora, como não cobraremos valores negativos se viajarmos de regresso a lugares diferentes, provavelmente faz sentido que a distância que estejamos a percorrer seja sempre positiva. Portanto, em termos de matemática, faz sentido colocar uma restrição nos números que podemos colocar nesta equação, dizendo que os valores de 𝑥, o número de milhas, devem ser pelo menos zero para que faça algum sentido.

Então, tendo feito tudo isto, vamos dar mais um exemplo e faremo-lo um pouco mais rapidamente. Então, nove alunos foram convidados a medir o diâmetro e o perímetro de nove circunferências diferentes, uma para cada um, e os resultados são apresentados na tabela abaixo. Então, temos para cada aluno, fizeram medições, pelo que não fizeram cálculos aqui, apenas tomaram uma régua ou um pedaço de corda e mediram estes comprimentos. Por exemplo, o primeiro aluno tinha um diâmetro de duas polegadas na sua circunferência e um perímetro de seis polegadas. Então, o que vamos fazer é representá-los num diagrama de dispersão. E depois vamos fazer uma reta de regressão linear, calcular a equação dessa reta de regressão linear e tentar interpretar alguns dos parâmetros. Então, primeiro, precisamos de definir quais são as nossas coordenadas em 𝑥 e 𝑦. Então, vou dizer 𝑥, que define o diâmetro da circunferência e que esta determina qual é o perímetro, então vou utilizar 𝑥 para o diâmetro e 𝑦 para o perímetro, e, a seguir, vou tratar cada um destes como um par ordenado e utilizar a coordenada em 𝑥 e a coordenada em 𝑦 para representar esses pontos.

E é isto que temos. Agora, a maioria dos pontos sugere fortemente uma relação de reta entre 𝑥 e 𝑦, entre o diâmetro e o perímetro, mas há um ponto que parece muito diferente dos outros. O que está a acontecer aqui? Portanto, várias possibilidades diferentes vêm à mente. Quero dizer, pode ser que a régua que esse aluno utilizou seja extraordinariamente sensível às mudanças de temperatura, pelo que se expande e contrai à medida que aquece ou arrefece, e talvez tivessem a fazer as suas medições num ambiente onde a temperatura estava a mudar rapidamente. Pode ser que tenha havido um evento gravitacional bizarro por perto, que distorceu enormemente o espaço-tempo enquanto o aluno fazia as suas medições. Pode ser que tenham encontrado uma circunferência bizarra que parece muito diferente e tem propriedades diferentes de todas as outras circunferências, ou talvez o aluno tenha sido muito mau a medir ou, possivelmente, apenas tenha registado os números mal. Bem, não sabemos qual é a situação real e não podemos fazer nenhuma suposição. Parece muito provável que tenham acabado de transpor o diâmetro e o perímetro. Mas como se trata de dados secundários, não temos acesso às circunferências originais, não temos acesso aos alunos originais, acho que o que faremos é assumir que parece muito diferente. Provavelmente está errado; vamos ignorar este dado por enquanto. E precisa de ter muito cuidado com o descarte de partes de dados dos quais simplesmente não gosta, porque obviamente pode distorcer os seus resultados. Mas pelo que sabemos sobre as circunferências, o modo como funcionam e a geometria, acho bem claro que isto parece uma parte de dados desonesta, então acho que, neste caso específico, podemos ignorá-lo. Então, vamos traçar uma reta que melhor se aproxime do restante dos pontos.

Agora, isto parece-se com uma reta de regressão linear razoável para o restante destes pontos. Então, para calcular a equação desta reta, teremos que determinar a interseção e o declive. Bem, esta reta parece passar pela origem. Portanto, a interseção com O𝑦, quando 𝑥 é zero, o valor de 𝑦 é zero. E para calcular o declive, selecionarei dois pontos do meu eixo de coordenadas e calcularei a diferença em 𝑥 e a diferença em 𝑦 novamente. Então, indo deste ponto para este ponto, a coordenada em 𝑦 subiu de zero para trinta, então a diferença na coordenada 𝑦 é trinta. E entre estes mesmos dois pontos, a coordenada em 𝑥 vai de zero para nove ponto cinco. Portanto, o declive parece ser trinta dividido por nove ponto cinco, que é cerca de três ponto um seis. E como temos uma relação linear, a nossa equação será semelhante a 𝑦 igual a 𝑚 𝑥 mais 𝑏 mais e calculamos que o declive é de três ponto um seis e a interseção é zero. Então, a nossa equação é 𝑦 igual a três ponto um seis 𝑥 mais zero. Por outro lado, normalmente não nos preocupamos em escrever mais zero no final das nossas equações, então vamos apenas com 𝑦 igual a três ponto um seis 𝑥.

Então, pensando bem que 𝑥 representa o diâmetro em polegadas e 𝑦 representa o perímetro em polegadas, então, para aquelas circunferências estamos a dizer com estes dados que temos, calculamos que o perímetro seja aproximadamente igual a três ponto um seis vezes o diâmetro. E interpretando estes parâmetros, a interseção aqui no zero, faz sentido; então, se temos uma circunferência com diâmetro zero, não temos realmente uma circunferência, então o perímetro também será zero. Então, estamos felizes com a interpretação disto, e isso significa que sempre que adicionarmos uma polegada ao diâmetro da nossa circunferência, multiplicá-lo-emos por três ponto um seis para obter o perímetro. Portanto, cada centímetro extra no diâmetro adiciona três ponto um seis polegadas ao perímetro da circunferência. Agora mesmo daqui, posso ouvir aqueles de vocês que estão a prestar atenção às suas aulas de geometria a gritar comigo: “Mas sabemos que o perímetro de uma circunferência é 𝜋 vezes o diâmetro!” Então, o que fizemos na nossa pequena experiência aqui com estes nove alunos é calculámos utilizando técnicas estatísticas uma aproximação para o valor de 𝜋. Estas duas coisas são completamente compatíveis uma com a outra, exceto que uma é um pouco mais imprecisa que a outra. Como os nossos alunos estão a medir, nem sempre o fazem com cem por cento de precisão, portanto alguns destes pontos não estão mesmo na reta, embora, em teoria, todos devessem estar exatamente numa reta. Mas com todos estes erros, quando somamos todos estes erros, a nossa estimativa do valor de 𝜋 saiu ligeiramente errada; é três ponto um seis em vez de três ponto um quatro um cinco nove blá blá blá blá blá blá. Mas, no entanto, não é uma estimativa má. Por isso, esperamos que os dois exemplos que acabámos de ver lhe tenham dado a chance de ver o valor dos diagramas de dispersão e o quão úteis podem ser na interpretação dos dados. Mas, o mais importante, talvez, permitiram calcular a equação de uma reta e interpretar alguns dos valores. Portanto, a interseção, a interseção com O𝑦 e o declive dessa reta, interpretámo-los nalgum tipo de contexto da vida real.

A Nagwa usa cookies para garantir que você tenha a melhor experiência em nosso site. Saiba mais sobre nossa Política de privacidade.