Lesson Video: Representando Graficamente Dados Experimentais | Nagwa Lesson Video: Representando Graficamente Dados Experimentais | Nagwa

Lesson Video: Representando Graficamente Dados Experimentais

Nesta aula, vamos aprender como reconhecer padrões em gráficos de dados experimentais e como interpretá-los para compreender como as quantidades estão relacionadas.

14:11

Video Transcript

Neste vídeo, vamos falar sobre representar graficamente de dados experimentais. Quando uma experiência é realizada, uma certa quantidade de dados é recolhida. Muitas vezes, porém, o significado ou a importância desses pontos de dados é são claros até que sejam representados graficamente. Os dados gráficos podem revelar tendências e padrões que, de outra forma, são muito difíceis de ver. Nesta aula, veremos como representar graficamente os dados recolhidos numa experiência e como utilizá-los para entender o que aconteceu. Antes de termos dados para representar graficamente, precisamos de realizar uma experiência para recolhê-los.

Digamos que fazemos uma experiência numa determinada estrada próxima durante a hora de ponta do final de tarde entre as 17:00 e as 18:00. Se dividirmos esta hora em intervalos de 10 minutos, o que temos são intervalos de um, dois, três, quatro, cinco, seis, 10 minutos nesta hora. E digamos que fazemos a previsão de que, nesses intervalos de 10 minutos, a maioria dos carros passará durante o último das 5:50 às 18:00. Para testar a nossa previsão, permaneceremos nessa estrada entre as 5:00 e as 6:00 numa semana da noite. E contaremos os carros à medida que passam. Sempre que um carro passar, acrescentamo-lo à nossa contagem nesse intervalo de 10 minutos específico.

E assim fazemo-lo. Contamos o número de carros que passam entre 5:00 e 5:10. Depois, contamos o número de carros que passaram entre 5:10 e 5:20, depois entre 5:20 e 5:30, e assim por diante. E digamos que, depois de recolhermos todos os nossos dados, estas são as contagens em cada intervalo. No primeiro intervalo de tempo, seis carros passaram, depois 11 no segundo, 14, 20, 25 e, finalmente, 19. Para organizar os dados que recolhemos, podemos criar algumas colunas. Primeiro, temos a coluna que indica o intervalo de tempo. Podemos liga-la ao intervalo das 5:00 às 5:10, número um, depois das 5:10 às 5:20, número dois, e assim por diante, até ao intervalo de tempo número seis, das 5:50 às 18:00.

E, em seguida, a corresponder a estes intervalos está o número de carros que passam durante cada um. Então, basicamente temos duas colunas com informações de valor. Temos o intervalo de tempo durante o qual recolhemos a contagem de carros. E depois temos a contagem correspondente de carros. E, a propósito, já podemos ver que a nossa previsão não estava correta. Não obtivemos o maior número de carros que passaram no último intervalo de tempo, mas no penúltimo. Dito isto, há mais a descobrir sobre estes dados experimentais. Mas, escrito na forma de tabela como está agora, é difícil ver essas coisas. Então vamos fazer isto. Vamos elaborar um gráfico bidimensional. E chamaremos o eixo horizontal, por enquanto, o eixo O𝑥 e o eixo vertical, o O𝑦.

O que faremos com este gráfico é: marcaremos os pontos de dados que recolhemos para podermos investigar quaisquer tendências existentes. Então, o que faremos é representar as duas colunas de informações que temos sobre esta experiência. A primeira coluna é o intervalo de tempo durante o qual contámos os carros e a segunda coluna é a contagem de carros durante esses intervalos. Agora, sabemos que quando representarmos pontos de dados num gráfico como temos aqui, representamo-los nesta ordem, primeiro 𝑥 e depois 𝑦. Ou seja, a variável 𝑥 corresponde ao eixo horizontal. E a variável 𝑦 corresponde ao vertical. Mas agora, somos confrontados com uma pergunta: qual deveria ser 𝑥 e qual deveria ser 𝑦, deveria 𝑥 ser o intervalo de tempo e o número de carros 𝑦 ou vice-versa?

Para descobrir isto, é útil conhecer um pouco da terminologia experimental. Em qualquer experiência bem planeada, temos uma variável chamada variável independente. Esta é a que alteramos de propósito de maneira controlada, a fim de ver qual é o efeito que pode ter noutra variável. Com o nosso gráfico elaborado da maneira que está, é o eixo O𝑥, o eixo horizontal, que representa os valores da variável independente. Mencionamos isso numa experiência. Quando a variável independente é alterada, esta pode afetar outra variável. E existe um nome para esta; é chamada de variável dependente. Esta variável é normalmente representada no eixo vertical ou no eixo O𝑦.

Então, na nossa experiência de contagem de carros, qual é a variável independente e qual é a dependente? Bem, podemos ver que os intervalos de tempo que escolhemos — aqueles tempos específicos e depois chamá-los de um, dois, três, quatro, cinco e assim por diante — faziam parte do projeto experimental. Não foram influenciados ou impactados por nenhuma outra variável. Por outras palavras, poderíamos dizer que optámos por variar o tempo nesta experiência e ver qual foi o efeito que teria no número de carros que passavam. Isto diz-nos que são as informações do intervalo de tempo que é a variável independente na nossa experiência. Estes incrementos específicos de 10 minutos foram apenas algo que decidimos ao planeá-la.

Sabendo isto, podemos ver qual é a variável dependente. O número de carros que passava dependia do intervalo de tempo específico que escolhemos. Portanto, isto diz-nos que, quando representamos os nossos pontos 𝑥𝑦 neste gráfico, os valores de 𝑥 que representam a variável independente incluirão os intervalos de tempo de um a seis. E os valores 𝑦 que representam a variável dependente mostrará o número de carros que passou nesses respetivos intervalos. Assim, ao traçarmos os pontos de dados 𝑥𝑦, podemos ver que estamos a representar o intervalo com o número correspondente de carros que passou. Agora, para fazer isso, precisamos de trabalhar um pouco nos nossos eixos. Como primeiro passo, podemos alterar os rótulos 𝑥𝑦 para ler o intervalo e o número de carros. Agora, os rótulos desses eixos dizem-nos a que se referem.

A próxima coisa que queremos fazer é desenhar marcas de escala nos eixos horizontal e vertical, para que possamos escrever e ajustar todos os números no eixo horizontal, bem como aqueles que aparecerão no eixo vertical. Focando primeiro nos valores de 𝑥, precisaremos de acomodar valores entre um e seis. Portanto, se colocarmos marcas no eixo que se parecem com isto, a partir de zero, teremos o nosso primeiro intervalo de tempo, depois o nosso segundo, depois o terceiro, até o último, o sexto. Em seguida, faremos algo semelhante para o eixo vertical, onde indicamos o número de carros que passa. Podemos ver que o valor máximo que precisamos de indicar é 25. Este é o número mais alto em qualquer um dos nossos intervalos.

Então, o que podemos fazer é colocar marcas no nosso eixo vertical, onde cada marca representa mais três carros. Então começamos em zero e, em seguida, a primeira marca de escala representa três carros que passam. A próxima representa seis, depois nove, depois 12, e assim por diante, até chegarmos a um valor máximo de 27. Este valor máximo é maior do que o valor máximo que precisamos de representar a partir dos nossos dados. Isso significa que o nosso eixo é capaz de cobrir o intervalo de valores que temos. Agora que tudo isto está no seu lugar, podemos começar a representar pontos a partir dos dados que recolhemos utilizando esta forma, intervalo e, em seguida, o número correspondente de carros.

Então, para representar o ponto que aparece no nosso primeiro intervalo de tempo, desenharemos uma linha vertical a partir deste primeiro intervalo no nosso eixo horizontal. E a seguir, olhando para a nossa tabela de dados, podemos ver que seis carros passaram naquele intervalo de 10 minutos. O que fazemos então é encontrar esse número no nosso eixo vertical — encontramos seis aqui — e depois desenhar uma linha horizontal a partir deste até encontrar a linha vertical do primeiro intervalo. E onde estas duas linhas se cruzarem, desenharemos o nosso primeiro ponto de dados.

Quando este ponto está no seu lugar, fazemos o mesmo no intervalo de tempo número dois. Traçamos uma linha tracejada vertical a partir desta marca de intervalo. Em seguida, olhamos para a nossa tabela de dados e vemos que 11 carros passaram durante o segundo intervalo. Encontramos esse valor no nosso eixo vertical. Temos 11 carros por aqui, e depois traçamos uma linha horizontal tracejada a partir daí. E mais uma vez, onde estas duas linhas se cruzarem, desenhamos o nosso ponto de dados. Em seguida, passamos para o terceiro ponto de data, correspondente ao intervalo de tempo número três. Nesses 10 minutos, contámos 14 carros que passam. Então, encontrar este valor no nosso eixo vertical, está bem ali. E, mais uma vez, traçando uma linha horizontal a partir daquele e onde as linhas vertical e horizontal se cruzam, é onde o nosso ponto de dados pertence. E, em seguida, para os pontos de dados quatro, cinco e seis, o mesmo processo é repetido.

E aqui está como o nosso gráfico fica quando todos os pontos são representados. Estabelecidos desta maneira, podemos ver que há uma tendência geral nos dados. De um modo geral, quanto mais tarde for o nosso intervalo de tempo, mais carros serão contados a passar naquela estrada. Agora, dizemos, de um modo geral, porque podemos ver que há uma exceção. No último intervalo de tempo, não contamos mais carros do que em qualquer outro intervalo. Mas, no geral, a tendência do conjunto de dados como um todo é que mais carros passem nos intervalos de tempo mais à frente.

Temos um nome específico para dados que correspondem desta maneira. Dada uma variável independente e uma variável dependente, como temos na nossa experiência, se quando aumentamos a variável independente, neste caso o valor no eixo horizontal, vemos um aumento na variável dependente. No geral, chamamos isto de uma correlação positiva. Isso significa que a tendência é que um aumento na variável independente leve a um aumento correspondente na dependente. E podemos ver que é isto que temos aqui no caso dos nossos dados experimentais.

Obviamente, não era necessário que ocorresse desta forma, aumentando o intervalo de tempo geral, aumentaria o número de carros que passava. Poderia ter sido que descobríssemos a tendência oposta. por outras palavras, poderíamos ter visto que, aumentando o nosso intervalo de tempo, menos carros passariam. O termo para isso, quando o aumento da variável independente leva a uma diminuição na variável dependente, é correlação negativa. Dizemos que estas variáveis têm uma correlação negativa, ou seja, à medida que uma aumenta, a outra diminui. Agora, apenas como observação, estes dois termos, correlação positiva e correlação negativa, são úteis. Mas não descrevem todas as relações possíveis que duas variáveis podem ter. Pode ser, por exemplo, que não haja correlação entre duas variáveis particulares numa experiência.

Portanto, embora estas duas descrições sejam exaustivas — não abrangem todas as possibilidades —, são úteis para descrever algumas das tendências que possamos encontrar. Tudo bem, agora temos todos os pontos de dados que recolhemos, representados no nosso gráfico. E digamos que consideramos este gráfico e o mostramos a um amigo. E depois de estudá-lo por algum tempo, o nosso amigo diz, estou curioso, quantos carros passaram pela rua nos primeiros 25 minutos da experiência? Em resposta, poderíamos ver à nossa tabela de dados. E veríamos que o primeiro intervalo abrange das 5:00 às 5:10 e no segundo intervalo abrange das 5:10 às 5:20. Então, esses são os primeiros 20 minutos no total. Mas não parámos em 25 minutos para contar o número de carros que havia passado até aquele momento.

No nosso gráfico, 25 minutos apareceriam aqui, entre os intervalos de tempo dois e três. O que o nosso amigo está a perguntar é se traçássemos uma linha vertical a partir deste ponto, onde é que se cruzariam os nossos dados? Mas podemos ver que não se cruzam os dados, pelo menos não diretamente. Medimos pontos a cada 10 minutos, mas não a cada cinco minutos, como precisaríamos para ter esta resposta. Nesta altura, há algumas coisas que poderíamos fazer. Uma é refazer a experiência e recolher dados com mais frequência. Digamos que recolheríamos a cada cinco minutos em vez de a cada 10 minutos. Ou talvez a recolhêssemos a cada minuto em intervalos de 60 segundos.

Podemos ver, porém, que há um limite para a quantidade de dados que podemos recolher razoavelmente durante uma experiência. Portanto, outra opção para responder à pergunta do nosso amigo sem voltar a recolher mais dados é desenvolver o que é chamada de uma reta de regressão aos dados que temos. Aqui está a definição de uma reta de regressão. É uma reta que melhor exibe o padrão do conjunto de dados. É uma reta que desenhamos após os dados serem representados para resumir esses dados. Agora, considerando o nosso conjunto de dados de seis pontos, uma maneira de traçar uma reta de regressão para estes seis pontos é desenhar numa área que inclua todos os pontos que medimos na nossa experiência. E, em seguida, traçaremos uma reta nessa área que a cortará aproximadamente ao meio. Então, essa reta pode ficar aproximadamente assim.

Ok, agora que temos a nossa reta de regressão, como é que esta nos ajuda? Bem, observa que agora podemos dar uma resposta à pergunta do nosso amigo sobre quantos carros passaram na estrada nos primeiros 25 minutos. Embora não tenhamos um ponto de dados de medida para esse valor, agora temos a nossa reta de regressão. Assim, quando atingimos esta reta, podemos mover-nos numa linha horizontal e ver qual é o valor que se cruza com o eixo do número de carros. Outra maneira a qual uma reta de regressão é útil é que o seu declive ou o seu gradiente pode dizer-nos o quão positivamente ou negativamente estão correlacionados os nossos dados. Quanto mais positivo for o gradiente ou o declive, mais positiva será a correlação. E quanto mais negativo, mais negativa é a correlação.

Há algumas coisas importantes a serem observadas sobre as retas de regressão em geral e nesta em particular. Primeiro, podemos ver que a reta não passa por todos os nossos pontos de dados. E é importante perceber que uma reta de regressão pode estar perfeitamente correta sem passar por nenhum dos pontos medidos. Em conjunto com isso, observa que a reta de regressão neste caso não passa pela origem. Em geral, isso é perfeitamente aceitável, a menos que haja um requisito físico de que a reta passe pela origem. Pode passar por esse ponto ou não.

Para a nossa reta de regressão, vemos que interseta o eixo O𝑦 ou vertical aqui, em três carros que passam. Esta é a interseção desta reta de regressão. E a seguir, se traçarmos a reta mais adiante, veremos onde intersetaria o eixo horizontal. E este ponto de interseção é chamado de interseção em O𝑥. A interseção em O𝑥 e O𝑦 da reta de regressão geralmente é útil para dar informações sobre o cenário. Por exemplo, no nosso caso, a interseção em O𝑦 da reta de regressão prevê que o número de carros que passou no início da experiência.

Vamos resumir agora o que aprendemos sobre a representação gráfica de dados experimentais. Desde o início, vimos que os dados gráficos têm a vantagem de ajudar a revelar tendências e padrões nos dados experimentais. Em casos bidimensionais, vimos que os dados são representados nesta ordem. A variável 𝑥 é a variável independente e a variável 𝑦 é a variável dependente. Vimos ainda que os dados podem ser correlacionados positiva ou negativamente ou pode ser nenhum dos casos. Por fim, vimos que uma reta de regressão é uma reta que melhor exibe o padrão de um conjunto de dados.

Join Nagwa Classes

Attend live sessions on Nagwa Classes to boost your learning with guidance and advice from an expert teacher!

  • Interactive Sessions
  • Chat & Messaging
  • Realistic Exam Questions

Nagwa uses cookies to ensure you get the best experience on our website. Learn more about our Privacy Policy