Visualização de dados filogenéticos e fósseis - BIE5751

A ideia por trás desse tutorial é ter um primeiro contato com os principais tipos de dados usados em Macroevolução. Os exercícios propostos aqui serão retomados com maior detalhe no próximo tutorial, que será feito diretamente no R, então no momento não se preocupe em saber como as coisas são feitas, e busque só se familiarizar com os diferentes tipos de dados.

Usaremos uma ferramenta interativa que permite a visualização instantânea e simplificada de comandos do R, usando o pacote shiny. Esta ferramenta ainda está em desenvolvimento, então por favor nos avise dos possíveis problemas que encontrarem ao longo da aula para que possamos arrumá-los em versões futuras! (Para salvar as figuras geradas, clique com o botão direito do mouse e depois em “Salvar Imagem Como…”)

O código necessário para usar a ferramenta está neste arquivo. Para salvá-lo, clique com o botão direito no link e depois em “Salvar link como…”, e então salvá-lo no diretório de sua escolha. Para abrir o arquivo basta clicar duas vezes para abrí-lo no RStudio. No topo da janela do arquivo com o código, clique no botão escrito “Run App” para rodar a ferramenta.

Filogenias Moleculares

Com a ferramenta aberta e funcionando, vamos simular filogenias que resultam de diferentes combinações entre taxas de especiação e extinção. Por enquanto usaremos apenas modelos de taxas constantes ao longo do tempo por simplicidade, mas mais para frente no curso veremos que essa condição pode ser relaxada de diferentes formas.

Nascimento puro (Pure Birth ou Yule)

Os parâmetros definidos por padrão na ferramenta (especiação = 0.2 e extinção = 0) já estão prontos para serem usados em simulações de um processo de nascimento puro (Pure birth). Para gerar uma nova simulação, basta clicar no botão “Rodar Simulação”. Cada vez que você clicar, uma nova simulação será feita e plotada na mesma janela. A ferramenta plota duas filogenias: a de cima é a filogenia completa e a de baixo é a filogenia molecular. Ainda, existe um checkbox com a opção “Mostrar LTT Plot”, que quando marcado plota também um gráfico com o número de linhagens vivas ao longo do tempo.

Simulações

Inicialmente, simule e analise calmamente uma árvore usando as taxas pré-definidas (lembre-se de nesse passo não alterar as taxas de extinção, que devem permanecer em 0). Observe que as duas filogenias plotadas são sempre idênticas. Por que isso acontece?

Em seguida, repita o processo acima algumas vezes sem mexer nos parâmetros. O que é possível dizer sobre o número de espécies final das filogenias geradas? E sobre as curvas de diversidade?

Relação entre taxa e tempo

No próximo passo, a ideia é comparar a interação entre a taxa de especiação e a idade do clado. Antes de simular, o que você espera de árvores geradas sob um mesmo regime (i.e. taxas) porém com idades diferentes?

Para analisarmos essa dualidade nas árvores, você deve simular algumas árvores com uma mesma taxa de especiação (0.2) e idade (15). Em cada etapa, estime o número total de espécies formadas e anote esses valores.

Em seguida, altere a idade do clado simulado para 30, mantendo a taxa de especiação sem alterações (0.2). Novamente simule diferentes árvores e anote o número estimado total de espécies formadas.

Agora compare os valores entre os dois cenários. Quão diferentes são as árvores geradas? Você consegue propor um modelo de crescimento (linear, exponencial, logístico) que possa explicar essas diferenças?

Por fim, retorne o valor da idade para 10, mas agora ajuste o valor de especiação para 0.4, e repita os passos acima. Quais conclusões é possível tirar baseados nesses resultados?

Nascimento e morte (Birth-Death)

Nesta parte do tutorial, vamos analisar como a extinção afeta a filogenia (e consequentemente as curvas de diversidade e os LTT plots).

Simulações

Inicialmente, ajuste a taxa de especiação para 0.3 e aumente a taxa de extinção para 0.1, e também ajuste o tempo para 20. Note que com essa combinação de taxas, o “saldo” de diversificação (especiação - extinção) é positivo e com igual valor (0.2) ao que iniciamos a parte anterior do tutorial, porém agora com efeito da extinção. Comparando as duas filogenias plotadas (com especial atenção na filogenia molecular, no gráfico de baixo), o que se pode dizer sobre a assinatura que a extinção deixa nessas filogenias e nas curvas de diversidade? Repita este procedimento algumas vezes para ganhar intuição sobre o processo.

Simule também árvores geradas por diferentes combinações de especiação e extinção. Somente ccuidado com a combinação dos parâmetros, pois valores muito extremos podem fazer o R travar. Caso isso por acaso aconteça, basta fechar a janela da ferramenta e clicar em “Run App” novamente.

“Saldo” 0 (ou negativo)

Por fim, rode simulações com a taxa de extinção sendo igual à taxa de especiação (ambas em 0.4). O que acontece, e por que? Vale também tentar simular árvores com as taxas de extinção ligeiramente maiores que as de especiação para ver o que acontece!

Registro Fóssil

Vamos agora simular o outro tipo de dados comumente usados em macroevolução. O registro fóssil tem vantagens e desvantagens quando comparado às filogenias moleculares, e essas diferenças serão abordadas ao longo do curso.

Assim como no caso das filogenias, usaremos modelos estocásticos de nascimento puro ou nascimento e morte.

Importante: as funções de simulação de registro fóssil são mais lentas do que as funções para gerar filogenias. Sendo assim, ao clicar nos botões para gerar as simulações, espere alguns segundos para que a simulação seja terminada, pois no caso de repetidos cliques no botão de simulação, o R pode travar.

Para cada simulação serão plotados 3 gráficos: o primeiro (painel esquerdo) representa a duração ou as ocorrências das linhagens simuladas (que podem ser observadas usando o botão de seleção “Tipo de Gráfico”); no painel direito, dividido em 2, serão plotados histogramas das durações (em milhões de anos) das espécies da simulação. O painel superior representa as durações sabendo-se o exato momento de surgimento e desaparecimento das espécies, enquanto que o painel inferior representa as durações calculadas a partir da primeira e última ocorrências dos fósseis.

Nascimento Puro (Pure Birth ou Yule)

Simulações

De maneira análoga às simulações para filogenias moleculares, simule diferentes registros fósseis usando os valores definidos por padrão na ferramenta (especiação = 0.2, extinção = 0, número total de espécies = 30, preservação = 100). Para cada simulação, observe a duração das espécies alternando entre os dois tipos de visualização (Duração e Ocorrências). Analise também os dois histogramas das durações das linhagens, comparando isso com as representações das durações das linhagens.

Importância da qualidade do registro

Na próxima etapa, ajuste o valor de preservação para 50% e novamente simule diferentes histórias. Alternando entre os dois tipos de visualização dos dados, e também avaliando as diferenças entre os histogramas, o que é possível inferir sobre como a qualidade do registro fóssil afeta as nossas estimativas de duração das espécies? Em um caso ainda mais extremo, ajuste o valor de preservação para 10%.

Nascimento e Morte (Birth Death)

Simulações

Repita os passos anteriores, porém agora usando taxas de especiação de 0.3 e taxas de extinção de 0.1 (retornando a preservação para 100%). Simulando diferentes histórias, o que é possível notar de diferente nesse cenário quando comparado ao anterior?

Em seguida, repita as mudanças nos valores de preservação (para 50% e depois para 10%), e também compare as durações e os histogramas, alternando entre os dois tipos de visualização.

Resumo

Este tutorial foi pensado para que permita um primeiro contato com os principais tipos de dados que usamos em macroevolução, porém sem usar ou expor a maquinaria estatística/computacional por trás. Na próxima aula, veremos os códigos usados para gerar a ferramenta, bem como exploraremos um pouco mais as característas dos processos geradores de diversidade.