Categorias
Escala Cosmológica Escala Galáctica

Mineração de Dados na Astronomia

Essa é uma forma de processamento de dados que tem se mostrado cada vez mais presente em determinados trabalhos científicos astronômicos.

A crescente tecnologia de coleta de dados já está mostrando sua inevitável consequência: um volume enorme de dados que podem fornecer informações que nem imaginamos. Já foram levados a cabo diversos surveys que forneceram uma enormidade de dados que ainda esperam ser analisados. Surveys consistem em se obter imagens de regiões do céu. O volume de dados desses surveys é fabuloso, e muitos encontram-se disponíveis na internet, como o Digital Sky Survey http://archive.stsci.edu/cgi-bin/dss_form.

Um dos motivos para esses dados se tornarem públicos é simples: o volume de dados disponíveis é muito superior ao que poderia ser processado por um determinado grupo de astrônomos, por maior que esse grupo seja. Em geral, as observações astronômicas feitas para pesquisa tornam-se públicas após um certo período de tempo, normalmente o tempo necessário para o autor (ou autores) da observação publicar seus resultados. Muitas vezes esses dados vêm a público sem serem totalmente explorados.

No caso dos surveys, as quantidades de dados são verdadeiramente gigantescas. E surge o problema de como processar de maneira eficiente todos esses dados. Por “maneira eficiente”, quero dizer em um intervalo de tempo razoavelmente curto e se obtendo a maior quantidade possível de informações a partir dos dados. Entra então no cenário científico uma tecnologia de processamento de dados chamada datamining.

Ao pé da letra podemos traduzir como mineração de dados. Para se utilizar o datamining, é necessária uma organização de dados diferente do convencional. Em geral, imaginamos dados organizados em forma de tabelas, com linhas e colunas. Dados organizados dessa maneira são acessados segundo um processo conhecido como On Line Transaction Processing, ou OLTP. Dados para serem processados por datamining devem estar organizados de uma maneira diferente, cuja forma de se acessar é conhecida como On Line Analytical Processing, ou OLAP.

Em vez de tabelas, para imaginarmos uma base dados configurada para OLAP, devemos imaginar algo com mais dimensões. Enquanto os dados em uma tabela, que é bidimensional, estão preparados para OLTP, podemos imaginar os dados preparados para OLAP organizados em um cubo ou alguma outra forma de mais dimensões.

Eu sei que siglas de “informatiquês” não agradam a muita gente. Para nosso interesse específico, algo importante no processo de datamining é a procura por padrões. Através de busca de padrões, podemos obter classificação de objetos feita pelo computador. Assim, podemos conhecer em uma dada região do céu todos os objetos observados ali como estrelas, aglomerados, aglomerados de galáxias, etc. É fácil imaginar como isso é bom quando temos um volume gigantesco de dados para ser analisado.

Os mais interessados por processamento de dados na Astronomia vão ouvir muito falar em datamining. Essa tecnologia veio para tornar possível o processamento dos dados obtidos com tecnologias observacionais cada vez mais elaboradas. E esse é apenas um recente exemplo de intercâmbio entre Astronomia e Informática.

Por Leandro L S Guedes

Astrônomo, Diretor de Astronomia da Fundação Planetário da Cidade do Rio de Janeiro, Msc., Dr., Astrofísica Extragaláctica, História e Filosofia da Ciência.