Última alteração: 2016-11-15
Resumo
Novas tecnologias de sequenciamento genômico estão revolucionando o estudo de doenças causadas por falhas no material genético, como o câncer. Essa revolução advém do fato da redução do custo e aumento da velocidade no sequenciamento, o que tem gerado um aumento significativo de dados genéticos nos últimos anos. Nesse contexto, grandes repositórios públicos de dados genômicos foram criados, os quais são mantidos e atualizados constantemente. Dentre os repositórios criados nos últimos anos destaca-se o TCGA (The Cancer Genome Atlas), que possui como objetivo manter um repositório com alto volume de dados com acesso público para que se possa subsidiar pesquisas na área de câncer. Este trabalho apresenta estudos preliminares do repositório TCGA, com o objetivo de entender e descrever os tipos de dados existentes no repositório assim como investigar as formas de extração desses dados.
PALAVRAS-CHAVE: Biologia computacional. Bioinformática. Câncer. TCGA.