Ciência e Big Data: saiba o que fazem os bioinformatas


Publicado em 28/05/2018 às 08:42 | Por Luana Cruz

Lidar com um grande volume, velocidade e variedade de dados é hoje o desafio para muitas áreas da ciência. A biologia, em especial, precisou melhorar a capacidade da análise das informações e desenvolver ferramentas que auxiliam na interpretação delas. Dessa forma, surgiram profissionais especialistas em dar sentido aos dados, retornando benefícios que contribuem para a melhoria e desenvolvimento da vida humana.

“O bioinformata é um hibrido. Usa ferramentas poderosas computacionais para resolver problemas biológicos. Em especial, problemas que envolvem múltiplos dados. Na era do Big Data, em que geramos um conjunto gigantesco de dados, são necessários cada vez mais recursos para analisar. O bioinformata é o profissional que navega muito bem em computação. Ele é programador, conhece, utiliza e desenvolve softwares específicos. Sabe a programação dos algoritmos e consegue decidir que tipo de abordagem computacional vai usar para resolver um problema biológico”, coordenadora do programa de Bioinformática da Universidade Federal de Minas Gerais (UFMG), Glória Regina Franco.

Foi no contexto de necessidade do tratamento especializado de dados que surgiu, em 2003, o programa de pós-graduação em Bioinformática. Na época, a Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes) lançou o edital BioMicro para incentivar a criação de cursos na área. Na UFMG, primeiramente, criou-se o doutorado e 10 anos depois, o mestrado.

O programa é fruto de um esforço dos departamentos de Bioquímica e Imunologia (DBI) e Ciência da Computação (DCC), juntamente com outros cinco setores dos institutos de Ciências Biológicas, Ciências Exatas e Escola de Engenharia. Na última avaliação quadrienal na Capes, foi qualificado com 7, a nota máxima, por isso é um dos programas que apresentaremos na série de reportagens sobre pesquisas de excelência desenvolvidas em Minas.

“Somos o melhor programa de Bioinformática do país. Com a nota 7 estamos no patamar mais alto, comparado a cursos de toda Europa e Estados Unidos”, se orgulha o professor Vasco Azevedo, que está no curso desde a criação. Segundo ele, outros programas do Brasil demorarão de 8 a 12 anos para almejar a nota máxima.

Área efervescente

Bioinformática é chamado na UFMG de programa interunidades. A área de pesquisa é estratégica no desenvolvimento de projetos multidisciplinares e está dividida em três linhas: Bioinformática de Biomoléculas, Bioinformática Funcional e Bioinformática Genômica. Os cientistas analisam sequências de DNA e proteínas, estudam as estruturas tridimensionais de moléculas, criam algoritmos para visualização de modelos moleculares, desenvolvem tecnologias de telepresença em sistemas biológicos, entre outros trabalhos.

O programa formou 46 mestres e 69,6% desses egressos estão, hoje, em outras instituições federais de Minas, fora do estado ou em outros países. Também foram formados 91 doutores, cujos 72,5% ainda trabalham com ensino e pesquisa. O programa é sediado no DBI, que concentra o maior número de professores do curso.

“É uma área efervescente. Todo mundo gostaria de ter um bioinformata no seu grupo ou trabalhar com ele, porque a capacidade dos biólogos em analisar dados é muito pequena. Quando surgem milhares e milhões de dados ou metadados, é preciso ter um conhecimento maior das ferramentas”, explica Glória Regina.

Imagem do DNA. Foto: Karl-Ludwig-Poggemann/ Wikimedia

Segundo a coordenadora, o biólogo queria, antigamente, uma ferramenta que pudesse apertar o botão e obter resultados. “Uma caixa preta, que não sabia como funcionava e acreditava no que saía de lá, porque não tinha a menor ideia de como era desenvolvida. Muitas vezes, o desenvolvedor da ferramenta também não sabia qual era a melhor aplicação. O bioinformata faz a leitura dessa caixa preta. Ele modifica comandos, adapta algoritmos ou softwares para responder às suas perguntas biológicas. Um bom bioinformata é desenvolvedor de ferramentas, por isso precisa muito de computação e estatística”.

Na UFMG, o programa de pós-graduação tem um viés de utilização e elaboração de sistemas que ajudam na interpretação de dados biológicos, justamente por ser concebido nas ciências biológicas. É diferente da Universidade de São Paulo (USP), onde o programa nasceu no Instituto de Matemática e Estatística e se dedica a formar excelentes desenvolvedores de softwares.

 “A ciência que o mundo faz”

Para Glória Regina, fazer pesquisa de excelência, é “estar na fronteira do conhecimento”. Segundo a coordenadora, a vantagem da bioinformática é que ela pode trabalhar com dados biológicos públicos, apesar de ser muito importante a geração de dados próprios. Nesse sentido, mesmo sem recursos suficientes, o pesquisador pode usar informações que outro cientista produziu, pois gerar esse material é muito caro.

É possível usar dados de estudos de outros países, por exemplo. Um orientando de Glória Regina trabalha com respostas do cérebro a stress, aprendizado e memória social. Ele aproveita informações de um pesquisador da Universidade da Flórida, que gerou um conjunto grande de dados sobre animais (camundongos) jovens e velhos. Os bichos foram submetidos a aprendizado; alguns aprenderam outros não.

O cientista norte-americano queria comparar as diferenças nos cérebro desses animais, por isso trabalhou com genes expressos que produziam RNAs em resposta ao aprendizado. A pesquisa desenvolvida na UFMG usa os dados gerados por ele fazendo outros tipos de análises, buscando marcadores que ele não encontrou e usando metodologia diferente.

“Não preciso ter camundongos, extrair RNA, fazer sequenciamento de DNA para entender como isso funciona. Posso usar os dados biológicos, fazer a junção de informações, chegar a novas respostas e gerar conhecimento absolutamente novo. Seria muito bom se gerássemos nossos próprios dados, mas pela restrição de verba nas pesquisas, fica complicado porque essas gerações são muito caras”, explica Glória Regina.

De acordo com a coordenadora, a excelência está em aproveitar oportunidades, fazendo “a ciência que o mundo faz”. Para isso, são necessários investimentos, porque tudo é muito caro na pesquisa de ponta. Ela afirma que o Brasil não pode ficar para trazer porque tem potencial e excelentes pesquisadores precisando de aporte financeiro para trabalhar.

O que a Bioinformática tem?

Os pesquisadores do programa usam supercomputadores e servidores potentes para processar terabytes de dados biológicos. Além disso, estudam com um corpo docente de 28 professores experientes que são referência em seus campos de origem, tendo a Bioinformática, geralmente, como segunda área. Pós-graduandos formados em biologia passam por uma imersão na área da computação e vice-versa. Todos são incentivados a publicar artigos em periódicos de grande impacto para o meio.

Estrutura proteica. Foto: Andrei-Lomize/Wikimedia

O professor Vasco Azevedo avalia a importância do time que faz parte do programa. “A alma da pós-graduação é o envolvimento de professores e discentes comprometidos. Nós temos a capacidade de crescer porque ainda pode vir muita gente das Exatas para interagir”. Conforme o professor, foram escolhidos para entrar no programa os melhores docentes da bioquímica, genética, computação e outros.

Parafraseando Darcy Ribeiro, o professor ressalta: “A universidade se faz com cabeças, cabeças, cabeças, biblioteca e equipamento”. Para Vasco Azevedo, o amor dos docentes pelo ensino e pesquisa são diferenciais e vão muito além de bons instrumentos ou tecnologia para trabalhar.

Há também muitas cooperações nacionais e internacionais. Alunos são enviados para outras instituições e pesquisadores são trazidos para troca de experiências. Há docentes que atuam no programa de Bioinformática que são vinculados a instituições federais do Pará, Paraná, Bahia, além do interior de Minas. Ademais, o programa desenvolve a chamada “solidariedade”, que consiste em apoiar egressos na criação e implementação de linhas de pesquisa em Bioinformática em outras instituições.

Para os interessados na área, o programa oferece cursos de verão e inverno em Bioinformática, recebendo pessoas de vários lugares do Brasil e do mundo. “As pessoas têm curiosidade porque o bioinformata é um profissional pouco conhecido no mercado. Eu costumo explicar assim: você já ouviu falar no sequenciamento do genoma humano? Pois é, ele abriu portas para gente desvendar o mecanismo de doenças e conhecer os genes profundamente. Para saber isso tudo, precisamos gerar um volume de dados grandes. O profissional de bioinformática atua na compreensão disso tudo porque está muito ligado à genômica”, detalha Glória Regina.

  • Egressos do programa trabalham em laboratórios de análises clínicas, em Minas Gerais, desenvolvendo pesquisas sobre doenças genéticas para alcançar diagnósticos de alta performance. Ajudam também a conhecer doenças complexas como câncer, diabetes e neurodegenerativas;

  • Bioinformatas da UFMG atuam em institutos de pesquisa de câncer;

  • A professora do programa, Rafaela Salgado, é vencedora do prêmio Mulheres na Ciência. Ela trabalha com design de moléculas que podem ser usadas na produção de remédios para uma série de doenças. Desenvolve pesquisas que unem química, biologia e informática para encontrar produtos naturais na pesquisa de novos medicamentos;

  • Egressos do programa trabalham na Fiocruz com Zika vírus, sequenciando genomas para conhecer as estirpes que circulam no Brasil;

  • Muitos outros bioinformatas pesquisam organismos causadores de doenças;

  • Há cientistas da UFMG na Embrapa estudando genomas de eucaliptos, cacau e cana-de-açúcar para melhorar a produção, conseguir cultivares mais eficientes ou combater pragas;

  • Um egresso do programa criou uma startup que oferece soluções customizadas de bioinformática a laboratórios, institutos de pesquisa e empresas de biotecnologia que trabalham com certificação alimentar.

Lucas Carrijo de Oliveira é doutorando no programa. Para ele, a importância de pesquisar em um departamento de excelência não se resume à nota, mas a tudo que levou o curso merecer essa avaliação. “Destaco a possibilidade de conviver com os maiores especialistas do Brasil, ter acesso a parcerias internacionais e ser referência nacional em nossa área”.

Ficção científica?

O doutorando desenvolve uma tese que envolve a técnica chamada reconstrução de sequências ancestrais. É como se Lucas Carrijo tentasse “ressuscitar” proteínas que existiram há milhares, milhões ou até bilhões de anos. Isso ajuda a elucidar a evolução dessas moléculas e, consequentemente, compreender melhor a função e os processos biológicos em que estão envolvidas.

Quando o pós-graduando tenta explicar o objeto de estudo para as pessoas, percebe que elas associam a realidade da pesquisa com filmes hollywoodianos. “Geralmente, perguntam se é para fazer vacinas, remédios, cosméticos ou gerar tecnologia. Analisar sequências de DNA, visualizar estruturas proteicas, construir sistemas biológicos, tudo isso parece ficção científica para quem nunca viu, mas fazemos isso cotidianamente. Muitas pessoas acreditam que proteínas são bolinhas coloridas como víamos nos livros didáticos e querem saber se a manipulação do DNA mostrada nos filmes é, de fato, possível”, conta.

Lucas Carrijo é graduado em Ciências Biológicas da Universidade Federal de Uberlândia (UFU). Foi atraído ao programa da UFMG por pesquisas em biologia computacional de proteínas, pois queria trabalhar com proteômica – a ciência que estuda o conjunto de proteínas em amostra biológicas. “Há massiva quantidade de dados disponíveis em bancos de dados públicos, esperando para serem analisados. Isso é um prato cheio para pesquisadores curiosos e criativos, e que eventualmente disponham somente de um laptop para fazer sua pesquisa”, explica.

Turma de pesquisadores – alunos e professores – do programa de Bioinformática. Foto: Divulgação UFMG

Desafio das gerações

Tanto a coordenadora Glória Regina quanto o professor Vasco Azevedo não são bioinformatas de origem, pois se formaram em épocas que não existia esse profissional. Assim, enfrentam o desafio geracional de lidar com biotecnologia de ponta. Quando o programa de pós-graduação foi criado, não havia no mercado bioinformatas, propriamente com este nome. Havia, inclusive, dificuldade de interação entre biólogos e cientistas da computação.

“Nós aprendemos a ser bioinformatas”, afirma o professor Vasco Azevedo, que é originalmente da área de genética.

“Eu não sou originalmente bioinformata, por isso é um desafio gigante. Meus alunos falam que eu já sou, mas eu não sei programar. Não me sinto menos capaz porque consigo entender os softwares e algoritmos, mas programar é um exercício diário, uma questão de prática. Eu vim de uma era que não tinha computador, por isso não é fácil treinar. Os bioinformatas são muito curiosos, eles são jovens e criam uma reciclagem para gente. Foram as crianças que surgiram na era dos tablets e laptops. Me sinto jovem e muito renovada”, afirma Glória Regina.

Doutores formados no programa hoje são também docentes o que, para a coordenação, é um fator fundamental no alcance da nota 7 da Capes. Boa parte dos pesquisadores usam a linguagem de programação Python. Também usam a linguagem R para cálculos estatísticos. Os próprios alunos do programa se ajudam, ofertam disciplinas e cursos dessas ferramentas para capacitar colegas. Ainda não há uma graduação em Bioinformática na UFMG, mas, segundo a coordenadora Glória Regina, esta poderá ser uma opção no futuro.