Redes Metabólica

    De forma a encontrar as proteínas responsáveis pelo metabolismo e transporte, optou-se por dividir as proteínas em dois grupos:

  • Proteínas responsáveis pelo metabolismo;
  • Proteínas responsáveis pelo transporte.

    Como foi pedido, para o primeiro grupo de proteínas obteve-se os respectivos 'EC numbers', 'Kegg ortholog', 'Kegg Reaction IDs' e 'Kegg pathways' de forma a caracterizar estas proteínas através da base de dados KEGG.

    Para o segundo grupo apenas há uma diferença, a substituição dos 'EC numbers' pelos 'TC numbers'.

    Sendo assim, decidiu-se criar um script que recolhesse todas as proteínas que contivessem os termos 'Metabolism', 'Regulatory' ou 'Transport' na sua função:

TransportMetabolic.py

    Como se pode ver, foram criados dois ficheiros: um para cada grupo de proteínas. Recorreu-se à base de dados KEGG para acrescentar os campos pedidos e eliminaram-se todas as CDS que não possuiam 'EC numbers' ou 'TC numbers', caso estas fossem metabólicas/regulatórias ou transportadoras respectivamente. Chegámos assim a estas duas tabelas finais:

Tabela com CDS de função regulatória/metabólica:

 RegulatoryMetabolic.xlsx (14289)
 

Tabela com CDS de função de transporte:

 Transport.xlsx (9731)