Redes Metabólica
De forma a encontrar as proteínas responsáveis pelo metabolismo e transporte, optou-se por dividir as proteínas em dois grupos:
- Proteínas responsáveis pelo metabolismo;
- Proteínas responsáveis pelo transporte.
Como foi pedido, para o primeiro grupo de proteínas obteve-se os respectivos 'EC numbers', 'Kegg ortholog', 'Kegg Reaction IDs' e 'Kegg pathways' de forma a caracterizar estas proteínas através da base de dados KEGG.
Para o segundo grupo apenas há uma diferença, a substituição dos 'EC numbers' pelos 'TC numbers'.
Sendo assim, decidiu-se criar um script que recolhesse todas as proteínas que contivessem os termos 'Metabolism', 'Regulatory' ou 'Transport' na sua função:
Como se pode ver, foram criados dois ficheiros: um para cada grupo de proteínas. Recorreu-se à base de dados KEGG para acrescentar os campos pedidos e eliminaram-se todas as CDS que não possuiam 'EC numbers' ou 'TC numbers', caso estas fossem metabólicas/regulatórias ou transportadoras respectivamente. Chegámos assim a estas duas tabelas finais:
Tabela com CDS de função regulatória/metabólica:
RegulatoryMetabolic.xlsx (14289)
Tabela com CDS de função de transporte: