Andrey V Lisitsa, Ekaterina V Poverennaya, Elena A Ponomarenko y Alexander I Archakov
La secuenciación del genoma completo ha revelado el número de genes que codifican proteínas en un organismo determinado, lo que puede considerarse una primera aproximación a la complejidad molecular. Debido a las modificaciones postranscripcionales y postranscripcionales, como el empalme del ARN, los polimorfismos, las modificaciones covalentes y la degradación, el número total de especies proteínicas diferentes (el proteoma) puede ser mucho mayor que el número de genes que codifican proteínas. La electroforesis en gel 2-D se puede utilizar para estimar el ancho del proteoma humano. El número de puntos obtenidos con diferentes tinciones (colorantes) bajo diferentes condiciones de carga de proteínas puede dar una idea aproximada del número de proteínas diferentes en la muestra. Se han investigado datos sobre plasma y líneas celulares humanas y sobre células bacterianas para determinar la dependencia del número de puntos con respecto a la sensibilidad al colorante. Suponiendo que cada punto representa una especie proteínica diferente, se aplicó la dependencia de los puntos con respecto a la sensibilidad como una estimación del ancho del proteoma. En teoría, hay 1,75 millones de proteoformas en 1 L de plasma sanguíneo, 18 mil especies por célula HepG2 individual y 6700 especies por bacteria.