Expertos del departamento de ciencias de la computación de la Universidad Carnegie Mellon han desarrollado un método para rastrear secuencias de ADN en cuestión de minutos, una mejora notable ya que antes esto requería días.
La tecnología, concebida por Carl Kingsford y Brad Solomon, del Departamento de Biología Computacional, está diseñada para encontrar secuencias de ADN y ARN mediante una nueva estructura de datos de indexación, llamada Sequence Bloom Trees, o SBT. El Instituto Nacional de Salud (NHI por sus siglas en inglés) posee una base gigantesca de datos de secuencias, en total unos tres mil billones de pares de bases que los expertos utilizan para obtener información sobre los procesos biológicos básicos relacionados a posibles curas para el cáncer.
Se necesitarían miles de discos duro para almacenar todas esas secuencias. Y buscar las deseadas, por lo habitual secuencias de 50 a 200 pares bases, entre los miles de billones, resulta una tarea titánica.
“La base de datos contiene un número incalculable de conocimientos que aún no hemos descubierto – asegura Kingsford –. El principal problema es que es muy difícil realizar una búsqueda”.
El SBT funciona del mismo modo que el catálogo de una biblioteca. En un primer nivel el sistema verifica si la secuencia de ADN está en la base de datos. Si es así, la búsqueda continúa dividiendo todo el índice en dos mitades y determinando en cuál de ellas se encuentra. Luego vuelve a dividirlo y así sucesivamente hasta que se encuentran las secuencias deseadas.
Kingsford y Solomon probaron su técnica sobre un archivo de 2.652 análisis de sangre, mama y cerebro, cada uno de los cuales a menudo contienen más de mil millones de pares de bases de ARN. El SBT completaba la tarea en unos 20 minutos promedio, un avance de enormes proporciones teniendo en cuenta que a las técnicas existentes hasta la fecha, como SRA-BLAST y STAR, les llevaría 2,2 días y 921 días, respectivamente. Por si fuera poco se pueden realizar hasta 200.000 exploraciones simultáneas. Los investigadores de diferentes áres pueden hacer uso de SBT ya que se trata de un software de código abierto.
El trabajo se ha publicado en la revista Nature.

Juan Scaliter