4 Avances recientes en biología computacional

0

Biología computacional está evolucionando rápidamente con la llegada de las nuevas tecnologías, especialmente en la forma de recoger, analizar y visualizar los datos. El Dr. Ragothaman Yennmalli, un Kolabtree independiente y científico, examina cuatro avances prometedores.  

En el marco del seguimiento de la anterior entrada introductoriaEn este artículo destacaré algunas de las tendencias o avances recientes en las ciencias biológicas que están transformando la biología computacional. Estos avances se basan en gran medida en herramientas y métodos computacionales: análisis de grandes datos, modelización multiescala, etc. A continuación se enumeran algunos de ellos.

1. Los grandes datos

Se trata de un término bien conocido en informática y que ha sido recogido por los biólogos sólo recientemente. Gracias a las técnicas de secuenciación de nueva generación, la secuencia de un genoma puede obtenerse en un tiempo relativamente menor. Por ejemplo, la relevancia de generar datos rápidamente se magnifica cuando se trabaja con datos metagenómicos o un microbioma. ¿Cómo se pueden gestionar los datos? ¿Y el almacenamiento a largo plazo? ¿Cuáles son las herramientas para analizar datos tan masivos? Estas preguntas surgen y tienen respuesta. Como se ha mencionado, esta es una tendencia reciente en la biología, pero no en las ciencias de la computación o la física experimental, donde el manejo y el análisis de grandes datos es un trabajo rutinario.

big-data-1667184_1280
Un caso particular en el que se está investigando es en los formatos de archivo de los big data biológicos. En el caso de los archivos de estructuras de proteínas, el estándar actual es el formato .pdb, un formato dependiente de las columnas que es analizable y legible tanto por humanos como por máquinas. Sin embargo, este formato falla cuando se describen megaestructuras, como el ribosoma o las cápsides virales completas. Por ello, se ha propuesto un nuevo formato llamado .pdbx que supera las limitaciones del formato anterior. También existe otro formato llamado MMTF que acelera el tiempo de carga de estructuras con más de 20 millones de átomos en segundos.

Más información sobre big data en informática biología estructural:
http://science.sciencemag.org/content/355/6322/248

2. Técnicas de crio-EM y XFEL

Estos dos métodos no son nuevos, como tales. Sin embargo, la tecnología actual y los avances que se están produciendo en estos dos campos están ampliando los límites del análisis de la estructura biomolecular. Cryo-EM es una técnica que permite captar la estructura tridimensional de la biomolécula mediante un microscopio electrónico de alta resolución. En uno de los laboratorios pioneros de los NIH se resolvió una estructura de 2,5Å. Esta resolución suele obtenerse con la estructura cristalina de las proteínas, lo que habitualmente implica al menos 1 ó 2 meses de tiempo para estandarizar el cristal óptimo que se dispara bajo el haz de rayos X.

alat2-872522_1920
En cambio, una técnica reciente que está revolucionando la biología estructural es XFEL que consiste en disparar haces de rayos X de alta intensidad sobre microcristales de proteínas. Debido a la alta radiación, los microcristales se queman literalmente para obtener los datos. Se necesitan decenas de miles de microcristales para obtener datos de una cobertura decente. Cada imagen capturada de un microcristal tiene que ser analizada con el resto para obtener la estructura 3D de la biomolécula.

Estas técnicas dependen en gran medida de programas informáticos automatizados que utilizan algoritmos de procesamiento de imágenes y, en cierta medida, enfoques de aprendizaje automático para identificar la señal del ruido circundante. Este es el big data, ya que la diversidad y la velocidad a la que se adquiere la información es astronómica.

3. Modelización multiescala

A diferencia de la modelización de una sola estructura biomolecular y de la extrapolación a un sistema más complejo, la modelización multiescala implica a más de 200.000 átomos y la dinámica obtenida revela interacciones de largo alcance temporal y un comportamiento complejo de los múltiples componentes (ya sean homogéneos o heterogéneos). Los datos generados a partir de estos experimentos son masivos debido al número de puntos de datos obtenidos, también debido a las múltiples ejecuciones para obtener una significación estadística.

Un caso en el que se ha utilizado la modelización multiescala es en la comprensión de la dinámica del celulosoma, una estructura compleja bacteriana formada por proteínas y enzimas heterogéneas que se adhieren a la celulosa. Los celulosomas tienen importancia industrial en el ámbito de los biocombustibles, concretamente en la producción de bioetanol.

Más información: http://www.ks.uiuc.edu/Research/biofuels/

4. Secuenciación de células individuales

En lugar de examinar varias células, la técnica más reciente consiste en aislar cada célula individual, extraer el ARN y secuenciarlo. Esta técnica reciente se llama secuenciación de ARN de una sola célula o scRNA-seq. En este artículo de Nature, en el que se habla del método y de sus ventajas, se menciona que

Es mucho más difícil manipular células individuales que grandes poblaciones, y como cada célula sólo produce una pequeña cantidad de ARN, no hay margen de error. Otro problema es el análisis de las enormes cantidades de datos resultantes, sobre todo porque las herramientas utilizadas pueden ser poco intuitivas.

Aquí se ofrece una excelente revisión del flujo de trabajo y de las herramientas para scRNA-seq: https://doi.org/10.3389/fgene.2016.00163


¿Necesita ayuda para consultar a Biólogo computacional? Contratar a un Biología computacional autónoma experto en Kolabtree. Es gratis publicar tu proyecto y obtener presupuestos.

¿Quieres consultar al Dr. Yennamalli sobre un proyecto? Ponte en contacto con él en Kolabtree aquí.

Expertos relacionados:
Contratar a un bioinformático         Contratar a un biólogo molecular      Contratar a un bioestadístico


Kolabtree ayuda a las empresas de todo el mundo a contratar expertos bajo demanda. Nuestros freelancers han ayudado a las empresas a publicar artículos de investigación, desarrollar productos, analizar datos y mucho más. Sólo se necesita un minuto para decirnos lo que necesita hacer y obtener presupuestos de expertos de forma gratuita.


Comparte.

Sobre el autor

El Dr. Ragothaman Yennamalli se doctoró en Biología Computacional y Bioinformática en 2008 en la Universidad Jawaharlal Nehru de Nueva Delhi. Realizó una investigación posdoctoral en la Universidad Estatal de Iowa (2009-2011), la Universidad de Wisconsin-Madison (2011-2012) y la Universidad de Rice (2012-2014). Actualmente es profesor asistente en la Universidad Jaypee de Tecnología de la Información, Waknaghat, Himachal Pradesh, India.

Dejar una respuesta

Expertos autónomos de confianza, listos para ayudarle con su proyecto


La mayor plataforma mundial de científicos autónomos  

No gracias, no estoy buscando contratar en este momento