4 Progrès récents en biologie computationnelle

0

Biologie computationnelle évolue rapidement avec l'avènement des nouvelles technologies, notamment dans la manière dont nous collectons, analysons et visualisons les données. Le Dr. Ragothaman Yennmalli, une Kolabtree freelance et scientifique, examine quatre avancées prometteuses.  

Dans le prolongement de la poste d'introduction précédentDans ce numéro, je vais mettre en lumière certaines des tendances ou avancées récentes dans les sciences biologiques qui transforment la biologie computationnelle. Ces avancées reposent en grande partie sur des outils et des méthodes informatiques - analyse de données massives, modélisation multi-échelle, etc. Certaines d'entre elles sont énumérées ci-dessous.

1. Le Big Data

Ce terme, bien connu en informatique, n'a été repris que récemment par les biologistes. Grâce aux techniques de séquençage de nouvelle génération, la séquence d'un génome peut être obtenue en un temps relativement court. Ainsi, la pertinence de générer des données rapidement est amplifiée lorsqu'on travaille avec des données métagénomiques ou un microbiome. Comment gérer les données ? Qu'en est-il du stockage à long terme ? Quels sont les outils pour analyser des données aussi massives ? Ces questions se posent et elles ont des réponses. Comme nous l'avons mentionné, il s'agit d'une tendance récente en biologie, mais pas en informatique ou en physique expérimentale, où la manipulation et l'analyse de données massives sont des tâches courantes.

big-data-1667184_1280
Les formats de fichiers des grandes données biologiques constituent un exemple particulier de recherche en cours. Dans le cas du format de fichier de structure des protéines, la norme actuelle est le format .pdb, un format dépendant des colonnes qui peut être analysé et lu par l'homme et la machine. Cependant, ce format échoue lorsqu'il s'agit de décrire des méga-structures, comme le ribosome ou les capsides virales complètes. Un nouveau format a donc été proposé, le format .pdbx, qui permet de surmonter les limites du format précédent. Il existe également un autre format appelé format MMTF qui accélère le temps de chargement des structures de plus de 20 millions d'atomes en quelques secondes.

Autres lectures sur le big data en informatique biologie structurelle:
http://science.sciencemag.org/content/355/6322/248

2. Techniques Cryo-EM et XFEL

Ces deux méthodes ne sont pas nouvelles, en tant que telles. Toutefois, la technologie actuelle et les progrès réalisés dans ces deux domaines repoussent les limites de l'analyse de la structure biomoléculaire. Cryo-EM est une technique permettant de capturer la structure tridimensionnelle de la biomolécule à l'aide d'un microscope électronique à haute résolution. Dans l'un des laboratoires pionniers du NIH, une structure de 2,5Å a été résolue. Cette résolution est habituellement obtenue avec la structure cristalline des protéines, ce qui implique au moins 1 à 2 mois de temps pour normaliser le cristal optimal à photographier sous le faisceau de rayons X.

alat2-872522_1920
En revanche, une technique récente qui révolutionne la biologie structurelle est la suivante XFEL qui consiste à envoyer des faisceaux de rayons X de haute intensité sur des microcristaux de protéines. En raison du rayonnement élevé, les microcristaux sont littéralement brûlés pour obtenir les données. Des dizaines de milliers de microcristaux sont nécessaires pour obtenir des données d'une couverture décente. Chaque image capturée à partir d'un microcristal doit être analysée avec les autres pour obtenir la structure 3D de la biomolécule.

Ces techniques dépendent fortement de logiciels automatisés qui utilisent des algorithmes de traitement d'images et, dans une certaine mesure, des approches d'apprentissage automatique pour identifier le signal dans le bruit environnant. Ce site est le big data, car la diversité et la vitesse à laquelle les informations sont acquises sont astronomiques.

3. Modélisation multi-échelle

Contrairement à la modélisation d'une structure biomoléculaire unique et à l'extrapolation à un système plus complexe, la modélisation multi-échelle implique plus de 200 000 atomes et la dynamique obtenue révèle des interactions à long terme et un comportement complexe des multiples composants (homogènes ou hétérogènes). Les données générées par de telles expériences sont massives en raison du nombre de points de données obtenus, mais aussi en raison de l'exécution de plusieurs cycles pour obtenir une signification statistique.

Un exemple d'utilisation de la modélisation multi-échelle est la compréhension de la dynamique du cellulosome, une structure bactérienne complexe composée de protéines hétérogènes et d'enzymes qui se fixent à la cellulose. Les cellulosomes sont importants sur le plan industriel dans le domaine des biocarburants, notamment pour la production de bioéthanol.

Pour en savoir plus : http://www.ks.uiuc.edu/Research/biofuels/

4. Séquençage de cellules uniques

Au lieu d'examiner plusieurs cellules, la dernière technique consiste à isoler chaque cellule individuelle, à en extraire l'ARN et à les séquencer. Cette technique récente est appelée séquençage de l'ARN d'une seule cellule ou scRNA-seq. Dans cet article de Nature, discutant de la méthode et de ses avantages, ils mentionnent que

Il est beaucoup plus difficile de manipuler des cellules individuelles que de grandes populations, et comme chaque cellule ne produit qu'une quantité infime d'ARN, il n'y a pas de place pour l'erreur. Un autre problème est l'analyse des énormes quantités de données qui en résultent, notamment parce que les outils utilisés peuvent être peu intuitifs.

Une excellente revue du flux de travail et des outils pour scRNA-seq est donnée ici : https://doi.org/10.3389/fgene.2016.00163


Besoin d'aide pour le conseil de Biologiste informaticien? Engagez un freelance Biologie computationnelle expert sur Kolabtree. Il est gratuit de publier votre projet et d'obtenir des devis.

Vous souhaitez consulter le Dr. Yennamalli sur un projet ? Contactez-le sur Kolabtree. ici.

Experts connexes :
Embaucher un bioinformaticien         Embaucher un biologiste moléculaire      Engager un biostatisticien


Kolabtree aide les entreprises du monde entier à embaucher des experts à la demande. Nos freelances ont aidé des entreprises à publier des articles de recherche, à développer des produits, à analyser des données, et bien plus encore. Il suffit d'une minute pour nous dire ce dont vous avez besoin et obtenir gratuitement des devis d'experts.


Partager.

À propos de l'auteur

Le Dr Ragothaman Yennamalli a obtenu son doctorat en biologie computationnelle et bioinformatique en 2008 à l'université Jawaharlal Nehru de New Delhi. Il a effectué des recherches postdoctorales à l'université d'État de l'Iowa (2009-2011), à l'université du Wisconsin-Madison (2011-2012) et à l'université Rice (2012-2014). Il est actuellement professeur adjoint à la Jaypee University of Information Technology, Waknaghat, Himachal Pradesh, Inde.

Laissez une réponse

Des experts indépendants de confiance, prêts à vous aider dans votre projet.


La plus grande plateforme de freelance au monde pour les scientifiques  

Non merci, je ne cherche pas à embaucher pour le moment.