Donner un sens à toutes ces données

Il s’agit de la deuxième partie d’une série en deux parties sur la science des données, adaptée d’un article du Northwestern University News Center. Pour en savoir plus sur la façon dont la science des données éclaire la recherche dans les domaines du cancer, des soins cardiovasculaires et des soins pédiatriques critiques, lisez la première partie.

L’énorme volume de données généré par l’exploration de données génomiques nécessite une énorme puissance de calcul, bien supérieure à ce que l’ordinateur de bureau moyen peut gérer.

Elizabeth McNally, MD, PhD, qui a récemment pris la tête du Centre de médecine génétique, connaît bien les défis de l’analyse de quantités époustouflantes de données. Elle dirige un projet parrainé par les National Institutes of Health pour examiner le séquençage du génome entier de 300 personnes atteintes de cardiomyopathie, une cause fréquente d’insuffisance cardiaque. En tant que clinicien, McNally dirige le programme de génétique cardiovasculaire au Northwestern Medicine Bluhm Cardiovascular Institute. McNally, également professeur Elizabeth J. Ward de médecine génétique, travaille avec une équipe de médecins et de conseillers en génétique où ils utilisent régulièrement des tests génétiques chez les patients et les familles atteints de maladies cardiovasculaires et neuromusculaires héréditaires pour déterminer les variantes génétiques contribuant à leurs maladies. Ces informations permettent d’établir un diagnostic et d’orienter une démarche thérapeutique.

« Chaque génome est composé de 3 milliards de paires de bases, les unités de construction du génome, et chacun de nous a quatre ou cinq millions de différences entre nous », a déclaré McNally. «Nous essayons de déterminer laquelle ou deux de ces variantes causent la maladie chez cet individu. C’est comme chercher une aiguille dans un tas d’aiguilles. Ce serait impossible sans des ordinateurs puissants.

« Si j’essayais d’analyser 250 génomes et les millions de différences dans les gènes sur mon ordinateur de bureau, cela prendrait 50 ans pour le faire », a déclaré McNally.

Elle utilise le supercalculateur du Laboratoire national d’Argonne pour disposer de la puissance de calcul nécessaire pour séquencer et analyser rapidement les génomes de ses patients en quelques jours seulement. Maintenant, elle a hâte de travailler avec Quest, le cluster de calcul haute performance de la Northwestern University.

Science des données et dossiers médicaux électroniques

Le projet Electronic Medical Records and Genomics (eMERGE) du NIH dirigé à Northwestern par Rex Chisholm, PhD, professeur Adam et Richard T. Lind de génétique médicale et vice-doyen pour les affaires scientifiques et l’enseignement supérieur, et Maureen Smith, MS, professeur adjoint de médecine au Département de cardiologie et directeur clinique de NUgene.

Chisholm, Smith et leur équipe ont analysé les données cliniques et les séquences génomiques des individus de la biobanque NUgene pour savoir quelles anomalies génétiques causent certaines maladies et déterminer quel médicament est le plus efficace pour les individus, en fonction de leur variante génétique. Aujourd’hui, eMERGE construit et teste un système informatique d’aide à la décision – intégrant des données sur les variantes génétiques dans les dossiers de santé électroniques – pour aider les médecins à prescrire le bon médicament.

Quelle est la prochaine étape pour la science des données ?

Les scientifiques se précipitent pour suivre les méthodes statistiques et développer des techniques de plus en plus sophistiquées pour extraire le véritable sens des données.

« Les compétences analytiques et les compétences méthodologiques sont inventées tous les jours, car il y a de nouveaux problèmes et défis », a déclaré Donald Lloyd-Jones, MD, président de la médecine préventive et directeur du Northwestern University Clinical and Translational Sciences Institute. « C’est un énorme quantité de données et nous devons comprendre ce qu’est une variation aléatoire et quelle est la variation importante qui peut conduire à la maladie.