Les 10 principaux outils statistiques utilisés dans la recherche médicale

0

Kolabtree statisticien indépendant Kingsley Ukwuoma écrit sur les principaux outils statistiques utilisés dans la recherche médicale et l'analyse des données cliniques. 

Il fut un temps où la validation des expériences par les données se faisait entièrement par calcul manuel. Cela ouvrait la voie à l'erreur humaine et augmentait le coût de la recherche, surtout lorsque les données étaient volumineuses, par exemple plus de 1000 observations sur le terrain. Aujourd'hui, grâce à l'avancée progressive de la technologie, les outils statistiques sont utilisés dans la recherche médicale pour plus d'efficacité et de précision.

Dans le domaine de la recherche médicale, qui s'étend des examens systématiques aux essais cliniques en passant par les méta-analyses, l'exactitude et la précision sont primordiales. Les paramètres de validation doivent être plus stricts. Lors de la vérification des hypothèses de recherche, l'hypothèse est basée sur l'exactitude 100%. Cependant, comme les données en elles-mêmes ne sont jamais normalement distribuées ou parfaites, il devient important d'attribuer un pourcentage de 0,01 (1%) comme niveau de signification ou marge d'erreur ou probabilité que le résultat produise une erreur, bien que légère mais qui s'améliore à mesure que le repère s'approche de 100%, en d'autres termes, 0,001 (0,1%) ou 0,0001 (0,01%).

Les données en elles-mêmes, composées d'un mélange de chiffres, de chaînes de caractères et de points alphanumériques, peuvent sembler intimidantes, mais l'analyse des données ne doit pas être toujours complexe. Le processus peut être décomposé en trois étapes claires :

-Comprendre l'origine des données, à travers les objectifs de la recherche.
-Que faire des données (choix du test d'estimation) ?
-Comment donner du sens aux données (interprétation des résultats) ?

Il existe un vaste univers d'outils statistiques utilisés dans la recherche médicale. Ces outils accomplissent le travail de manière similaire, mais les différences résident dans la facilité d'utilisation et de présentation ainsi que dans les différences de licence (propriétaire ou non), d'interface (pointer et cliquer ou ligne de commande) et de coût (gratuit ou payant). Ces outils gèrent les processus de bout en bout de la collecte, de l'organisation, de l'analyse et de l'interprétation des données statistiques. Examinons les 10 principaux outils statistiques utilisés dans la recherche médicale par les scientifiques, les médecins et les professionnels de la R&D de l'industrie.

1. Stata

Stata est une boîte à outils complète qui offre une capacité de gestion des données, d'analyse des données et une interface graphique colorée. Stata peut être considéré comme le logiciel de statistique politique commun aux institutions, y compris les organisations internationales comme les Nations Unies, les gouvernements et les universitaires pour la santé publique, l'économie, le travail social et la médecine. Il reste le logiciel le plus puissant disponible dans l'espace analytique. Le nom Stata est une abréviation syllabique des mots statistiques et données et a été lancé en 1985, puis l'option d'interface utilisateur graphique en 2003.

Les caractéristiques de Stata comprennent une interface utilisateur graphique (GUI) ou simplement une interface de type pointer-cliquer accompagnée d'une option d'interface de ligne de commande (CLI) qui est rapide, authentique et facile à utiliser. STATA est compatible avec les fichiers Excel (.xls, .xlsx), les fichiers texte (.txt, .csv, .dat), SAS (.XPT) et autres (.XML).

Il existe de nombreuses fonctionnalités statistiques, allant de l'analyse descriptive, de l'analyse par tableaux croisés à des techniques plus avancées comme la modélisation par équations structurelles, les modèles de probabilité, l'analyse de survie, les séries chronologiques et les modèles multiniveaux. Stata permet aux utilisateurs d'avoir le contrôle sur les données, les variables et aussi la compilation statistique des groupes. Stata fonctionne bien avec les données longitudinales mais ne peut contenir qu'un seul jeu de données en mémoire qui doit être réécrit pour ajouter ou accéder à un nouveau jeu de données. Les graphiques de Stata ne sont pas très flexibles par rapport à d'autres logiciels et les différents paquets limitent la taille des ensembles de données utilisables (Stata/IC, Stata/SE et Stata/MP).

2. R

R est un outil logiciel statistique à source ouverte Il s'agit d'un outil logiciel à interface de ligne de commande (CLI) de programmation. Bien qu'il soit relativement nouveau dans l'espace utilisateur, R compte désormais un grand nombre d'adeptes, avec plus de 6 000 paquets contribués par des spécialistes des données, de la bioinformatique et des chercheurs médicaux, couvrant un large éventail de disciplines allant de la recherche sur le cancer à la méta-analyse, en passant par l'analyse clinique, la biologie moléculaire et la phylogénie.

L'environnement de développement intégré (IDE) R-studio, qui abrite les outils R, fonctionne comme le moteur de base de données d'Oracle où l'on utilise SQL. La version précédente a été lancée en 1993 et l'IDE est sorti en 2011. R est compatible avec les fichiers Excel (.xls, .xlsx), les fichiers texte (.txt, .dat, .csv), SPSS (.sav), Stata (.dta), SAS (. sas7bdat), autres (. xml, json). R interagit bien avec les autres logiciels, avec une courbe d'apprentissage assez raide, étant donné les différents types de données.

Plus précisément, Metafor est l'un des nombreux paquets R disponibles pour réaliser des méta-analyses et contient les outils d'analyse les plus complets. Son site Web contient des exemples très utiles d'analyses et de graphiques avec le code correspondant. Cependant, comme le paquetage nécessite l'utilisation de l'environnement R, il peut être difficile pour ceux qui n'ont jamais utilisé R auparavant de s'y habituer rapidement. Les exemples suivants méritent d'être mentionnés JASP ou Jamovi paquets.

3. GraphPad Prism

GraphPad Prism est populaire parmi les biologistes du monde universitaire et de l'industrie. Il est également doté de fonctionnalités qui permettent aux chercheurs d'effectuer des recherches en laboratoire et des essais cliniques à l'aide du test t, de l'ANOVA à sens unique, du tableau de contingence, de l'analyse de survie et de modèles de probabilité comme le modèle de régression logistique.

Le logiciel, contrairement à tout autre, est accompagné d'une page d'analyse des résultats interprétée après la production des estimations. Le langage est facile à comprendre, avec moins de technicité. Le logiciel dispose également d'une fonction automatisée intégrée qui combine l'analyse et la sortie graphique en un seul instantané - ce qui ajoute au comportement permanent de la réanalyse automatique des données dans les cas où l'un des points de données est modifié, le tout en cours d'exécution sans qu'il soit nécessaire de refaire l'analyse ou le graphique.

L'outil logiciel est compatible avec les fichiers Excel (.xls, .xlsx), les fichiers texte (.txt, .dat, .csv), et autres (. xml, json). Les fonctionnalités graphiques sont exceptionnelles.

Lisez aussi : Comment les statisticiens indépendants peuvent améliorer la recherche

4. SAS

SAS est le fondement de l'analyse avancée, dont les fonctionnalités touchent un large éventail d'entreprises et d'organisations scientifiques et techniques. Le développement de SAS (Statistical Analysis System) a commencé en 1966 par Anthony Bar de l'Université d'État de Caroline du Nord, rejoint ensuite par James Goodnight. Le National Institute of Health a financé ce projet dans le but d'analyser les données agricoles pour améliorer le rendement des cultures.

SAS est compatible avec les fichiers Excel (.xls), les fichiers ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp) et d'autres extensions de fichiers (.xml). Cela permet d'importer et d'exporter facilement des données sans recourir à des processus manuels susceptibles d'entraîner des erreurs. SAS est également doté d'une bonne interface graphique interactive. Cependant, SAS peut parfois s'avérer fastidieux pour créer des graphiques parfaits avec la syntaxe.

Certaines des caractéristiques ou avantages de SAS sont liées à sa taille et à la propriété de la licence propriétaire. Le temps nécessaire à la mise en œuvre de nouvelles idées et méthodes et les aspects techniques du processus de documentation en sont les principaux. SAS a gagné en popularité dans les secteurs des services financiers, des administrations publiques, de l'industrie manufacturière, de la santé et des sciences de la vie.

5. IBM SPSS

La version initiale de SPSS a été développée en 1968 jusqu'à son acquisition par IBM en 2009. IBM SPSS est assez complet et sert d'outil de référence pour presque toutes les disciplines et tous les professionnels. Le logiciel est doté de capacités approfondies et d'une interface utilisateur graphique facile à utiliser. Cependant, le logiciel fonctionne mieux pour les chercheurs qui ont une connaissance de base des statistiques, plus particulièrement des éléments de données comme les mesures de données, l'identification des types de données, l'affectation et le codage des variables et la sélection des cas.

IBM SPSS est compatible avec les fichiers Excel (.xls, .xlsx), les fichiers texte (.csv, .txt, .dat), SAS (. sas7bdat) et Stata (.dta). Il est doté d'une fonctionnalité remarquable, le 'Chart Builder', qui permet aux utilisateurs de glisser-déposer des graphiques et de les modifier. Outre sa facilité d'utilisation et sa capacité à traiter automatiquement les points de données manquants, SPSS Amos permet aux utilisateurs de réaliser des modèles d'équations structurelles.

Cependant, certaines méthodes statistiques robustes et complexes ne peuvent pas être estimées, par exemple, la régression de la moindre déviation absolue et la régression quantile.

6. MATLAB

MATLAB (The Mathworks) a été lancé en 1984. MATLAB est une interface de ligne de commande (CLI) complète ou un langage de programmation utilisé par les scientifiques et les ingénieurs. Comme pour R, le chemin d'apprentissage est raide et vous devrez créer votre propre code à un moment donné. Un grand nombre de boîtes à outils sont également disponibles pour vous aider à répondre à vos questions de recherche (comme EEGLab pour l'analyse des données EEG). La difficulté d'utilisation est complétée par une vaste gamme de méthodes statistiques et une grande flexibilité en termes de ce que le logiciel peut traiter. MATLAB a gagné en popularité auprès des scientifiques dans les domaines de l'ingénierie, de l'analyse numérique, de l'algèbre linéaire et du traitement des images.

MATLAB est compatible avec les fichiers Excel (.xls, .xlsx), les fichiers texte (.txt, .dat, .csv) et autres (. xml, json). MATLAB a un bon graphisme et s'intègre facilement avec des logiciels de programmation haut de gamme comme Python et C++ mais ne peut pas se vanter d'avoir les énormes méthodes statistiques qui sont disponibles pour SAS et IBM SPSS.

Il existe également une liste d'outils logiciels statistiques impopulaires qui se distinguent par leur facilité d'utilisation, avec des fonctions efficaces de type "pointer-cliquer".

7. JMP

JMP associe de puissantes statistiques à des graphiques dynamiques, en mémoire et sur le bureau. Son paradigme interactif et visuel permet à JMP de révéler des informations qu'il est impossible d'obtenir à partir de tableaux de chiffres bruts ou de graphiques statiques. À l'origine, JMP signifiait "John's Macintosh Program" et comportait cinq produits sur mesure : JMP, JMP Pro, JMP Clinical, JMP Genomics et JMP Graph Builder App.

JMP est compatible avec les fichiers Excel (.xls, .xlsx), les fichiers texte (.csv, .txt, .dat), SAS (. sas7bdat), Stata (.dta), SPSS (.sav). JMP est doté d'un graphique interactif, de tableaux de données liés dynamiquement et d'un langage de script, ainsi que d'une interface permettant l'utilisation de compléments R et Excel. Les utilisateurs bénéficient également d'une gestion efficace des résultats. Comme dans IBM SPSS, certaines méthodes robustes essentielles : régression, moindres carrés à deux étapes (2SLS), LAD, quantile sont absentes.

8. Minitab

Minitab offre une gamme d'outils statistiques de base et assez avancés pour l'analyse des données et a été développé en 1972 à partir d'OMNITAB 80 qui est une version légère. Comme pour GraphPad Prism, les commandes peuvent être exécutées à la fois par l'interface graphique et par des scripts, ce qui le rend accessible aux novices comme aux utilisateurs cherchant à effectuer des analyses plus complexes.

Le logiciel est compatible avec les fichiers Excel (.xls), les fichiers ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp), et d'autres extensions de fichiers (.xml). Cela permet d'importer et d'exporter facilement des données sans recourir à des processus manuels susceptibles d'entraîner des erreurs. Minitab automatise les calculs et permet la création efficace de graphiques.

9. Statistica

Statistica est une suite d'outils logiciels analytiques développée à l'origine par StatSoft et rachetée par Dell en 2014, puis par TIBCO qui a conclu un accord d'achat en 2017. Statistica est excellent avec la gestion des données, l'analyse, la visualisation, le data mining et l'apprentissage automatique.

SAS est compatible avec les fichiers Excel (.xls), les fichiers ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp) et d'autres extensions de fichiers (.xml). Cela permet d'importer et d'exporter facilement des données sans avoir recours à des processus manuels qui peuvent conduire à des erreurs. Statistica permet l'intégration de l'environnement de programmation R où des techniques analytiques supplémentaires sont disponibles.

10. Excel

Microsoft Office Excel a été développé à l'origine pour la gestion des données. Sans qu'il soit nécessaire de le présenter, Microsoft Corp Excel est largement utilisé pour l'analyse statistique, conformément à l'ensemble de données utilisé pour cette étude. Le programme a une portée plus large et la connaissance de l'utilisation est assez répandue que la quantité d'inconnu est très faible sur la façon d'utiliser et donc la facilité d'utilisation atteint le plus haut niveau parmi les logiciels examinés.

Excel dispose également d'un module complémentaire appelé Meta-Essentials, MetaXL et MetaEasy qui ajoute la possibilité d'effectuer des statistiques méta-analytiques avec Excel comme base.

Plusieurs facteurs influencent le résultat de l'analyse, notamment la taille de l'échantillon, les méthodes de collecte des données, le choix du test utilisé, la méthodologie, etc. L'analyse statistique doit être réalisée avec soin par des experts pour obtenir des résultats fiables. Engager un expert statisticien médical indépendant ou consultant en biostatistique peut vous aider à gagner du temps et de l'énergie, tout en vous concentrant sur vos recherches. La vérification de vos données de recherche avant leur publication est également essentielle pour que vous puissiez communiquer votre recherche au monde entier en toute confiance. Kolabtree offre un accès à des statisticiens indépendants expérimentés dans différents logiciels et outils. Voir les experts maintenant ou simplement publier un projet et obtenir des devis en 24 heures.

 


Kolabtree aide les entreprises du monde entier à embaucher des experts à la demande. Nos freelances ont aidé des entreprises à publier des articles de recherche, à développer des produits, à analyser des données, et bien plus encore. Il suffit d'une minute pour nous dire ce dont vous avez besoin et obtenir gratuitement des devis d'experts.


Partager.

À propos de l'auteur

Kingsley Ukwuoma est un statisticien et un analyste de données expérimenté, qui fournit un soutien à la recherche quantitative. Il possède plus de 10 ans d'expérience dans les applications d'entrée, notamment R, STATA, Eviews, Python, IBM SPSS et SAS/Excel, avec des applications industrielles dans les domaines de la science et de l'analyse de la santé, de l'épidémiologie, des statistiques appliquées et du commerce des technologies et du financement de la santé mondiale.

Laissez une réponse

Des experts indépendants de confiance, prêts à vous aider dans votre projet.


La plus grande plateforme de freelance au monde pour les scientifiques  

Non merci, je ne cherche pas à embaucher pour le moment.