Las 10 herramientas estadísticas más utilizadas en la investigación médica

0

Kolabtree estadístico autónomo Kingsley Ukwuoma writes about the top statistical tools used in medical research and clínica datos análisis

Hubo un tiempo en el que la validación de los experimentos a través de los datos se realizaba íntegramente mediante cálculos manuales. Esto abría brechas para el error humano y un mayor coste en la realización de la investigación, especialmente cuando los datos eran grandes, por ejemplo, más de 1000 observaciones de campo. Hoy en día, debido al avance gradual de la tecnología, las herramientas estadísticas se utilizan en la investigación médica para lograr una mayor eficiencia y precisión.

En el ámbito de la investigación médica, que se extiende desde las revisiones sistemáticas, los metaanálisis y los ensayos clínicos, la exactitud y la precisión son primordiales. Los parámetros de validación deben ser más estrictos. En la comprobación de las hipótesis de investigación, la suposición se basa en la exactitud 100%. Sin embargo, dado que los datos en sí mismos nunca se distribuyen normalmente ni son perfectos, es importante asignar un porcentaje de 0,01 (1%) como nivel de significación o margen de error o probabilidad de que el resultado produzca un error, aunque sea leve, pero que mejora a medida que la referencia se acerca a 100%, es decir, 0,001 (0,1%) o 0,0001 (0,01%).

Los datos en sí mismos, que consisten en una mezcla de puntos numéricos, de cadena y alfanuméricos, pueden parecer intimidantes, pero el análisis de los datos no tiene por qué ser siempre complejo. El proceso puede dividirse en tres pasos claros:

-Comprender el origen de los datos, a través de los objetivos de la investigación
-Qué hacer con los datos (elección de la prueba de estimación)
-Cómo dar sentido a los datos (interpretación de los resultados)

Existe un amplio universo de herramientas estadísticas utilizadas en la investigación médica. Estas herramientas realizan el trabajo de forma similar, pero las diferencias radican en la facilidad de uso y presentación, así como en las diferencias de licencia (propietaria o no), la interfaz (apuntar y hacer clic o línea de comandos) y el coste (gratuito o de pago). Estas herramientas se encargan de los procesos integrales de recogida, organización, análisis e interpretación de datos estadísticos. Veamos las 10 principales herramientas estadísticas utilizadas en la investigación médica por científicos, médicos y profesionales de I+D de la industria.

1. Stata

Stata is a complete toolbox that provides a data management capability, data analysis and a colorful graphical interface. Stata can be termed as the policy statistical software common to institutions, including international organizations like the United Nations, governments and academicians for Public health, Economics, Social Work and Medicine. It remains the most powerful software available in the análisis space. The name Stata is a syllabic abbreviation of the words statistics and data and was released in 1985 and then the graphical user interface option in 2003.

Las características de Stata incluyen, la interfaz gráfica de usuario (GUI) o simplemente, la interfaz de apuntar y hacer clic acompañada de una opción para la interfaz de línea de comandos (CLI) que es rápida, auténtica y fácil de usar. STATA es compatible con archivos de Excel (.xls, .xlsx), archivos de texto (.txt, .csv, .dat), SAS (.XPT) y otros (.XML).

There are a lot of statistical features, stretching from descriptive analysis, cross tabulation analysis to more advanced techniques like structural equation modeling, probability models, survival analysis, time series and multilevel models. Stata allows users to have controlar over data, variables and also statistical compilation of groups. Stata works well with longitudinal data but can only hold one dataset in memory which has to rewritten to add or access a new dataset. The Stata graphics are not that flexible when compared to other software and the different packages limits the usable datasets size (Stata/IC, Stata/SE, and Stata/MP).

2. R

R es un herramienta de software estadístico de código abierto that is well equipped to handle, visualization, analysis and aspects of machine learning ‘heavy computing’ and it’s strictly a programming ‘command line interface (CLI) software tool though relatively new in the user space, R now commands a strong fan base, boasting over 6000 packages, contributed by data scientists, bioinformatics and medical researchers, covering an expanse of disciplines from cancer research, clinical analysis, molecular biología, phylogeny, to meta-analysis.

The R-studio integrated Desarrollo Environment (IDE) which houses the R tools works like the Oracle Data Base Engine where SQL is used. The earlier version was launched in 1993 and the IDE released in 2011. R is compatible with Excel files (.xls, .xlsx), Text files (.txt, .dat, .csv), SPSS (.sav), Stata (.dta), SAS (. sas7bdat), Other (. xml, json). R interacts with other software well with a rather steep learning curve, given the different data types.

Específicamente, Metafor es uno de los muchos paquetes de R disponibles para realizar meta-análisis y contiene las herramientas de análisis más completas. Su sitio web contiene algunos ejemplos de análisis y gráficos muy útiles con el código correspondiente. Sin embargo, dado que el paquete requiere el uso del entorno R, puede ser difícil para aquellos que nunca han utilizado R antes acostumbrarse al paquete tan rápidamente. Merece la pena mencionar el JASP o Jamovi paquetes.

3. Prisma de GraphPad

GraphPad Prism es popular entre los biólogos del mundo académico y de la industria. También viene con funcionalidades que permiten a los investigadores realizar investigaciones de laboratorio y pruebas de ensayos clínicos utilizando la prueba t, ANOVA unidireccional, tabla de contingencia, análisis de supervivencia y modelos de probabilidad como el modelo de regresión logística.

El software, a diferencia de cualquier otro, viene con una página de análisis de resultados interpretada después de que se hayan producido las estimaciones. El lenguaje es fácil de entender y con menos tecnicismos. El software también tiene una función automatizada incorporada que combina el análisis y el resultado gráfico en una sola instantánea, lo que se suma al comportamiento propio del reanálisis automático de los datos en caso de que se altere alguno de los puntos de datos, todo ello en tiempo de ejecución sin necesidad de rehacer el análisis realizado o el gráfico dibujado.

La herramienta de software es compatible con archivos de Excel (.xls, .xlsx), archivos de texto (.txt, .dat, .csv) y otros (. xml, json). Las características de los gráficos son excepcionales.

Lea también: Cómo los estadísticos autónomos pueden mejorar la investigación

4. SAS

SAS es la base de la analítica avanzada, con funcionalidades que abarcan una amplia gama de empresas y organizaciones científicas y de ingeniería. El desarrollo de SAS (Statistical Analysis System) comenzó en 1966 de la mano de Anthony Bar, de la Universidad Estatal de Carolina del Norte, al que se unió posteriormente James Goodnight. El Instituto Nacional de Salud financió este proyecto con el objetivo de analizar los datos agrícolas para mejorar el rendimiento de las cosechas.

SAS es compatible con archivos Excel (.xls), archivos ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp) y otras extensiones de archivo (.xml). Esto permite importar y exportar datos con facilidad, sin tener que recurrir a procesos manuales que pueden dar lugar a errores. SAS también cuenta con una buena interfaz gráfica interactiva. Sin embargo, SAS puede ser engorroso a veces para crear gráficos perfectos con la sintaxis.

Algunas de las características o ventajas de SAS están relacionadas con su tamaño y la propiedad de la licencia. La clave está en el tiempo de implementación de nuevas ideas y métodos y los tecnicismos en el proceso de documentación. SAS ha ganado popularidad entre los servicios financieros, la administración pública, la industria manufacturera y las ciencias de la salud y la vida.

5. IBM SPSS

La versión inicial de SPSS se desarrolló en 1968 hasta la adquisición de IBM en 2009. IBM SPSS es bastante completo y sirve como herramienta para casi todas las disciplinas y profesionales. El software tiene una gran capacidad con una función de interfaz gráfica de usuario fácil de usar. Sin embargo, el software funciona mejor para los investigadores que tienen conocimientos básicos de estadística, especialmente de elementos de datos como la medición de datos, la identificación de tipos de datos, la asignación y codificación de variables y la selección de casos.

IBM SPSS es compatible con archivos de Excel (.xls, .xlsx), archivos de texto (.csv, .txt, .dat), SAS (. sas7bdat) y Stata (.dta). Viene con una característica sorprendente en 'Chart Builder' que permite a los usuarios arrastrar y soltar gráficos y hacer modificaciones. Además de la facilidad de uso y la capacidad de manejar automáticamente los puntos de datos perdidos, los usuarios pueden realizar modelos de ecuaciones estructurales a través de SPSS Amos.

Sin embargo, algunos métodos estadísticos robustos y complejos no pueden estimarse, por ejemplo, la regresión de la mínima desviación absoluta y la regresión cuantil.

6. MATLAB

MATLAB (The Mathworks) was released in 1984. MATLAB is a complete command line interface (CLI) or programming language used by scientist and engineers. As with R, the learning path is steep, and you will be required to create your own code at some point. A plentiful number of toolboxes are also available to help answer your research questions (such as EEGLab for analysing EEG data). The difficult to use feature is complemented by a vast array of statistical methods and flexibility in terms of what the software can handle. MATLAB gained popularity among scientist in the zonas of engineering, numerical analysis, linear algebra and image processing.

MATLAB es compatible con archivos de Excel (.xls, .xlsx), archivos de texto (.txt, .dat, .csv), otros (. xml, json). MATLAB tiene una buena gráfica y se integra fácilmente con software de programación de alta gama como Python y C++, pero no cuenta con los enormes métodos estadísticos de los que disponen SAS e IBM SPSS.

Además, hay una lista de herramientas de software estadístico poco populares que se distinguen por su facilidad de uso, con funciones eficaces de apuntar y hacer clic.

7. JMP

JMP combina potentes estadísticas con gráficos dinámicos, en memoria y en el escritorio. Su paradigma interactivo y visual permite a JMP revelar conocimientos que son imposibles de obtener a partir de tablas de números sin procesar o gráficos estáticos. Originalmente significaba 'John's Macintosh Program' con cinco productos a medida: JMP, JMP Pro, JMP Clinical, JMP Genomics y JMP Graph Builder App.

JMP es compatible con archivos de Excel (.xls, .xlsx), archivos de texto (.csv, .txt, .dat), SAS (.sas7bdat), Stata (.dta), SPSS (.sav). JMP viene con un gráfico interactivo, tablas de datos enlazadas dinámicamente y un lenguaje de scripting y también tiene una interfaz que permite el uso de complementos de R y Excel, Los usuarios también obtienen los beneficios añadidos de la gestión de la salida de forma efectiva. Al igual que IBM SPSS, algunos métodos robustos esenciales: regresión; mínimos cuadrados en dos etapas (2SLS), LAD, Quantile están ausentes.

8. Minitab

Minitab ofrece una gama de herramientas estadísticas tanto básicas como bastante avanzadas para el análisis de datos y fue desarrollado en 1972 a partir de OMNITAB 80, que es una versión ligera. Al igual que GraphPad Prism, los comandos pueden ejecutarse tanto a través de la interfaz gráfica de usuario como de los comandos de script, lo que lo hace accesible tanto a los principiantes como a los usuarios que buscan realizar análisis más complejos.

El software es compatible con archivos Excel (.xls), archivos ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp) y otras extensiones de archivo (.xml). Esto permite importar y exportar datos con facilidad, sin recurrir a procesos manuales que pueden dar lugar a errores. Minitab automatiza los cálculos y permite la creación eficiente de gráficos.

9. Estadística

Statistica is a suite of analytical software tool originally developed by StatSoft and acquired by Dell in 2014 and TIBCO entering agreement to buy in 2017. Statistica is great with data management, analysis, visualization, data mining and machine learning.

SAS es compatible con archivos Excel (.xls), archivos ext (.txt, .dat, .csv), IBM SPSS (.sav), Stata (.dta), JMP (.jmp) y otras extensiones de archivo (.xml). Esto permite importar y exportar datos con facilidad, sin recurrir a procesos manuales que pueden dar lugar a errores. Statistica permite la integración del entorno de programación R en el que se dispone de técnicas analíticas adicionales.

10. Excel

Microsoft Office Excel se desarrolló originalmente para la gestión de datos. Sin necesidad de introducción, Microsoft Corp Excel se utiliza ampliamente en el análisis estadístico por el conjunto de datos tomados para esta revisión. El programa tiene un alcance más amplio y el conocimiento de su uso está bastante extendido, por lo que la cantidad de desconocimiento sobre la forma de uso es muy reducida y, por lo tanto, la facilidad de uso es la más alta entre el software revisado.

Excel también tiene un complemento llamado Meta-Essentials, MetaXL y MetaEasy que añade la capacidad de realizar estadísticas meta-analíticas con Excel como base.

Hay varios factores que afectan al resultado del análisis, como el tamaño de la muestra, los métodos de recogida de datos, la elección de la prueba utilizada y la metodología, entre otros. El análisis estadístico debe ser realizado cuidadosamente por expertos para obtener resultados fiables. Contratar a un experto estadístico médico autónomo o consultor de bioestadística puede ayudarle a ahorrar tiempo y energía, mientras se centra en su investigación. Conseguir que los datos de su investigación se verifiquen antes de su publicación también es esencial para que pueda comunicar su investigación al mundo con confianza. Kolabtree ofrece acceso a estadísticos autónomos con experiencia en diferentes programas y herramientas. Ver expertos ahora o simplemente publicar un proyecto y obtener presupuestos en 24 horas.

 


Kolabtree ayuda a las empresas de todo el mundo a contratar expertos bajo demanda. Nuestros freelancers han ayudado a las empresas a publicar artículos de investigación, desarrollar productos, analizar datos y mucho más. Sólo se necesita un minuto para decirnos lo que necesita hacer y obtener presupuestos de expertos de forma gratuita.


Comparte.

Sobre el autor

Ramya Sriram gestiona los contenidos digitales y las comunicaciones en Kolabtree (kolabtree.com), la mayor plataforma de trabajo autónomo para científicos del mundo. Cuenta con más de una década de experiencia en edición, publicidad y creación de contenidos digitales.

Dejar una respuesta