[Numerical expression of the clinical course of the disease. Data management]

Rev Med Inst Mex Seguro Soc. 2023 Oct 2;61(Suppl 3):S503-S509. doi: 10.5281/zenodo.8319834.
[Article in Spanish]

Abstract

Data management "behind the scenes" refers to collection, cleaning, imputation, and demarcation; and despite of being indispensable processes, they are usually neglected and thus, generate erroneous information. During the collection are errors: omission of covariates, deviation from the objective, and insufficient quality. The omission of covariates distorts the result attributed to the main manoeuvre. Deviation from the primary objective commonly occurs when the outcome is rare, delayed, or subjective and promotes substitution by non-equivalent surrogate variables. Moreover, insufficient quality occurs due to inadequate instruments, omission of the measurement procedure, or measurements out of context, such as attribution at the wrong time or equivalent. Furthermore, cleaning implies identifying erroneous, extreme, and missing values, which may or may not be imputed, depending on the percentage. The values of the manoeuvre or the outcome are never imputed, nor are patients eliminated due to a lack of values. Finally, the demarcation of each variable seeks to give it a clinical meaning about the outcome, for which a hierarchical sequence of criteria is followed: 1) previous clinical study, 2) expert agreement, 3) clinical judgment of the investigator/investigators, and 4) statistics. Acting without quality controls in data management frequently causes involuntary lies and confuses instead of clarifying.

El manejo de datos “tras bambalinas” se refiere a los procesos de recopilación, limpieza, imputación y demarcación; los cuales, aun siendo indispensables, usualmente suelen ser descuidados, por lo que generan información errónea. Durante la recopilación son errores: omisión de covariables, desvío del objetivo, y calidad insuficiente. La omisión de covariables distorsiona el resultado atribuido a la maniobra principal. El desvío del objetivo primario es común cuando el desenlace es raro, tardado o subjetivo y promueve la sustitución por variables subrogadas no equivalentes. Además, la calidad insuficiente, sucede por instrumentos inadecuados, omisión del procedimiento de medición, o medición fuera de contexto -como atribución a destiempo o equivalente-. Por otro lado, la limpieza implica identificar valores erróneos, extremos y faltantes, que podrán ser o no imputados, dependiendo del porcentaje se imputará comúnmente por la medida de resumen. Nunca se imputan los valores de la maniobra ni del desenlace, ni se eliminan pacientes por falta de valores. Finalmente, la demarcación de cada variable busca un significado clínico en referencia al desenlace, para ello se sigue una secuencia jerárquica de criterios: 1) estudio clínico previo, 2) acuerdo de expertos, 3) juicio clínico del investigador/investigadores y 4) estadística. Actuar sin controles de calidad en el manejo de datos provoca frecuentemente mentiras involuntarias y confunde en lugar de esclarecer.

Keywords: Clinical Epidemiology; Data Collection; Data Management; Statistics.

Publication types

  • English Abstract

MeSH terms

  • Data Management*
  • Disease Progression
  • Humans
  • Surveys and Questionnaires