Multi-omics data integration approaches for precision oncology

Raidel Correa-Aguila; Niuxia Alonso-Pupo; Erix W Hernández-Rodríguez

doi:10.1039/d1mo00411e

Multi-omics data integration approaches for precision oncology

Mol Omics. 2022 Jul 11;18(6):469-479. doi: 10.1039/d1mo00411e.

Authors

Raidel Correa-Aguila^{1

2}, Niuxia Alonso-Pupo³, Erix W Hernández-Rodríguez⁴

Affiliations

¹ Laboratorio de Farmacología Clínica Experimental, Departamento de Docencia e Investigaciones, Instituto Nacional de Oncología y Radiobiología, 10400 La Habana, Cuba. raidel@inor.sld.cu.
² Laboratorio de Química Computacional y Teórica, Facultad de Química, Universidad de La Habana, 10400 La Habana, Cuba.
³ Departamento de Ciencias Básicas, Facultad de Ciencias Médicas "Manuel Fajardo", Universidad de Ciencias Médicas de La Habana, 10400 La Habana, Cuba.
⁴ Laboratorio de Bioinformática y Química Computacional (LBQC), Facultad de Medicina, Universidad Católica del Maule, & Escuela de Química y Farmacia, Facultad de Medicina, Universidad Católica del Maule, 3460000 Talca, Chile, 3460000 Talca, Chile.

PMID: 35470819
DOI: 10.1039/d1mo00411e

Abstract

High-throughput technologies used in molecular biology have been pivotal to enhance the molecular characterization of human malignancies, allowing multiple omics data types to be available for cancer researchers and practitioners. In this context, appropriate data integration strategies are required to gain new insights from omics high-dimensional data. Yet, in order to extract valuable knowledge from this kind of information in an efficient manner, different approaches to reduce data dimensionality should be considered in multi-omics data integration pipelines. Multi-omics data integration approaches are mainly classified according to the label availability. Unsupervised data integration only draws inference from inputs without prior labels, whereas its supervised counterpart models allow incorporating known phenotype labels to improve the accuracy of high-throughput biomedical data analyses. However, the real value of the above mentioned approaches lies in their sequential combination with machine learning methods. It represents a major challenge for implementing multi-omics data analysis pipelines but it can certainly improve the decision-making process in the diagnosis and clinical management of cancer. The present review addresses the impact of current multi-omics data integration approaches, and their synergy with machine learning approaches, on the precision oncology field.

Publication types

Review

MeSH terms

Computational Biology* / methods
Humans
Machine Learning
Medical Oncology
Neoplasms* / diagnosis
Neoplasms* / genetics
Precision Medicine / methods