FedFSA: Hybrid and federated framework for functional status ascertainment across institutions

Sunyang Fu; Heling Jia; Maria Vassilaki; Vipina K Keloth; Yifang Dang; Yujia Zhou; Muskan Garg; Ronald C Petersen; Jennifer St Sauver; Sungrim Moon; Liwei Wang; Andrew Wen; Fang Li; Hua Xu; Cui Tao; Jungwei Fan; Hongfang Liu; Sunghwan Sohn

doi:10.1016/j.jbi.2024.104623

FedFSA: Hybrid and federated framework for functional status ascertainment across institutions

J Biomed Inform. 2024 Apr:152:104623. doi: 10.1016/j.jbi.2024.104623. Epub 2024 Mar 6.

Authors

Sunyang Fu¹, Heling Jia², Maria Vassilaki³, Vipina K Keloth⁴, Yifang Dang⁵, Yujia Zhou⁶, Muskan Garg⁷, Ronald C Petersen⁸, Jennifer St Sauver⁹, Sungrim Moon¹⁰, Liwei Wang¹¹, Andrew Wen¹², Fang Li¹³, Hua Xu¹⁴, Cui Tao¹⁵, Jungwei Fan¹⁶, Hongfang Liu¹⁷, Sunghwan Sohn¹⁸

Affiliations

¹ Mayo Clinic, Rochester, MN, United States; University of Texas Health Science Center, Houston, TX, United States. Electronic address: sunyang.fu@uth.tmc.edu.
² Mayo Clinic, Rochester, MN, United States. Electronic address: Jia.Heling@mayo.edu.
³ Mayo Clinic, Rochester, MN, United States. Electronic address: Vassilaki.Maria@mayo.edu.
⁴ Yale University, New Haven, CT, United States. Electronic address: vipina.kuttichikeloth@yale.edu.
⁵ University of Texas Health Science Center, Houston, TX, United States. Electronic address: Yifang.Dang.1@uth.tmc.edu.
⁶ University of Texas Health Science Center, Houston, TX, United States. Electronic address: Yujia.Zhou@uth.tmc.edu.
⁷ Mayo Clinic, Rochester, MN, United States. Electronic address: Garg.Muskan@mayo.edu.
⁸ Mayo Clinic, Rochester, MN, United States. Electronic address: peter8@mayo.edu.
⁹ Mayo Clinic, Rochester, MN, United States. Electronic address: StSauver.Jennifer@mayo.edu.
¹⁰ Mayo Clinic, Rochester, MN, United States. Electronic address: sungrim.moon@nih.gov.
¹¹ Mayo Clinic, Rochester, MN, United States. Electronic address: Liwei.Wang@uth.tmc.edu.
¹² University of Texas Health Science Center, Houston, TX, United States. Electronic address: Andrew.Wen@uth.tmc.edu.
¹³ University of Texas Health Science Center, Houston, TX, United States. Electronic address: Fang.Li@uth.tmc.edu.
¹⁴ Yale University, New Haven, CT, United States. Electronic address: hua.xu@yale.edu.
¹⁵ University of Texas Health Science Center, Houston, TX, United States. Electronic address: Cui.Tao@uth.tmc.edu.
¹⁶ Mayo Clinic, Rochester, MN, United States. Electronic address: Fan.Jung-wei@mayo.edu.
¹⁷ Mayo Clinic, Rochester, MN, United States; University of Texas Health Science Center, Houston, TX, United States. Electronic address: Hongfang.Liu@uth.tmc.edu.
¹⁸ Mayo Clinic, Rochester, MN, United States. Electronic address: Sohn.Sunghwan@mayo.edu.

PMID: 38458578
PMCID: PMC11005095 (available on 2025-04-01)
DOI: 10.1016/j.jbi.2024.104623

Abstract

Introduction: Patients' functional status assesses their independence in performing activities of daily living, including basic ADLs (bADL), and more complex instrumental activities (iADL). Existing studies have discovered that patients' functional status is a strong predictor of health outcomes, particularly in older adults. Depite their usefulness, much of the functional status information is stored in electronic health records (EHRs) in either semi-structured or free text formats. This indicates the pressing need to leverage computational approaches such as natural language processing (NLP) to accelerate the curation of functional status information. In this study, we introduced FedFSA, a hybrid and federated NLP framework designed to extract functional status information from EHRs across multiple healthcare institutions.

Methods: FedFSA consists of four major components: 1) individual sites (clients) with their private local data, 2) a rule-based information extraction (IE) framework for ADL extraction, 3) a BERT model for functional status impairment classification, and 4) a concept normalizer. The framework was implemented using the OHNLP Backbone for rule-based IE and open-source Flower and PyTorch library for federated BERT components. For gold standard data generation, we carried out corpus annotation to identify functional status-related expressions based on ICF definitions. Four healthcare institutions were included in the study. To assess FedFSA, we evaluated the performance of category- and institution-specific ADL extraction across different experimental designs.

Results: ADL extraction performance ranges from an F1-score of 0.907 to 0.986 for bADL and 0.825 to 0.951 for iADL across the four healthcare sites. The performance for ADL extraction with impairment ranges from an F1-score of 0.722 to 0.954 for bADL and 0.674 to 0.813 for iADL across four healthcare sites. For category-specific ADL extraction, laundry and transferring yielded relatively high performance, while dressing, medication, bathing, and continence achieved moderate-high performance. Conversely, food preparation and toileting showed low performance.

Conclusion: NLP performance varied across ADL categories and healthcare sites. Federated learning using a FedFSA framework performed higher than non-federated learning for impaired ADL extraction at all healthcare sites. Our study demonstrated the potential of the federated learning framework in functional status extraction and impairment classification in EHRs, exemplifying the importance of a large-scale, multi-institutional collaborative development effort.

Keywords: Deep learning; Electronic health records; Federated learning; Functional status; Natural language processing.

Publication types

Research Support, N.I.H., Extramural

MeSH terms

Activities of Daily Living*
Aged
Functional Status*
Humans
Information Storage and Retrieval
Learning
Natural Language Processing

Abstract

Publication types

MeSH terms

Grants and funding