RAG- und LLM-basierte Modellierung für eine skalierbare Zuordnung von Patienten zu Studien : Kommentare

Donnerstag, April 30, 2026

RAG- und LLM-basierte Modellierung für eine skalierbare Zuordnung von Patienten zu Studien

Die Zuordnung von Patienten zu Studien erfordert die Auswertung langer, heterogener elektronischer Patientenakten (EHRs) und komplexer Zulassungskriterien, was erhebliche Herausforderungen hinsichtlich Skalierbarkeit, Generalisierbarkeit und Recheneffizienz mit sich bringt. In einem Forschungsprojekt wurde “Retrieval-Augmented Generation” (RAG) mit der Modellierung auf Basis großer Sprachmodelle für eine skalierbare Patienten-Studien-Zuordnung verwendet. Dieser Ansatz verfolgt ein zweistufiges Vorgehen: RAG wird verwendet, um klinisch relevante Segmente aus langen EHRs zu identifizieren und so die Komplexität der Eingabe zu reduzieren, während große Sprachmodelle eingesetzt werden, um diese ausgewählten Segmente in informative Darstellungen zu kodieren.
Die Forscher bewerten diesen Ansatz anhand mehrerer öffentlicher Benchmarks (n2c2, SIGIR, TREC 2021/2022) sowie eines realen multimodalen Datensatzes der Mayo Clinic (MCPMD).
Die Ergebnisse der Untersuchung zeigen, dass die retrievalbasierte Informationsauswahl den Rechenaufwand deutlich reduziert und gleichzeitig klinisch aussagekräftige Informationen bewahrt bleiben. Dabei liefern “frozen” LLMs (LLMs, deren interne Gewichte/Parameter nach dem ersten Training nicht mehr verändert werden) starke Representationen für strukturierte klinische Daten liefern, während ein Fine-Tuning für die Modellierung unstrukturierter klinischer Texte unerlässlich ist.
URLs: