Oproep tot deelname van medische centra in Vlaanderen, Wallonië en Brussel
Beste medische centra,
We doen een beroep op uw expertise en inzet om deel te nemen aan een innovatieve en ambitieuze studie over langdurige COVID, op het snijvlak van algemene geneeskunde, gezondheidsinformatietechnologie en kunstmatige intelligentie.
Ik ben arts, doctoraatsstudent in de biostatistiek en medische informatica aan de UGent, en in het kader van mijn doctoraatsonderzoek leid ik een project dat een revolutie teweeg kan brengen in de manier waarop we informatie uit de elektronische medische dossiers van patiënten met long COVID samenvatten en delen.
Waarom is dit onderzoek cruciaal?
Long COVID is een chronische aandoening die een aanzienlijk deel van de bevolking treft, vaak in stilte. De manifestaties zijn divers, soms diffuus, en de impact op de kwaliteit van leven is groot. Toch wordt lang COVID-onderzoek te vaak beperkt tot tweedelijnszorg of gecodificeerde databases. De rijke, ongestructureerde klinische verhalen die het resultaat zijn van consultaties in de algemene geneeskunde blijven weinig benut. Dit is echter waar de meest representatieve gegevens van de werkelijke ervaring van patiënten in het veld zich bevinden.
In deze studie willen we automatisch de inhoud van elektronische medische dossiers (EPD's) van patiënten met langdurige COVID samenvatten, met behulp van Large Language Models (LLM's) zoals GPT-4 en een cohort creëren van langdurige COVID-patiënten die in de huisartsenpraktijk worden gevolgd. Deze samenvattingen zullen worden geproduceerd in een internationaal erkend formaat: de International Patient Summary (IPS), die de uitwisseling van informatie op nationaal en grensoverschrijdend niveau vergemakkelijkt.
Doelstellingen van het onderzoek
- Verbeter de kwaliteit van samenvattingen van lange COVID-medische dossiers : We zullen automatisch gegenereerde samenvattingen vergelijken met handmatig geproduceerde samenvattingen, zowel wat betreft de klinische kwaliteit als de vereiste menselijke inspanning.
- Maak gegevens interoperabel en bruikbaar voor onderzoek : Door bestanden van uw software om te zetten in IPS en vervolgens in gestandaardiseerde gegevens voor onderzoek - OMOP-CDM (Observational Medical Outcomes Partnership - Common Data Model) - helpen we bij het creëren van een robuuste database voor toekomstige klinische studies.
- Het delen van medische informatie vergemakkelijken : Deze aanpak zal het uiteindelijk mogelijk maken om betrouwbare medische samenvattingen te produceren die klaar zijn om te worden gedeeld met andere gezondheidswerkers of om tussen instellingen te worden overgedragen.
Waar we naar op zoek zijn
We rekruteren minstens 20 medische centra, idealiter verspreid over Vlaanderen, Wallonië en Brussel, die:
- ten minste 10 patiënten met langdurige COVID volgen momenteel ;
- relatief goed onderhouden EPD's hebben, inclusief vrije tekst (klinische verhalen);
- zijn klaar om deel te nemen aan een wetenschappelijke samenwerking die voldoet aan de GDPR-normen (gegevens worden geanonimiseerd met behulp van bewezen tools).
Uw deelname zou een fundamentele bijdrage leveren aan klinisch onderzoek in de eerstelijnszorg.
Waarom deelnemen?
Voor uw patiënten
- Patiënten met langdurige COVID zullen baat hebben bij een meer diepgaande blik op hun medische dossiers en follow-up.
- Je draagt bij aan een beter begrip van deze complexe en vaak verwaarloosde pathologie.
Voor jouw team
- Je maakt deel uit van een baanbrekend project dat AI integreert in de zorg.
- U krijgt toegang tot samenvattingen van bestanden die mogelijk nuttig zijn voor uw dagelijkse praktijk.
Voor de algemene praktijk
- Je benadrukt het belang van de rol van de huisarts in het onderzoek.
- Je werkt mee aan een pilootproject dat het gezondheidsbeleid op Belgisch en Europees niveau kan beïnvloeden.
Hoe zal uw deelname plaatsvinden?
Hieronder beschrijven we stap voor stap wat we doen en wat we van je vragen. Elke fase specificeert de acties die door het onderzoeksteam worden uitgevoerd en die van het medisch centrum, evenals de veiligheids- en ethische garanties.
Preambule — randvoorwaarden
- Voordat er gegevens worden verwerkt, ondertekenen we een verwerkersovereenkomst en specificeren we de lokale correspondent (technisch contactpersoon en klinisch contactpersoon) in uw medisch centrum.
- We rekruteren medische centra die ten minste 10 langdurige COVID-patiënten volgen en een EPD hebben met vrije tekst (klinische verhalen).
Fase 0 — Administratieve en technische voorbereiding (jouw rol)
- Wijs een contactpersoon (administratief/IT) en een verwijzende arts aan voor het project.
- Geef ons informatie over de bedrijfssoftware (uitgever/versie) en de mogelijkheid om PMF-bestanden (Patient Migration Format) te exporteren - ons team begeleidt u indien nodig bij de export.
- Ondertekening van juridische documenten (DPA, samenwerkingsovereenkomst); validatie door de lokale DPO indien gewenst.
Fase 1 — Eerste identificatie van potentiële gevallen (NLP en MLHO)
- Objectief. Identificeer automatisch patiënten die risico lopen op langdurige COVID in uw dossiers op basis van klinische criteria, codes, medicijnen, laboratoriumresultaten en tekstnotities.
- Hoe. We passen Natural Language Processing (NLP)-algoritmen en MLHO-methoden (Machine Learning for Health Outcomes) toe op uw gegevens om een lijst van potentiële patiënten te produceren. In dit stadium is de identificatie een algoritmische selectie en is deze onderworpen aan een ethisch kader (goedkeuring door de ethische commissie vereist). Individuele toestemming is niet vereist voor de verkennende identificatiefase als de studie wordt uitgevoerd op gepseudonimiseerde gegevens/volgens het advies van de ethische commissie.
Belangrijke opmerking: de eerste identificatie kan ter plaatse gebeuren (lokale uitvoering) of via beveiligde export volgens uw voorkeur / softwarebeperkingen — we passen de methode in overleg technisch aan.
Fase 2 — Veilige export van MFP's voor de-identificatie (overdracht)
- Zodra de patiënten zijn "voorgeselecteerd", helpen wij u de bijbehorende FMP's van uw bedrijfssoftware te exporteren naar een beveiligde cloudruimte voor verwerking (encryptie tijdens het transport en in rust). U behoudt de controle over de overdracht en krijgt de nodige technische ondersteuning.
- Vóór elke export formaliseren we de stromen, het gebruik en de houdbaarheid in de overeenkomst; De toegang tot de cloud is beperkt en wordt geregistreerd.
Fase 3 — De-identificatie/pseudonimisering (gevalideerde AP-HP-tool)
- Doel. Verwijder/vervang de identificerende elementen van de vrije teksten (namen, adressen, data, identificatiegegevens) met behoud van het klinische nut van het bestand. De gekozen aanpak is pseudonimisering (vervangende identificatiecode die alleen via een beveiligde sleutel kan worden omkeerbaar indien nodig voor klinische validatie) — een perfecte, onomkeerbare anonimisering van teksten wordt momenteel als onmogelijk beschouwd; daarom passen we beproefde methoden van pseudonimisering toe.
- Gereedschap & methode. We gebruiken een gevalideerde open-source tool (gebaseerd op de pipeline die voor AP-HP is ontwikkeld): PDF→text conversie indien nodig, named entity recognition (NER) door een mix van regels / machine learning, vervanging door plausibele substituten en vervolgens automatische kwaliteitscontrole. De soorten verwerkte items zijn: achternamen, voornamen, adressen, telefoonnummers, e-mails, specifieke data, identificatienummers, enz. De gerapporteerde prestaties voor vergelijkbare tools overschrijden meestal een hoge recall na ~500 tot 1.000 geannoteerde documenten - vandaar de robuustheid van de methode.
- Dit blijft zichtbaar voor de behandelende arts. Tijdens pseudonimisering worden niet-identificerende klinische kenmerken (leeftijd, geslacht, essentiële geschiedenis) behouden om lokale identificatie door de behandelend arts voor de toestemmings-/cohortfase mogelijk te maken.
Fase 4 — Cohortvorming en geïnformeerde toestemming
- Na pseudonimisering worden de lijst en de gepseudonimiseerde PMF's terugbezorgd naar de behandelende arts. De arts identificeert elke patiënt op basis van de bijgehouden indices (leeftijd, geslacht, geschiedenis) en voert het informatiegesprek uit / het verzamelen van geïnformeerde toestemming voor opname in het prospectieve follow-upcohort. Toestemming is vereist voor de integratie van het cohort en voor het gebruik van de gegevens in het prospectieve/analytische deel van het onderzoek.
- Wij bieden: Patiënteninformatiepakket, Voorbeeldtoestemmingsformulier, Informatieprocedure, Veelgestelde vragen voor patiënten en Weigeringslogboeksjablonen. Alle patiënten behouden het recht om hun zorg te weigeren zonder gevolgen voor hun zorg.
Fase 5 — PMF → IPS-conversie en AI-verwerking
- Objectief. Transformeer gepseudonimiseerde PMF's in standaard International Patient Summary (IPS), om interoperabele klinische syntheses te hebben die kunnen worden gebruikt voor onderzoek en uitwisseling.
- AI-pijplijn. We testen LLM-type modellen (bijv. GPT-4, T5) om IPS te produceren van de PMF. Modellen worden geëvalueerd in twee hoofdconfiguraties: met en zonder Retrieval-Augmented Generation (RAG) - RAG is een techniek die LLM-generatie en het ophalen van literatuur combineert om misuitvindingen ("hallucinaties") te beperken en de feitelijke nauwkeurigheid te verbeteren. Transformaties worden uitgevoerd op gepseudonimiseerde gegevens en in een gecontroleerde omgeving (geen gebruik van onveilige openbare API's).
- Vergelijkingen. De automatisch gegenereerde IPS zal worden vergeleken met "gouden standaard" IPS (van een enkele beoefenaar/volledige PMF) en met handmatige syntheses om de kwaliteit, volledigheid en vereiste inspanning te meten.
Fase 6 — Klinische validatie bij de mens en kwaliteitsmetrieken
- Een panel van huisartsen en experts zal de klinische kwaliteit van de gegenereerde SNP's beoordelen: feitelijkheid, relevantie, volledigheid, duidelijkheid en klinisch nut.
- Automatische metrieken (RED, BLUE, BERTScore, enz.) zullen de beoordeling voltooien. Definitieve beslissingen over klinische aanvaardbaarheid worden genomen door het Expert Panel.
Fase 7 — Gestandaardiseerde mapping, opslag en hergebruik voor zoeken
- Gevalideerde IPS'en kunnen worden geëxporteerd in interoperabel formaat (openEHR) en vervolgens worden toegewezen aan een onderzoeksdatamodel (OMOP-CDM) om gepoolde analyses en daaropvolgende studies mogelijk te maken.
- Alle onderzoeksgegevens die in beveiligde omgevingen zijn opgeslagen, voldoen aan de AVG; De toegang is beperkt tot geautoriseerde personen en gedocumenteerd. Geen enkele persoonlijk identificeerbare informatie verlaat uw medische huis zonder strikte procedures en toestemming.
Fase 8 — Terugkeer naar de praktijk en waardering
- We bieden klinische samenvattingen (IPS) en een geaggregeerd analyserapport dat nuttig kan zijn voor de dagelijkse praktijk (inclusief klinische samenvattingen, visualisaties, patiëntenlijsten).
- Wetenschappelijke resultaten (publicaties, mededelingen) worden op individueel niveau geanonimiseerd; We zullen de resultaten en feedback communiceren naar de deelnemende medische centra.
Veiligheid, bestuur en patiëntenrechten
- Het project wordt uitgevoerd in overeenstemming met de AVG; De bestanden worden gepseudonimiseerd en verwerkt in een beveiligde ruimte. Pseudonimiseringsprocedures en -tools zijn gebaseerd op een gevalideerde pijplijn (AP-HP) en bewezen NLP-methoden voor het detecteren en vervangen van tekst-ID's.
- De ethische commissie heeft een centrale rol: bij de selectie, export en het gebruik wordt het gunstig advies van de commissie gerespecteerd wanneer dat nodig is.
- Elke patiënt wordt geïnformeerd en kan het gebruik van zijn gegevens voor het cohort weigeren (opt-out/toestemming); Wij zorgen voor documentatie en ondersteuning bij de informatieprocedure.
Wat we van u vragen (operationele samenvatting)
- Wijs een klinische contactpersoon en een IT-contactpersoon aan.
- Autoriseer (door ondertekening) de technische export van PMF's van vooraf gescreende patiënten naar de overeengekomen beveiligde omgeving.
- Patiënten informeren en identificeren voor het verkrijgen van definitieve toestemming (onderzoek levert tools en modellen op).
Wat wij ondersteunen
- Technische ondersteuning voor PMF-export en veilige overdrachtsconfiguratie.
- De-identificatie/pseudonimisering van teksten (AP-HP tool / gevalideerde pipeline).
- PMF→IPS-conversie door AI (tests met/zonder RAG) en menselijke validatie; verstrekking van SPI's en geaggregeerde rapporten.
Privacy en ethiek
Dit project is volledig GDPR-compliant. Er zal geen identificeerbare informatie uw medische huis verlaten. Alle gegevens zullen worden gepseudonimiseerd en uitsluitend worden gebruikt in het kader van deze studie die is goedgekeurd door een ethische commissie.
Patiënten kunnen op de hoogte worden gebracht van hun deelname via een procedure die wij u zullen aanbieden, en kunnen op elk moment bezwaar maken tegen het gebruik van hun gegevens, zonder gevolgen voor hun zorg.
Hoe deelnemen?
Neem gewoon contact met ons op via: 📞 Pamela.MfouthKemajou@UGent.be 0466 435 906
Wij organiseren een informatiebijeenkomst (online of ter plaatse) om al uw vragen te beantwoorden en u te voorzien van volledige documentatie.
Kortom
Je hebt de mogelijkheid om deel te nemen aan een baanbrekend onderzoeksproject over long COVID, waarbij wetenschappelijke nauwkeurigheid, kunstmatige intelligentie en de valorisatie van eerstelijnszorggegevens worden gecombineerd.
Uw inzet als medisch centrum zal niet alleen het onderzoek bevorderen, maar ook concrete instrumenten aanreiken voor de zorg voor uw patiënten.
We kijken ernaar uit om met u samen te werken aan dit innovatieve project, op het snijvlak van data science, AI en huisartsgeneeskunde. Laten we samen de eerstelijnszorg naar een meer verbonden, intelligente en humane toekomst brengen.
Met mijn respectvolle groeten,
Dr. Pamela Mfouth Kemajou
Arts, doctoraatsstudente in de Biostatistiek en Medische InformaticaUniversiteit Gent – Departement Biostatistiek en Medische Informatica.