$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Deze representatieve resultaten werden verkregen door de procedure te volgen die in dit protocol wordt beschreven. Er werd een analyse van de tekstmining-associatie uitgevoerd volgens het CaseOLAP LIFT-protocol5 met standaardparameters, waarbij acht brede categorieën van hart- en vaatziekten72 en hun associatie met mitochondriale eiwitten (GO:0005739) werden bestudeerd. In totaal werden 635.696 meldingen tot en met mei 2024 vastgesteld als relevant voor deze ziekten; Onder hen werden 4.655 eiwitziekte-associaties met een hoog vertrouwen geïdentificeerd om downstream-analyses te informeren. In mei 2024 is een biomedische kennisgrafiek gemaakt met behulp van de softwarecode van Know2BIO met behulp van standaardinstellingen9. De resulterende kennisgrafiek bestaat uit 219.450 knooppunten, 6.323.257 randen, evenals knooppuntkenmerken voor 189.493 knooppunten met knooppuntbeschrijvingen, eiwit-/gensequenties, chemische structuur, enz. Waar beschikbaar. Een schatting van de rekentijd voor alle stappen in het protocol wordt weergegeven in tabel 1.
Het RUGG-systeem werd geïnitialiseerd door het bouwen van de vectordatabases voor zowel knowledge graph-knooppunten en -functies, als voor de CVD-relevante publicaties. Alle Knowledge Graph-knooppunten, randen en knooppuntfuncties werden verwerkt met een brokgrootte van 20 tokens met het BART 71-inbeddingsmodel om zich voor te bereiden op het zoeken naar RAG-vectoren. Op dezelfde manier werden originele bijdragen en recensieartikelen verwerkt met behulp van een brokgrootte van 500 tokens en het BART-inbeddingsmodel om zich voor te bereiden op het zoeken naar RAG-vectoren. Voor het ophalen van literatuur werden full-text publicaties van meer dan 500 tokens hiërarchisch samengevat op basis van de afzonderlijke secties van een publicatie door het BART-inbeddingsmodel. Het GPT-4o-model werd gebruikt voor de overige LLM-agenten in het systeem.
Deze representatieve resultaten tonen een voorbeeld van een use case om potentiële geneesmiddeltherapieën voor aritmogene cardiomyopathie (ACM) en gedilateerde cardiomyopathie (DCM) te onderzoeken, geïdentificeerd als respectievelijk MeSH_Disease: D019571 en MeSH_Disease: D002311. Een reeks vragen wordt beschreven in Figuur 3, met gemarkeerde voorbeelden van modelantwoorden in Figuur 4 en de volledige respons gerapporteerd in Aanvullend Dossier 1, Sectie A. De onderzoeksrichting werd aangepast aan de door de onderzoeker gevalideerde antwoorden, waarbij volgende vragen werden opgesteld op basis van de resultaten van de eerdere antwoorden. De analyse onthulde 11 kandidaat-geneesmiddelen die zijn geclassificeerd onder bètablokkers en antiaritmica. Nieuwe wegen voor therapeutische behandeling werden beoordeeld met behulp van een Graph Convolutional Neural Network link-voorspellingsmodel op een subset van de volledige kennisgrafiek, inclusief knooppunten binnen 1 uur van studieziekte en geneesmiddelknooppunten en hun onderlinge verbindingen, met evaluatiestatistieken gerapporteerd in tabel 4. De top 10 relevante randen voor elke voorspelling door het model werden verder onderzocht door een grafiekverklaarbaarheidsmodule, GNNExplainer44, om respectievelijk de bovenste knooppunten en randen te identificeren die bijdragen aan elke voorspelling. De totale kosten van het gebruik van commerciële LLM voor alle stappen van het RUGGEN-protocol voor deze use case worden op het moment van schrijven geschat op $ 1,50.

Figuur 1: Ophalen onder Graph-Guided Explainable disease Distinction (RUGGED) workflow. RUGGED bestaat uit vier primaire componenten: (1) het samenstellen en verwerken van gegevens uit ethisch verantwoorde en professioneel beheerde bronnen (bijv. PubMed en gecureerde biomedische kennisbanken), (2) het integreren van collegiaal getoetste onderzoeksresultaten in een uniforme kennisgrafiek, (3) het structureren van de tekst- en grafiekgegevens binnen databaseservices, (4) het modelleren en voorspellen van verklaarbare relaties tussen biomedische entiteiten binnen de kennisgrafiek, en (5) het ophalen en synthetiseren van kennis via een Retrieval Augmented Generation (RAG)-workflow (Figuur 2) om complexe moleculaire relaties te valideren en AI-gestuurde ziektevoorspellingen te onderzoeken. Een human-in-the-loop beoordelingsstap kan door de gebruiker worden uitgevoerd om de nauwkeurigheid van de uitvoer te verbeteren. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 2: Retrieval-architectuur en workflow voor het beperken van vooroordelen. Het Retrieval Augmented Generation (RAG)-framework maakt gebruik van meerdere LLM-agents, die elk specifieke taken uitvoeren om de toegang tot relevante informatie te ondersteunen op basis van de gebruikersquery. Dit systeem levert gedocumenteerd bewijs voor de gebruikersgerichte GPT-gebaseerde Reasoning Agent, waardoor de interactie tussen gebruiker en agent en de synthese van kennis worden vergemakkelijkt. (1) Biomedical Text Retrieval: Peer-reviewed originele bijdragen en overzichtsartikelen worden gefilterd op basis van hun relevantie voor het begrijpen van ziekteassociaties. Er wordt een vectordatabase geconstrueerd voor door de auteur en de redacteur gevalideerd tekstbewijs, gewogen op basis van het overeenkomstige gedeelte van de publicatie, respectievelijk: 70% abstract, 10% resultaten, 10% metadata en 10% voor alle andere subsecties. Een zoekopdracht op trefwoord en een gelijkeniszoekopdracht op basis van de tekstinbedding van de gebruikerszoekopdracht identificeren samen relevante documenten. Samenvattingen van elk document worden gegenereerd met behulp van een op BERT gebaseerde samenvatting, waarbij de op GPT gebaseerde Text Evaluator Agent de zoekopdracht verfijnt om de relevantie van het querydocument te valideren. (2) Knowledge Graph Retrieval: Een op BERT gebaseerde module voor benoemde entiteitsherkenning en GPT-gebaseerde relatie-extractie verbindt de gebruikersquery met relevante entiteiten in de knowledge graph. Een gelijkeniszoekopdracht in een vectordatabase identificeert relevante knooppunten en randen. Gegevens worden opgehaald uit de Neo4j-database via Cypher-query's die zijn gegenereerd door de op GPT gebaseerde Cypher Query Agent en verfijnd door de Query Verification Agent. (3) De individuele antwoorden van de pijplijnen Biomedical Text Retrieval of Knowledge Graph Retrieval worden gepresenteerd aan de Reasoning Agent, die een beknopt antwoord synthetiseert met minimale vertekening van de vraag van de gebruiker. Dit systeem is gericht op het behoud van nauwkeurigheid en onpartijdigheid bij het presenteren van feitelijke informatie. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 3: Use case voor kennissynthese en hypothese-exploratie via eentrapsgewijze query. Deze figuur toont een gemarkeerde use case die zich richt op een reeks gerelateerde vragen en concepten die een onderzoeker en/of zorgprofessional aan het RUGGED-systeem zou kunnen stellen. Vragen van de gebruiker worden in numerieke volgorde aan het systeem gepresenteerd, waarbij pijlen staan voor afgeleide logische en domeinspecifieke redeneringen bij elke vraag. Het systeem haalt uit de impliciete en relevante informatie (bron weergegeven in blauw) en reageert op de vraag. Voorbeelden van systeemreacties worden weergegeven in figuur 4. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 4: Use case cardiovasculaire pathologie: opheldering van de pathogenese van HVZ. Query-antwoordparen tussen de gebruiker en het RUGGED-systeem worden weergegeven. In het paneel linksboven halen vragen 1-6 informatie op door informatie uit de knowledge graph-database te extraheren om evidence-based antwoorden te formuleren. Vraag 7 maakt gebruik van een verklaarbare voorspelling van grafieklinks om de best scorende therapieën te identificeren. De query leidt tot een voorspellingsanalyse, die automatisch wordt uitgevoerd en verwerkt door het systeem, en de belangrijkste bevindingen worden beknopt samengevat. Vraag 8 evalueert literatuurbewijs uit het gedefinieerde tekstgegevenscorpus dat wordt opgehaald als relevant bewijs om de voorspelde bevinding te verifiëren, valideren en bevestigen. De reacties van het systeem zijn beoordeeld door een human-in-the-loop inspectieproces en aangepast voor leesbaarheid en beknoptheid. Een volledig transcript van deze bevindingen is gedetailleerd in het aanvullende dossier 1. Klik hier om een grotere versie van deze figuur te bekijken.
| Stappen | Beschrijving | Tijd |
| Toegang tot biomedische kennis | 30% totaal |
| Bereid het corpus van de biomedische literatuur voor | Maak verbinding met PubMed en PubMed Central, download en parseer publicatiegegevens voor downstreamtaken. | 20% |
| Kennisbankgegevens voorbereiden | Maak verbinding met biomedische kennisbanken, download en analyseer de benodigde informatie voor downstream-taken. | 5% |
| Extractie van informatie | 30% totaal |
| CaseOLAP LIFT Analyse van tekstmining | Identificeer ziekte-eiwitrelaties op hoog niveau binnen het biomedische tekstcorpus. | 25% |
| Kenniskaart Constructie | Verbind en integreer ongelijksoortige informatie uit biomedische kennisbanken in een uniforme kennisgrafiek. | 5% |
| Voorspelling Analyse | 10% totaal |
| Train Graph Neuraal Netwerk | Train het model op de gegevens van de biomedische kennisgrafiek om verborgen patronen in de grafiek te leren. | 5% |
| Analyse van de relevantierangschikking | Pas de verklaarbaarheidsmodule toe om de meest relevante knooppunten en randen te markeren die relevant zijn voor het bestuderen van ziekten. | 2.5% |
| Link voorspelling | Gebruik de verklaarbaarheidsmodule om belangrijke knooppunten en randen te identificeren die bijdragen aan nieuwe voorspelde randen. | 2.5% |
| Hypothese genereren en/of valideren | 30% totaal |
| Database-instelling voor het ophalen van augmented generation | Initialiseer de grafiekdatabase voor het opvragen van de knowledge graph en de vectordatabase voor het ophalen van tekst. | 25% |
| Hypothese Exploratie | Maak gebruikersinteractie met RUGGED mogelijk om toegang te krijgen tot relevante informatie en deze te onderzoeken voor het verkennen van hypothesen. | 5% |
Tabel 1: Workflow en snelheidsbeperkende stappen. Deze tabel bevat ruwe schattingen van de rekentijd die nodig is voor elke fase van de werkstroom. Snelheidsbeperkende stappen omvatten het openen, extraheren en indexeren van biomedische kennis die nodig is voor het genereren van opgehaalde bronnen. Het onderzoek van hypothesen kan continu worden herhaald zonder dat het nodig is om snelheidsbeperkende stappen opnieuw uit te voeren.
| Ziekte Categorie | MeSH Boom Nummers | # PMID's | # Originele bijdragen | # Artikelen beoordelen |
| Cardiomyopathieën (CM) | C14.280.238 | 132,531 | 102,337 | 19,942 |
| C14.280.434 |
| Hartritmestoornissen (ARR) | C14.280.067 | 125,286 | 92,374 | 13,854 |
| C23.550.073 |
| Aangeboren hartafwijkingen (CHD) | C14.280.400 | 82,006 | 54,023 | 6,379 |
| Hartklepaandoeningen (VD) | C14.280.484 | 72,016 | 50,119 | 5,743 |
| Myocardiale ischemie (IHD) | C14.280.647 | 256,986 | 210,042 | 30,223 |
| Ziekte van het hartgeleidingssysteem (CCD) | Zaak C14.280.123 | 53,050 | 35,399 | 4,363 |
| Ventriculaire uitstroomobstructie (VOO) | C14.280.955 | 22,244 | 15,504 | 1,686 |
| Andere hartziekten (OTH) | C14.280.195 C14.280.282 C14.280.383 C14.280.470 C14.280.945 C14.280.459 C14.280.720 | 114,085 | 77,302 | 11,799 |
| Totaal | 635,696 | 478,404 | 69,690 |
Tabel 2: Statistieken van de biomedische literatuur. Deze tabel geeft een overzicht van de studieziektecategorieën met de bijbehorende MeSH-boomnummers en het aantal PubMed-documenten dat tot en met mei 2024 is opgehaald en dat wordt gebruikt als corpus voor tekstmining. Een subset van deze publicaties, bestaande uit originele bijdragen aan onderzoeksartikelen en overzichtsartikelen, wordt geïndexeerd in een vectordatabase voor opvraging door RUGGED tijdens het genereren van hypothesen.
| Categorie | Aantal knooppunten | Aantal randen | Bron(nen) van de gegevens |
| Anatomie | 5,049 | 122,533 | Bgee, PubMed, MeSH, Uberon, |
| Biologisch proces | 27,047 | 108,106 | Gen ontologie |
| Cellulaire component | 4,057 | 52,238 | Gen ontologie |
| Verbinding | 27,278 | 3,292,028 | DrugBank, MeSH, CTD, UMLS, KEGG, TTD, SIDER, Inxight Drugs, Hetionet, PathFX, MyChem.info |
| Ziekte | 21,938 | 311,773 | PubMed, MeSH, DisGeNET, SIDER, ClinVar, ClinGen, PharmGKB, MyDisease.info, PathFX, UMLS, OMIM, Mondo, DOID, KEGG |
| Drug klasse | 5,721 | 8,283 | ATC |
| Gen | 29,810 | 943,419 | HGNC, GRNdb, KEGG, ClinVar, ClinGen, |
| Moleculaire functie | 11,151 | 47,086 | SMPDB, DisGENET, PharmGKB, MyGene.info |
| Weg | 52,012 | 234,944 | Gen ontologie |
| Eiwit | 20,740 | 1,074,809 | Reactoom, KEGG, SMPDB |
| Reactie | 14,647 | 128,038 | UniProt, Reactome, TTD, SMPDB, STRING, HGNC |
| Subtotaal | 219,450 | 6,323,257 | Reactoom |
| Tekst-mining Verenigingen | 8 | 4,670 | |
| Totaal | 219,458 | 6,327,927 | |
Tabel 3: Statistieken van de kennisgrafiek. Deze tabel beschrijft 11 brede biomedische categorieën, bestaande uit de geconstrueerde Know2BIO-kennisgrafiek, verrijkt met extra randen die zijn afgeleid van tekstmining-analyse en voorspellende analyse. De resulterende kennisgrafiek en voorspellingen worden beheerd door de Neo4j-grafiekdatabase voor het ophalen door RUGGED tijdens het genereren van hypothesen.
| Nauwkeurigheid | Precisie | Herinneren | F1-score | AUROC | AUPRC |
| Validering | 0.7158 | 0.6639 | 0.8743 | 0.7547 | 0.8437 | 0.8637 |
| Test | 0.703 | 0.6367 | 0.9455 | 0.761 | 0.8961 | 0.9094 |
Tabel 4: Verklaarbare evaluatie van het AI-model. Deze tabel rapporteert de evaluatiestatistieken voor de voorspelling van de knowledge graph-link met behulp van een convolutioneel neuraal netwerk met twee lagen graph. Metrieken werden beoordeeld door grafiekranden te verdelen in 85% training, 5% validatie en 10% testdatasets. Nauwkeurigheid geeft het aandeel van correct geclassificeerde voorspellingen aan. Precisie rapporteert het aandeel van correcte positieve voorspellingen onder alle positieve voorspellingen. Terugroepen meet de verhouding tussen het aantal juiste positieve voorspellingen en de werkelijke positieve randen. De F1-score is het harmonische gemiddelde van precisie en recall, waarbij de twee maatstaven in evenwicht zijn. AUROC evalueert het vermogen van het model om onderscheid te maken tussen positieve en negatieve voorspellingen. AUPRC kwantificeert de afweging tussen precisie en recall over verschillende drempels heen. Voor alle metrische gegevens geven hogere waarden betere modelprestaties aan.
Aanvullend bestand 1: Dit bestand beschrijft de volledige modelrespons van RUGGED en een vergelijking met GPT-4o. Sectie A presenteert de volledige mens-computerinteractie met RUGGED, waarbij wordt voortgebouwd op de chain-of-query-benadering die wordt beschreven in Figuur 3 en het volledige antwoord biedt dat verder gaat dan de samenvatting die is gemarkeerd in Figuur 4. Sectie B evalueert de antwoorden van GPT-4o zonder deze op te halen aan de hand van die van RUGGED, waarbij kenmerken worden beoordeeld zoals precisie, diepte, betrouwbaarheidsscore, betrouwbaarheid van het bewijs en kosten. Klik hier om dit bestand te downloaden.