Waiting
Procesando inicio de sesión ...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

Het uitvoeren van data mining en integratieve analyse van biomarker in borstkanker met behulp van meerdere openbaar toegankelijke databases

Published: May 17, 2019 doi: 10.3791/59238

Summary

Hier presenteren we een protocol om de biomarker en Survival voorspeller van borstkanker te verkennen op basis van de uitgebreide analyse van gebundelde klinische datasets afgeleid van een verscheidenheid van openbaar toegankelijke databases, met behulp van de strategie van meningsuiting, correlatie en overlevings analyse stap voor stap.

Abstract

In de afgelopen jaren, opkomende databases werden ontworpen om de belemmeringen voor het benaderen van de ingewikkelde kanker genomic datasets, waardoor het vergemakkelijken van onderzoekers te analyseren en te interpreteren genen, monsters en klinische gegevens over verschillende vormen van kanker te verlagen. Hierin beschrijven we een praktische operatieprocedure, waarbij ID1 (remmer van DNA-bindende eiwitten 1) als een voorbeeld, om de expressie patronen van biomarker en overleving voorspellers van borstkanker te karakteriseren op basis van gebundelde klinische datasets afgeleid van Online toegankelijke databases, waaronder ONCOMINE, bcGenExMiner v 4.0 (borstkanker gen-Expression Miner v 4.0), GOBO (genexpressie-based uitkomst voor borstkanker online), HPA (de menselijke proteïne Atlas), en Kaplan-Meier plotter. De analyse begon met het bevragen van het uitdrukkingspatroon van het gen van belang (b.v., ID1) in kanker monsters versus normale steekproeven. Vervolgens werd de correlatieanalyse tussen ID1 en clinicopathological kenmerken bij borstkanker uitgevoerd. Vervolgens werd de expressieprofielen van ID1 gelaagd volgens verschillende subgroepen. Tot slot werd de associatie tussen ID1 expressie en overlevings uitkomst geanalyseerd. De operatieprocedure vereenvoudigt het concept om multidimensionale data types te integreren op het gen niveau van verschillende databases en test hypothesen met betrekking tot herhaling en genomische context van gen wijziging gebeurtenissen in borstkanker. Deze methode kan de geloofwaardigheid en de representativiteit van de conclusies verbeteren, daardoor, huidig informatief perspectief op een gen van belang.

Introduction

Borstkanker is een heterogene ziekte met diverse prognose-en behandelingsstrategieën in verschillende moleculaire subtypen, waarbij de pathogenese en de ontwikkeling waarschijnlijk geassocieerd worden met uiteenlopende moleculaire mechanismen1,2 , 3. echter, het identificeren van een therapeutisch doelwit duurt meestal jaren, of zelfs decennia, van de eerste ontdekking in fundamenteel onderzoek naar klinisch gebruik4. Genoom brede toepassing van high-throughput sequencing technologie voor kanker genoom is sterk gevorderd het proces van het zoeken naar waardevolle Biomarkers of therapeutische doelstellingen 5.

De overweldigende hoeveelheid kanker Genomics gegevens die door de grootschalige kanker Genomics platforms, zoals de ICGC (International Cancer genoom Consortium) en TCGA (de Cancer genoom Atlas), is een grote uitdaging voor onderzoekers om gegevens uit te voeren exploratie, integratie en Analytics, met name voor gebruikers die geen intensieve opleiding in informatica en berekening6,7,8,9,10. In de afgelopen jaren, opkomende databases, (bijv., ONCOMINE, bcGenExMiner v 4.0, en Kaplan-Meier plotter, enz.) werden ontworpen en ontwikkeld om de bar te verlagen voor het naderen van de ingewikkelde kanker genomic datasets, waardoor het vergemakkelijken van onderzoekers te analyseren en interpreteren van de genen, monsters en klinische gegevens over verschillende vormen van kanker11. Het doel van dit protocol is een onderzoekstrategie te beschrijven die is geïntegreerd met meerdere niveaus van gen-informatie uit een reeks Open Access-databases, die op grote schaal door een groot aantal onderzoekers zijn erkend, om de potentiële biomerkers te identificeren en prognostische factoren voor borstkanker.

De ONCOMINE database is een web-gebaseerde data-mining platform met kanker Microarray informatie en is ontworpen om de ontdekking van nieuwe biomarkers en therapeutische doelstellingen te vergemakkelijken11. Momenteel zijn er meer dan 48.000.000 genexpressie metingen van 65 genexpressie datasets in deze database11,12. De bcGenExMiner v 4.0 (een gratis tool voor non-profit instelling), ook wel borstkanker Gene-Expression Miner, is een gebruiksvriendelijke web-based applicatie bestaande uit DNA arrays resultaten van 3.414 teruggewonnen borstkanker patiënten en 1.209 ervaren een pejoratieve gebeurtenis13. Het is ontworpen om gen prognostische analyse prestaties te verbeteren met R statistische software en pakketten.

De GOBO is een multifunctioneel gebruiksvriendelijk online tool met arrays informatie (bijv. Affymetrix U133A) van een 51-sample borstkanker Cell line set en een 1881-sample borsttumor data set, dat een breed scala van analyses maakt14. Er zijn een verscheidenheid van toepassingen beschikbaar in de GOBO database, die een snelle analyse van genexpressie profielen in verschillende moleculaire subtypen van borsttumoren en cel lijnen, screening voor co-uitgesproken genen voor de schepping van potentiële gen te nemen, en correlatieanalyse tussen resultaat en genexpressie niveaus van enkelvoudige genen, sets van genen, of gen handtekeningen in de gegevens van borstkanker set15.

De menselijke eiwit Atlas is een Open-Access programma dat is ontworpen voor wetenschappers om de menselijke proteome, die al heeft bijgedragen aan een groot aantal publicaties op het gebied van de menselijke biologie en ziekte te verkennen. De menselijke eiwit Atlas wordt erkend als een Europese kern bron voor Life Science Gemeenschap16,17.

De Kaplan Meier plotter is een online hulpmiddel dat genexpressie en klinische gegevens gelijktijdig integreert dat beoordeling van het prognostische effect van 54.675 genen toestaat die op 10.461 kanker steekproeven worden gebaseerd, die 1.065 maag, 2.437 Long, 1.816 ovariële en 5.143 omvatten borstkanker patiënten met een gemiddelde follow-up van 33/49/40/69 maanden18. Informatie van genexpressie, terugval-vrije overleving (RFS) en algehele overleving (OS) zijn te downloaden van deze database19,20.

Hier beschrijven we een praktische operatieprocedure van het gebruik van meerdere openbaar toegankelijke databases te vergelijken, te analyseren en te visualiseren patronen van veranderingen in de expressie van het gen van belang in meerdere kanker studies, met als doel het samenvatten van de expressieprofielen, prognostische waarden en potentiële biologische functies bij borstkanker. Bijvoorbeeld, recente studies hebben aangegeven de oncogene eigenschappen van ID-eiwitten in tumoren en werden geassocieerd met kwaadaardige functies, waaronder cellulaire transformatie, immortalisatie, Enhanced proliferatie en metastase21, 22,23. Nochtans, speelt elk lid van de familie van identiteitskaart verschillende rollen in verschillende types van stevige tumors, en hun rol in borstkanker blijft onduidelijk24. In eerdere studies, onderzocht door middel van deze methode, vonden we dat ID1 was een zinvolle prognostische indicator in borstkanker25. Daarom zal het protocol ID1 als voorbeeld nemen om de data mining methoden in te voeren.

De analyse begint van het bevragen van het uitdrukkingspatroon van het gen van belang in kanker monsters versus normale steekproeven in ONCOMINE. Vervolgens werd de uitdrukking correlatie van de genen van belang in borstkanker werd uitgevoerd met behulp van de BC-GenExMiner v 4.0, GOBO, en ONCOMINE. Vervolgens werd de expressieprofielen van ID1 gelaagd volgens verschillende subgroepen met behulp van de drie bovengenoemde databases. Ten slotte werd de associatie tussen ID1 expressie en Survival out geanalyseerd met BC-GenExMiner v 4.0, de menselijke proteïne Atlas, en de Kaplan-Meier plotter. De bewerkingsprocedure werd weergegeven als het stroomdiagram in Figuur 1.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. expressiepatroon analyse

  1. Ga naar de ONCOMINE web interface26.
  2. Verkrijg de relatieve expressie niveaus van Gene id1 in verschillende soorten maligniteiten door id1 te typen in het zoekvak.
  3. Selecteer analyse type in het menu primaire filters . Dan, selecteer kanker versus normale analyse, borstkanker versus normale analyse.
  4. Selecteer Gene samenvattingsweergave in het menu andere weergaven . Stel de drempel van P-waarde op 0,01. Download de cijfers.
    Opmerking: de drempel van de voudige verandering is 2, zoals beschreven in de vorige studie27.

2. expressie Correlatieanalyse

  1. Ga naar de BC-GenExMiner v 4.0 web interface28.
  2. Selecteer correlatie in het menu analyse en druk op de uitputtende knop. Typ id1 naar het zoekvak. Druk op de Submit knop en de Start analyse knop.
    Opmerking: standaardinstelling Toon uitdrukking correlatieanalyse van alle patiënten, die nauwkeuriger kan worden in verschillende subtypen van borstkanker door te drukken op de molecule subtype filter.

3. analyse van subgroepen

  1. Subgroep analyse in BC-GenExMiner v 4.0
    1. Ga naar de BC-GenExMiner v 4.0 web interface28.
    2. Selecteer expressie in het menu analyse en druk op de uitputtende knop. Typ id1 naar het zoekvak en druk op de Submit knop en de Start analyse knop.
    3. Klik op de knoop status (ln) en Scarff Bloom & Richardson grade status (SBR) miniaturen om volledige beelden te bekijken. Druk in de SBR-beelden op de onderstaande knop om de P-waarden van de figuren te visualiseren. Download de cijfers.
  2. Subgroep analyse in genexpressie-gebaseerde uitkomst voor borstkanker online (GOBO)
    1. Ga naar de GOBO web interface14.
    2. Het symbool van het type gen van belang id1 aan het scherm Upload de reeks van het gen.
    3. Stel het zoekbereik van Define gen/probe identifiers in op Gene symbool. Stel Alles in tumor selectie. Selecteer node status en rang gelaagde in de multivariate parameters. Andere items blijven standaard. Stuur het onderzoek en Download de cijfers.

4. overlevings analyse

  1. Overlevings analyse in BC-GenExMiner v 4.0
    1. Ga naar de BC-GenExMiner v 4.0 web interface28.
    2. Selecteer prognostische in het menu analyse , druk op de uitputtende knop. Typ id1 naar het zoekvak en druk op de Submit knop en de Start analyse knop.
    3. Selecteer in de uitputtende prognostische analyse nm, ERm, Mr in de populatie-en gebeurtenis criteria en druk op de Submit knop om meer informatie te verkrijgen. Druk op de Kaplan-Meier curve miniaturen om de volledige grafieken te exporteren.
      Nota: N (+,-, m): de status van de knoop (+: positief,-: negatief, m: gemengd); ER (+,-, m): de status van de oestrogeen receptor (+: positief,-: negatief, m: gemengd); MR: gemetastaseerde terugval
  2. De analyse van de overleving in de menselijke eiwit Atlas (HPA)
    1. Ga naar de menselijke proteïne Atlas web interface29.
    2. Typ id1 naar het zoekvak en klik op de knop zoeken . Selecteer pathologie sub-Atlas.
      Nota: de mRNA uitdrukkingsniveaus over de 17 kankertypes worden getoond in de sectie van het overzicht van de uitdrukking van RNA. Elk kankerweefsel etiket van het doos perceel is aanklikbaar om tot een gedetailleerde pagina toegang te hebben die overlevings analysegegevens en de uitdrukkingsniveaus van RNA verstrekt.
    3. Klik op het etiket van borstkanker, dan is de gedetailleerde pagina aan te tonen interactieve Survival Scatter plot en survival analyse. Download de cijfers.
  3. Survival analyse in de Kaplan-Meier plotter Survival
    1. Ga naar de Kaplan-Meier plotter web interface30. Klik op Start km plotter voor borstkanker in de mRNA genen chip zone.
    2. Typ id1 naar de zoekbalk en selecteer het groene item in het menu van de kandidaat.
    3. Selecteer RFS als overlevings type en andere items blijven standaard. Klik op Draw Kaplan-Meier plot en Download de cijfers.
      Nota: de montages van de overlevings types, de cutoff types, en de opvolgings drempel, evenals de opties van de sonde reeks, kunnen worden veranderd zoals vereist. Subgroep prognostische analyse met inbegrip van ER, PR, haar-2, lymfeklieren, rang, Tp53 status, en moleculaire subtypen kan worden verkregen via het veranderen van de instelling in de beperken analyse tot subtypen vak1. Evenzo kan de filterbeperking van de behandeling worden ingesteld in de analyse te beperken tot geselecteerde cohorten ' vak.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Een representatief resultaat van data mining en integratieve analyse van borstkanker biomarker werd uitgevoerd met behulp van ID1, een van de remmers van DNA-bindende familieleden, die zijn gemeld in de vorige studie 25.

Zoals aangetoond in Figuur 2, werden de verschillen van id1 mRNA uitdrukking tussen tumor en normale weefsels in veelvoudige types van kanker geanalyseerd gebruikend de ONCOMINE gegevensbestand, dat een totaal van 445 unieke analyses bevatte. Er waren 5 studies die openbaarden dat het mRNA uitdrukkings niveau van ID1 beduidend hoger was in normale weefsels dan in weefsels van borstkanker. Deze gegevens wezen op de uitdrukking ontregeling van ID1 in borstkanker. Figuur 3 toonde de beste positieve en negatieve correlatieve genen van id1 uit de analyse uitgevoerd in BC-GenExMiner v 4.0. Voor het identificeren van de correlatie tussen mRNA expressie van ID1 en de clinicopathological parameters van BC patiënten, BC-GenExMiner v 4.0 database werd gebruikt de analyse. Zoals aangetoond in Figuur 4, significant verhoogde mRNA niveau van id1 werd gevonden bij patiënten met borstkanker zonder lymfeklier metastasen, in vergelijking met die met lymfeklier metastasen (P= 0,0005). Voorts toonde de analyse in GOBO aan dat de verhoogde mRNA niveaus van ID1 aan lagere tumor rang (Figuur 5, P< 0.00001) gecorreleerd waren. Deze resultaten impliceerden dat de verhoogde uitdrukking van ID1 aan lager gemetastaseerde potentieel en lagere pathologische rang in BC werd verbonden. De analyse van de BC-GenExMiner v 4.0 database aangegeven dat hogere mRNA niveau van ID1 werd gecorreleerd aan langere verre metastasen-vrije overleving (DMFS) bij patiënten met borstkanker (Figuur 6, HR = 0.82, 95% CI: 0.73-0.92, P= 0,001). Consequent, analyse van de menselijke eiwit Atlas suggereerde dat verhoogde eiwit niveau van ID1 werd geassocieerd met een betere overleving uitkomst bij patiënten met borstkanker (Figuur 7, P= 0,0389). De analyse van de overleving van de plotter Kaplan-Meier toonde ook aan dat het hogere mRNA niveau van ID1 uitdrukking betere recidief-vrije overleving (RFS) bij de patiënten van borstkanker voorspelde (Figuur 8, HR = 0.81, P= 0,00023).

Figure 1
Figuur 1. Overzicht van het verkennen van de expressie patronen en prognostische waarden van verschillende borstkanker biomarkers en online databases selectie. Systematische analyse van verschillende borstkanker biomarkers werd stap voor stap uitgevoerd in een verscheidenheid van databases. Ten eerste, de uitdrukking patroon van het gen van belang in kanker monsters versus normale monsters. Dan, werd de uitdrukkings correlatie van genen van belang in borstkanker uitgevoerd. Vervolgens werd de expressieprofielen van ID1 gelaagd volgens verschillende. Ten slotte werd de associatie tussen ID1 expressie en Survival out geanalyseerd. Klik hier om een grotere versie van dit cijfer te bekijken.

Figure 2
Figuur 2. Het mRNA uitdrukkingspatroon van ID1 in verschillende types van menselijke kanker. De mRNA expressie van id1 geanalyseerd met de ONCOMINE database. De grafiek toonde de aantallen gegevenssets met statistisch significante mRNA overexpressie (rood) of downregulated uitdrukking (blauw) van het doel gen aan. Het aantal in elke cel vertegenwoordigde het aantal analyses dat aan de drempel binnen die analyse en kankertypes voldoet. De rang van het gen werd geanalyseerd door percentiel van het doel gen in de bovenkant van alle genen die in elk onderzoek worden gemeten. De kleur van de cel werd bepaald door het beste gen weelderig percentiel voor de analyses binnen de cel. De P-waarde werd opgezet bij 0,01 en de vouw-verandering werd bepaald als 2, zoals getoond in het rode kader. Dit cijfer is gewijzigd van de vorige studie25. Klik hier om een grotere versie van dit cijfer te bekijken.

Figure 3
Figuur 3. De correlatieanalyse van het gen van ID1 in BC-GenExMiner v 4.0. De mRNA uitdrukkings correlatie van ID1 en relevante genen in 5, 696 patiënten van borstkanker binnen 36 studies geanalyseerd in bcGenExMiner v 4.0. Dit cijfer is gewijzigd van de vorige studie25. Klik hier om een grotere versie van dit cijfer te bekijken.

Figure 4
Figuur 4. De relatie tussen ID1 expressie en lymfeklier metastase status. Het mRNA uitdrukkings niveau van ID1 in 4, 307 patiënten van borstkanker met de verschillende status van de lymfeknoop (LN) geanalyseerd in bcGenExMiner v 4.0. Dit cijfer is gewijzigd van de vorige studie25. Klik hier om een grotere versie van dit cijfer te bekijken.

Figure 5
Figuur 5. De relatie tussen de genexpressie niveau van ID1 en tumor grade. De mRNA expressie niveau van ID1 bij borstkankerpatiënten met verschillende pathologische rang werd geanalyseerd in GOBO. Het globale significante verschil tussen groepen werd beoordeeld om p-waarden te produceren en p< 0.05 werd overwogen om op een statistisch significant verschil te wijzen. 1, 2, 3 in x-as tribune voor sub-groepen patiënten in verschillende pathologische rang 1, rang 2, rang 3. Dit cijfer is gewijzigd van de vorige studie 25. Klik hier om een grotere versie van dit cijfer te bekijken.

Figure 6
Figuur 6. De prognostische waarden van ID1 voor verre metastasen-vrije overleving in de patiënten van borstkanker. De vereniging tussen ID1 mRNA niveaus en verre metastasen-vrije overlevings ramingen werd geanalyseerd in bcGenExMiner v 4.0. Dit cijfer is gewijzigd van de vorige studie25. Klik hier om een grotere versie van dit cijfer te bekijken.

Figure 7
Figuur 7. De overlevingskans van ID1 bij patiënten met borstkanker.  Het effect van ID1 eiwit niveau voor het voortbestaan van patiënten met borstkanker werd geanalyseerd in de menselijke proteïne Atlas (HPA). Dit cijfer is gewijzigd van de vorige studie25. Klik hier om een grotere versie van dit cijfer te bekijken.

Figure 8
Figuur 8. De prognostische waarden van ID1 in borstkanker volgens de terugkerende-vrije overleving (RFS). Verschillend id1 mRNA niveau in alle 3, 951 patiënten van borstkanker die in de plotter van Kaplan-Meier worden geanalyseerd. Dit cijfer is gewijzigd van de vorige studie25. Klik hier om een grotere versie van dit cijfer te bekijken.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Uitgebreide analyse van openbare databases kan wijzen op de onderliggende functie van het gen van belang en onthullen het potentiële verband tussen dit gen en clinicopathological parameters in specifieke kanker27,31. De exploratie en analyse op basis van een enkele database kan bieden beperkte of geïsoleerde perspectieven als gevolg van de potentiële selectie bias, of in zekere mate, mogelijk te wijten aan de verscheidenheid van de kwaliteit van gegevens, met inbegrip van het verzamelen van gegevens en de analytische algoritme van de database19. De belangrijkste stap van dit protocol is het selecteren van de juiste databases, die algemeen moeten worden erkend door een groter aantal wetenschappers met voldoende representativiteit. De onderzoeker zou veelvoudige gegevensbestanden moeten gebruiken om de hypothese te testen en de resultaten te bevestigen die uit verschillende gegevensbestanden worden afgeleid, eerder dan één enkele gegevensbestand te gebruiken.

Het hier beschreven protocol is een onderzoeker friendly Operation procedure. Het voordeel van deze methode is dat het zorgt voor de snelle visualisatie en interpretatie van de potentiële rol van een gen in borstkanker. Bovendien, alle resultaten verkregen via deze procedure kan onmiddellijk worden getest en herhaald door simpelweg het opvragen van de overeenkomstige websites. De beperking van deze methode is dat de conclusies die voortkomen uit de uitgebreide analyse van de databases niet precies de feitelijke functie of relatie in de klinische setting weerspiegelen. Dit kan voortkomen uit de systematische bias van de database, en in sommige gevallen, mogelijk als gevolg van onvoldoende samplegrootte32,33. Met behulp van meer dan een database om een query hetzelfde onderzoek vraag kan wederzijds bevestigen de resultaten en de geloofwaardigheid van de conclusie34te verhogen. Het wordt sterk aanbevolen om monsters van de instelling van de onderzoeker te gebruiken om de resultaten te verifiëren, of indien mogelijk, om gerelateerde basisexperimenten uit te voeren om de resultaten te testen.

Meer en meer online kanker genomica of Proteomics databases beschikbaar zal zijn en toegankelijk voor onderzoekers35,36. Het protocol kan een efficiënte en economische methode voor de onderzoeker om een potentieel doelwit gen en de bijbehorende signalering traject te identificeren door middel van diepgaande analyse van online databases en met behulp van genomics, transcriptomics en epigenomics Aanpak.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

De auteurs hebben niets te onthullen

Acknowledgments

Dit werk werd gedeeltelijk gesteund door de Stichting van de natuurwetenschappen van de provincie van Guangdong, China (nr. 2018A030313562), het onderwijs hervormings project van het klinische onderwijs van Guangdong basis (nr.  2016JDB092), National Natural Science Foundation van China (81600358), en de jeugd innovatieve talent project van hogescholen en universiteiten in de provincie Guangdong, China (NO. 2017KQNCX073)

Materials

Name Company Catalog Number Comments
A personal computer or computing device with an Internet browser with Javascript
enabled
Microsoft 051690762553 We support and test the following browsers: Google Chrome, Firefox 3.0 and above, Safari, and Internet Explorer 9.0 and above
Adobe Flash player Adobe Systems Inc. It can be freely downloaded from http://get.adobe.com/flashplayer/. This browser plug-in is required for visualizing networks on the network
analysis tab.
Chrome Broswer Google Inc. It can be freely downloaded from https://www.google.cn/chrome/ This is necessary for viewing PDF files including the Pathology Reports and many of
the downloadable files.
Java Runtime Environment Oracle Corporation It can be downloaded from http://www.java.com/getjava/.
Office 365 ProPlus for Faculty Microsoft 2003BFFD8117EA68 This is necessary for viewing the Pathology Reports and for viewing many of
the downloadable files.
Vectr Online Vectr Labs Inc. It can be freely used from https://vectr.com/new This is necessary for visualizing and editing many of
the downloadable files and pictures.

DOWNLOAD MATERIALS LIST

References

  1. van 't Veer, L. J., et al. Gene expression profiling predicts clinical outcome of breast cancer. Nature. 415 (6871), 530-536 (2002).
  2. Loi, S., et al. Definition of clinically distinct molecular subtypes in estrogen receptor-positive breast carcinomas through genomic grade. Journal of Clinical Oncology. 25 (10), 1239-1246 (2007).
  3. Cancer Genome Atlas, N. Comprehensive molecular portraits of human breast tumours. Nature. 490 (7418), 61-70 (2012).
  4. Emerson, J. W., Dolled-Filhart, M., Harris, L., Rimm, D. L., Tuck, D. P. Quantitative assessment of tissue biomarkers and construction of a model to predict outcome in breast cancer using multiple imputation. Cancer Informatics. 7, 29-40 (2009).
  5. Yu, H., et al. Integrative genomic and transcriptomic analysis for pinpointing recurrent alterations of plant homeodomain genes and their clinical significance in breast cancer. Oncotarget. 8 (8), 13099-13115 (2017).
  6. He, W., et al. TCGA datasetbased construction and integrated analysis of aberrantly expressed long noncoding RNA mediated competing endogenous RNA network in gastric cancer. Oncology Reports. , (2018).
  7. Liu, J., et al. An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics. Cell. 173 (2), e411 400-416 (2018).
  8. Esgueva, R., et al. Next-generation prostate cancer biobanking: toward a processing protocol amenable for the International Cancer Genome Consortium. Diagnostic Molecular Pathology. 21 (2), 61-68 (2012).
  9. Joly, Y., Dove, E. S., Knoppers, B. M., Bobrow, M., Chalmers, D. Data sharing in the post-genomic world: the experience of the International Cancer Genome Consortium (ICGC) Data Access Compliance Office (DACO). PLoS Computational Biology. 8 (7), e1002549 (2012).
  10. Zhang, J., et al. International Cancer Genome Consortium Data Portal--a one-stop shop for cancer genomics data. Database (Oxford). 2011, bar026 (2011).
  11. Rhodes, D. R., et al. ONCOMINE: a cancer microarray database and integrated data-mining platform. Neoplasia. 6 (1), 1-6 (2004).
  12. Rhodes, D. R., et al. Oncomine 3.0: genes, pathways, and networks in a collection of 18,000 cancer gene expression profiles. Neoplasia. 9 (2), 166-180 (2007).
  13. Jezequel, P., et al. bc-GenExMiner: an easy-to-use online platform for gene prognostic analyses in breast cancer. Breast Cancer Research and Treatment. 131 (3), 765-775 (2012).
  14. , Available from: http://co.bmc.lu.se/gobo/gsa.plb (2018).
  15. Ringner, M., Fredlund, E., Hakkinen, J., Borg, A., Staaf, J. GOBO: gene expression-based outcome for breast cancer online. PLoS One. 6 (3), e17911 (2011).
  16. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas--a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  17. Ponten, F., Schwenk, J. M., Asplund, A., Edqvist, P. H. The Human Protein Atlas as a proteomic resource for biomarker discovery. Journal of Internal Medicine. 270 (5), 428-446 (2011).
  18. Gyorffy, B., et al. An online survival analysis tool to rapidly assess the effect of 22,277 genes on breast cancer prognosis using microarray data of 1,809 patients. Breast Cancer Research and Treatment. 123 (3), 725-731 (2010).
  19. Stevinson, C., Lawlor, D. A. Searching multiple databases for systematic reviews: added value or diminishing returns? Complementary Therapies in Medicine. 12 (4), 228-232 (2004).
  20. Yin, J., et al. Integrating multiple genome annotation databases improves the interpretation of microarray gene expression data. BMC Genomics. 11, 50 (2010).
  21. Patel, D., Morton, D. J., Carey, J., Havrda, M. C., Chaudhary, J. Inhibitor of differentiation 4 (ID4): From development to cancer. Biochimica et Biophysica Acta. 1855 (1), 92-103 (2015).
  22. Kamalian, L., et al. Increased expression of Id family proteins in small cell lung cancer and its prognostic significance. Clinical Cancer Research. 14 (8), 2318-2325 (2008).
  23. Cruz-Rodriguez, N., et al. High expression of ID family and IGJ genes signature as predictor of low induction treatment response and worst survival in adult Hispanic patients with B-acute lymphoblastic leukemia. Journal of Experimental and Clinical Cancer Research. 35, 64 (2016).
  24. Yang, H. Y., et al. Expression and prognostic value of Id protein family in human breast carcinoma. Oncology Reports. 23 (2), 321-328 (2010).
  25. Zhou, X. L., et al. Prognostic values of the inhibitor of DNAbinding family members in breast cancer. Oncology Reports. 40 (4), 1897-1906 (2018).
  26. , Available from: https://www.oncomine.org (2018).
  27. Lin, H. Y., Zeng, L., iang, Y. K., Wei, X. L., Chen, C. F. GATA3 and TRPS1 are distinct biomarkers and prognostic factors in breast cancer: database mining for GATA family members in malignancies. Oncotarget. 8 (21), 34750-34761 (2017).
  28. , Available from: http://bcgenex.centregauducheau.fr/BCGEM/GEM-requete.php (2018).
  29. , Available from: https://www.proteinatlas.org (2018).
  30. , Available from: http://kmplot.com/analysis (2018).
  31. Zhu, Y. F., Dong, M. Expression of TUSC3 and its prognostic significance in colorectal cancer. Pathology-Research and Practice. 214 (9), 1497-1503 (2018).
  32. Nelson, J. C., et al. Validation sampling can reduce bias in health care database studies: an illustration using influenza vaccination effectiveness. Journal of Clinical Epidemiology. 66 (8 Suppl), S110-S121 (2013).
  33. Haibe-Kains, B., Desmedt, C., Sotiriou, C., Bontempi, G. A comparative study of survival models for breast cancer prognostication based on microarray data: does a single gene beat them all? Bioinformatics. 24 (19), 2200-2208 (2008).
  34. Yang, C., et al. Understanding genetic toxicity through data mining: the process of building knowledge by integrating multiple genetic toxicity databases. Toxicology Mechanisms and Methods. 18 (2-3), 277-295 (2008).
  35. Cannata, N., Merelli, E., Altman, R. B. Time to organize the bioinformatics resourceome. PLoS Computational Biology. 1 (7), e76 (2005).
  36. Wren, J. D., Bateman, A. Databases, data tombs and dust in the wind. Bioinformatics. 24 (19), 2127-2128 (2008).

Tags

Kankeronderzoek borstkanker biomarker database Data Mining prognose bioinformatie
Het uitvoeren van data mining en integratieve analyse van biomarker in borstkanker met behulp van meerdere openbaar toegankelijke databases
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Chen, M. n., Zeng, D., Zheng, Z. q., More

Chen, M. n., Zeng, D., Zheng, Z. q., Li, Z., Wu, J. l., Jin, J. y., Wang, H. j., Huang, C. z., Lin, H. y. Performing Data Mining And Integrative Analysis Of Biomarker in Breast Cancer Using Multiple Publicly Accessible Databases. J. Vis. Exp. (147), e59238, doi:10.3791/59238 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter