Waiting
로그인 처리 중...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

Udførelse af datamining og Integrativ analyse af biomarker i brystkræft ved hjælp af flere offentligt tilgængelige databaser

Published: May 17, 2019 doi: 10.3791/59238

Summary

Her præsenterer vi en protokol for at udforske biomarkør og overlevelses Prædikeren for brystkræft baseret på en omfattende analyse af puljede kliniske datasæt afledt af en række offentligt tilgængelige databaser, ved hjælp af strategien for udtryk, korrelation og overlevelse analyse trin for trin.

Abstract

I de seneste år, nye databaser blev designet til at sænke barriererne for at nærme sig indviklede kræft genomiske datasæt, dermed lette undersøgere til at analysere og fortolke gener, prøver og kliniske data på tværs af forskellige typer af kræft. Heri beskriver vi en praktisk Operations procedure, der tager ID1 (hæmmer af DNA-bindings proteiner 1) som et eksempel, for at karakterisere udtryks mønstrene for biomarkør og overlevelses indikatorer for brystkræft baseret på poolede kliniske datasæt afledt af online tilgængelige databaser, herunder ONCOMINE, bcGenExMiner v 4.0 (Breast Cancer gen-Expression minearbejder v 4.0), GOBO (gene Expression-baseret udfald for Breast Cancer online), HPA (det humane protein Atlas), og Kaplan-Meier plotter. Analysen begyndte med at forespørge på udtryks mønstret af genet af interesse (f. eks. ID1) i kræft prøver vs. normale prøver. Derefter blev korrelationsanalysen mellem ID1 og clinicopatologiske egenskaber ved brystkræft udført. Dernæst blev udtryks profilerne for ID1 stratificeret efter forskellige undergrupper. Endelig blev sammenslutningen mellem ID1 udtryk og overlevelses resultatet analyseret. Operations proceduren forenkler konceptet for at integrere multidimensionelle datatyper på genniveauet fra forskellige databaser og test hypoteser vedrørende gentagelse og genomisk kontekst af genmodificering af brystkræft. Denne metode kan forbedre troværdigheden og repræsentativitet af konklusionerne, dermed præsentere informative perspektiv på et gen af interesse.

Introduction

Brystkræft er en heterogen sygdom med forskellig prognose og behandlingsstrategier i forskellige molekylære subtyper, hvor patogenesen og udvikling sandsynligvis er forbundet med uensartede molekylære mekanismer1,2 , 3. men identifikation af et terapeutisk mål tager normalt år, eller endda årtier, fra første opdagelse i grundforskning til klinisk brug4. Genom bred anvendelse af høj-gennemløb sekventering teknologi for kræft genom har i høj grad fremmet processen med at søge efter værdifulde biomarkører eller terapeutiske mål 5.

Den overvældende mængde af kræft genomforskning data genereret fra de store kræft genomforskning platforme, såsom ICGC (International Cancer genom Consortium) og tcga (The Cancer genom Atlas), udgør en stor udfordring for forskerne at udføre data udforskning, integration og analyse, især for brugere, der mangler intensiv træning i Informatik og beregning6,7,8,9,10. I de seneste år er nye databaser (f. eks., ONCOMINE, bcGenExMiner v 4.0 og Kaplan-Meier-plotter osv.) designet og udviklet til at sænke linjen for at nærme sig de indviklede kræft genomdatasæt og derved gøre det lettere for efterforskerne at analysere og fortolke gener, prøver og kliniske data på tværs af forskellige typer af kræft11. Formålet med denne protokol er at beskrive en forskningsstrategi, der er integreret med flere niveauer af geninformation fra en række åbne databaser, som er blevet bredt anerkendt af et stort antal forskere, for at identificere de potentielle biomarkører og prognostiske faktorer for brystkræft.

ONCOMINE database er en web-baseret data-mining platform med kræft microarray information og er designet til at lette opdagelsen af nye biomarkører og terapeutiske mål11. I øjeblikket er der mere end 48.000.000 genekspressions målinger fra 65 genekspressions datasæt i denne database11,12. Den bcGenExMiner v 4.0 (et gratis værktøj til non-profit institution), også kaldet brystkræft gene-Expression miner, er en brugervenlig web-baseret applikation, der omfatter DNA-mikroarrays resultater af 3.414 genvundet brystkræftpatienter og 1.209 oplevede en nedsættende hændelse13. Det er designet til at forbedre genprognostisk analyse ydeevne med R statistisk software og pakker.

GOBO er et multifunktionelle brugervenligt online værktøj med mikroarrays oplysninger (f. eks Affymetrix U133A) fra en 51-prøve brystkræft cellelinje sæt og en 1881-prøve bryst tumordata sæt, der giver mulighed for en bred vifte af analyser14. Der er en bred vifte af applikationer til rådighed i GOBO database, som omfatter hurtig analyse af genekspression profiler i forskellige molekylære undertyper af brysttumorer og cellelinjer, screening for Co-udtrykte gener for skabelse af potentielle metagener, og korrelationsanalyse mellem resultater og genekspressions niveauer for enkelt gener, sæt af gener eller gensignaturer i datasættet for brystkræft15.

Human protein Atlas er et åbent program designet til videnskabsfolk til at udforske menneskelige proteome, som allerede har bidraget til en lang række publikationer inden for human biologi og sygdom. Det humane protein Atlas er anerkendt som en europæisk kerneressource for Life Science community16,17.

Kaplan Meier-plotteren er et online værktøj, der integrerer genekspression og kliniske data samtidigt, som gør det muligt at vurdere den prognostiske effekt af 54.675 gener baseret på 10.461 Cancer prøver, som omfatter 1.065 gastrisk, 2.437 lunge, 1.816 æggestokke og 5.143 brystcancer patienter med en gennemsnitlig opfølgning på 33/49/40/69 måneder18. Oplysninger om genekspression, recidiv-fri overlevelse (RFS) og samlet overlevelse (os) kan downloades fra denne database19,20.

Her beskriver vi en praktisk Operations procedure for brug af flere offentligt tilgængelige databaser til at sammenligne, analysere og visualisere mønstre af ændringer i udtrykket af det gen af interesse på tværs af flere kræft undersøgelser, med det formål at opsummere de udtryks profiler, prognostiske værdier og potentielle biologiske funktioner i brystkræft. For eksempel har nylige undersøgelser indikeret de onkogene egenskaber af ID-proteiner i tumorer og var forbundet med maligne egenskaber, herunder cellulær omdannelse, immortalisering, øget proliferation og metastase21, 22,23. Men, hvert medlem af ID-familien spiller forskellige roller i forskellige typer af solide tumorer, og deres rolle i brystkræft er stadig uklart24. I tidligere undersøgelser, udforsket gennem denne metode, fandt vi, at ID1 var en meningsfuld prognostisk indikator i brystkræft25. Derfor vil protokollen tage ID1 som et eksempel for at indføre datamining metoder.

Analysen starter fra at forespørge udtryks mønstret af genet af interesse i kræft prøver vs normale prøver i ONCOMINE. Derefter, udtrykket korrelation af gener af interesse i brystkræft blev udført ved hjælp af BC-GenExMiner v 4.0, GOBO, og ONCOMINE. Dernæst blev udtryks profilerne for ID1 stratificeret efter forskellige undergrupper ved hjælp af de tre ovennævnte databaser. Endelig, sammenslutningen mellem ID1 udtryk og overlevelse ud blev analyseret ved hjælp af BC-GenExMiner v 4.0, det humane protein Atlas, og Kaplan-Meier plotter. Operations proceduren blev vist som rutediagrammet i figur 1.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. analyse af udtryks mønster

  1. Gå til ONCOMINE-webgrænsefladen26.
  2. Opnå de relative udtryks niveauer af gen ID1 i forskellige typer af maligniteter ved at skrive ID1 til søgefeltet.
  3. Vælg analyse type i menuen primære filtre . Derefter, Vælg kræft vs normal analyse, brystkræft vs normal analyse.
  4. Vælg gen-oversigtsvisning i menuen andre visninger . Angiv tærsklen for P-værdi til 0,01. Download tallene.
    Bemærk: tærsklen for ændring af fold er 2, som beskrevet i det tidligere studie27.

2. udtryk korrelationsanalyse

  1. Gå til BC-GenExMiner v 4.0-webgrænsefladen28.
  2. Vælg korrelation i menuen analyse , og tryk på knappen udtømmende . Skriv ID1 i søgefeltet. Tryk på knappen Send og knappen Start analyse .
    Bemærk: standardindstilling viser udtryk korrelationsanalyse af alle patienter, som kan være mere nøjagtige i forskellige undertyper af brystkræft ved at trykke på molekyle under type filter.

3. under gruppe analyse

  1. Under gruppe analyse i BC-GenExMiner v 4.0
    1. Gå til BC-GenExMiner v 4.0-webgrænsefladen28.
    2. Vælg udtryk i analyse menuen, og tryk på knappen udtømmende . Skriv ID1 til søgefeltet og tryk på knappen Send og knappen Start analyse .
    3. Klik på nodal status (LN) og scarff Bloom & Richardson grade status (SBR) miniaturer for at se hele billeder. I SBR billeder, tryk på knappen nedenfor for at visualisere P-værdier af tallene. Download tallene.
  2. Under gruppe analyse i genekspression-baseret udfald for Breast Cancer online (GOBO)
    1. Gå til GOBO-webgrænsefladen14.
    2. Type gene symbol af interesse ID1 til skærmen upload gen sæt.
    3. Indstil søgeområdet for Definer gen/Probe-id'er til gensymbol. Sæt alle i tumor udvælgelse. Vælg node status og- grad stratificeret i multivariat-parametrene. Andre elementer forbliver standard. Indsend forespørgslen og download tallene.

4. overlevelse analyse

  1. Overlevelsesanalyse i BC-GenExMiner v 4.0
    1. Gå til BC-GenExMiner v 4.0-webgrænsefladen28.
    2. Vælg prognose i menuen analyse , og tryk på knappen udtømmende . Skriv ID1 til søgefeltet og tryk på knappen Send og knappen Start analyse .
    3. I den udtømmende prognostiske analyse skal du vælge nm, ERm, Mr i populations-og hændelses kriterierne og trykke på knappen Send for at få flere oplysninger. Tryk på Kaplan-Meier-kurve miniaturerne for at eksportere de komplette grafer.
      Bemærk: N (+,-, m): knude-status (+: positiv,-: negativ, m: blandet); ER (+,-, m): østrogen receptor status (+: positiv,-: negativ, m: blandet); MR: metastatisk recidiv
  2. Overlevelsesanalyse i human protein Atlas (HPA)
    1. Gå til human protein Atlas web interface29.
    2. Skriv ID1 til søgefeltet, og klik på knappen Søg . Vælg patologi sub-Atlas.
      Bemærk: mRNA-udtryks niveauerne på tværs af de 17 kræfttyper vises i afsnittet Oversigt for RNA-udtryk. Hver kræft vævs etiket af boksen plot er klikbare for at få adgang til en detaljeret side giver overlevelse analysedata og RNA udtryk niveauer.
    3. Klik på etiketten af brystkræft, så den detaljerede side for at vise interaktive overlevelse scatter plot og overlevelse analyse. Download tallene.
  3. Overlevelse analyse i Kaplan-Meier plotter overlevelse
    1. Gå til Kaplan-Meier plotter-webgrænsefladen30. Klik på Start km-plotter for brystkræft i mRNA-genchip zonen.
    2. Skriv ID1 til søgelinjen, og vælg det grønne element i kandidat menuen.
    3. Vælg RFS som overlevelses type og andre elementer forbliver standard. Klik på tegn Kaplan-Meier plot og download tallene.
      Bemærk: indstillinger for overlevelses typerne, cutoff-typerne og opfølgnings tærsklen samt indstillinger for sonde sættet kan ændres efter behov. Under gruppe prognostisk analyse, herunder ER, PR, hendes-2, lymfeknuder, grade, Tp53 status, og molekylære undertyper kan opnås ved at ændre indstillingen i Begræns analyse til undertyper boks1. På samme måde kan filter begrænsningen af behandlingen fastsættes i begrænsnings analyse til udvalgte kohorter ' box.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Et repræsentativt resultat af datamining og Integrativ analyse af brystcancer biomarkør blev udført ved hjælp af ID1, en af inhibitorer af DNA-bindende familiemedlemmer, som er blevet rapporteret i den tidligere undersøgelse 25.

Som påvist i figur 2blev forskellene i ID1 mRNA-udtryk mellem tumor og normalt væv i flere kræfttyper analyseret ved hjælp af ONCOMINE-databasen, som indeholdt i alt 445 unikke analyser. Der var 5 undersøgelser, som afslørede, at mRNA-ekspressions niveauet for ID1 var signifikant højere i normalt væv end i brystkræft væv. Disse data indikerede udtrykket dysregulering af ID1 i brystkræft. Figur 3 viste de bedste positive og negative korrelative gener af ID1 fra analysen udført i BC-GenExMiner v 4.0. For at identificere sammenhængen mellem mRNA-ekspression af ID1 og de clinicopatologiske parametre for BC-patienter blev BC-GenExMiner v 4.0-databasen brugt analysen. Som vist i figur 4blev mRNA-niveauet i ID1 signifikant forøget hos brystkræftpatienter uden lymfeknudemetastaser sammenlignet med lymfeknudemetastaser (P= 0,0005). Desuden viste analysen i GOBO, at forhøjede mRNA-niveauer af ID1 var korreleret til lavere tumor grad (figur 5, P< 0.00001). Disse resultater indebar, at øget ekspression af ID1 var forbundet med lavere metastatisk potentiale og lavere patologisk grad i BC. Analysen fra BC-GenExMiner v 4.0-databasen indikerede, at højere mRNA-niveau på ID1 var korreleret til længere Fjern metastase-fri overlevelse (DMFS) hos brystkræftpatienter (figur 6, hr = 0.82, 95% CI: 0,73-0,92, P= 0,001). Konsekvent, analyse fra Human protein Atlas foreslog, at forhøjet protein niveau af ID1 var forbundet med bedre overlevelse resultat hos brystkræftpatienter (figur 7, P= 0,0389). Overlevelsesanalyse fra Kaplan-Meier-plotteren viste også, at højere mRNA-niveau for ID1-udtryk forudsagde bedre overlevelse (RFS) hos brystkræftpatienter (figur 8, hr = 0.81, P= 0,00023).

Figure 1
Figur 1. Oversigt over at udforske udtryks mønstre og prognostiske værdier af forskellige brystkræft biomarkører og online databaser udvælgelse. En systematisk analyse af forskellige brystkræft biomarkører blev udført trin for trin i en række databaser. For det første udtrykket mønster af genet af interesse i kræft prøver vs normale prøver. Derefter, udtrykket korrelation af gener af interesse i brystkræft blev udført. Dernæst blev udtryks profilerne for ID1 stratificeret efter forskellige. Endelig, sammenslutningen mellem ID1 udtryk og overlevelse ud blev analyseret. Klik her for at se en større version af dette tal.

Figure 2
Figur 2. MRNA-udtryks mønstret for ID1 i forskellige typer af kræft hos mennesker. MRNA-udtrykket ID1 analyseres med ONCOMINE-databasen. Grafikken viste antallet af datasæt med statistisk signifikant mRNA-overekspression (rød) eller nedreguleret udtryk (blå) af målgenet. Tallet i hver celle repræsenterede antallet af analyser, der opfyldte tærsklen inden for disse analyser og kræfttyper. Genrang blev analyseret af percentil af målgenet i toppen af alle gener målt i hver forskning. Cellefarven blev bestemt af den bedste genrang fraktil for analyserne i cellen. P-værdien blev sat op på 0,01 og fold-ændring blev defineret som 2, som vist i den røde ramme. Dette tal er blevet ændret fra den tidligere undersøgelse25. Klik her for at se en større version af dette tal.

Figure 3
Figur 3. Genkorrelations analyse af ID1 i BC-GenExMiner v 4.0. MRNA Expression korrelation af ID1 og relevante gener i 5, 696 brystkræftpatienter inden for 36 undersøgelser analyseret i bcGenExMiner v 4.0. Dette tal er blevet ændret fra den tidligere undersøgelse25. Klik her for at se en større version af dette tal.

Figure 4
Figur 4. Forholdet mellem ID1 udtryk og lymfeknude metastase status. MRNA-udtryks niveauet på ID1 i 4, 307 brystkræftpatienter med forskellige lymfeknuder (LN)-status analyseret i bcGenExMiner v 4.0. Dette tal er blevet ændret fra den tidligere undersøgelse25. Klik her for at se en større version af dette tal.

Figure 5
Figur 5. Forholdet mellem genekspression niveau af ID1 og tumor grade. MRNA-udtryks niveauet for ID1 hos brystkræftpatienter med forskellige patologiske grader blev analyseret i GOBO. Den globale signifikante forskel mellem grupperne blev vurderet til at generere p-værdier, og p< 0,05 blev anset for at indikere en statistisk signifikant forskel. 1, 2, 3 i x-aksen står for undergrupper af patienter i forskellige patologiske grad 1, grad 2, grad 3. Dette tal er blevet ændret fra den tidligere undersøgelse 25. Klik her for at se en større version af dette tal.

Figure 6
Figur 6. De prognostiske værdier for ID1 for fjern metastaser-fri overlevelse hos brystkræftpatienter. Sammenslutningen mellem ID1 mRNA niveauer og fjerne metastaser-fri overlevelse estimater blev analyseret i bcGenExMiner v 4.0. Dette tal er blevet ændret fra den tidligere undersøgelse25. Klik her for at se en større version af dette tal.

Figure 7
Figur 7. Overlevelse sandsynlighed for ID1 hos brystkræftpatienter.  Virkningen af ID1 Proteinniveau for overlevelse af patienter med brystkræft blev analyseret i humant protein Atlas (HPA). Dette tal er blevet ændret fra den tidligere undersøgelse25. Klik her for at se en større version af dette tal.

Figure 8
Figur 8. De prognostiske værdier af ID1 i brystkræft i henhold til recidiverende-fri overlevelse (RFS). Forskellige ID1 mRNA-niveau i alle 3, 951 brystkræftpatienter analyseret i Kaplan-Meier-plotter. Dette tal er blevet ændret fra den tidligere undersøgelse25. Klik her for at se en større version af dette tal.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Omfattende analyse af offentlige databaser kan indikere den underliggende funktion af genet af interesse og afslører den potentielle forbindelse mellem dette gen og patologiske parametre i specifikke kræft27,31. Efterforskning og analyse baseret på en enkelt database kan give begrænsede eller isolerede perspektiver på grund af den potentielle selektions skævhed eller i et vist omfang, muligvis på grund af de mange forskellige data kvaliteter, herunder dataindsamling og den analytiske algoritme af databasen19. Det vigtigste skridt i denne protokol er at udvælge de relevante databaser, som i vid udstrækning bør anerkendes af et større antal videnskabsfolk med tilstrækkelig repræsentativitet. Investigator bør anvende flere databaser til at afprøve hypotesen og underbygge resultaterne fra forskellige databaser i stedet for at anvende en enkelt database.

Den her beskrevne protokol er en undersøgelses venlig Operations procedure. Fordelen ved denne metode er, at det giver mulighed for hurtig visualisering og fortolkning af et gen's potentielle rolle i brystkræft. Desuden kan alle de resultater, der opnås gennem denne procedure, straks testes og gentages ved blot at forespørge på de tilsvarende websteder. Begrænsningen af denne metode er, at de konklusioner, der kommer fra den omfattende analyse af databaserne, måske ikke ligefrem afspejler den faktiske funktion eller forholdet i den kliniske indstilling. Dette kunne stamme fra den systematiske bias af databasen, og i nogle tilfælde, eventuelt på grund af utilstrækkelige stikprøvestørrelse32,33. Brug af mere end én database til at forespørge det samme forskningsspørgsmål kunne gensidigt bekræfte resultaterne og øge troværdigheden af konklusionen34. Det anbefales kraftigt at anvende prøver fra investigatorinstitutionen til at verificere resultaterne, eller hvis det er muligt, til at udføre relaterede grundlæggende eksperimenter for at teste resultaterne.

Flere og flere online kræft genomforskning eller proteomics databaser vil være tilgængelige og tilgængelige for forskere35,36. Protokollen kan være en effektiv og økonomisk metode for forskeren til at identificere et potentielt målgen og den tilhørende signalerings pathway gennem dybtgående analyser af online databaser og ved hjælp af genomforskning, transkriptomics og epigenomics Tilgang.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har intet at afsløre

Acknowledgments

Dette arbejde blev delvist støttet af naturvidenskab Foundation af Guangdong provinsen, Kina (nr. 2018A030313562), undervisning reform projekt af Guangdong klinisk undervisning base (NO.  2016JDB092), national naturvidenskab Foundation i Kina (81600358), og ungdom innovative talent projekt af gymnasier og universiteter i Guangdong provinsen, Kina (NO. 2017KQNCX073)

Materials

Name Company Catalog Number Comments
A personal computer or computing device with an Internet browser with Javascript
enabled
Microsoft 051690762553 We support and test the following browsers: Google Chrome, Firefox 3.0 and above, Safari, and Internet Explorer 9.0 and above
Adobe Flash player Adobe Systems Inc. It can be freely downloaded from http://get.adobe.com/flashplayer/. This browser plug-in is required for visualizing networks on the network
analysis tab.
Chrome Broswer Google Inc. It can be freely downloaded from https://www.google.cn/chrome/ This is necessary for viewing PDF files including the Pathology Reports and many of
the downloadable files.
Java Runtime Environment Oracle Corporation It can be downloaded from http://www.java.com/getjava/.
Office 365 ProPlus for Faculty Microsoft 2003BFFD8117EA68 This is necessary for viewing the Pathology Reports and for viewing many of
the downloadable files.
Vectr Online Vectr Labs Inc. It can be freely used from https://vectr.com/new This is necessary for visualizing and editing many of
the downloadable files and pictures.

DOWNLOAD MATERIALS LIST

References

  1. van 't Veer, L. J., et al. Gene expression profiling predicts clinical outcome of breast cancer. Nature. 415 (6871), 530-536 (2002).
  2. Loi, S., et al. Definition of clinically distinct molecular subtypes in estrogen receptor-positive breast carcinomas through genomic grade. Journal of Clinical Oncology. 25 (10), 1239-1246 (2007).
  3. Cancer Genome Atlas, N. Comprehensive molecular portraits of human breast tumours. Nature. 490 (7418), 61-70 (2012).
  4. Emerson, J. W., Dolled-Filhart, M., Harris, L., Rimm, D. L., Tuck, D. P. Quantitative assessment of tissue biomarkers and construction of a model to predict outcome in breast cancer using multiple imputation. Cancer Informatics. 7, 29-40 (2009).
  5. Yu, H., et al. Integrative genomic and transcriptomic analysis for pinpointing recurrent alterations of plant homeodomain genes and their clinical significance in breast cancer. Oncotarget. 8 (8), 13099-13115 (2017).
  6. He, W., et al. TCGA datasetbased construction and integrated analysis of aberrantly expressed long noncoding RNA mediated competing endogenous RNA network in gastric cancer. Oncology Reports. , (2018).
  7. Liu, J., et al. An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics. Cell. 173 (2), e411 400-416 (2018).
  8. Esgueva, R., et al. Next-generation prostate cancer biobanking: toward a processing protocol amenable for the International Cancer Genome Consortium. Diagnostic Molecular Pathology. 21 (2), 61-68 (2012).
  9. Joly, Y., Dove, E. S., Knoppers, B. M., Bobrow, M., Chalmers, D. Data sharing in the post-genomic world: the experience of the International Cancer Genome Consortium (ICGC) Data Access Compliance Office (DACO). PLoS Computational Biology. 8 (7), e1002549 (2012).
  10. Zhang, J., et al. International Cancer Genome Consortium Data Portal--a one-stop shop for cancer genomics data. Database (Oxford). 2011, bar026 (2011).
  11. Rhodes, D. R., et al. ONCOMINE: a cancer microarray database and integrated data-mining platform. Neoplasia. 6 (1), 1-6 (2004).
  12. Rhodes, D. R., et al. Oncomine 3.0: genes, pathways, and networks in a collection of 18,000 cancer gene expression profiles. Neoplasia. 9 (2), 166-180 (2007).
  13. Jezequel, P., et al. bc-GenExMiner: an easy-to-use online platform for gene prognostic analyses in breast cancer. Breast Cancer Research and Treatment. 131 (3), 765-775 (2012).
  14. , Available from: http://co.bmc.lu.se/gobo/gsa.plb (2018).
  15. Ringner, M., Fredlund, E., Hakkinen, J., Borg, A., Staaf, J. GOBO: gene expression-based outcome for breast cancer online. PLoS One. 6 (3), e17911 (2011).
  16. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas--a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  17. Ponten, F., Schwenk, J. M., Asplund, A., Edqvist, P. H. The Human Protein Atlas as a proteomic resource for biomarker discovery. Journal of Internal Medicine. 270 (5), 428-446 (2011).
  18. Gyorffy, B., et al. An online survival analysis tool to rapidly assess the effect of 22,277 genes on breast cancer prognosis using microarray data of 1,809 patients. Breast Cancer Research and Treatment. 123 (3), 725-731 (2010).
  19. Stevinson, C., Lawlor, D. A. Searching multiple databases for systematic reviews: added value or diminishing returns? Complementary Therapies in Medicine. 12 (4), 228-232 (2004).
  20. Yin, J., et al. Integrating multiple genome annotation databases improves the interpretation of microarray gene expression data. BMC Genomics. 11, 50 (2010).
  21. Patel, D., Morton, D. J., Carey, J., Havrda, M. C., Chaudhary, J. Inhibitor of differentiation 4 (ID4): From development to cancer. Biochimica et Biophysica Acta. 1855 (1), 92-103 (2015).
  22. Kamalian, L., et al. Increased expression of Id family proteins in small cell lung cancer and its prognostic significance. Clinical Cancer Research. 14 (8), 2318-2325 (2008).
  23. Cruz-Rodriguez, N., et al. High expression of ID family and IGJ genes signature as predictor of low induction treatment response and worst survival in adult Hispanic patients with B-acute lymphoblastic leukemia. Journal of Experimental and Clinical Cancer Research. 35, 64 (2016).
  24. Yang, H. Y., et al. Expression and prognostic value of Id protein family in human breast carcinoma. Oncology Reports. 23 (2), 321-328 (2010).
  25. Zhou, X. L., et al. Prognostic values of the inhibitor of DNAbinding family members in breast cancer. Oncology Reports. 40 (4), 1897-1906 (2018).
  26. , Available from: https://www.oncomine.org (2018).
  27. Lin, H. Y., Zeng, L., iang, Y. K., Wei, X. L., Chen, C. F. GATA3 and TRPS1 are distinct biomarkers and prognostic factors in breast cancer: database mining for GATA family members in malignancies. Oncotarget. 8 (21), 34750-34761 (2017).
  28. , Available from: http://bcgenex.centregauducheau.fr/BCGEM/GEM-requete.php (2018).
  29. , Available from: https://www.proteinatlas.org (2018).
  30. , Available from: http://kmplot.com/analysis (2018).
  31. Zhu, Y. F., Dong, M. Expression of TUSC3 and its prognostic significance in colorectal cancer. Pathology-Research and Practice. 214 (9), 1497-1503 (2018).
  32. Nelson, J. C., et al. Validation sampling can reduce bias in health care database studies: an illustration using influenza vaccination effectiveness. Journal of Clinical Epidemiology. 66 (8 Suppl), S110-S121 (2013).
  33. Haibe-Kains, B., Desmedt, C., Sotiriou, C., Bontempi, G. A comparative study of survival models for breast cancer prognostication based on microarray data: does a single gene beat them all? Bioinformatics. 24 (19), 2200-2208 (2008).
  34. Yang, C., et al. Understanding genetic toxicity through data mining: the process of building knowledge by integrating multiple genetic toxicity databases. Toxicology Mechanisms and Methods. 18 (2-3), 277-295 (2008).
  35. Cannata, N., Merelli, E., Altman, R. B. Time to organize the bioinformatics resourceome. PLoS Computational Biology. 1 (7), e76 (2005).
  36. Wren, J. D., Bateman, A. Databases, data tombs and dust in the wind. Bioinformatics. 24 (19), 2127-2128 (2008).

Tags

Kræftforskning brystkræft biomarker database data mining prognose Bioinformation
Udførelse af datamining og Integrativ analyse af biomarker i brystkræft ved hjælp af flere offentligt tilgængelige databaser
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Chen, M. n., Zeng, D., Zheng, Z. q., More

Chen, M. n., Zeng, D., Zheng, Z. q., Li, Z., Wu, J. l., Jin, J. y., Wang, H. j., Huang, C. z., Lin, H. y. Performing Data Mining And Integrative Analysis Of Biomarker in Breast Cancer Using Multiple Publicly Accessible Databases. J. Vis. Exp. (147), e59238, doi:10.3791/59238 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter