Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

Utføre data mining og integrerende analyse av biomarkør i brystkreft bruke flere allment tilgjengelige databaser

Published: May 17, 2019 doi: 10.3791/59238

Summary

Her presenterer vi en protokoll for å utforske biomarkør og overlevelse som er en indikasjon på brystkreft basert på den omfattende analysen av samlede kliniske datasett avledet fra en rekke offentlig tilgjengelige databaser, ved hjelp av uttrykks strategi, korrelasjon og overlevelse analyse trinn for trinn.

Abstract

I de senere årene, nye databaser ble utviklet for å senke barrierer for nærmer seg intrikate kreft genomisk datasett, og dermed tilrettelegge etterforskere til å analysere og tolke gener, prøver og kliniske data på tvers av ulike typer kreft. Heri, beskriver vi en praktisk operasjon prosedyre, tar ID1 (hemmer av DNA bindende proteiner 1) som et eksempel, for å karakterisere uttrykket mønstre av biomarkør og overlevelse prediktorer av brystkreft basert på samlede kliniske datasett avledet fra Online tilgjengelige databaser, inkludert ONCOMINE, bcGenExMiner v 4.0 (brystkreft gen-uttrykk miner v 4.0), GOBO (Gene Expression-basert utfall for brystkreft online), HPA (den menneskelige protein Atlas), og Kaplan-Meier plotter. Analysen begynte med å spørre uttrykket mønster av genet av interesse (f. eks, ID1) i kreft prøver kontra normale prøver. Deretter ble korrelasjons analysen mellom ID1 og clinicopathological egenskaper i brystkreft utført. Deretter ble uttrykks profilene til ID1 lagdelt i henhold til ulike undergrupper. Til slutt ble tilknytningen mellom ID1 uttrykk og overlevelses utfall analysert. Operasjons prosedyren forenkler konseptet med å integrere flerdimensjonale datatyper på gen nivået fra ulike databaser og test hypoteser om gjentakelse og genomisk kontekst for gen endring i brystkreft. Denne metoden kan forbedre troverdigheten og representativitet av konklusjonene, og dermed presentere informativt perspektiv på et gen av interesse.

Introduction

Brystkreft er en heterogen sykdom med ulike prognose og behandling strategier i ulike molekylære under typer, der patogenesen og utvikling er trolig forbundet med ulike molekylære mekanismer1,2 , 3. men å identifisere et terapeutisk mål tar vanligvis år, eller til og med flere ti år, fra første oppdagelse i grunnleggende forskning til klinisk bruk4. Genova bred anvendelse av høy-produksjon sekvensering teknologien for kreften Genova har høyeste avansert prosessen av forskende for kostbar biomarkører eller terapeutisk mål 5.

Den overveldende mengden av kreft Genomics data generert fra stor skala kreft Genomics plattformer, slik som ICGC (International Cancer Genova Consortium) og TCGA (The Cancer Genova Atlas), er poserer en stor utfordring for forskere å utføre data leting, integrasjon og analyse, spesielt for brukere som mangler intensiv opplæring i informatikk og beregning6,7,8,9,10. I de senere årene, nye databaser, (f. eks, ONCOMINE, bcGenExMiner v 4.0, og Kaplan-Meier plotter, etc.) ble designet og utviklet for å senke bar for nærmer seg intrikate kreft genomisk datasett, og dermed tilrettelegge etterforskere å analysere og tolke gener, prøver og kliniske data på tvers av ulike typer kreft11. Målet med denne protokollen er å beskrive en forskningsstrategi som integreres med flere nivåer av gen informasjon fra en rekke åpne tilgang databaser, som har blitt allment anerkjent av et stort antall forskere, for å identifisere de potensielle biomarkører og Prognostisk faktorer for brystkreft.

Den ONCOMINE databasen er en Web-basert data-mining plattform med kreft Microarray informasjon og er utformet for å lette oppdagelsen av romanen biomarkører og terapeutiske mål11. For tiden er det mer enn 48 000 000 genuttrykk målinger fra 65 Gene Expression datasett i denne databasen11,12. Den bcGenExMiner v 4.0 (et gratis verktøy for non-profit institusjon), også kalt brystkreft Gene-Expression miner, er en bruker-vennlig Web-basert applikasjon bestående av DNA Microarrays resultatene av 3 414 gjenvunnet brystkreftpasienter og 1 209 opplevde en nedsettende hendelse13. Den er designet for å forbedre gen Prognostisk analyse ytelse med R statistisk programvare og pakker.

Den GOBO er et multifunksjonelt brukervennlig online verktøy med Microarrays informasjon (f. eks Affymetrix U133A) fra en 51-sample brystkreft cellelinje sett og en 1881-sample bryst tumor datasett, som gjør at en rekke analyser14. Det finnes en rekke programmer tilgjengelig i GOBO database, som inkluderer rask analyse av genuttrykk profiler i ulike molekylære undergrupper av brystkreft svulster og cellelinjer, screening for co-uttrykt gener for etablering av potensielle metagenes, og korrelasjon analyse mellom utfall og genuttrykk nivåer av enkelt gener, sett av gener, eller gen underskrifter i brystkreft datasett15.

Human protein Atlas er en åpen tilgang program utviklet for forskere å utforske menneskelig proteom, som allerede har bidratt til et stort antall publikasjoner innen menneskets biologi og sykdom. Den menneskelige protein Atlas er anerkjent som en europeisk kjerne ressurs for Life Science Community16,17.

Den Kaplan Meier plotter er et nettbasert verktøy integrere genuttrykk og kliniske data samtidig som tillater vurdering av Prognostisk effekten av 54 675 gener basert på 10 461 kreft prøver, som inkluderer 1 065 mage, 2 437 lunge, 1 816 eggstokkene og 5 143 brystkreftpasienter med en gjennomsnittlig oppfølging av 33/49/40/69 måneder18. Informasjon om genuttrykk, overlevelse uten tilbakefall (RFs) og total overlevelse (OS) kan lastes ned fra denne databasen19,20.

Her beskriver vi en praktisk operasjonsprosedyre for å bruke flere offentlig tilgjengelige databaser for å sammenligne, analysere og visualisere mønstre av endringer i uttrykket av genet av interesse på tvers av flere kreft studier, med mål om å oppsummere uttrykks profiler, Prognostisk verdier og potensielle biologiske funksjoner i brystkreft. For eksempel har nyere studier indikert de kreftfremkallende egenskapene til ID proteiner i svulster og var assosiert med ondartede funksjoner, inkludert cellulær transformasjon, immortalization, forbedret spredning og metastasering21, 22,23. Men hvert medlem av ID-familien spiller forskjellige roller i ulike typer solide svulster, og deres rolle i brystkreft er fortsatt uklart24. I tidligere studier, utforsket gjennom denne metoden, fant vi ut at ID1 var en meningsfull Prognostisk indikator i brystkreft25. Derfor protokollen vil ta ID1 som et eksempel for å innføre data mining metoder.

Analysen starter fra spørring uttrykket mønster av genet av interesse i kreft prøver kontra normale prøver i ONCOMINE. Deretter ble uttrykket korrelasjon av gener av interesse for brystkreft utført ved hjelp av BC-GenExMiner v 4.0, GOBO, og ONCOMINE. Deretter ble uttrykks profilene til ID1 lagdelt i henhold til ulike undergrupper ved hjelp av de tre databasene ovenfor. Til slutt ble foreningen mellom ID1 uttrykk og overlevelse ut analysert ved hjelp av BC-GenExMiner v 4.0, den menneskelige protein Atlas, og Kaplan-Meier plotter. Operasjons prosedyren ble vist som flytskjema i figur 1.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. uttrykk mønster analyse

  1. Gå til ONCOMINE web-grensesnitt26.
  2. Skaff de relative uttrykks nivåene for gen ID1 i ulike typer ondartet ved å skrive ID1 i søkeboksen.
  3. Velg analyse type fra Primær filtre -menyen. Deretter velger kreft kontra normal analyse, brystkreft vs normal analyse.
  4. Velg gen sammendragsvisning fra den andre visninger -menyen. Angi terskelen for P-verdi ved 0,01. Last ned tallene.
    Merk: terskelen til fold endring er 2, som beskrevet i forrige studie27.

2. analyse av uttrykks korrelasjon

  1. Gå til webgrensesnittet for BC-GenExMiner v 4.028.
  2. Velg korrelasjon fra analyse -menyen, trykk på ut tømmende -knappen. Type ID1 å gjennomsøkningen bokse med. Trykk på Send -knappen og Start analyse knappen.
    Merk: standardinnstillingen viser uttrykks korrelasjons analyse for alle pasienter, som kan være mer nøyaktig i ulike under typer av brystkreft ved å trykke på molekyl under type filteret.

3. analyse av undergruppe

  1. Undergruppeanalyse i BC-GenExMiner v 4.0
    1. Gå til webgrensesnittet for BC-GenExMiner v 4.028.
    2. Velg uttrykk fra analyse -menyen, trykk på ut tømmende -knappen. Type ID1 å gjennomsøkningen bokse med og presse det underkaste seg knapp og starten analyse knapp.
    3. Klikk på Nodal-status (ln) og SCARFF Bloom & Richardson (SBR) miniatyrbilder for å vise fullstendige bilder. I SBR-bildene trykker du på knappen nedenfor for å visualisere P-verdiene til figurene. Last ned tallene.
  2. Undergruppeanalyse i Gene Expression-basert utfall for brystkreft online (GOBO)
    1. Gå til GOBO Web Interface14.
    2. Type Gene symbol av interesse ID1 til skjermen laste opp genet sett.
    3. Angi søkeområdet for definere gen/probe-identifikatorer til gen symbol. Sett alle i tumor valg. Velg status for noden og Vurder lagdelt i multivariabel parametere. Andre elementer forblir standard. Send inn henvendelsen og Last ned tallene.

4. overlevelse analyse

  1. Overlevelse analyse i BC-GenExMiner v 4.0
    1. Gå til webgrensesnittet for BC-GenExMiner v 4.028.
    2. Velg Prognostisk fra analyse -menyen, trykk på ut tømmende -knappen. Type ID1 å gjennomsøkningen bokse med og presse det underkaste seg knapp og starten analyse knapp.
    3. I den uttømmende Prognostisk-analysen velger du NM, ERm, Mr i populasjonen og hendelses kriterier og trykker på submit -knappen for å få mer informasjon. Trykk på miniatyrbildene av Kaplan-Meier-kurven for å eksportere hele grafene.
      Merk: N (+,-, m): Nodal status (+: positiv,-: negativ, m: Mixed); ER (+,-, m): østrogen reseptor status (+: positiv,-: negativ, m: blandet); MR: metastatisk tilbakefall
  2. Survival analyse i Human protein Atlas (HPA)
    1. Gå til Human protein Atlas webgrensesnitt29.
    2. Type ID1 å gjennomsøkningen bokse med og falle i staver gjennom søkningen knapp. Velg patologi sub-Atlas.
      Merk: mRNA-uttrykks nivåene på tvers av de 17 kreft typene vises i oversiktsdelen for RNA-uttrykk. Hver kreft vev etiketten av boksen tomten er klikkbare å få tilgang til en detaljert side som gir overlevelse analysedata og RNA uttrykks nivåer.
    3. Klikk på etiketten av brystkreft, så den detaljerte siden for å vise interaktive overlevelse scatter plot og overlevelse analyse. Last ned tallene.
  3. Overlevelse analyse i Kaplan-Meier plotter Survival
    1. Gå til Kaplan-Meier plotter nettgrensesnitt30. Klikk Start km plotter for brystkreft i mRNA genet chip sone.
    2. Skriv inn ID1 i søkefeltet, og velg det grønne elementet i kandidat menyen.
    3. Velg RFs AS Survival type og andre elementer forblir standard. Klikk tegn Kaplan-Meier plot og laste ned tallene.
      Merk: innstillinger for overlevelses typer, cut-typer og oppfølgings terskel, samt alternativer for sonde-sett, kan endres etter behov. Undergruppe Prognostisk analyse inkludert ER, PR, HER-2, lymfeknuter, klasse, Tp53 status, og molekylære under typer kan fås ved å endre innstillingen i begrense analysen til under typer boks1. På samme måte kan filter begrensningen av behandling angis i Begrens analyse til den valgte kohorter -boksen.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Et representativt resultat av data mining og integrerende analyse av brystkreft biomarkør ble utført ved hjelp av ID1, en av hemmere av DNA-bindende familiemedlemmer, som har vært rapportert i forrige studie 25.

Som demonstrert i figur 2, ble forskjellene av ID1 mRNA uttrykk mellom tumor og normalt vev i flere typer kreft analysert ved hjelp av ONCOMINE database, som inneholdt totalt 445 unike analyser. Det var 5 studier som avslørte at mRNA uttrykket nivået på ID1 var signifikant høyere i normal vev enn i brystkreft vev. Disse dataene indikerte uttrykket feilregulering av ID1 i brystkreft. Figur 3 viste de beste positive og negative correlative GENER av ID1 fra analysen utført i BC-GenExMiner v 4.0. For å identifisere sammenhengen mellom mRNA-uttrykk for ID1 og clinicopathological parametere for BC-pasienter, ble BC-GenExMiner v 4.0-databasen brukt analysen. Som vist i Figur 4, betydelig økt mRNA nivå av ID1 ble funnet i brystkreftpasienter uten lymfe node metastasering, sammenlignet med de med lymfeknuter metastasering (P= 0,0005). Videre analysen i GOBO demonstrerte at økt mRNA nivåer av ID1 ble korrelert til lavere tumor karakter (figur 5, P< 0.00001). Disse resultatene antydet at økt uttrykk for ID1 var knyttet til lavere metastatisk potensial og lavere patologisk karakter i BC. Analysen fra BC-GenExMiner v 4.0-databasen indikerte at høyere mRNA nivå på ID1 var korrelert med lengre fjernt metastasering overlevelse (DMFS) hos brystkreftpasienter (figur 6, hr = 0.82, 95% CI: 0.73-0.92, P= 0,001). Konsekvent, analyse fra Human protein Atlas foreslo at forhøyet protein nivå ID1 var assosiert med bedre overlevelse utfall i brystkreftpasienter (figur 7, P= 0,0389). Survival analyse fra Kaplan-Meier plotter viste også at høyere mRNA nivå ID1 uttrykk spådd bedre gjentakelse-fri overlevelse (RFS) i brystkreftpasienter (Figur 8, hr = 0.81, P= 0,00023).

Figure 1
Figur 1. Oversikt over å utforske uttrykket mønstre og Prognostisk verdier av distinkte brystkreft biomarkører og online databaser utvalg. Systematisk analyse av distinkte brystkreft biomarkører ble utført trinn for trinn i en rekke databaser. Først uttrykket mønster av genet av interesse for kreft prøver kontra normale prøver. Deretter ble uttrykket korrelasjon av gener av interesse for brystkreft utført. Deretter ble uttrykks profilene til ID1 lagdelt i henhold til forskjellige. Til slutt ble foreningen mellom ID1 uttrykk og overlevelse analysert. Vennligst klikk her for å se en større versjon av dette tallet.

Figure 2
Figur 2. Den mRNA uttrykk mønster av ID1 i ulike typer av menneskelig kreft. MRNA-uttrykket for ID1 analysert med ONCOMINE-databasen. Grafikken demonstrerte antall datasett med statistisk signifikant mRNA overuttrykte (rød) eller downregulated uttrykk (blå) av mål genet. Tallet i hver celle representerte antall analyser som oppfyller terskelen innenfor disse analyse-og kreft typene. Gen rangeringen ble analysert med persentil av målet genet i toppen av alle gener målt i hver forskning. Cellefarge ble bestemt av den beste gen rang persentil for analysene i cellen. P-verdien ble satt opp på 0,01 og fold-endring ble definert som 2, som vist i den røde rammen. Dette tallet er endret fra forrige studie25. Vennligst klikk her for å se en større versjon av dette tallet.

Figure 3
Figur 3. Gen korrelasjon analyse av ID1 i BC-GenExMiner v 4.0. Den mRNA uttrykk korrelasjon av ID1 og relevante gener i 5, 696 brystkreftpasienter innen 36 studier analysert i bcGenExMiner v 4.0. Dette tallet er endret fra forrige studie25. Vennligst klikk her for å se en større versjon av dette tallet.

Figure 4
Figur 4. Forholdet mellom ID1-uttrykk og metastasering status for lymfe-noder. Det mRNA uttrykket nivå av ID1 i 4, 307 brystkreftpasienter med ulik lymfe node (LN) status analysert i bcGenExMiner v 4.0. Dette tallet er endret fra forrige studie25. Vennligst klikk her for å se en større versjon av dette tallet.

Figure 5
Figur 5. Forholdet mellom genuttrykket nivå ID1 og tumor karakter. Den mRNA uttrykket nivå av ID1 i brystkreftpasienter med ulik patologisk karakter ble analysert i GOBO. Den globale signifikant forskjell mellom grupper ble vurdert til å generere p-verdier og p< 0,05 ble ansett for å indikere en statistisk signifikant forskjell. 1, 2, 3 i x-aksen står for undergrupper av pasienter i ulike patologiske grad 1, grad 2, grad 3. Dette tallet er endret fra forrige studie 25. Vennligst klikk her for å se en større versjon av dette tallet.

Figure 6
Figur 6. De Prognostisk verdiene til ID1 for Fjern metastasering overlevelse hos brystkreftpasienter. Foreningen mellom ID1 mRNA nivåer og fjerne metastasering overlevelse anslag ble analysert i bcGenExMiner v 4.0. Dette tallet er endret fra forrige studie25. Vennligst klikk her for å se en større versjon av dette tallet.

Figure 7
Figur 7. Overlevelse sannsynlighet for ID1 i brystkreftpasienter.  Virkningen av ID1 protein nivå for overlevelse av pasienter med brystkreft ble analysert i Human protein Atlas (HPA). Dette tallet er endret fra forrige studie25. Vennligst klikk her for å se en større versjon av dette tallet.

Figure 8
Figur 8. De Prognostisk verdiene av ID1 i brystkreft i henhold til tilbakevendende fri overlevelse (RFS). Ulike ID1 mRNA nivå i alle 3, 951 brystkreftpasienter analysert i Kaplan-Meier plotter. Dette tallet er endret fra forrige studie25. Vennligst klikk her for å se en større versjon av dette tallet.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Omfattende analyse av offentlige databaser kan indikere den underliggende funksjonen av genet av interesse og avdekke den potensielle koblingen mellom dette genet og clinicopathological parametere i bestemte kreft27,31. Leting og analyse basert på en enkelt database kan gi begrensede eller isolerte perspektiver på grunn av den potensielle utvalgs bias, eller i en viss grad, muligens på grunn av mangfoldet av datakvalitet, inkludert datainnsamling og analytisk algoritme av databasen19. Det viktigste trinnet i denne protokollen er å velge de riktige databasene, som bør være allment anerkjent av et større antall forskere med tilstrekkelig representativitet. Undersøkeren bør bruke flere databaser for å teste hypotesen og bekrefte resultatene avledet fra ulike databaser, i stedet for å bruke en enkelt database.

Protokollen er beskrevet her er en etterforsker vennlig operasjon prosedyre. Fordelen med denne metoden er at det gir mulighet for rask visualisering og tolkning av et gen potensielle rolle i brystkreft. Videre, alle resultatene oppnås gjennom denne prosedyren kan umiddelbart testet og gjentas ved å spørre den tilsvarende nettsteder. Begrensningen av denne metoden er at konklusjonene som kommer fra den omfattende analysen av databasene ikke nødvendigvis gjenspeiler den faktiske funksjonen eller forholdet i den kliniske innstillingen. Dette kan stamme fra systematisk skjevhet i databasen, og i noen tilfeller muligens på grunn av utilstrekkelig utvalgsstørrelse32,33. Bruke mer enn én database for å spørre samme forskningen spørsmålet kan gjensidig bekrefte resultatene og øke troverdigheten til konklusjonen34. Det anbefales på det sterkeste å bruke prøver fra undersøkelses institusjonen for å verifisere resultatene, eller hvis det er mulig, å utføre relaterte grunnleggende eksperimenter for å teste resultatene.

Flere og flere online Cancer Genomics eller Proteomikk databaser vil være tilgjengelig og tilgjengelig for forskere35,36. Protokollen kan gi en effektiv og økonomisk metode for forskeren å identifisere en potensiell mål genet og tilhørende signalering veien gjennom inngående analyse av online databaser og ved hjelp Genomics, transcriptomics, og epigenomics Tilnærming.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har ingenting å avsløre

Acknowledgments

Dette arbeidet ble delvis støttet av Natural Science Foundation of Guangdong-provinsen, Kina (no. 2018A030313562), den Teaching reform prosjekt av Guangdong klinisk undervisning Base (nr.  2016JDB092), National Natural Science Foundation i Kina (81600358), og Youth innovative talent prosjekt for høyskoler og universiteter i Guangdong-provinsen, Kina (NO. 2017KQNCX073)

Materials

Name Company Catalog Number Comments
A personal computer or computing device with an Internet browser with Javascript
enabled
Microsoft 051690762553 We support and test the following browsers: Google Chrome, Firefox 3.0 and above, Safari, and Internet Explorer 9.0 and above
Adobe Flash player Adobe Systems Inc. It can be freely downloaded from http://get.adobe.com/flashplayer/. This browser plug-in is required for visualizing networks on the network
analysis tab.
Chrome Broswer Google Inc. It can be freely downloaded from https://www.google.cn/chrome/ This is necessary for viewing PDF files including the Pathology Reports and many of
the downloadable files.
Java Runtime Environment Oracle Corporation It can be downloaded from http://www.java.com/getjava/.
Office 365 ProPlus for Faculty Microsoft 2003BFFD8117EA68 This is necessary for viewing the Pathology Reports and for viewing many of
the downloadable files.
Vectr Online Vectr Labs Inc. It can be freely used from https://vectr.com/new This is necessary for visualizing and editing many of
the downloadable files and pictures.

DOWNLOAD MATERIALS LIST

References

  1. van 't Veer, L. J., et al. Gene expression profiling predicts clinical outcome of breast cancer. Nature. 415 (6871), 530-536 (2002).
  2. Loi, S., et al. Definition of clinically distinct molecular subtypes in estrogen receptor-positive breast carcinomas through genomic grade. Journal of Clinical Oncology. 25 (10), 1239-1246 (2007).
  3. Cancer Genome Atlas, N. Comprehensive molecular portraits of human breast tumours. Nature. 490 (7418), 61-70 (2012).
  4. Emerson, J. W., Dolled-Filhart, M., Harris, L., Rimm, D. L., Tuck, D. P. Quantitative assessment of tissue biomarkers and construction of a model to predict outcome in breast cancer using multiple imputation. Cancer Informatics. 7, 29-40 (2009).
  5. Yu, H., et al. Integrative genomic and transcriptomic analysis for pinpointing recurrent alterations of plant homeodomain genes and their clinical significance in breast cancer. Oncotarget. 8 (8), 13099-13115 (2017).
  6. He, W., et al. TCGA datasetbased construction and integrated analysis of aberrantly expressed long noncoding RNA mediated competing endogenous RNA network in gastric cancer. Oncology Reports. , (2018).
  7. Liu, J., et al. An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics. Cell. 173 (2), e411 400-416 (2018).
  8. Esgueva, R., et al. Next-generation prostate cancer biobanking: toward a processing protocol amenable for the International Cancer Genome Consortium. Diagnostic Molecular Pathology. 21 (2), 61-68 (2012).
  9. Joly, Y., Dove, E. S., Knoppers, B. M., Bobrow, M., Chalmers, D. Data sharing in the post-genomic world: the experience of the International Cancer Genome Consortium (ICGC) Data Access Compliance Office (DACO). PLoS Computational Biology. 8 (7), e1002549 (2012).
  10. Zhang, J., et al. International Cancer Genome Consortium Data Portal--a one-stop shop for cancer genomics data. Database (Oxford). 2011, bar026 (2011).
  11. Rhodes, D. R., et al. ONCOMINE: a cancer microarray database and integrated data-mining platform. Neoplasia. 6 (1), 1-6 (2004).
  12. Rhodes, D. R., et al. Oncomine 3.0: genes, pathways, and networks in a collection of 18,000 cancer gene expression profiles. Neoplasia. 9 (2), 166-180 (2007).
  13. Jezequel, P., et al. bc-GenExMiner: an easy-to-use online platform for gene prognostic analyses in breast cancer. Breast Cancer Research and Treatment. 131 (3), 765-775 (2012).
  14. , Available from: http://co.bmc.lu.se/gobo/gsa.plb (2018).
  15. Ringner, M., Fredlund, E., Hakkinen, J., Borg, A., Staaf, J. GOBO: gene expression-based outcome for breast cancer online. PLoS One. 6 (3), e17911 (2011).
  16. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas--a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  17. Ponten, F., Schwenk, J. M., Asplund, A., Edqvist, P. H. The Human Protein Atlas as a proteomic resource for biomarker discovery. Journal of Internal Medicine. 270 (5), 428-446 (2011).
  18. Gyorffy, B., et al. An online survival analysis tool to rapidly assess the effect of 22,277 genes on breast cancer prognosis using microarray data of 1,809 patients. Breast Cancer Research and Treatment. 123 (3), 725-731 (2010).
  19. Stevinson, C., Lawlor, D. A. Searching multiple databases for systematic reviews: added value or diminishing returns? Complementary Therapies in Medicine. 12 (4), 228-232 (2004).
  20. Yin, J., et al. Integrating multiple genome annotation databases improves the interpretation of microarray gene expression data. BMC Genomics. 11, 50 (2010).
  21. Patel, D., Morton, D. J., Carey, J., Havrda, M. C., Chaudhary, J. Inhibitor of differentiation 4 (ID4): From development to cancer. Biochimica et Biophysica Acta. 1855 (1), 92-103 (2015).
  22. Kamalian, L., et al. Increased expression of Id family proteins in small cell lung cancer and its prognostic significance. Clinical Cancer Research. 14 (8), 2318-2325 (2008).
  23. Cruz-Rodriguez, N., et al. High expression of ID family and IGJ genes signature as predictor of low induction treatment response and worst survival in adult Hispanic patients with B-acute lymphoblastic leukemia. Journal of Experimental and Clinical Cancer Research. 35, 64 (2016).
  24. Yang, H. Y., et al. Expression and prognostic value of Id protein family in human breast carcinoma. Oncology Reports. 23 (2), 321-328 (2010).
  25. Zhou, X. L., et al. Prognostic values of the inhibitor of DNAbinding family members in breast cancer. Oncology Reports. 40 (4), 1897-1906 (2018).
  26. , Available from: https://www.oncomine.org (2018).
  27. Lin, H. Y., Zeng, L., iang, Y. K., Wei, X. L., Chen, C. F. GATA3 and TRPS1 are distinct biomarkers and prognostic factors in breast cancer: database mining for GATA family members in malignancies. Oncotarget. 8 (21), 34750-34761 (2017).
  28. , Available from: http://bcgenex.centregauducheau.fr/BCGEM/GEM-requete.php (2018).
  29. , Available from: https://www.proteinatlas.org (2018).
  30. , Available from: http://kmplot.com/analysis (2018).
  31. Zhu, Y. F., Dong, M. Expression of TUSC3 and its prognostic significance in colorectal cancer. Pathology-Research and Practice. 214 (9), 1497-1503 (2018).
  32. Nelson, J. C., et al. Validation sampling can reduce bias in health care database studies: an illustration using influenza vaccination effectiveness. Journal of Clinical Epidemiology. 66 (8 Suppl), S110-S121 (2013).
  33. Haibe-Kains, B., Desmedt, C., Sotiriou, C., Bontempi, G. A comparative study of survival models for breast cancer prognostication based on microarray data: does a single gene beat them all? Bioinformatics. 24 (19), 2200-2208 (2008).
  34. Yang, C., et al. Understanding genetic toxicity through data mining: the process of building knowledge by integrating multiple genetic toxicity databases. Toxicology Mechanisms and Methods. 18 (2-3), 277-295 (2008).
  35. Cannata, N., Merelli, E., Altman, R. B. Time to organize the bioinformatics resourceome. PLoS Computational Biology. 1 (7), e76 (2005).
  36. Wren, J. D., Bateman, A. Databases, data tombs and dust in the wind. Bioinformatics. 24 (19), 2127-2128 (2008).

Tags

Kreftforskning brystkreft biomarkør database data mining prognose Bioinformation
Utføre data mining og integrerende analyse av biomarkør i brystkreft bruke flere allment tilgjengelige databaser
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Chen, M. n., Zeng, D., Zheng, Z. q., More

Chen, M. n., Zeng, D., Zheng, Z. q., Li, Z., Wu, J. l., Jin, J. y., Wang, H. j., Huang, C. z., Lin, H. y. Performing Data Mining And Integrative Analysis Of Biomarker in Breast Cancer Using Multiple Publicly Accessible Databases. J. Vis. Exp. (147), e59238, doi:10.3791/59238 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter