Medicine

Geração de banco de dados de Oncologia Torácica Comprehensive - Ferramenta para Pesquisa Translacional

Published: January 22, 2011 doi: 10.3791/2414

Summary

Um banco de dados de oncologia torácica foi desenvolvido para servir como um repositório completo de dados clínicos e laboratoriais para fins de investigação de translação. O banco de dados servirá pesquisadores de câncer translacional dentro do Programa de Cirurgia Torácica Oncology Research. Este banco de dados é adaptável aos modelos outro câncer, bem como outras doenças humanas.

Abstract

O Thoracic Oncology Projeto de Banco de Dados do Programa foi criado para servir como um repositório global verificada, e acessível para os espécimes bem anotado câncer e dados clínicos de estar disponível para pesquisadores no âmbito do Programa Thoracic Oncology Research. Esta base de dados também captura um grande volume de dados genômicos e proteômicos obtidos em estudos diferentes tecidos do tumor. Uma equipe de pesquisadores da ciência clínica e básica, um bioestatístico, e um especialista em bioinformática foi convocada para projetar o banco de dados. Variáveis de interesse foram claramente definidas e suas descrições foram escritas dentro de um manual de operação padrão para garantir a consistência de anotação de dados. Usando um protocolo para bancos de tecidos prospectivo e outro protocolo para a banca retrospectiva, tumor e amostras de tecido normal de pacientes consentiram com estes protocolos foram coletados. Informações clínicas, tais como dados demográficos, caracterização câncer, e planos de tratamento para estes pacientes foram abstraídas e entrou em um banco de dados Access. De dados de proteômica e genômica foram incluídos no banco de dados e têm sido associados a informações clínicas dos pacientes descritos no banco de dados. Os dados de cada tabela foram ligados utilizando a função de relações no Microsoft Access para permitir que o gerente de banco de dados para conectar a informação clínica e laboratorial durante uma consulta. Os dados consultados podem ser exportados para análise estatística e geração de hipóteses.

Protocol

1. Pesquisa da Universidade Protocolos Clínicos:

Dois protocolos da universidade foram desenvolvidos para os fins desta iniciativa. O primeiro protocolo permite a aquisição em potencial de tecidos de câncer de pulmão, câncer de esôfago, tumor carcinóide, timoma, e pacientes com mesotelioma. O protocolo também permite sangue e fluidos corporais a ser coletadas de pacientes para estudos de biomarcadores. O protocolo permite que pesquisadores para obter informações clínicas do paciente fonte de tais espécimes via abstração gráfico e armazenar amostras e dados clínicos em um banco de dados protegidos.
O segundo protocolo é semelhante ao primeiro, exceto que ele permite aos pesquisadores o acesso tecidos previamente depositado e outras amostras obtidas durante o curso de diagnóstico de um paciente e tratamento do câncer. Pacientes que tenham consentido em cirurgia da Universidade de Chicago e que tenham assinado este protocolo são elegíveis.

2. Protocolo de Coleta de Dados clínicos:

Pacientes que estão sendo vistos na Universidade de Chicago Medical Center para o tratamento dos tumores malignos mencionados foram incluídos neste protocolo.
Pacientes elegíveis foram identificados por seus oncologista tratamento e foram consentido por um membro da equipe clínica treinados nos dois protocolos.
Uma vez consentido, a informação de um paciente história médica foi obtida através de abstração gráfico e foi inserido no banco de dados por um membro da equipe de suporte clínico.

3. Protocolo de Coleta de Amostras:

Amostras de tecido

Tecidos contendo uma malignidade conhecida ou suspeita obtidos durante o tratamento padrão clínico de um paciente através de biópsia ou cirurgia foram incluídos neste protocolo. Nenhum tecido adicional, fora do que era necessário para a investigação diagnóstica de um paciente, foi obtido.
Após a remoção cirúrgica da amostra necessária para a preparação das seções permanentes, o tecido residual foi colocado no gelo.
Um técnico de recolha de tecidos transportados a amostra residual no gelo para o departamento de patologia.
Tecidos residuais foram medidos, pesados, transferidos para a memória, rotulado e devidamente documentados de acordo com o procedimento operacional padrão.
Armazenamento de longo prazo das amostras foi mantido em um freezer -80 ° C no departamento de patologia.
Para acessar amostras de tecido de pacientes que já tinham sido submetidos a cirurgia para um tumor maligno torácica, listas de pacientes mantidos por colaborar cirurgiões e radioterapeutas foram referenciados. Desta forma os pacientes de interesse foram identificados. Suas amostras de tecido do tumor pôde ser reactivado a partir do departamento de patologia se o consentimento foi obtido.

Amostras de sangue

Durante sangue clinicamente indicado empates, o protocolo permitiu também um adicional de 2-6 tubos de sangue em um tubo superior verde 5 mL (heparina), um tubo de 10 ml top roxo (EDTA germline DNA) e um top 10 mL vermelho (Soro) Tubo de sangue.
Até seis amostras em momentos diferentes foram tomadas, com a data do sorteio sangue anotada.
Amostras de sangue foram centrifugadas a 2000 rpm por 10 minutos.
Componentes do plasma e soro foram aliquotado em tubos cryovial em 1 mL porções.
Para a coleta de células brancas do sangue, o 1-2 mL superior da interface / fração de glóbulos vermelhos foram ressuspensos com 1-2 ml de meio de preservação de células (MEM EBS media + 10% de soro fetal cal + 5% DMSO).
Todas as amostras foram congeladas lentamente em uma caixa de congelamento isopropílico a 70-80 ° C durante 16-24 horas, em seguida, transferido para uma temperatura de -70 ° C a -80 ° C caixa de armazenamento.
Todas as amostras foram marcadas com um identificador de código de barras único e devidamente documentados na forma de aquisição da amostra por um técnico de laboratório.

Outros fluidos corporais:

Fluido não recolhidos para uso clínico podem ser coletadas e armazenadas nos termos do presente protocolo. Amostras de escarro foram coletadas e enviadas para citologia. Amostras de escarro foram armazenados em gelo a 4 ° C, enquanto estão sendo transferidos.
Amostras de escarro foram então transferidos para tubos de 15 mL Falcon e centrifugados a 1400 rpm por 10 minutos.
O sobrenadante foi aliquotado em 4 porções mL em cyrovials 6ml. Cyrovials foram colocados em um freezer, em gelo seco, ou em uma caixa de congelamento isopropílico a ser posteriormente congeladas a uma temperatura de -70 ° C a -80 ° C. Após 16-24 horas, as amostras foram transferidas para uma temperatura de -70 ° C a -80 ° C caixa de armazenamento.
Todas as amostras foram marcadas com um identificador de código de barras único e devidamente documentados na forma de aquisição da amostra por um técnico de laboratório.

4. Construção da infra-estrutura de Informática:

Depois de avaliar uma série de programas de gerenciamento de banco de dados, Microsoft Access foi selecionado como o programa para a casa de dados clínicos e laboratoriais para o Torácica Onmusicologia Projeto de Banco de Dados do Programa com base na sua operacionalidade e capacidade de ligação conjuntos de dados relacionados.
Uma equipa de clínicos, pesquisadores de ciência básica, um bioestatístico, e um especialista em bioinformática foi convocada para identificar as variáveis de interesse para capturar dentro do banco de dados.
A equipe identificou elementos de dados relacionados a demografia, a caracterização do câncer, fatores epidemiológicos, e anotação de amostra com base nas necessidades de pesquisadores de oncologia torácica e referindo-se a padrões estabelecidos sobre elementos de dados comuns (CDES) pelo National Cancer Institute.
A equipe desenvolveu um esquema de codificação para tornar os dados analisáveis para fins de pesquisa. Quando possível, os dados foram codificados utilizando variáveis numéricas, de modo a reduzir a quantidade de texto livre entrou em banco de dados.
Variáveis de interesse foram divididos entre sete diferentes tabelas dentro de Microsoft Access para capturar aspectos variados de informações relacionadas.

5. Projetando o conteúdo de cada tabela:

Sete tabelas primárias foram criadas: 1) Pacientes mesa, 2) tabela de dados de exemplo, 3) TMA mesa, 4) As amostras de DNA de mesa, 5) Peito tabela Conferência Oncology, 6) Linha tabela Cell, e 7) C. tabela elegans.
A tabela Pacientes foi concebido como a única tabela no banco de dados para abrigar informações clinicamente relevantes sobre os pacientes, o câncer, seu curso clínico, seus fatores de risco, eo seu resultado (Fig. 1). A intenção deste projeto particular foi para limitar a redundância no banco de dados.
Amostra ligações tabela de dados espécimes patológicos às suas fontes paciente. Cada amostra é dado um número de amostra patologia e este número está relacionado com o número do registro médico do paciente. Espécimes múltiplos podem ser obtidos a partir de cada indivíduo e por isso a tabela também inclui informações sobre a data em que o espécime foi obtido eo tipo de espécime coletado: tumor inicial, recidiva tumoral, ou amostra de autópsia.
A tabela a TMA tem sido utilizado até agora para capturar dados de proteína expressão por 63 proteínas específicas. A TMA pode ser usado para caracterizar a distribuição de proteínas diferencialmente expressos no tecido tumoral e não-tumor usando anticorpos para localizar proteínas (Fig. 2). Expressão da proteína é representada por uma pontuação de 0, 1, 2 ou 3 baseada na impressão do patologista da intensidade e porcentagem de coloração TMA.
Quando a coloração é medida por cento, uma pontuação de 0 indica que não há manchas, uma coloração indica menos de 11%, 2 coloração indica menos de 50%, e 3 indica coloração superior a 50%. Quando a intensidade é medida, uma pontuação é atribuída com base na quantidade relativa de coloração, também em uma escala de 0 a 3. Em alguns casos, slides IHC também são escaneados em alta resolução e intensidade de coloração é quantificada por Automated Imaging System Celular (ACIS) software de imagem em paralelo com a pontuação do patologista. No entanto, para ambas as técnicas, uma maior pontuação indica maior expressão de proteínas.
Além disso, a tabela TMA anota a localização do soco TMA para referência futura. Além disso, o banco de dados inclui a fonte do tecido (tumor, linfonodo normal,, o tecido metastático), a localização dentro da amostra (no centro, borda), a histologia do câncer, eo número do prontuário de vincular essas informações para a tabela de pacientes.
O DNA tabela lista todos os espécimes DNA armazenada dentro do laboratório. Amostras de DNA estão ligados à sua fonte paciente através do número do paciente prontuário médico. Informações básicas sobre a amostra é capturado para descrever a origem da amostra, incluindo a localização e histologia do tumor. O objetivo desta tabela é descrever as alterações genéticas que foram caracterizados dentro do espécime utilizando a reação em cadeia da polimerase, seqüenciamento de DNA padrão, e análises de mutação.
A tabela também capta variáveis, tais como mudanças de aminoácidos, alterações de nucleotídeos, homozigotia, sinonímia, eo gene em que a mutação ocorreu. Exemplos de genes que têm sido estudados incluem Paxillin, CCBL, EGFR, p53, KRAS, CMET, e EphB4. O investigador que tem caracterizado as mutações também é listado.
A tabela a quinta no banco de dados é a tabela Peito Conferência Oncology. A conferência de oncologia torácica é uma reunião semanal de oncologistas, cirurgiões torácicos, patologistas, radiologistas, radioterapeutas e outros membros da equipe de oncologia torácica clínicos que se encontram para desenvolver planos de tratamento coordenado paciente. O objetivo desta tabela é a lista dos pacientes que foram discutidos na conferência como parte de seu padrão de atendimento. Informações sobre a disponibilidade de espécimes patológicos para cada paciente também é capturado nesta tabela.
A tabela a sexta é a célula da tabela Lines. Esta é uma mesa livre de pé no banco de dados porque não está ligada a nenhuma das outras tabelas. Ele descreve as linhas de células que foram utilizamd em laboratório para fins de pesquisa. A tabela capta as mudanças de aminoácidos, alterações de nucleotídeos, a homozigotia e sinonímia de mutações, e da localização de mutações no DNA da linhagem celular.
A tabela sétimo é o C. elegans tabela e é também uma mesa de pé livre. Esta tabela lista quinases receptor tirosina ortólogos e inclui a pontuação de agulha, que é uma medida de similaridade com proteínas humanas.

6. Estabelecer relações entre tabelas:

Cada mesa é atribuída uma chave primária, que serve como um identificador único para cada entrada na tabela. Por definição, um valor de identificador único não pode ser repetido. Por exemplo, dentro da tabela Pacientes, a chave primária é o número do prontuário desde que um MRN só pode significar um indivíduo único. Dentro da tabela de dados de exemplo, a chave primária é a amostra patologia número (SP). As amostras como as tabelas TMA e DNA não têm identificadores únicos, um número fictício foi estabelecida como a chave primária. As tabelas TMA e DNA foram então ligados a outras tabelas usando a MRN e os números de SP, respectivamente. Isso garante que cada soco TMA e espécime DNA estão ligados de volta para ambas as informações específicas sobre a amostra e informações clínicas do paciente doação.
No Microsoft Access, tabelas individuais estão ligadas através de suas chaves primárias, tais que as relações lógicas são estabelecidas (Fig. 3). Estas relações são necessárias para gerar consultas onde os dados são coletados de várias tabelas.

7. Consultando:

Realizar uma consulta de conjuntos de dados relacionados é relativamente simples no Microsoft Access. A consulta pode ser projetado, selecionando a opção "design da consulta" na guia criar.
Tabelas, incluindo as áreas de interesse são selecionados e exibidos.
Variáveis das tabelas de interesse são selecionados e, se necessário, podem ser filtrados com base em critérios do pesquisador de interesse (Fig. 4).
A consulta pode ser executado, resultando em os campos desejados listados na forma de planilha.

8. Dados de exportação:

Uma vez que uma consulta foi gerado, os dados podem ser exportados. Enquanto a maioria dos pesquisadores preferem que os dados sejam na forma de uma planilha do Microsoft Excel, os dados podem ser exportados para uma série de outros programas usando o menu de exportação sob a "dados externos" guia. Os dados podem ser salvos com a extensão de arquivo apropriado.
Quando os dados são exportados para fins estatísticos, um conjunto determinado de variáveis são incluídas na exportação de modo que uma análise abrangente pode ser feito para controlar para covariáveis.

9. Importação de dados:

Importar os dados exige uma combinação perfeita entre o formato dos dados importados eo formato da tabela no Access. As variáveis de interesse dentro da tabela para importar deve ter os mesmos nomes da tabela do Access. A ortografia deve ser exato e não pode haver espaços onde os espaços não existem na tabela do Access.
Uma vez que a simetria entre as duas tabelas é atingido, o usuário tem a habilidade de usar uma consulta acréscimo ou atualização para importar os dados para o Access. Uma consulta de acréscimo vai permitir ao usuário adicionar novas linhas de dados no banco de dados Access. Por exemplo, se a informação está disponível sobre os pacientes que já não estavam no banco de dados, uma consulta de acréscimo poderia ser usado para adicionar esses pacientes. No entanto, se novos dados disponíveis em doentes ou amostras que precisam ser modificados, uma consulta de atualização deve ser executada em essas entradas.

10. Atualizando o banco de dados:

Membros do projeto de banco de dados têm papéis prescritos para garantir que o banco de dados é mantida atual. Um funcionário em tempo integral é encarregado de regular preenchimento e atualização do banco de dados com informações clínicas baseadas em pacientes que tenham sido aprovados na clínica.
Outro funcionário em tempo integral, servindo como o gerenciador de dados, é acusado de obter dados laboratoriais como ela se torna disponível e introduzir esta informação no banco de dados com uma atualização ou consulta de acréscimo.
Assistentes de pesquisa que são treinados no protocolo são responsáveis por executar uma atualização sistemática do banco de dados a cada seis meses para obter os dados mais recentes disponíveis. Isto é particularmente importante para os campos, tais como estado vital e data do último contato, já que estes campos têm um impacto direto na análise de sobrevivência realizada sobre os dados.

11. Acesso ao banco de dados:

O banco de dados só é acessível a pessoas que estejam em conformidade HIPAA e estão incluídos no âmbito do protocolo IRB. O acesso é ainda mais reduzida para pessoas treinadas no Microsoft Access e que têm responsabilidades directas para atualizar ou modificar os dados.
Pesquisadores que têm contribuído para o banco de dados poderá solicitar informações do banco de dados do gerenciador de dados, mas eles mesmos sãonão permissão para acessar os dados diretamente.
O gerenciador de dados fornece informações de-identificados com os pesquisadores solicitando através da remoção de variáveis como o número do prontuário eo nome do paciente, ao gerar uma consulta de exportação.

12. Resultados representativos:

Um pesquisador pode estar interessado em saber o significado clínico da sobre-expressão da proteína em Paxillin não-pequenas células de câncer de pulmão. Como este pesquisador tem gerado uma grande quantidade de dados TMA no banco de dados para Paxillin, o gerenciador de dados aprova pedido do pesquisador de acesso à informação clínica para correlacionar com os dados de laboratório. O gerenciador de dados executa uma consulta onde ele combina Tabela dos pacientes e da Tabela TMA. Variáveis de interesse da tabela Pacientes incluem data de nascimento do paciente, sua raça, a histologia do câncer, o estágio do câncer, a data do diagnóstico, o seu estado vital, sua data de morte, e sua data de último contato. Usando essas variáveis, como idade ao diagnóstico e estágio, fatores de confusão importantes podem ser contabilizados e controlados. Da tabela TMA, informações importantes, tais como o tipo de tumor ea expressão da proteína pode ser verificada.

Como as duas tabelas estão ligadas através do número do prontuário, informações de pacientes de indivíduos cujos tumores têm sido estudadas para a expressão Paxillin estão incluídos na saída. Os resultados podem ser filtrados de forma que apenas os pacientes com câncer não pequenas de pulmão de células são exibidos. Os resultados podem ser aperfeiçoadas com base nas necessidades do pesquisador.

Estes resultados podem ser exportados para a análise de dados primários pelo bioestatístico e os resultados são, então, compartilhada com o pesquisador.

Projeto home page: modelo de banco de dados Access e Procedimentos Operacionais Padrão estão disponíveis em:
http://www.ibridgenetwork.org/uctech/salgia-thoracic-oncology-access-template

Licença: disponível gratuitamente para uso acadêmico e sem fins lucrativos.

Restrições à utilização por não-acadêmicos: usuários comerciais precisam de uma licença. Para dúvidas sobre o uso comercial, entre em contato com a Universidade de Chicago Escritório de Tecnologia e Propriedade Intelectual (UChicagoTech) em (773) 702-1692 ou www.tech.uchicago.edu

Figura 1. A imagem do banco de dados Access representando uma seção da tabela Pacientes.

Figura 2. Esquemático representando um microarray de tecido (TMA) ²

Figura 3. Screenshot relações estabelecidas entre representando tabelas dentro do banco de dados Access. Tabelas estão ligadas por chaves primárias.

Figura 4. Query de exemplo para Paxillin mutação, os resultados TMA, e as variáveis clínicas.

Disclosures

Não há conflitos de interesse declarados.

Acknowledgments

Este trabalho foi financiado pelo NIH concede 5R01CA100750-07, 5R01CA125541-04, 3R01CA125541-03S1, 5R01CA129501-03, 3R01CA129501-02S1 para RS

Materials

Name	Company	Catalog Number	Comments
Centrifuge	Eppendorf
Conical centrifuge tube	Falcon BD	518-PG
Minimum essential medium eagle (MEM)	Sigma-Aldrich	M4655-500ML
Fetal Calf Serum	Cellgro	MTT35011CV
Dimethyl Sulfoxide (DMSO)	American Bioanalytical	AB03091
BD Vacutainer Serum Tubes	Fisher Scientific	367815

DOWNLOAD MATERIALS LIST

References

Adamski, J., Finnegan, K. New Perspectives on Microsoft Office Access. , Course Technology. Boston. (2007).
Giltnane, J., Rimm, D. Technology Insight: Identification of biomarkers with tissue microarray technology. Nat Clin Pract Oncol. 1, 104-111 (2004).

Medicine

Geração de banco de dados de Oncologia Torácica Comprehensive - Ferramenta para Pesquisa Translacional

Summary

Abstract

Protocol

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Protocol

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.