Immunology and Infection

Identification des souris et des répertoires d’anticorps humain par séquençage de prochaine génération

Published: March 15, 2019 doi: 10.3791/58804

Lin Sun¹, Naoko Kono², Hiroyuki Toh³, Hanbing Xue¹, Kaori Sano^4,5, Tadaki Suzuki⁴, Akira Ainai⁴, Yasuko Orba⁶, Junya Yamagishi^7,8, Hideki Hasegawa^4,5, Yoshimasa Takahashi⁹, Shigeyuki Itamura², Kazuo Ohnishi^9,10

¹Graduate School of Life and Environmental Sciences, University of Tsukuba, ²Center for Influenza Virus Research, National Institute of Infectious Diseases, ³School of Science and Technology, Kwansei Gakuin University, ⁴Department of Pathology, National Institute of Infectious Diseases, ⁵Division of Infectious Diseases Pathology, Department of Global Infectious Diseases, Tohoku University Graduate School of Medicine, ⁶Division of Molecular Pathobiology, Research Center for Zoonosis Control, Hokkaido University, ⁷Division of Collaboration and Education, Research Center for Zoonosis Control, Hokkaido University, ⁸Global Station for Zoonosis Control, GI-CoRE, Hokkaido University, ⁹Department of Immunology, National Institute of Infectious Diseases, ¹⁰Faculty of Life and Environmental Sciences, University of Tsukuba

Summary

Nous décrivons ici les protocoles pour l’analyse et la visualisation de la structure et la constitution de répertoires entiers d’anticorps. Il s’agit de l’acquisition de vastes séquences d’ARN d’anticorps moyen du séquençage de prochaine génération.

Abstract

L’adaptabilité immense de reconnaissance de l’antigène par les anticorps est la base du système immunitaire acquise. Malgré notre compréhension des mécanismes moléculaires qui sous-tendent la production de la vaste répertoire d’anticorps par le système immunitaire est acquis, il n'a pas encore été possible de parvenir à une vision globale d’un répertoire complet d’anticorps. En particulier, répertoires de cellules B ont été considérés comme une boîte noire en raison de leur nombre astronomique de clones d’anticorps. Cependant, technologies de séquençage de nouvelle génération permettent aux percées d’augmenter nos connaissances sur le répertoire des cellules B. Dans ce rapport, nous décrivons une méthode simple et efficace pour visualiser et analyser les souris ensemble individuelle et les répertoires d’anticorps humain. Depuis les organes du système immunitaire, représentativement de rate chez les souris et les cellules mononucléaires du sang périphérique chez les humains, ARN total a été préparée, inverse transcrit et amplifié à l’aide de la méthode 5'-RACE. En utilisant une amorce universelle avant et amorces antisens pour les domaines constants d’anticorps spécifiques à la classe, anticorps ARNm ont été uniformément amplifiées dans des proportions qui reflète leur fréquence dans les populations d’anticorps. Les amplicons ont été séquencés par séquençage de prochaine génération (NGS), ce qui donne plus de 10 séquences d’anticorps de⁵ par exemple immunologique. Nous décrivons les protocoles pour les analyses des séquences d’anticorps dont annotation de V (D) J-gène-segment, une vue aérienne du répertoire de l’anticorps et nos méthodes de calcul.

Introduction

Le système d’anticorps est l’un des principes fondamentaux du système immunitaire acquis. Il est très puissant contre l’invasion des agents pathogènes en raison de sa grande diversité et spécificité de la reconnaissance de l’antigène fine l’expansion clonale des lymphocytes B spécifiques de l’antigène. Le répertoire des cellules productrices d’anticorps de B est estimé à plus de 10¹⁵ dans un unique individuelle¹. Cette immense diversité est générée à l’aide de la recombinaison VDJ gène l’immunoglobuline loci génétiques². Description des répertoires de l’ensemble des lymphocytes B et leur évolution dynamique en réponse à l’antigène-immunisation est donc difficile, mais essentiel pour une compréhension complète de la réponse en anticorps contre l’invasion des agents pathogènes.

En raison de leur diversité astronomique, répertoires de cellules B ont été considérés comme une boîte noire ; Cependant, l’avènement de NGS technology a permis des percées à une meilleure compréhension de leur complexité³^,⁴. Répertoires entiers d’anticorps ont été correctement analysés, tout d’abord zebrafish⁵, puis souris⁶, et les humains⁶^,⁷. Bien que NGS est devenu un outil puissant pour l’étude de la réponse immunitaire adaptative, les analyses de base des points communs et des différences dans les répertoires d’anticorps chez les individus font défaut.

Chez les souris, il a été signalé que les répertoires d’IgM sont presque identiques entre les individus, alors que ceux des IgG1 et IgG2c sont sensiblement différents entre individus⁸. En plus du profil d’utilisation V-gène, la fréquence observée de VDJ-profil dans les cellules B périphériques naïve est très semblable entre individus⁸. L’analyse des séquences d’acides aminés de la région de VDJ-aussi montré la présence des mêmes séquences jonctionnelles dans différentes souris beaucoup plus souvent que précédemment pensée⁸. Ces résultats indiquent que les mécanismes de la formation de répertoire d’anticorps peuvent être déterministe et non stochastiques⁵^,⁸^,⁹. Le processus de développement de répertoire anticorps chez la souris a également été correctement analysé à l’aide de NGS pour souligner davantage le potentiel de NGS pour découvrir le système immunitaire des anticorps détail¹⁰.

Dans ce rapport, nous décrivons une méthode simple et efficace pour visualiser et analyser un répertoire d’anticorps au niveau mondial.

Protocol

Toutes les expériences animales ont été effectuées conformément aux directives institutionnelles et avec l’approbation de la National Institute of infectieuses maladies Animal Care et utilisation. Échantillonnage des PBMC de volontaires adultes sains, utilisé comme le résultat représentatif dans ce rapport, a été réalisée avec l’approbation du comité d’éthique de l’Institut National des maladies infectieuses, Tokyo, Japon et écrit le consentement éclairé a été obtenu de chaque participant en utilisant un formulaire approuvé par comité de déontologie.

1. amorces

Concevoir une amorce universelle avant d’ADNc pour amplifier l’immunoglobuline ARNm sans préjugé d’amorces PCR, tel qu’utilisé dans les courses 5'¹¹^,¹² et la SMART-PCR¹³ techniques.
Pour l’amplification de gène VH immunoglobuline, concevoir les séquences spécifiques à la classe d’immunoglobuline dans la région constante comme amorces inverse⁸^,¹⁴ (Figure 1 a).
NOTE : Séquences tag Multiplex peuvent être ajoutés à l’une de ces amorces d’étiqueter les molécules de la bibliothèque de sources différentes d’échantillon. Séquences pour PCR nichée peuvent également être ajoutés, selon le manuel de la trousse utilisée¹⁵.

Amorce universelle vers l’avant	5'-AAGCAGTGGTATCAACGCAGAGT-3'
Inverser les amorces pour les immunoglobulines de souris (Ref.8)
IgM_CH1 :	5'-CACCAGATTCTTATCAGACAGGGGGCTCTC-3 '
IgG1_CH1 :	5'-CATCCCAGGGTCACCATGGAGTTAGTTTGG-3 '
IgG2c_CH1 :	5'-GTACCTCCACACACAGGGGCCAGTGGATAG-3 '
IgG3_CH1 :	5'-ATGTGTCACTGCAGCCAGGGACCAAGGGA-3'
IgA_CH1 :	5'-GAATCAGGCAGCCGATTATCACGGGATCAC-3'
Igκ_CH1 :	5'-GCTCACTGGATGGTGGGAAGATGGATACAG-3 '
Igλ_CH1 :	5'-CTBGAGCTCYTCAGRGGAAGGTGGAAACA-3 '
Inverser les amorces pour les immunoglobulines humaines (réf.14)
IgM_CH1 :	5'-GGGAATTCTCACAGGAGACG-3 '
IgG_CH1 :	5'-AAGACCGATGGGCCCTTG-3 '
IgD_CH1 :	5'-GGGTGTCTGCACCCTGATA-3 '
IgA_CH1 :	5'-GAAGACCTTGGGGCTGGT-3 '
IgE1_CH1 :	5'-GAAGACGGATGGGCTCTGT-3 '
IgE2_CH1 :	5'-TTGCAGCAGCGGGTCAAGGG-3 '
Igκ_CH1 :	5'-TGCTCATCAGATGGCGGGAAGAT-3 '
Igλ_CH1 :	5'-AGAGGAGGGCGGGAACAGAGTGA-3 '

Tableau 1 : Séquences d’amorces PCR-amplification des immunoglobulines

2. acide nucléique isolement de tissus et de cellules immunitaires

Remarque : La procédure ci-dessous est pour l’extraction des acides nucléiques de la rate de souris. Toutefois, elle s’applique à d’autres tissus immunitaires et les cellules humaines comme les ganglions lymphatiques ou des cellules mononucléaires du sang périphérique (PBMC) (Figure 1 b).

Disséquer les tissus, par exemple, rate d’une souris C57BL/6 de 8 semaines et passez-la au travers d’une maille inox (200 à 400 µm) avec 2 mL de tampon PBS pour obtenir des cellules dispersées. Transférer la suspension de cellules dans un tube de microtubes de 2,0 mL et centrifuger pendant 5 min à 600 × g et 4 ° c. Jeter le surnageant.
Ajouter 800 µL de tampon de lyse ACK (150 mM NH₄Cl, 1 mM KHCO₃, 0,1 mM Na₂EDTA, pH 7,2) au culot et incuber sur glace pendant 2 min à lyser les globules rouges dans le tissu.
Laver les cellules de tissu avec 2 mL de PBS 3 x, suivi par centrifugation pendant 5 min à 600 × g et 4 ° c.
Ajouter 800 µL de réactif de l’isothiocyanate de phénol/guanidine au culot, vortex soigneusement et incuber à environ 25 ° c pendant 5 min.
Ajouter chloroforme (200 µL), agiter manuellement pendant 15 s et puis incuber pendant 2 min à environ 25 ° c.
Séparer les phases par centrifugation à 12 000 × g et 25 ° c pendant 15 minutes et transférer la phase aqueuse supérieure dans un nouveau tube.
Ajouter un volume d’éthanol à 70 %, vortex brièvement et l’appliquer à la colonne de silice.
Éluer l’ARN avec 30 – 100 µL d’eau.
Quantifier la concentration en ARN initiale à l’aide d’un fluorimètre (Table des matières).
Stocker l’ARN purifié à-80 ° c.

3. synthèse de cDNA et Amplification par PCR

Remarque : La méthode décrite ci-dessous repose sur les 5'-RACE¹¹^,¹² et SMART-PCR techniques¹³. Les détails et l’optimisation de la réaction sont décrites dans le manuel du kit ¹⁵. Les matières de départ pour les immunoglobulines de souris sont l’exemple de l’étape 2.10. Les matières de départ pour les immunoglobulines humaines sont l’échantillon de tissus humains, ex. PBMC, traité comme décrit aux points 2.3 à 2.10.

Synthétiser le cDNA de premier-brin de 2 à 10 µg de descripteur d’ARN total à l’aide d’amorce CDS de 5'-RACE (oligo-dT-contenant) et oligonucléotides SMART-PCR (Table des matières) selon instructions^{15 les directives du fabricant}.
1. Pour l’immunoglobuline de souris, PCR-amplifier cDNA avec haute fidélité ADN polymérase en utilisant l’amorce avant universelle et des amorces inverse spécifiques à la classe immunoglobuline (tableau 1). Définissez les conditions thermiques de cyclisme comme : 94 ° c pendant 2 min, puis 40 cycles de 94 ° c pendant 30 s, 59 ° c pendant 30 s et 72 ° c pendant 30 s, suivi d’une extension finale à 72 ° c pendant 5 min.
  Remarque : Les expériences typiques amplifient classes d’immunoglobulines IgM, IgG1, IgG2c, Igk et Igl à regarder les naïfs, les Th1 dépendantes et les cellules Th2-dépendante B (Figure 3).
2. Pour l’immunoglobuline humaine, effectuer le 1^st PCR à l’aide de l’amorce avant universelle et des amorces inverse spécifiques à la classe immunoglobuline (tableau 1) avec des séquences de balise. Inclure les séquences d’index pour chaque échantillon de 2^nd PCR en utilisant des amorces de séquence index. Utiliser les conditions suivantes de la PCR et la polymérase Taq : 94 ° c pendant 2 min, 21 cycles (1^st PCR) ou 32 cycles (2^nd PCR) à 94 ° c pendant 30 s, 59 ° c pendant 30 s, 72 ° c pendant 30 s.
  Remarque : Les expériences typiques amplifient IgM, IgD, IgG (IgG1, IgG2, IgG3 et IgG4), IgA (IgA1 et IgA2), classes d’immunoglobulines IgE, Igk et Igl de regarder toutes les populations de lymphocytes B (Figure 4).
Electrophorese des produits PCR sur gel d’agarose et purifier les fragments de pb de 600 à 800 à l’aide d’une membrane spin-colonne de silice.
1. Electrophorese de l’échantillon de 3.2.1 ou 3.2.2 sur gel d’agarose à 2 %.
2. Visualiser les bandes d’ADN sur UV-transilluminateur et d’accise les découpes gel contenant la bande large entre 600 et 800 bp.
3. Ajouter 10 mL de solution de liaison de membrane par 10 mg de gel de tranche. Mélanger et laisser incuber entre 50 et 65 ° C jusqu'à dissolution complète de la tranche de gel.
4. Transférer la solution de gel sur la membrane spin-colonne de silice. Laver une fois avec le tampon de lavage et éluer ADN avec 50 mL d’eau exempte de nucléase (Table des matières).
Quantifier les amplicons purifiés avec un fluorimètre et piscine amplicons de chaque classe d’immunoglobuline en parts égales pour l’ordonnancement de la NGS.
Remarque : En général, 2-10 mg amplicon ADN a été récupéré pour chaque classe d’immunoglobuline. Mélangez chaque solution également en quantité d’ADN pour donner naissance 50 mL d’une solution contenant 10-20 ng d’ADN/mL.
Déterminer la taille et la concentration des bibliothèques qui utilisent une micro-capillaire selon l’électrophorèse avec puce ADN de dimensionnement (Table des matières). Stocker les bibliothèques à - 20 ° C.

4. NGS séquençage des bibliothèques

Générer un SampleSheet.cvs pour le séquençage exécution spécification échantillon nom, les informations d’index et instruire pour obtenir uniquement les fichiers .fastq.
Dégelez la cartouche de réactif (Table des matières) et les bibliothèques.
Faire 0,2 N NaOH et diluer les bibliothèques afin d’obtenir la concentration molaire désirée.
Rincez et séchez la cellule d’écoulement. Ajouter 600 mL de solution diluée et dénaturée de la bibliothèque dans le puits de la cartouche de réactif.
Lancer l’exécution de séquençage.

5. contrôle de la qualité des données d’end

Effectuer le contrôle de la qualité des données FASTQ à l’aide de la « FASTX-boîte à outils »¹⁶.
Remarque : Un exemple de base d’utilisé le réglage des paramètres est la suivante :
fastq_quality_trimmer - v -t 20 - l 200 -i [InFilename.fastq] -o [InFilename.fastq]
fastq_quality_filter - v - q 20 - p 80 -i [InFilename.fastq] -o [InFilename.fastq]
fastx_reverse_complement - v -i [InFilename.fastq] -o [InFilename.fastq]
Les fichiers de sortie pour « fasta nucleic acid (.fna) » le format de la commande suivante :
fastq_to_fasta - v - n -i [InFilename.fastq] -o [InFilename.fna]

6. extraction et analyse des séquences d’immunoglobuline de données .fna

Remarque : Les exemples de programmes ont été mis en œuvre dans un environnement UNIX. Veuillez les utiliser comme un exemple de référence parce que la performance peut dépendre de l’environnement de matériel et de système d’exploitation. Les auteurs n’acceptent pas de toute responsabilité pour toute erreur ou omission. Les langages de programmation Perl,¹⁷, R¹⁸et modules requis doivent être installés selon les instructions sur les sites Web cités. le programme de IgBLAST doivent être installés selon les instructions sur le site Web approprié¹⁹^,²⁰.

Télécharger les exemples suivants de programmes internes pour l’analyse du répertoire de https://github.com/KzPipeLine/KzPipeLine :
03_PipeLine_Mouse.zip ; Un ensemble de programmes d’exemple pour les analyses de séquences d’anticorps de souris.
05_PipeLine_Human.zip ; Un ensemble de programmes d’exemple pour les analyses de séquences d’anticorps humain.
Extrait l’anticorps se lit dans les données de séquence : extraire les séquences d’immunoglobuline (Ig) de chaque classe d’Ig des données (.fna) par un programme Perl qui recherche les séquences de signature dans chaque région constante d’immunoglobuline (tableau 2).
1. Pour les gènes de chaîne lourde (des hommes ISFH) souris immunoglobuline, extraire les lectures par la commande suivante :
  $ 01_KzMFTIgCmgggaNtdVer3_Kz160607.pl de perl [Input filename] [nom du fichier de sortie (suffixe)]
2. Pour la chaîne légère de l’immunoglobuline de souris (IgL) gènes extraire les lectures par la commande suivante :
  $ 01_KzMFTCkltNtdVer1_170810.pl de perl [Input filename] [nom du fichier de sortie (suffixe)]
3. Pour les gènes de chaîne lourde (des hommes ISFH) des immunoglobulines humaines, extraire les lectures par la commande suivante :
  $ 01_KzMfHuIgHCmgadeNtdVer1_Kz180312.pl de perl [Input filename] [nom du fichier de sortie (suffixe)]
4. Pour les gènes de chaîne légère (IgL) d’immunoglobuline humaine, extraire les lectures par la commande suivante :
  $ 01_KzMfHuIgCkltNtd_180316.pl de perl [Input filename] [nom du fichier de sortie (suffixe)]
Annotez et vérifier la productivité de la recombinaison de V (D) J gène :
Remarque : La méthode décrite ci-dessous utilise autonome IgBLAST¹⁹ pour l’annotation des segments de gène de V (D) J dans la séquence. Définissez la base de données pour les gènes de V (D) J et le réglage des paramètres pour IgBLAST comme décrit²⁰.
1. Annoter les gènes de chaîne lourde (des hommes ISFH) souris immunoglobuline par la commande suivante :
  igblastn $-germline_db_V $IGDATA/ImtgMouseIghV_NtdDb.txt-germline_db_J $IGDATA/ImtgMouseIghJ_NtdDb.txt-germline_db_D $IGDATA/ImtgMouseIghD_NtdDb.txt-organisme de souris - domain_system imgt-requête. / $InFile-auxiliary_data $IGDATA/option file/mouse_gl.aux-show_translation - outfmt 7 >>. / $OutName
2. Annoter les gènes de chaîne légère (IgL) souris immunoglobuline par la commande suivante :
  igblastn $-germline_db_V $IGDATA/ImtgMouseIgkV_NtdDb.txt-germline_db_J $IGDATA/ImtgMouseIgkJ_NtdDb.txt-germline_db_D $IGDATA/ImtgMouseIghD_NtdDb.txt-organisme de souris - domain_system imgt-requête. / $InFile-auxiliary_data $IGDATA/option file/mouse_gl.aux-show_translation - outfmt 7 >>. / $OutName
3. Annoter les gènes de chaîne lourde (des hommes ISFH) d’immunoglobuline humaine par la commande suivante :
  igblastn $-germline_db_V $IGDATA/ImtgHumanIghV_NtdDb.txt-germline_db_J $IGDATA/ImtgHumanIghJ_NtdDb.txt-germline_db_D $IGDATA/ImtgHumanIghD_NtdDb.txt-organisme humain - domain_system imgt-requête. / $InFile-auxiliary_data $IGDATA/option file/Human_gl.aux-show_translation - outfmt 7 >>. / $OutName
4. Annoter les gènes de chaîne légère (IgL) d’immunoglobuline humaine par la commande suivante :
  igblastn $-germline_db_V $IGDATA/ImtgHumanIgkV_NtdDb.txt-germline_db_J $IGDATA/ImtgHumanIgkJ_NtdDb.txt-germline_db_D $IGDATA/ImtgHumanIghD_NtdDb.txt-organisme humain - domain_system imgt-requête. / $InFile-auxiliary_data $IGDATA/option file/human_gl.aux-show_translation - outfmt 7 >>. / $OutName
Visualiser la fonction globale d’un répertoire d’anticorps.
1. Visualiser le répertoire IgH de souris par la commande suivante :
  $ . 00a1_3DView_MoIgH_Kz180406.sh
  Remarque : Le fichier d’entrée est filename.fna (données de séquence), de préférence le fichier de sortie de 6.2.1. Ce fichier doit être placé dans un répertoire plus faible (dossier) nommé « filename ». En ligne 50 du script shell, attribuer un « nom de fichier » pour Para_4.
2. Visualiser le répertoire de l’ISFH humain par la commande suivante :
  $ . 00a1_3DView_HuIgH_Kz180411.sh
  Remarque : Le fichier d’entrée est filename.fna données de séquençage, préférence le fichier de sortie de 6.2.3. Ce fichier doit être placé dans le répertoire inférieur (dossier), ce nom est « filename ». Ligne 46 le script shell, attribuer un « nom de fichier » pour Para_4.
3. Visualiser le répertoire IgL de souris par la commande suivante :
  $ . 00_2DViewS_MoIgL_Kz180406.sh
  Remarque : Avec cette canalisation, Igk et Igl sont traités simultanément. Le fichier d’entrée est de préférence filename.fna (données de séquence), le fichier de sortie de 6.2.2. Ce fichier doit être placé dans le répertoire inférieur (dossier) nommé « filename ». Ligne 53 le script shell, attribuer un « nom de fichier » pour Para_4. Nom du fichier sortie, se terminant par « _IgKlCount.txtDim2Rpm.txt » donne les coordonnées d’un graphique à barres à deux dimensions (Figure 3, IgL).
4. Visualiser le répertoire IgL humain par la commande suivante :
  $ . 00_2DView_HuIgL_Kz180319.sh
  Remarque : Avec cette canalisation, Igk et Igl sont traités simultanément. Le fichier d’entrée est filename.fna données de séquençage, préférence le fichier de sortie de 6.2.4. Ce fichier doit être placé dans un répertoire plus faible (dossier) nommé « filename ». Ligne 53 le script shell, affectez « nomfichier » pour Para_4. Le nom de fichier de sortie qui se termine par « _IgKlCount.txtDim2Rpm.txt » donne les coordonnées d’un graphique à barres à deux dimensions (Figure 4, IgL).

Representative Results

Répertoires des anticorps de souris

On trouvera un point de vue d’un répertoire d’anticorps murin dans un ensemble de cellules ou de tissus tels que la rate, la moelle osseuse, ganglions lymphatiques ou de sang. La figure 3 illustre les résultats représentatifs des IgM, IgG1, IgG2c et immunoglobuline répertoires de chaîne légère (IgL) de la rate de souris naïves. Le résumé des nombres de lecture est indiqué dans le tableau 3. Par exemple, 166 175/475 144 lectures contenaient séquence signature d’IgM spécifiques (tableau 2) et 133 371/166 175 lectures ont été déduites en IgBLAST¹⁹VDJ-productifs.

La figure 3 montre un profil de répertoire de VDJ-réarrangement par 3D-VDJ-intrigue, dans lequel la taille de chaque boule représente le nombre relatif de lectures ; en d’autres termes, le nombre des anticorps ARNm dans les cellules entières de B. Le maillage 3D est constitué de 110 IGHV, 12 IGHD et IGHJ 4, qui sont alignés pour refléter leur ordre sur le chromosome. En outre, les gènes de manière ambiguë attribués par IgBLAST ont été collectés séparément en dernière position pour chaque ligne IGHV, IGHD et IGHJ, donnant naissance à 7 215 nœuds dans le cuboïde.

En outre, montré à la Figure 3 est un 2D-VJ-terrain montrant le profil de VJ-réarrangement dans le répertoire de l’IgL. La longueur de chaque barre sur cette parcelle représente le nombre relatif de lectures. L’axe des abscisses représentant 3 gènes IGLVλ et IGLVκ 101, et l’axe y représentant 3 gènes IGLJλ et IGLJκ 4. Les non annotées V-J-gènes et sont représentées à la limite droite.

La région 3 (CDR3) déterminant la complémentarité des séquences de ces lectures productifs, qui donnent lieu à la majorité de la spécificité de liaison de l’antigène, sont donnés dans les sorties de la IgBLAST. Le CDR3 séquences peuvent être analysées statistiquement, y compris les réplicats biologiques ou techniques, comme décrit précédemment,⁸^,¹⁰.

Répertoires d’anticorps humain

Un point de vue d’un répertoire d’anticorps humain dans son ensemble peut être analysée de divers tissus, y compris les cellules mononucléaires de sang périphérique (PBMC) ou des tissus pathologiques. Figure 4 montre des résultats représentatifs de l’IgM, IgG (IgG1, IgG2, IgG3 et IgG4) de total, total IgA (IgA1 et IgA2), IgD, IgE et IgL répertoires de PBMC normal. Un résumé des nombres de lecture est indiqué dans le tableau 3. Par exemple, 90 238/1 582 754 lectures contenaient des IgM spécifiques signature séquence et 67 896/90 238 lectures étaient productifs VDJ.

Le profil de répertoire de réarrangement VDJ est montré sur un 3D-VDJ-complot dans lequel la taille de chaque boule représente le nombre relatif de lectures ; en d’autres termes, le nombre des anticorps mRNA de PBMC entiers (Figure 4). Le maillage 3D se compose de 56 IGHV, 27 IGHD et IGHJ 6, alignés dans l’ordre qu’ils apparaissent sur le chromosome. En outre, gènes ambigu attribués par IgBLAST sont représentés séparément en dernière position pour chaque ligne IGHV, IGHD et IGHJ, donnant naissance à 11 172 noeuds dans le cuboïde.

Le profil de VJ-réarrangement dans le répertoire IgL est représenté dans un 2D-VJ-complot dans lequel la longueur de chaque barre représente le nombre relatif de lectures (Figure 4). L’axe des abscisses représentant 41 IGLVκ et 32 IGLVλ gènes, et l’axe y représentant 5 IGLJκ et 5 IGLJλ gènes. L’ONU-V - et J-gènes annotés sont représentés sur la limite droite.

Les séquences de CDR3 humaines sont donnés en IgBLAST sorties et peuvent être analysées statistiquement comme décrit plus haut⁸^,¹⁰.

Classe d’immunoglobuline	Sens	Antisens
Chaînes lourdes d’immunoglobulines souris (C57BL/6)
IgM	AGTCAGTCCTTCCCAAATGTC	GACATTTGGGAAGGACTGACT
IgG1	AAAACGACACCCCCATCTGTC	GACAGATGGGGGTGTCGTTTT
(Variante IgG1)	AAAACAACACCCCCATCAGTC	GACTGATGGGGGTGTTGTTTT
IgG2c	AAAACAACAGCCCCATCGGTC	GACCGATGGGGCTGTTGTTTT
IgG3	GTGATCCCGTGATAATCGGCT	AGCCGATTATCACGGGATCAC
IgA	TCCCTTGGTCCCTGGCTGCAG	TCCCTTGGTCCCTGGCTGCAG
Chaînes légères de l’immunoglobuline de souris (C57BL/6)
Igκ	CTGTATCCATCTTCCCACCATCCAGTGAGC	GCTCACTGGATGGTGGGAAGATGGATACAG
Igλ1	TGTTTCCACCTTCCTCTGAAGAGCTCGAG	CTCGAGCTCTTCAGAGGAAGGTGGAAACA
Igλ2	TGTTTCCACCTTCCTCTGAGGAGCTCAAG	CTTGAGCTCCTCAGAGGAAGGTGGAAACA
Igλ3	TGTTTCCACCTTCCCCTGAGGAGCTCCAG	CTGGAGCTCCTCAGGGGAAGGTGGAAACA
Igλ4	TGTTCCCACCTTCCTCTGAAGAGCTCAAG	CTTGAGCTCTTCAGAGGAAGGTGGGAACA
Chaînes lourdes des immunoglobulines humaines
IgM	GGGAGTGCATCCGCCCCAAC	GTTGGGGCGGATGCACTCCC
IgG	GCTTCCACCAAGGGCCCATC	GATGGGCCCTTGGTGGAAGC
IgA	GCATCCCCGACCAGCCCCAA	GACCGATGGGGCTGTTGTTTT
IgD	GCACCCACCAAGGCTCCGGA	TCCGGAGCCTTGGTGGGTGC
IgE	GCCTCCACACAGAGCCCATC	GATGGGCTCTGTGTGGAGGC
Chaînes légères des immunoglobulines humaines
Igκ	ACTGTGGCTGCACCATCTGC	GCAGATGGTGCAGCCACAGT
Igλ1, 2, 6	GTCACTCTGTTCCCGCCCTC	GAGGGCGGGAACAGAGTGAC
Igλ3, 7	GTCACTCTGTTCCCACCCTC	GAGGGTGGGAACAGAGTGAC

Tableau 2 : Sommaire des séquences immunoglobuline signature

ISFH souris	Totales lectures	IgM	IgG1	IgG2c
Entrée	475 144
Contenant du CIG		166 175	229 671	36 628
VDJ-productif		133 371	196 583	31 446
IgL de souris	Totales lectures	IgKappa	IgLambda
Entrée	527 668
Contenant du CIG		178 948	21 446
VJ-productif		160 924	16 988
ISFH humaine	Totales lectures	IgM	IgG	IgA	IgD	IgE
Entrée	1 582 754
Contenant du CIG		90 238	5 298	94 061	75 549	2 932
VDJ-productif		67 896	2 775	78 203	56 495	3
IgL humaine	Totales lectures	IgKappa	IgLambda
Entrée	1 582 754
Contenant du CIG		120 316	64 148
VJ-productif		97 169	52 324

Tableau 3 : Sommaire des numéros dans les expériences de lecture

Figure 1 : représentation schématique de la stratégie de séquencement pour analyser les répertoires d’anticorps chez la souris individuels. (A) ARN total des tissus ou cellules immunitaires a été inverse-transcrits et amplifié par PCR à l’aide de l’amorce universelle vers l’avant et d’immunoglobulines spécifiques à la classe inverser amorces. Les amplicons de chaque classe d’immunoglobuline ont été mis en commun et rendus pour l’ordonnancement de la prochaine génération. (B) biologique réplique tels que des rates de souris C57BL/6 ont été traités comme suit : ARN total ont été purifiée à partir d’échantillons de la rate et des ADNc ont été amplifiés par 5' de course utilisant l’amorce universelle et les anticorps spécifiques à la classe amorce. Ils ont été ensuite rendus pour séquençage de nouvelle génération avec étiquetage des amorces pour les souris. Certaines parties de la figure sont adaptés des⁸ avec permission. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Figure 2 : schématique d’organigramme informatique pour analyser les répertoires d’anticorps chez la souris individuels. Lectures d’amplicon obtenues après le séquençage de nouvelle génération ont été traitées comme suit : (1) séquences de lecture ont été vérifiées pour la présence des anticorps spécifiques à la classe signature séquences ; (2) les séquences ont été examinés pour la V, D, et des fragments de gène J utilisant IMGT/HighV-Quest et/ou IgBLAST ; (3) les séquences contenant une jonction VDJ productive ont été recueillis ; et (4) ces séquences ont été utilisées pour l’analyse de l’ensemble des caractéristiques répertoire, CDR3, etc s’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Figure 3 : visualisation de données globales pour les répertoires d’anticorps souris. Les profils de répertoire global de chaque classe d’anticorps ont été visualisées par 3D-VDJ-terrain. L’axe des abscisses représentant 110 gènes IGHV classés comme sur le chromosome. Les axes y et z représente 12 IGHD et 4 gènes IGHJ, respectivement. Le volume des sphères sur chaque nœud représente le nombre de lectures. Les sphères rouges : gènes V, D et J non annotés. L’IgL lire les distributions sont affichées sur un 2D-VJ-terrain dans lequel la longueur de chaque barre représente le nombre relatif de lectures. L’axe des abscisses représentant 101 x 3 gènes de x IGLVλ et de IGLVκ, et l’axe y représentant 4 x 3 gènes de x IGLJλ et de IGLJκ. Les gènes V et J non-annotés sont représentés sur la limite droite. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Figure 4 : visualisation de données globales pour les répertoires de l’anticorps humain. Les profils de répertoire global de chaque classe d’anticorps ont été visualisées par 3D-VDJ-terrain. L’axe des abscisses représentant 56 gènes IGHV classés comme sur le chromosome. Les axes y et z représente 27 IGHD et 6 gènes IGHJ, respectivement. Le volume des sphères sur chaque nœud représente le nombre de lectures. Les sphères rouges : gènes V, D et J non annotés. Les lectures de l’IgL sont rangés sur le 2D-VJ-complot dans lequel la longueur de chaque barre représente le nombre relatif de la lit. L’axe des abscisses représentant 41 x 32 gènes de x IGLVλ et de IGLVκ, et l’axe des ordonnées représentant 5 x 5 gènes de x IGLJλ et de IGLJκ. L’ONU-V - et J-gènes annotés sont représentés sur la limite droite. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Discussion

La méthode décrite ici utilise NGS anticorps ARN amplifié à l’aide de la méthode 5'-RACE. Contrairement aux méthodes qui utilisent des amorces de gène dégénérés 5'-V_H , ARNm de chaque classe d’anticorps est amplifiées uniformément à l’aide d’amorces universelles de vers l’avant. En outre, l’utilisation des amorces anti-sens spécifiques pour la région constante-1 (CH1) du gène anticorps active le répertoire profilage des classes d’immunoglobulines spécifiques. Ceci est très bénéfique pour disséquer la réponse en anticorps spécifiques à la classe, ainsi que pour comparer les naïfs et les répertoires immunisés⁸^,⁹.

Un piège très probablement de la méthode est une rareté des messages d’immunoglobuline amplifié. La profondeur du répertoire d’anticorps obtenu par le présent protocole substantiellement dépend de l’amplification par PCR décrite aux points 3.1 et 3.2. Si la profondeur du répertoire n’est pas correctement obtenue, changeant les rapports modèle ADNc et apprêts en étapes 3.2.1 ou 3.2.2 est fortement recommandé.

En général, environ 20 % les lectures de l’anticorps produit par NGS sont ambiguës séquences²¹. Mis en place même avec des « méthodes de correction », 5-10 % restent ambigus³. Donc, nous, analysé la séquence et filtrée lectures brutes contenant des séquences de signature correspondant à des régions constante de l’immunoglobuline (CμH1, Cγ1H1, Cγ2cH1, etc..). L’analyse de hyper-mutations somatiques doit donc les examens prudents.

Une des limites de cette méthode est que lourde de l’immunoglobuline et paire de chaînes légères ne peut être déduit. La vue de répertoire obtenue par cette méthode n’est donc pas holistique. Toutefois, il est possible de rapprocher les paires de haut rang par analyse statistique des données¹⁰. En outre, une nouvelle méthode en séquence les paires d’immunoglobuline a été rapporté récemment³^,⁴.

Les séquences d’immunoglobulines dans les données de .fna de sortie ont été extraits basée sur la présence de séquences géniques de signature immunoglobuline. Le gène V, D et J segments ont été annotées puis et la productivité des réarrangements V (D) J ont été évaluées. La région 3 (CDR3) déterminant la complémentarité des séquences ont été également annotés. Ces examens systématiques des séquences d’immunoglobuline dans .fna données proviennent utilement l’IMGT/HighV-quête serveur²²^,²³^,²⁴. Cependant, construction d’un pipeline de traitement automatisé a le mérite d’analyser les données expérimentales grosses. Le pipeline personnalisé pour chaque but est possible de mettre en place à l’aide de la version autonome de protocole IgBLAST¹⁹. Cette approche nécessite des connaissances de base en programmation mais est très utile pour des analyses détaillées du système immunoglobuline. Les pipelines décrites sont les exemples du protocole personnalisé (Figure 2).

Le nombre d’anticorps lit est proportionnelle à la quantité d’ARN d’anticorps dans l’échantillon, ce qui reflète les constituants de l’anticorps du système anticorps à donné temps points⁵^,⁸^,²⁵. La méthode décrite ici donne une vue d’oiseau de la constitution de V (D) J d’un répertoire d’anticorps à l’aide de programmes de R⁸^,¹⁸^,²⁶.

La vision globale des répertoires d’anticorps IgM de souris naïves individuels ont révélé un profil VDJ hautement conservé par rapport à celles des IgG1 ou IgG2c⁸. Il a été signalé que des combinaisons de VDJ du poisson-zèbre immature sont très stéréotypés⁹. En revanche, les combinaisons de VDJ humaines sont signalés comme étant fortement inclinées⁶. Les profils VDJ déterministes hautement conservées dans les cellules de B de naïve sont probablement soit générée par VDJ-réarrangements asymétriques ou négative sélection avec auto-antigènes présentés dans le corps. Par exemple, IGHV11-2 est exprimé préférentiellement dans le foetus IgM répertoire²⁷ et cette prédominance est attribuée à l’autoreactivity du IGHV11-2 contre les érythrocytes sénescents²⁷. Fait intéressant, IGHV11-2 était aussi le grand répertoire plus courant dans notre analyse déjà publiée de naïve IgM⁸.

La méthode décrite ici est utile pour décrypter les répertoires sensibles aux antigène anticorps en analysant inclusivement l’espace répertoire anticorps généré dans des organes individuels, évitant l’omission involontaire de l’anticorps principaux répertoires⁸^, ¹⁰. Cette méthode permet également l’examen du dynamisme de réseau détaillées d’anticorps, qui faciliterait accélérée découverte d’anticorps protecteurs contre les nouveaux agents pathogènes.

Disclosures

Les auteurs n’ont aucun conflit d’intérêt à divulguer.

Acknowledgments

Ce travail a été soutenu par une subvention de AMED sous Grant nombre JP18fk0108011 (KO et SI) et JP18fm0208002 (TS, KO et YO) et une subvention du ministère de l’éducation, de Culture, de Sports, de Science et de technologie (15K 15159) à KO. Nous remercions Sayuri Yamaguchi et Satoko Sasaki pour l’assistance technique précieuse. Nous tenons à remercier Editage (www.editage.jp) pour l’édition de langue anglaise.

Materials

Name	Company	Catalog Number	Comments
0.2 mL Strip Tubes	Thermo Fisher Scientific	AB0452	120 strips
100 bp DNA Ladder	TOYOBO	DNA-035	0.5 mL
2100 Bioanalyzer Systems	Agilent Technologies	G2939BA /2100
Acetic Acid	Wako	017-00256	500 mL
Agarose, NuSieve GTG	Lonza	50084
Ammonium Chloride	Wako	017-02995	500 g
Chloroform	Wako	038-02606	500 mL
Dulbecco's PBS (-)“Nissui”	NISSUI	08192
Ethylenediamine-N,N,N',N'-tetraacetic Acid Disodium Salt Dihydrate (2NA)	Wako	345-01865	500 g
Falcon 40 µm Cell Strainer	Falcon	352340	50/Case
ling lock tube 1.7 mL	BM EQUIPMENT	BM-15
ling lock tube 2.0 mL	BM EQUIPMENT	BM-20
MiSeq Reagent Kit v2	illumina	MS-102-2003	500 cycles
MiSeq System	illumina	SY-410-1003
NanoDrop 2000c Spectrophotometer	Thermo Fisher Scientific
Potassium Hydrogen Carbonate	Wako	166-03275	500 g
PureLink RNA Mini Kit	life technologies	12183018A
Qubit 3.0 Fluorometer	Thermo Fisher Scientific	Q33216
Qubit dsDNA HS Assay Kit	Thermo Fisher Scientific	Q32854	500 assays
SMARTer RACE 5’/3’ Kit	Clontech	634858
TaKaRa Ex Taq Hot Start Version	Takara Bio Inc.	RR006A
Trizma base	Sigma	T6066	1 kg
TRIzol Reagent	AmbionThermo Fisher Scientific	15596026	100 mL
Ultra Clear qPCR Caps	Thermo Fisher Scientific	AB0866	120 strips
UltraPure Ethidium Bromide	Thermo Fisher Scientific	15585011
Wizard SV Gel and PCR Clean-Up System	Promega	A9282

DOWNLOAD MATERIALS LIST

References

Schroeder, H. W. Jr Similarity and divergence in the development and expression of the mouse and human antibody repertoires. Developmental & Comparative Immunology. 30 (1-2), 119-135 (2006).
Tonegawa, S. Somatic generation of antibody diversity. Nature. 302 (5909), 575-581 (1983).
Georgiou, G., et al. The promise and challenge of high-throughput sequencing of the antibody repertoire. Nature Biotechnology. 32 (2), 158-168 (2014).
Lees, W. D., Shepherd, A. J. Studying Antibody Repertoires with Next-Generation Sequencing. Methods in Molecular Biology. 1526, 257-270 (2017).
Weinstein, J. A., Jiang, N., White, R. A. 3rd, Fisher, D. S., Quake, S. R. High-throughput sequencing of the zebrafish antibody repertoire. Science. 324 (5928), 807-810 (2009).
Arnaout, R., et al. High-resolution description of antibody heavy-chain repertoires in humans. PLoS One. 6 (8), e22365 (2011).
Boyd, S. D., et al. Individual variation in the germline Ig gene repertoire inferred from variable region gene rearrangements. Journal of Immunology. 184 (12), 6986-6992 (2010).
Kono, N., et al. Deciphering antigen-responding antibody repertoires by using next-generation sequencing and confirming them through antibody-gene synthesis. Biochemical and Biophysical Research Communications. 487 (2), 300-306 (2017).
Jiang, N., et al. Determinism and stochasticity during maturation of the zebrafish antibody repertoire. Proceedings of the National Academy of Sciences of the United States of America. 108 (13), 5348-5353 (2011).
Sun, L., et al. Distorted antibody repertoire developed in the absence of pre-B cell receptor formation. Biochemical and Biophysical Research Communications. 495 (1), 1411-1417 (2018).
Olivarius, S., Plessy, C., Carninci, P. High-throughput verification of transcriptional starting sites by Deep-RACE. Biotechniques. 46 (2), 130-132 (2009).
Yeku, O., Frohman, M. A. Rapid amplification of cDNA ends (RACE). Methods in Molecular Biology. 703, 107-122 (2011).
Zhu, Y. Y., Machleder, E. M., Chenchik, A., Li, R., Siebert, P. D. Reverse transcriptase template switching: a SMART approach for full-length cDNA library construction. Biotechniques. 30 (4), 892-897 (2001).
Vollmers, C., Sit, R. V., Weinstein, J. A., Dekker, C. L., Quake, S. R. Genetic measurement of memory B-cell recall using antibody repertoire sequencing. Proceedings of the National Academy of Sciences of the United States of America. 110 (33), 13463-13468 (2013).
SMARTer RACE 5’/3’ Kit User Manual (634858, 634859). , (2018).
FASTX-Toolkit. , Available from: http://hannonlab.cshl.edu/fastx_toolkit/ (2018).
Perl. , Available from: https://perldoc.perl.org/ (2018).
R: A language and environment for statistical computing. , R Foundation for Statistical Computing. Vienna, Austria. (2016).
Ye, J., Ma, N., Madden, T. L., Ostell, J. M. IgBLAST: an immunoglobulin variable domain sequence analysis tool. Nucleic Acids Research. 41 (Web Server issue), W34-W40 (2013).
IgBLAST. , Available from: https://www.ncbi.nlm.nih.gov/igblast/faq.html (2018).
Prabakaran, P., Streaker, E., Chen, W., Dimitrov, D. S. 454 antibody sequencing - error characterization and correction. BMC Research Notes. 4, 404 (2011).
Lefranc, M. P., et al. IMGT, the international ImMunoGeneTics information system. Nucleic Acids Research. 37 (Database issue), D1006-D1012 (2009).
Alamyar, E., Duroux, P., Lefranc, M. P., Giudicelli, V. IMGT((R)) tools for the nucleotide analysis of immunoglobulin (IG) and T cell receptor (TR) V-(D)-J repertoires, polymorphisms, and IG mutations: IMGT/V-QUEST and IMGT/HighV-QUEST for NGS. Methods in Molecular Biology. 882, 569-604 (2012).
IMGT/HighV-QUEST. , Available from: http://www.imgt.org/HighV-QUEST/login.action (2018).
Glanville, J., et al. Precise determination of the diversity of a combinatorial antibody library gives insight into the human immunoglobulin repertoire. Proceedings of the National Academy of Sciences of the United States of America. 106 (48), 20216-20221 (2009).
rgl: 3D Visualization Using OpenGL. , R package version 0.95.1247 (2015).
Hardy, R. R., Wei, C. J., Hayakawa, K. Selection during development of VH11+ B cells: a model for natural autoantibody-producing CD5+ B cells. Immunological Reviews. , 60-74 (2004).

Immunology and Infection

Identification des souris et des répertoires d’anticorps humain par séquençage de prochaine génération

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.