Этот протокол описывает метод для сопоставления пре мРНК 3′ конца обработки сайтов.
Исследования в течение последнего десятилетия показали, сложной и динамичной разнообразие пре мРНК расщепления и сплайсингу реакций. мРНК с длиной 3′ untranslated регионами (необычных) генерируются в дифференцированных клеток, тогда как пролиферирующих клеток преференциально Экспресс стенограммы с короткой 3′ необычных. Мы описываем A-seq протокол, теперь в его второй версии, которая была разработана карта сплайсингу сайты генома общесистемной и изучить правила пре мРНК 3′ конца обработки. Также этот текущий протокол использует polyadenylate (poly(A)) хвосты, которые добавляются во время биогенеза наиболее mammalian mRNAs обогатить для полностью обработанный мРНК. ДНК адаптер с deoxyuracil на его четвертой позиции позволяет точное обработка мРНК 3′ конца фрагментов для виртуализации. Не включая культуры клеток и ночи перешнуровок протокол требует около 8 h практическое время. Наряду с этим предоставляется пакет простое в использовании программное обеспечение для анализа данных производного последовательности. A-seq2 и связанные анализ программного обеспечения обеспечивают эффективное и надежное решение для сопоставления пре мРНК 3′ заканчивается в широком диапазоне условий, от 106 или меньше клеток.
Захват и последовательность мРНК 3′ концы позволяет изучение обработки мРНК и количественная оценка экспрессии генов. Из-за их poly(A) хвосты эукариотические мРНК могут быть эффективно очищены от всего lysates клетки с шарик прикол oligo-deoxythymidine (oligo(dT)) молекулы, которые также могут воспламенить синтез cDNA. Однако этот подход имеет два недостатка. Во-первых тянется A являются внутренними для стенограммы можно также премьер синтеза cDNA, что приводит к ложным poly(A) сайтов. Во-вторых, однородной poly(A) тянется представляют конкретные проблемы для виртуализации, помимо не информативна для идентификации транскрипт. Были предложены различные подходы обойти эти ограничения, такие как обратная транскрипция через poly(A) хвосты, следуют H РНКазы пищеварения (3 P-seq 1), использование пользовательской последовательность праймера, заканчивающийся в 20 Ts (2 P-seq 2), предыскания из Фрагменты РНК с poly(A) хвосты свыше 50 нуклеотидов с последующим H РНКазы пищеварения (3′ ЧИТАЕТ 3), а также использование праймера oligo-dT, содержащий 3′ адаптер в шпильку ( 4A-seq) грунт45 У.Е.5Т.
Недавно разработанный метод A-seq2 5 стремится обойти последовательности через poly(A) и в то же время для сведения к минимуму долю димеры, которые генерируются самолигирование адаптеров, особенно происходит когда Молярная концентрация адаптеры перевешивает Вставка концентрации. Эта проблема может быть устранена, когда оба адаптеры лигируют и тот же тип полинуклеотид концы как A-seq2, где 3′ адаптеры лигируют к 5′ концу фрагменты РНК и адаптеры 5′ 5′ концы cDNAs после обратной транскрипции. Метод является более удобным, чем наши ранее предложенных A-seq – в котором последовательности был в 5′-к-3 «направление, потребовав точно контролируется РНК фрагментации-, сохраняя при этом высокую точность идентификации сайта poly(A). Около 80% последовательного читает в типичных образцов однозначно сопоставить генома и привести к идентификации более 20 000 poly(A) сайт кластеров, более 70% которых перекрывающихся с аннотированной 3′ необычных.
Короче говоря A-seq2 протокол начинается с мРНК фрагментации и перевязка реверс дополнение 3′ адаптеры на 5′ концы фрагменты РНК. Поли (А)-содержащие РНК затем обратной транскрипции с 25 нуклеотидов (nt) длиной oligo(dT) грунт, который содержит нуклеотидов якорь в конце 3′, dU в позиции 4 и биотина 5′ в конце, позволяя привязки cDNA магнитные стрептавидина бисером. Большая часть грунтовки, включая биотин, удаляется из cDNA путем расщепления на dU пользователя фермент смесь, содержащие урацила ДНК glycosylase (UDG) и VIII эндонуклеазы glycosylase лиазы ДНК. Эта реакция оставляет нетронутыми концы для перевязки адаптер 5′, и три слева Ts после расщепления по-прежнему отмечать местоположение poly(A) хвост. Потому что 5′ и 3′ адаптеры прикреплены перевязки для получателей 5′ концы, генерируются нет димеров адаптер. Четырех нуклеотидов случайных РВК представил в начале чтения позволяет кластера резолюции по последнему слову последовательности документов и может также служить уникальный идентификатор молекулярные (UMI) для обнаружения и удаления артефактов амплификации PCR. Размер UMI можно увеличить, как это сделано в других исследованиях 6. Протокол создает чтений, которые являются вспять дополнение к мРНК 3′ заканчивается, все начиная с рандомизированных Тетрамер следуют 3 ц. обработка чтений, которые имеют 3 диагностические Ts на их 5′ конца начинается с коррекции артефактов амплификации PCR Использование UMIs, удаление 3′ адаптер последовательностей и отменить дополнения. Читает, которые возможно, возникла из oligo(dT) грунтовки на внутренние узлы A-богатые люди также определены вычислительно и отбрасывается. Паразитные сайты, как правило, недостает одной из 18 хорошо изученных и сохраняется poly(A) сигналов, которые должны быть расположен ~ 21 нуклеотидов вверх по течению сайт очевидно расщепления 7.
Протокол требует около 8 h практическое время, не считая культуры клеток и ночи перешнуровок. Связанные прочитать анализ программного обеспечения позволяет идентификации сайта высокоточную poly(A). С сайта poly(A) кластеры созданы на основе 4 образцы, далее подчеркивается в этой рукописи (два биологических реплицирует Си HNRNPC-лечение клеток и управления siRNA) 84% совпадения с аннотированной гена и из них, 75% совпадения с 3′ УТР и 86% либо с 3′ УТР или терминала экзона. Коэффициент корреляции Пирсона выражения 3′ концы в реплицировать образцах-0,92, и значения из более 0,9 обычно получаются с помощью метода. Таким образом A-seq2 — удобный метод, который дает очень воспроизводимые результаты.
Множество основных и вспомогательных факторов, которые участвуют в пре мРНК 3′ конца обработки отражается в пейзаже соответственно комплекс сплайсингу. Кроме того сплайсингу также реагировать на изменения в рамках других процессов, например транскрипции и сплайсинга. 3′ конца расщепления сайтов в пре мРНК обычно определяются на основании характерных poly(A) хвосты, которые добавляются к продукты расщепления 5′. Большинство методов использования грунтовки oligo(dT) переменной длины, которые позволяют конкретные преобразования поли (А)-содержащих mRNAs cDNAs в реакции обратной транскрипции. Общей проблемой этого подхода является внутренним грунтовки для A-богатые последовательности привело артефакты расщепления сайтов. Были предложены два метода, которые стремятся обойти этот артефакт на стадии подготовки проб. В 3P-seq метод 1адаптеры специально лигируют концы poly(A) хвосты с помощью шины oligo последовали частичный RNase T1 пищеварение и обратной транскрипции с ТТП в реакции как только deoxynucleotide. Полученный heteroduplexes poly(A)-poly(dT) затем усваиваются с H РНКазы и изолированы, лигируют адаптерам и виртуализированных оставшиеся фрагменты РНК. Простой и элегантный способ, 2P-seq, который использует пользовательские последовательности грунт, пропуск, оставшихся oligo(dT) стрейч в последовательности реакции сообщили же авторы 2. В связанный метод, 3′ ЧИТАЕТ 3, необычно длинные грунтовка 5 нас и 45 Ts, также содержащие биотин отжигом в разрозненных РНК, следуют строгим смывки для выбора для молекул РНК с хвостами poly(A) более 50 нуклеотидов. Хотя 3′ ЧИТАЕТ резко снижает частоту внутреннего грунтовки, он не полностью устраняет ее 3. Также были предложены протоколы для прямой последовательности РНК, но результирующая читает короткие и имеют высокий уровень ошибки и этот подход не был далее развитые 18,,19–20. Поля-Seq и коммерциализированной протоколы Квант Seq сочетают грунтовки на основе oligo(dT) с шагом случайных грунтовки для синтеза cDNA второй стренги 20. Использование шаблона переключателя обратной транскрипции реакции с обратной транскриптазы Молони мышиных вирус лейкемии (MMLV) приводит к генерации cDNAs с линкеры за один шаг и тем самым не адаптер димеры могут появляться в PAS-Seq и SAPAS методы 21 , 22.
A-seq2 метод здесь представлены выделяется в его использования горные нуклеотидов (dU) в пределах биотинилированным oligo(dT) грунт. Эта модификация сочетает в себе программу обогащения oligo(dT) гибридизированных, polyadenylated целей с удалением большей последовательности25 oligo (dT) от изолированных фрагментов до библиотеки готовятся и сохранение трех Ts, который указывают на наличие предварительного poly(A) хвоста. Напротив методы, которые используют H РНКазы удалить poly(A) из молекул РНК случайно оставить несколько как. Поскольку в A-seq2, секвенирование делается из 3′ конца стренги анти чувство, расщепление сайты являются предсказал должен располагаться после NNNNTTT мотив в начале чтения необработанных последовательностях. Рандомизированные тетрамера служат не только для того, чтобы позволить базы, но и вызов в ликвидации артефактов амплификации PCR. Длиннее UMIs также могут быть размещены. Возможность внутренней грунтование остается в A-seq2 и адресован вычислительно, сначала путем отбрасывания 3′ заканчивается с genomically кодировке, А богатые течению последовательности, а затем путем отбрасывания 3′ конца кластеры, которые можно объяснить внутренними грунтовки на Сам сигнал A-богатых poly(A). Недавний анализ сайтов poly(A), однозначно выведено большое количество протоколов указывает сайты, которые являются уникальными для A-seq2 распределение ожидаемых нуклеотидов и расположение внутри генов, похож на другие 3′ конца последовательность протоколов.
Важнейшим шагом в A-seq2 является выбор polyadenylated РНК и удаление рибосомной РНК и различных малых РНК. Проще всего это делается путем мРНК изоляции комплект с олиго (dT)25 магнитные бусы. В принципе общая РНК, изолированные с фенолом, содержащие решения также дает высокое качество РНК, которые могут далее подвергаться выбор мРНК изоляции комплект или oligo (dT) агарозы. Шаг, который может изменяться в A-seq2 это лечение с щелочной гидролиз, который может быть сокращен или продлен до получения РНК фрагменты разных размеров. Критической является также дополнение 3′ dATP 3′ концы фрагменты РНК, poly(A) полимеразы эффективным. В протоколе, описанные здесь это лечение применяется для всех РНК фрагменты, чтобы избежать concatemerization во время реакции перешнуровки. Наконец мы отмечаем, что, хотя РНК лигаза 1 обычно используется как РНК лигаза, он также ligates эффективно одного мель ДНК, как мы сделали здесь, чтобы перевязать адаптер к 5′ концу cDNA молекул.
Таким образом A-seq2 является эффективным и легко осуществить протокол для идентификации пре мРНК 3′ конца обработки сайтов. Будущие события могут включать дальнейшее сокращение сложности протокола и количество требуемых материалов. Связанный набор инструментов анализа вычислительных данных далее включить однородную обработку 3′ конца последовательности читает, полученные с широким спектром протоколов.
The authors have nothing to disclose.
Авторы благодарят миссис Béatrice Димитриадес за помощь с клеточной культуры. Эта работа была поддержана Швейцарский Национальный научный фонд грантов #31003A_170216 и 51NF40_141735 (НКРС РНК & болезнь).
Materials | |||
Agarose, ultra pure | Invitrogen | 16500-500 | |
2100 Bioanalyzer | Agilent | G2940CA | |
Cordycepin triphosphate (3’ dATP) | SIGMA | C9137 | |
DNA low bind vials, 1.5 ml | Eppendorf | 22431021 | |
Dulbecco’s Phosphate Buffered Saline | SIGMA | D8637 | |
Dynabeads mRNA-DIRECT Kit | Ambion | AM61012 | |
GR-Green dye | Excellgen | EG-1071 | use 1:10,000 dillution |
HiSeq 2500 or NextSeq 500 next generation sequencers | Illumina | inquire with supplier | |
KAPA HiFi Hotstart DNA polymerase mix | KAPA/Roche | KK2602 | |
Nuclease free water | Ambion | AM9937 | |
Poly(A) polymerase, yeast | Thermo Fisher Scientific | 74225Z25KU | |
Poly(A) polymerase, E.coli | New England Biolabs | M0276L | |
Polynucleotide kinase | Thermo Fisher Scientific | EK0032 | |
QIAEX II Gel Extraction Kit | Qiagen | 20021 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
RNA ligase 1, high concentration | New England Biolabs | M0437M | includes PEG-8000 |
RNeasy MinElute RNA Cleanup kit | Qiagen | 74204 | |
RNase H | New England Biolabs | M0279 | |
RNasin Plus, ribonuclease inhibitor | Promega | N2618 | |
Superscript IV reverse transcriptase | Thermo Fisher Scientiific | 18090050 | |
Turbo DNase | Ambion | AM2238 | |
USER enzyme mix | New England Biolabs | M5505 | |
Dyna-Mag-2 magnetic rack | Thermo Fisher Scientific | 12321D | |
Thermomixer C | Eppendorf | 5382000015 | Heated mixer with heated lid |
MicroSpin columns | GE-Healthcare | 27-5325-01 | |
Name | Company | Catalog Number | Comments |
Buffers | |||
Alkaline hydrolysis buffer, 1.5 x | Mix 1 part 0.1 M Na2CO3 and 9 parts 0.1 M NaHCO3. Add EDTA to 1 mM. Adjust pH to 9.2. Store aliquots at -20 °C. | ||
5x poly(A) polymerase buffer | Thermo Fisher Scientiific | 100 mM Tris-HCl, pH 7.0, 3 mM MnCl2, 0.1 mM EDTA, 1 mM DTT, 0.5 mg/ml acetylated BSA, 50% glycerol | |
Biotin binding buffer | 20 mM TrisCl pH 7.5, 2 M NaCl, 0.1% NP40 | ||
TEN buffer | 10 mM TrisCl, pH 7.5, 1 mM EDTA, 0.02% NP40 | ||
Name | Company | Catalog Number | Sequence |
Oligonucleotides according to Illumina TruSeq Small RNA Sample Prep Kits, for GA-IIx and Hiseq2000/2500 sequencers | Microsynth | ||
revRA3 (RNA) | Microsynth | 5’ amino CCUUGGCACCCGAGAAUUCCA 3’ | |
revDA5 | Microsynth | 5’ amino GTTCAGAGTTCTACAGTCCGAC GATCNNNN-3’ | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' (V = G, A or C) | |
PCR primer forward, RP1 | Microsynth | 5' AATGATACGGCGACCACCGAGA TCTACACGTTCAGAGTTCTACAGTC CGA 3' | |
PCR primer reverse, RPI1, barcode in bold | Microsynth | 5' CAAGCAGAAGACGGCATACGAGA TCGTGATGTGACTGGAGTTCCTTG GCACCCGAGAATTCCA 3' | |
Name | Company | Catalog Number | Comments |
Oligonucleotides according to Illumina TruSeq HT-Small RNA Sample Prep Kits, for HiSeq2000/2500 and NextSeq500 sequencers | |||
HT-rev3A (DNA/RNA) | Microsynth | 5'-amino-GTGACTGGAGTTCAGACGTGTGCT CTTCCrGrAUrC-3' | |
HT-rev5A | Microsynth | 5' amino-ACACTCTTTCCCTACACGACGCTCT TCCGATCTNNNN 3' | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' | |
PCR primers forward (D501-506) | Microsynth or Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACAC[i5]ACACTCTTTCCCTACAC GACGCTCTTCCGATCT -3' | |
PCR primers reverse (D701-D712) | Microsynth or Illumina | 5'-CAAGCAGAAGACGGCATACGAG A[i7]GTGACTGGAGTTCAGACGTG TGCTCTTCCGATC-3' | |
Documentation for Illumina multiplexing: | Illumina | https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf |