$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
W osobnym badaniu11, DNA zostało wyekstrahowane z proszku kostnego wygenerowanego z każdego miejsca pobierania próbek anatomicznych u 11 osób, przy użyciu standardowego protokołu ekstrakcji DNA zoptymalizowanego pod kątem krótkich fragmentów ze zwapniałej tkanki2. Następnie wyprodukowano biblioteki jednoniciowe28 i zsekwencjonowano na HiSeq 4000 (75 bp paired-end) do głębokości ~20 000 000 odczytów na próbkę. Uzyskane dane sekwencyjne zostały następnie ocenione pod kątem zawartości endogennego ludzkiego DNA przy użyciu EAGER pipeline29 (ustawienia BWA: długość ziarna 32, kara za niedopasowanie 0,1, filtr jakości mapowania 37). Wszystkie reprezentatywne wyniki są raportowane przy użyciu tych samych wskaźników, co Parker i in. 202011 w celu zapewnienia spójności. Biblioteki ze sproszkowanych części pars petrosa dostarczyły średnio wyższego endogennego DNA niż którekolwiek z pozostałych 23 badanych miejsc pobierania próbek anatomicznych (Ryc. 6A-B). Siedem dodatkowych anatomicznych miejsc pobierania próbek przedstawionych w tym protokole (cement, pierwsze przejście komory miazgi zębowej i zębina stałych zębów trzonowych; kość korowa z trzonu kręgu i górny łuk kręgowy kręgu piersiowego; kość korowa z kępki wierzchołkowej paliczka dystalnego oraz kość korowa z szyjki kości skokowej) dało kolejne najwyższe plony (bez istotności statystycznej między tymi anatomicznymi lokalizacjami pobierania próbek; Rysunek 6A-B; Plik uzupełniający 1: EndogenousDNAPreCap). Wszystkie te alternatywne lokalizacje konsekwentnie dawały plony DNA odpowiednie dla standardowych analiz genetyki populacyjnej, takich jak analizy mitochondrialne i analizy polimorfizmu pojedynczego nukleotydu (SNP). Wskaźniki duplikacji w bibliotekach pochodzących ze wszystkich lokalizacji próbkowania anatomicznego były niskie (współczynniki klastrów < średnio 1,2, obliczone jako stosunek wszystkich odczytów mapowania do unikalnych odczytów mapowania, tabela 2; Supplemental File 1: ClusterFactor), co wskazuje, że wszystkie przebadane biblioteki miały bardzo wysoki stopień skomplikowania. Podobnie, średnie szacunki egzogennego zanieczyszczenia ludzkiego DNA były niskie, średnio < 2% (zanieczyszczenie chromosomem X u mężczyzn, n = 7, zgodnie z raportem ANGSD30 pipeline) we wszystkich anatomicznych miejscach pobierania próbek, z wyjątkiem górnego łuku kręgowego (średnie szacowane zanieczyszczenie: 2,11%, z jedną próbką usuniętą jako wartość odstającą; KRA005: 19,52%, zob. tabela 2; Plik uzupełniający 1: Xcontamination). Średnia długość fragmentu (po przefiltrowaniu w celu usunięcia wszystkich odczytów < 30 pz) była najniższa w materiale pobranym z komory miazgi zębowej i zębiny, bez istotnych różnic wśród innych anatomicznych miejsc pobierania próbek (odpowiednio 55,14 pz i 60,22 pz w porównaniu ze średnią medianą 62,87, wartości p parami < 0,019, tab. 2; Plik uzupełniający 1: AvgFragLength). Dodatkowo, zęby i kręgi piersiowe zawierają wiele anatomicznych miejsc pobierania próbek, w których zaobserwowano wysoki poziom endogennego odzyskiwania DNA, co czyni je szczególnie odpowiednimi jako alternatywa dla pars petrosa.

Rysunek 6: Zawartość ludzkiego DNA we wszystkich próbkach przesiewowych. Czarne linie reprezentują ogólną średnią, podczas gdy czerwone linie reprezentują medianę (solidna: proporcja ludzkiego DNA, przerywana: zmapowane odczyty ludzkie na milion wygenerowanych odczytów). Poszczególne miejsca pobierania próbek anatomicznych, w których średni udział ludzkiego DNA jest wyższy niż średnia ogólna (8,16%) są kolorowane we wszystkich analizach. (A) Proporcja odczytów odwzorowanych na genomie referencyjnym hg19. Niebieska linia przerywana reprezentuje teoretyczne maksimum biorąc pod uwagę parametry mapowania rurociągu (wygenerowane przy użyciu Gargammel31 w celu symulacji losowego rozkładu 5 000 000 odczytów z genomu referencyjnego hg19 z symulowanym uszkodzeniem). Indywidualne średnie (X) i mediany (czerwone kółko) są podawane dla tych próbek, w których średni udział ludzkiego DNA jest wyższy niż średnia ogółem. Przedziały ufności wskazują górną i dolną granicę z wyłączeniem statystycznych wartości odstających. (B) Liczba unikalnych odczytów odwzorowujących genom referencyjny hg19 na milion odczytów wysiłku sekwencjonowania (75 pz sparowanego końca). Przedziały ufności wskazują górną i dolną granicę z wyłączeniem statystycznych wartości odstających. Ten rysunek został zaadaptowany z Parker, C. et al. 202011. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.
Tabela 2: Średnie poziomy duplikacji (odczyty mapowania/unikalne odczyty), średnia i mediana długości fragmentów oraz szacunki zanieczyszczenia chromosomu X dla wszystkich miejsc pobierania próbek anatomicznych. Błąd zgłaszany jako błąd standardowy średniej. Ta tabela została zaadaptowana z Parker, C. et al. 202011.
| Miejsce pobierania próbek | Średni współczynnik duplikacji (# zmapowane odczyty / # unikatowe zmapowane odczyty) | Średnia długość fragmentu w bp | Średni szacowany odsetek zanieczyszczenia chromosomem X |
| Piramida Petrousa | 1,188 ± 0,006 | 65,40 ± 1,36 | 0,000 ± 0,003 |
| Cement | 1,197 ± 0,028 | 67,28 ± 1,76 | 0,011 ± 0,003 |
| zębina | 1,188 ± 0,061 | 60,22 ± 2,37 | 0,002 ± 0,007 |
| miąższ | 1,179 ± 0,024 | 55,14 ± 2,90 | 0,013 ± 0,006 |
| Paliczek dystalny | 1,191 ± 0,049 | 65,95 ± 1,08 | 0,013 ± 0,005 |
| Trzon kręgu | 1,194 ± 0,037 | 66,14 ± 1,03 | 0,008 ± 0,003 |
| Łuk kręgowy górny | 1,19 ± 0,017 | 63,02 ± 1,23 | 0,021 ± 0,009* |
| usypisko | 1,198 ± 0,010 | 68,20 ± 1,24 | 0,011 ± 0,003 |
| *Próbka KRA005 usunięta jako wartość odstająca przy 0,1952 | | | |
Dostępność kodu
Wszystkie programy analityczne i moduły R wykorzystane w analizach tego manuskryptu są swobodnie dostępne u ich autorów. Wszystkie niestandardowe kody języka R są dostępne na żądanie.
Dostępność danych
Wszystkie surowe dane użyte do obliczenia reprezentatywnych wyników są swobodnie dostępne w repozytorium danych ENA Europejskiego Archiwum Nukleotydów (numer dostępu PRJ-EB36983) lub w materiałach uzupełniających Parker, C. et al.11.
Plik uzupełniający 1. Kliknij tutaj, aby pobrać ten plik.