$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
StickWRLD był wcześniej używany do wykrywania zależności interpozycyjnych (IPD) między resztami zarówno w ułożeniu DNA3, jak i białka15-17. Te współewoluujące reszty, choć często dystalne od siebie w wyrównaniu sekwencji, są często proksymalne względem siebie w pofałdowanym białku. StickWRLD pozwala na szybkie wykrycie współwystępowania specyficznego dla pozostałości w takich miejscach, np. alanina w pozycji "x" jest silnie skorelowana z treoniną w pozycji "y". Takie korelacje mogą wskazywać na możliwe do udowodnienia relacje strukturalne i zazwyczaj są to miejsca, które z konieczności współewoluują. StickWRLD jest w stanie wykryć te zależności nawet wtedy, gdy bardziej "tradycyjne" podejścia wykorzystujące HMM do opisywania motywów zawodzą. Na przykład analiza wyrównania PFAM domeny pokrywy ADK przy użyciu StickWRLD ujawnia silną dodatnią korelację między cysteinami (C) w pozycjach 4 i 8 a skoordynowaną parą C w pozycjach 35 i 38. W tym samym czasie StickWRLD wykazał podobny silny dodatni związek między histydyną (H) i seryną (S) w 4 i 8, z silnymi negatywnymi relacjami między nimi a kwartetem C w 4, 8, 35 i 38 oraz silnym dodatnim związkiem z kwasem asparaginowym (D) i treoniną (T) odpowiednio w pozycjach 35 i 38. Dodatkowe IPD istnieją między motywem H,S,D,T a T i G w pozycjach **** 10 i 29 w b subtilis ****, co podkreśla warunkowy charakter tych IPD - motyw tetracysteiny nie "dba" o tożsamości w tych dwóch pozycjach, podczas gdy hydrofilowy triada H,S,D,T wymaga określonych reszt w tych pozycjach prawie bezwzględnie. Te dwa zupełnie różne, zależne od położenia motywy pozostałości mogą spełniać tę samą rolę, co wieczko ADK. Jak widać na rysunku 6, na pierwszym planie widoczne jest duże skupisko IPD, w tym 3-węzłowy związek między G (glicyna) na pozycji 132, Y (tyrozyna) na pozycji 135 i P (prolina) na pozycji 141 (rysunek 6A). Na rysunku 6B widok został przekrzywiony tak, aby umieścić użytkownika nieco powyżej cylindra, odsłaniając IPD między H (histydyną) w pozycji 136 a M (metioniną) w pozycji 29, w odległości 107 reszt. Tymczasem motyw pochodzący z PFAM HMM z tej samej domeny (ryc. 2) nie tylko nie wykrywa ich jako specyficznie współwystępujących wariantów motywu, ale także definiuje ogólne grupowania w biologicznie nieuzasadnionym schemacie16.

Rysunek 1. Reprezentacja "Mapa metra" struktury domeny Lid kinazy adenozynowej (ADK) B. subtilis. Strzałki wskazują IPD zidentyfikowane w wyrównaniu PFAM domeny ADK Lid przez StickWRLD. StickWRLD jest w stanie prawidłowo zidentyfikować IChP w klastrze reszt, które znajdują się w bliskim sąsiedztwie w pofałdowanym białku. Szczególnie interesująca jest para T i G w pozycjach 9 i 29, która tworzy IPD tylko wtedy, gdy tetrada reszt w 4, 7, 24 i 27 nie jest C,C,C,C). Wyświetlane numery pozostałości reprezentują pozycję B. subtilis, a nie pozycje wyrównania PFAM. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 2. Skylign18 Hidden Markov Model (HMM) Sequence Logo dla domeny pokrywy ADK. Podczas gdy HMM są potężnymi narzędziami do określania prawdopodobieństwa w każdej pozycji, a także udziału każdej lokalizacji w ogólnym modelu, niezależność od pozycji HMM sprawia, że nie nadają się one do wykrywania IPD. Model ten nie sugeruje żadnej z zależności widocznych w reprezentacjach StickWRLD (Rysunek 6). Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 3. Program ładujący dane StickWRLD. Użytkownicy mogą wybierać spośród istniejących danych demonstracyjnych lub załadować własne dane w postaci dopasowań sekwencji DNA lub białek.

Rysunek 4. Okno StickWRLD Control. Panel sterowania umożliwia użytkownikowi zmianę różnych właściwości widoku, a także regulowanie progów kontrolujących wyświetlanie linii krawędzi wskazujących relacje między pozostałościami (IPD). W czerwonym kółku zaznaczono wartości domyślne, które zwykle należy dostosować, aby uzyskać najlepsze wyświetlanie dowolnego zestawu danych. Wartość resztkowa określa próg (obserwowany-oczekiwany), dla którego rysowane są linie łącznika/skojarzenia. Elementy sterujące etykietami kolumn i kulek określają, czy wyświetlane jest położenie kolumny i wartości pozostałości (np. "A" dla argininy). Kontrolka Linia krawędzi kolumny włącza i wyłącza wyświetlanie linii krawędzi łączących kolumny — w przypadku gęstych zestawów danych lepiej jest ją wyłączyć. Grubość kolumny określa, czy sama kolumna jest wyświetlana, czy nie – ustawienie tej wartości na bardzo małą wartość (np. 0,1) spowoduje narysowanie linii przechodzącej przez sfery w kolumnie, co ułatwi odróżnienie kolumn od siebie. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 5. Początkowy widok okna StickWRLD OpenGL z załadowanym zestawem danych białek domeny kinazy adenylanowej. Perspektywa początkowa patrzy "w dół" przez cylinder składający się z pozycji wyrównania sekwencji. Użytkownik może obracać cylinder za pomocą kliknięcia lewym przyciskiem myszy i przeciągnięcia oraz powiększać/pomniejszać za pomocą kliknięcia prawym przyciskiem myszy. Początkowy widok jest dość gęsty, ponieważ domyślny wyświetlacz pokazuje nawet niewielkie tempo koewolucji. W przypadku wielu białek w tym ustawieniu można wykryć odrębne moduły, ale nawet w gęsto współewoluujących białkach wyświetlacz można szybko i interaktywnie uprościć, aby znaleźć najważniejsze IPD za pomocą interfejsu StickWRLD. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 6. Zbliżenie na wizualizację StickWRLD białka domeny kinazy adenylanowej. Tutaj zmieniliśmy domyślną wartość Residual na 0,2. Zwiększa to próg wyświetlania krawędzi między pozostałościami, pokazując mniej krawędzi. Krawędzie, które pozostały, wskazują na silnie powiązane IPD. Dodatkowo widok został obrócony i powiększony, aby umożliwić łatwiejsze oglądanie krawędzi. (A) Na pierwszym planie widoczna jest duża grupa IPD, w tym 3-węzłowa asocjacja między G (glicyna) na pozycji 132, Y (tyrozyna) na pozycji 135 i P (prolina) na pozycji 141. (B) Widok został zniekształcony tak, aby umieścić użytkownika nieco powyżej cylindra, odsłaniając IPD między H (histydyną) w pozycji 136 a M (metioniną) w pozycji 29, w odległości 107 reszt. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 7. Widok informacyjny w prawym dolnym rogu okna StickWRLD Control. Kliknięcie lewym przyciskiem myszy na obiekcie (np. sferze lub krawędzi) w oknie OpenGL powoduje wyświetlenie informacji o obiekcie w prawym dolnym rogu okna StickWLRD Control. Tutaj widzimy informacje o krawędzi IPD między metioniną w pozycji 29 a histydyną w pozycji 136.