December 22nd, 2017
Questo articolo descrive la procedura per l'identificazione e la caratterizzazione di una famiglia di geni a grapevine applicato alla famiglia di Arabidopsis Tóxicos in Levadura (ATL) E3 ubiquitina ligasi.
L'obiettivo generale di questa procedura è quello di ottenere una caratterizzazione esaustiva di una famiglia genica nelle piante con un approccio globale che includa la definizione della struttura genica, i motivi proteici interessati, la posizione cromosomica, le duplicazioni geniche e i modelli di espressione. Questo metodo può aiutare a rispondere a domande chiave nella classificazione delle piante in famiglie, come l'identificazione genomica mondiale dei membri della famiglia e la loro trascrittomia fornisce questo attraverso l'analisi dell'espressione genica. Il vantaggio principale dell'intera procedura è quello di fornire un elenco esaustivo di passaggi sperimentali per ottenere una caratterizzazione completa della famiglia genica.
Questa procedura può essere applicata a qualsiasi famiglia genetica di qualsiasi specie vegetale per la quale sono disponibili dati genetici. Inoltre, questo approccio fornisce informazioni preziose per identificare candidati interessanti per gli studi funzionali. A dimostrare l'intera procedura sarà Pietro Ariani del mio laboratorio.
Apri la pagina web Blast e fai clic sulla sezione dell'esplosione proteica. Nel campo Inserisci sequenza di query, immettere la sequenza di amminoacidi della proteina che verrà utilizzata come sonda per identificare gli altri membri della famiglia. Utilizzare una proteina che abbia tutte le caratteristiche importanti che caratterizzano la famiglia.
Successivamente, nel campo scegli set di ricerca, seleziona la banca dati proteica di riferimento e l'organismo di interesse. Ora, nella selezione del programma sul campo, selezionare l'algoritmo PSI-BLAST. Se lo si desidera, fare clic sui parametri dell'algoritmo per regolare i parametri avanzati come la sequenza target massima e la matrice di punteggio.
Il valore E è la soglia, che per questa ricerca viene ridotta da 005 a 001. Fare clic sul pulsante BLAST per eseguire l'analisi. Da tutte le sequenze che mostrano corrispondenze relative alla query, deselezionare le voci che chiaramente non appartengono alla famiglia.
Fallo facendo clic sul segno di spunta nella colonna di selezione per PSI-BLAST. Quindi, esegui una seconda iterazione PSI-BLAST facendo clic sul pulsante Vai. Tutte le sequenze appena identificate saranno evidenziate in giallo.
Anche in questo caso, deselezionare i risultati che non appartengono alla famiglia. Continuare questo processo fino a quando l'algoritmo non trova alcuna voce rilevante o raggiunge la convergenza. Una volta eliminati tutti i falsi positivi, raccogli le sequenze di amminoacidi in un file formattato FASTA e carica il file nella suite di software bioinformatici.
Quindi, seleziona tutte le sequenze importate nell'elenco e fai clic sul pulsante di allineamento/assemblaggio nella barra degli strumenti. Quindi fare clic su allineamento multiplo a coppie e selezionare Allineamento MUSCOLARE e OK. L'allineamento verrà ora effettuato utilizzando le impostazioni predefinite. Ora visualizza il logo della sequenza dell'allineamento e ispeziona visivamente i geni per cercare falsi positivi.
Ulteriori analisi dei parametri fisici e dei domini delle proteine, della distribuzione cromosomica, delle duplicazioni e dell'organizzazione dell'introne dell'esone sono descritte nel protocollo testuale. Successivamente analizzare le relazioni tra i membri della famiglia ATL attraverso la costruzione di un albero filogenetico di alta qualità e la definizione di una nomenclatura familiare. In primo luogo, recuperare le sequenze ATL arabe adopt systelliana, richieste come riferimenti per la nomenclatura di un gene della vite, dal database UmoProt come riferimento.
Successivamente realizzare un file FASTA comprendente tutte le sequenze nucleotidiche della vite e i membri della famiglia genica Arabidopsis per l'analisi filogenetica. Ora sfoglia la home page di phylogeny France e seleziona la pipeline di analisi della filogenesi. Un clic è adatto nella maggior parte dei casi, ma se necessario, è possibile selezionare impostazioni avanzate specifiche utilizzando le opzioni avanzate o anche un'analisi completamente personalizzata utilizzando le opzioni à la carte.
Quindi, inserisci un nome per l'analisi e carica il file FASTA. Quindi fare clic su Invia per eseguire l'analisi. Se questa procedura genera un messaggio di errore, completare singolarmente ogni passaggio della pipeline della suite filogenetica.
Innanzitutto, vai alla home page del software MUSCLE e carica il file FASTA. Seleziona Pearson FASTA come formato di output e invia. Successivamente, scarica il file in formato FASTA ed elimina eventuali posizioni mal allineate.
Apri lo strumento del server G-block, carica il file FASTA di allineamento, seleziona DNA come tipo di sequenza e scegli il rigore che meglio si adatta all'analisi. Per un allineamento della famiglia genica ATL della vite, selezionare tutte e tre le opzioni proposte per una selezione meno rigorosa a causa dell'elevata divergenza di sequenza. Quindi fare clic su Ottieni blocchi per eseguire l'analisi.
Per salvare i risultati, fare clic sull'allineamento risultante nella parte inferiore della pagina di output e creare un nuovo file FASTA. I blocchi G eliminano la posizione mal allineata nelle regioni divergenti di un DNA o l'allineamento di pungolo in modo che diventi più adatto per un'analisi filogenetica. Per questo passaggio, la selezione dei parametri impericle per il rigore delle colonne è fondamentale per garantire che siano una passività delle tre.
Per completare l'albero, ci rivolgiamo alla home page di Phylogeny France. Lì, seleziona la pipeline à la carte e deseleziona le seguenti opzioni: allineamento multiplo e cura dell'allineamento. Quindi, fai clic su crea flusso di lavoro, carica il file FASTA curato da G-blocks, seleziona la procedura di bootstrap e utilizza i parametri e le impostazioni predefiniti.
Infine, fai clic su Invia per eseguire l'analisi. Questo completa il processo passo dopo passo. Ora che l'albero filogenico è stato creato, collassare i rami scarsamente supportati con valori di bootstrap inferiori al 70%Quindi scaricare i risultati finali nel formato Newick per ulteriori analisi.
Il protocollo testuale fornisce istruzioni su come assegnare un nome genetico in base alla filogenesi. Per questo protocollo, creare un file in formato testo filettato, lineato e di valori di espressione normalizzati da arma presi da una libreria di espressione genica. Organizza i valori per ogni gene della famiglia sotto le stesse righe del modello.
Successivamente, esegui l'analisi gerarchica bi-clustered utilizzando il software di visualizzazione multi-esperimento. Innanzitutto, carica la matrice di dati di lavoro e seleziona il file di testo. Selezionare l'array monocolore e rimuovere il segno di graduazione dall'annotazione di caricamento quando non viene fornita un'annotazione automatica.
Selezionare il valore dell'espressione più in alto a sinistra dell'anteprima della tabella delle espressioni e fare clic sul pulsante di caricamento. Quindi, regolare i dati, applicando la trasformazione Log2 e la normalizzazione di geni/righe. Quindi impostare il limite di scala corretto.
Ora calcola il clustering gerarchico. Nel campo di ottimizzazione dell'ordinazione, selezionare ottimizza l'ordine delle foglie del gene e ottimizza l'ordine delle foglie del campione. Successivamente, nel campo di selezione del metodo di collegamento, selezionare il clustering del collegamento medio e nel campo di selezione della matrice di distanza scegliere Correlazione di Pearson.
Quindi fare clic su OK per eseguire l'analisi. Visualizza i risultati nel pannello di sinistra della finestra ed esporta la mappa di calore facendo clic su Salva immagine nel menu file. Il gene più simile all'arabidopsis thaliana ATL2, secondo una ricerca BLAST-P, è stato utilizzato per esaminare i membri della famiglia ATL nel genoma della vite.
L'analisi PSI BLAST è convergente dopo alcuni cicli, fornendo un elenco di geni putativi nella famiglia dei geni. La presenza del dominio H2 dell'anello canonico per ciascun candidato è stata valutata mediante l'ispezione visiva dell'allineamento MUSCLE. Questo ha ristretto la ricerca a 96 geni della vite.
Per una nomenclatura è stata utilizzata un'analisi filogenetica dei geni identificati confrontandoli con la famiglia di geni ATL dell'arabidopsis. 13 dei 96 ATL della vite hanno ricevuto un identificatore specifico come ortologo del gene ATL dell'arabidopsis. La mappatura dei geni identificati nell'atlante globale dell'espressione genica della vite utilizzando un'analisi gerarchica bi-clustered ha mostrato che tutti i 96 sono espressi in almeno un tessuto e cinque cluster di espressione possono essere identificati.
Un approccio simile è stato applicato per studiare l'espressione di questi geni in risposta a stress biotici. C'è stato un coinvolgimento diretto della famiglia di geni ATL in risposta all'infezione da patogeni con 62 geni che hanno mostrato una modulazione significativa in almeno due condizioni. Dopo aver visto questo video, dovresti avere una buona comprensione di come gestire i software utilizzati per caratterizzare una famiglia di geni.
Durante il tentativo di questa procedura, è importante definire attentamente le caratteristiche di una determinata famiglia di geni e la sonda corrispondente utilizzata per l'identificazione dell'intero membro della famiglia del genoma. Seguendo questa procedura, è possibile studiare l'evoluzione della famiglia genica e la funzione di P30 realizzando ulteriori alberi filogenetici basati su alcune specie diverse da quelle richieste per l'attribuzione della nomenclatura delle famiglie geniche.
View the full transcript and gain access to thousands of scientific videos
Questo articolo descrive una procedura per l'identificazione e la caratterizzazione di una famiglia di geni nella vite, concentrandosi specificamente sulle E3 ubiquitina ligasi Arabidopsis Tóxicos in Levadura (ATL). Il metodo mira a fornire una comprensione completa della struttura del gene, dei motivi proteici, della posizione cromosomica, delle duplicazioni geniche e dei modelli di espressione.