Directrices para el ordenador basado en la caracterización estructural y funcional de la proteína mediante la canalización I-TASSER se describe. A partir de secuencias de proteínas de la consulta, los modelos 3D se generan con múltiples alineaciones threading e iterativo simulaciones estructurales de montaje. Inferencias funcionales a partir de entonces son elaborados sobre la base de los partidos a las proteínas de estructura conocida y funciones.
Los proyectos de secuenciación del genoma ha cifrado millones de secuencias de proteínas, que requieren el conocimiento de su estructura y función de mejorar la comprensión de su función biológica. Aunque los métodos experimentales pueden proporcionar información detallada para una pequeña fracción de estas proteínas, modelado computacional que se necesita para la mayoría de las moléculas de proteínas que son caracterizados experimentalmente. El servidor de I-TASSER es un banco de trabajo on-line de alta resolución de modelado de la estructura y función de proteínas. Dada una secuencia de la proteína, una salida típica del servidor I-TASSER incluye la predicción de estructura secundaria, prevé la accesibilidad solvente de cada residuo, las proteínas homólogas de plantilla detectado por roscado y alineaciones de la estructura, hasta cinco de larga duración en los modelos estructurales terciario, y basados en estructuras anotaciones funcionales para la clasificación de las enzimas, los términos de ontología de genes y la proteína-ligando sitios de unión. Todas las previsiones están marcadas con una puntuación de confianza quecuenta la precisión de la predicción son sin conocer los datos experimentales. Para facilitar las solicitudes especiales de los usuarios finales, el servidor proporciona canales para aceptar especificado por el usuario entre la distancia y el contacto con residuos de mapas para cambiar los modelos I-TASSER, sino que también permite al usuario especificar cualquier proteína como plantilla, o para excluir a cualquier plantilla proteínas durante las simulaciones de la estructura de montaje. La información estructural podría ser recogida por los usuarios sobre la base de evidencias experimentales o conocimientos biológicos con el fin de mejorar la calidad de la I-TASSER predicciones. El servidor fue evaluado como el mejor de los programas de estructura de las proteínas y las predicciones en función de los experimentos CASP reciente de toda la comunidad. Actualmente hay> 20.000 científicos registrados en más de 100 países que están utilizando el on-line I-TASSER servidor.
Método de descripción
Siguiendo el paradigma de la secuencia a la estructura a la función, el procedimiento de I-TASSER 1-4 para la estructura y la función de modelado consta de cuatro pasos consecutivos de: (a) identificación de la plantilla por LOMETS 5, (b) la estructura de reensamblaje de fragmentos de replica- intercambio de simulaciones Monte Carlo 6; (c) el perfeccionamiento estructura atómica nivel con REMO 7 y FG-MD 8, y (d) estructura basada en la interpretación con la función cofactor 9.
Identificación de la plantilla: Para una secuencia de la consulta enviada por el usuario, la secuencia es la primera pasa a través de una biblioteca de la estructura por un representante de AP LOMETS instalado localmente meta-threading servidor. Threading es un procedimiento de alineación de secuencias-estructura que se utiliza para identificar proteínas de plantilla que puede tener una estructura similar o que contengan motivos estructurales similares, como la proteína de la consulta. Para aumentar la cobertura de los homólogos templdetecciones comió, LOMETS combina múltiples del estado de la técnica de algoritmos que cubren las diferentes metodologías de roscado. Desde diferentes programas de roscar tienen diferentes sistemas de puntuación y la sensibilidad de alineación, la calidad de los alineamientos generados hilos de rosca de cada programa es evaluado por normalizado Z-score, que se define como:
donde Z es la puntuación en las unidades de desviación estándar con respecto a la media estadística de todas las alineaciones generado por el programa, y Z 0 es un programa específico de Z-score de corte determina con base en pruebas a gran escala de referencia para diferenciar los hilos 5 'buena "y" malos "de plantillas. Una plantilla con una alta puntuación Z significa que los modelos superiores tienen una puntuación significativamente más alta que la alineación la mayor parte de otras plantillas, que por lo general implica que la alineación se corresponde con un buen modelo. Si la mayoría de las plantillas de rosca superior tienen altanormalizado gh Z-score, la exactitud de la final I-TASSER modelo suele ser alto. Sin embargo, si la proteína es grande y la cobertura de las alineaciones de roscado se limita a una pequeña región de la proteína de la consulta, un alto normalizado Z-score no significa necesariamente un modelo de alta precisión para el modelo de cuerpo entero. Los dos primeros alineamientos hilos de cada programa de roscado se recogen y se utilizan para el siguiente paso del montaje de la estructura.
Iterativo de simulación de la estructura de montaje: Siguiendo el procedimiento de roscado, secuencia de la consulta se divide en regiones roscado alineados y no alineados. Fragmentos de continuo en la alineación hilos se cortan a partir de plantillas y utilizar directamente para el montaje de la estructura, mientras que las regiones de bucle no alineados se construyen mediante el modelado ab initio. El procedimiento de montaje de la estructura se realiza en un sistema de red guiado por la réplica de simulaciones de Monte Carlo de cambio 6. El campo I-TASSER fuerza incluye el hidrógeno-bonding interacciones 10, basado en el conocimiento de la energía términos estadísticos derivados de estructuras de proteínas conocidas en el AP 11, la secuencia basada en las predicciones de contacto de SVMSEQ 12, y las restricciones espaciales recogidos a partir de plantillas LOMETS 5 hilos. Los señuelos de conformación generados en las réplicas de baja temperatura durante las simulaciones se agrupan por Spicker 13 para identificar las estructuras de baja energía libre de los estados. Centroides de grupo de los grupos principales se obtiene promediando las coordenadas 3D de todos los señuelos agrupados estructurales y se utiliza para la generación del modelo final. La simulación y el procedimiento de agrupación se repiten dos veces para eliminar los enfrentamientos estéricos y refinar aún más la topología global.
A nivel atómico modelo de construcción y perfeccionamiento: Los centroides cluster obtenidos después de la agrupación Spicker se reducen modelos de proteínas (cada residuo, representada por su α C y la cadena lateral del centro de masa) y have biológica limitada aplicación. La construcción de todo el modelo atómico de los modelos reducidos se hace en dos pasos. En el primer paso, REMO 7 se utiliza para construir modelos atómicos completo de C-alfa rastros mediante la optimización de las redes de enlace H-. En el segundo paso, REMO completo atómica modelos más refinados por FG-MD 14, que mejora los ángulos de torsión columna vertebral, longitudes de enlace, y la cadena lateral orientaciones rotámero, por simulaciones de dinámica molecular, guiado por los fragmentos estructurales de la búsqueda estructuras de AP en TM-align. Los modelos FG-MD refinado se utilizan como los modelos finales de las predicciones estructura terciaria de I-TASSER.
La calidad de los modelos generados se calcula sobre la base de una puntuación de confianza (C-score), que se define sobre la base de la Z-score de alineaciones LOMETS roscado y la convergencia de la I-TASSER simulaciones, formuladas matemáticamente como:
donde <em> M es la multiplicidad de reclamos estructura de los grupos estructurales identificados por el Spicker 13; M tot es el número total de reclamos presentados a la agrupación; es el RMSD promedio de los señuelos a los centroides agrupados en racimo; Norm.Z-Score (i) es el normalizado Z-score (Ec. 1) de la alineación superior hilos obtenidos a partir de i ª roscado servidor en LOMETS 5, N es el número de servidores utilizados en LOMETS.
El C-score tiene una fuerte correlación con la calidad de los modelos I-TASSER. Mediante la combinación de C-score y la longitud de la proteína, la exactitud de los primeros I-TASSER modelos se puede estimar con un error promedio de 0,08 para el TM-score y un 2 para el RMSD 15. En general, los modelos de C-score> – 1.5 se espera que tengan un pliegue correcto. Aquí, RMSD y TM-score son medidas bien conocidas de la similitud topológica entre el modelo y la estructura nativa. TM-score valiosarango es de [0, 1], donde una mayor puntuación indica una mejor estructura coincide 16,17. Sin embargo, para los modelos de menor rango (es decir, 2 º -5 ª modelos), la correlación de C-score con el TM-score y RMSD es mucho más débil (~ 0,5), y no puede ser utilizado para la estimación fiable de la calidad del modelo absoluto.
Es el primer modelo siempre es el mejor modelo de I-TASSER simulaciones? La respuesta a esta pregunta depende del tipo de destino. Para un blanco fácil, el primer modelo suele ser la mejor modelo y su C-score es generalmente mucho mayor que el resto de los modelos. Sin embargo, para objetivos duros, donde rosca no tiene éxitos importantes de plantilla, el primer modelo no es necesariamente el mejor modelo y I-TASSER realmente tiene dificultades en la selección de las mejores plantillas y modelos. Por ello se recomienda analizar todas las 5 modelos para objetivos duros y seleccionarlos sobre la base de la información experimental y el conocimiento biológico.
Función predictions: En el último paso, último modelos 3D generados por FG-MD se utilizan para predecir tres aspectos de la función de las proteínas, a saber: a) Comisión de Enzimas (CE) número 18 y (b) Gene Ontology (GO) 19 términos y ( c) los sitios de unión de ligandos de moléculas pequeñas. Para todos los tres aspectos, interpretaciones funcionales se generan con cofactor, que es un nuevo enfoque para predecir la función de la proteína de la base de similitud global y local a las proteínas de la plantilla en el AP de estructura conocida y funciones. En primer lugar, la topología global de los modelos predijeron se compara con bibliotecas de plantillas funcionales mediante el programa de alineación estructural TM-align 20. A continuación, un conjunto de proteínas más similares a los modelos de destino son seleccionados de la biblioteca en base a su similitud estructura global, y una extensa búsqueda local se realiza para identificar la estructura y la similitud de secuencias, cerca de la región del sitio activo / vinculante. Las puntuaciones de similitud resultante global y lo local se utilizan para clasificar losproteínas plantilla (homólogos funcionales) y la transferencia de la anotación (números de la CE y Gene Ontology 19 términos) sobre la base de los éxitos con mayor puntuación. Del mismo modo, los residuos de unión al ligando del sitio y el modo de unión al ligando se infieren sobre la base de la alineación local de consulta con el conocido sitio de unión al ligando los residuos en las plantillas de función superior anotando 9.
La calidad de la función (CE y GO plazo) en la predicción de I-TASSER se evalúa según el puntaje de homología funcional (Fh-score) que es una medida de similitud global y local entre la consulta y la plantilla, y se define como:
donde C-score es una estimación de la calidad del modelo de predecir como se define en la ecuación. (2), TM-score mide la similitud estructural global entre el modelo y las proteínas de la plantilla; RMSD Ali es el RMSD entre el modelo y la estructura de la plantilla en la región estructuralmente alineado de TM-align 20; Cov representa la cobertura de la alineación estructural (es decir, la proporción de los residuos alineados estructuralmente dividido por la longitud de la consulta); ID ali es la identidad de la secuencia en la alineación TM-align. Las medidas de confianza estimados para las predicciones de su número CE incluye también un plazo para la evaluación de coincidir con el sitio activo (AcM) entre la consulta y la plantilla dentro de una región local definida, calculada como:
donde N representa el número t de residuos de la plantilla presentes en la zona local, Ali N es el número de los pares de residuos alineados plantilla de consulta, ii d es la distancia entre el par C α i-ésima de residuos alineados, d 0 = 3.0 Å es el punto de corte a distancia, M ii es la puntuación BLOSUM entre pares i de residuos alineados. En general, el FH-score se encuentra en el rango [0, 5] y la puntuación de AcM se encuentra entre [0, 2], Donde las puntuaciones más altas indican las asignaciones funcionales más confianza. Puntuación AcM también se utiliza para la evaluación de la estructura local y la similitud de secuencias cerca de los sitios de unión al ligando, lo que se conoce como BS-score.
1. Presentación de la secuencia de la proteína
2. Disponibilidad de los resultados
3. Estructura secundaria y predicciones solventes accesibilidad
4. Predicciones de estructura terciaria
5. LOMETS objetivo plantilla de alineación
6.Análogos estructurales en el AP
7. Función de predicción utilizando cofactor
8. Comisión de Enzimas de predicción número
9. Gene Ontology (GO) las predicciones de largo plazo
10. Ligando-proteína predicciones sitio de unión
11. Los resultados representativos
Figura 1 Un extracto de la página de resultados de I-TASSER muestra (A) FASTA formato secuencia de la consulta;. (B) predijo la estructura secundaria y los resultados asociados a la confianza, y (C) predijo disolvente accesibilidad de los residuos. Región analizada principal y el sitio de hidratación potencial en la consulta están resaltados en azul verdoso y rectángulos rojos, respectivamente.
Figura 2. </strong> Un ejemplo de página de resultados de I-TASSER se muestran predicciones de estructura terciaria de las proteínas de la consulta. Los modelos predicen se muestran en una miniaplicación Jmol interactivo, que permite al usuario cambiar la visualización de la molécula. Los modelos también se puede descargar haciendo clic en "Descargar" links. Las medidas de confianza para estimar la calidad del modelo se presenta como C-score.
Figura 3. Un ejemplo de página de resultados de I-TASSER muestra los diez mejores plantillas de identificar hilos y las alineaciones por LOMETS 5 programas de threading. La calidad de las alineaciones de roscado se evalúa en función normalizada Z-score (resaltado en verde), donde un valor> 1 refleja una alineación segura. Residuos alineados en la plantilla que son idénticos a los residuos de consulta correspondiente se resaltan en color para indicar la presencia de residuos conservados / motivos, mientras que la falta de alineación en la mayoría de los plantillas de arriba indica la presencia de varios dominios en la proteína de la consulta y los residuos no alineados corresponden a regiones enlazador de dominio. Haga clic aquí para ver la versión en tamaño completo de la figura 3.
Figura 4. Un ejemplo de página de resultados muestra los diez primeros identificado análogos estructurales y las alineaciones estructurales, identificados por TM-align 20 programa de alineación estructural. El ranking de los análogos se muestra en la se basa en el TM-score (en azul) de la alineación estructural. A TM-score> 0,5 indica que las dos estructuras comparadas tienen una topología similar, mientras que un TM-score <0.3 significa una similitud entre dos estructuras al azar. Estructuralmente alineado de pares de residuos se resaltan en color sobre la base de sus aminoácidos de propiedad, mientras que las regiones no alineados se indican con "-".ove.com/files/ftp_upload/3259/3259fig4large.jpg "> Haga clic aquí para ver la versión en tamaño completo de la figura 4.
Figura 5. Un ejemplo de página de resultados de I-TASSER mostrando identificado homólogos de la enzima de la proteína de la consulta en la biblioteca de AP. El nivel de confianza de la predicción del número CE se analiza sobre la base de la CE-score (resaltado en verde), en el CE-score> 1,1 indica similitud funcional (lo mismo los 3 primeros dígitos del número CE) entre la consulta y la proteína de la plantilla.
Figura 6. Un ejemplo de página de resultados de I-TASSER mostrando GO predicciones plazo para la proteína de la consulta. Homólogos funcionales de la proteína de la consulta en la biblioteca de Gene Ontology plantilla se clasifican en función de su Fh-score (en el rectángulo naranja). Común las características funcionales de estos éxitos puntaje más alto-se derivan para generar se comió la última GO predicciones plazo para la proteína de la consulta. La calidad de la predicción de los términos de GO se calcula sobre la base de GO-score (en verde), donde un GO-score> 0,5 indica una predicción fiable. Haga clic aquí para ver la versión en tamaño completo de la figura 6.
Figura 7. Un ejemplo de página de resultados de I-TASSER mostrando diez principales predicciones ligando de unión a proteínas sitio utilizando el algoritmo de cofactor 9. El ranking de los sitios de unión prevista se basa en el número de conformaciones ligando predijo que comparten bolsillo de unión común en la consulta. BS-score (en rojo) es una medida de la secuencia local y la similitud entre la estructura prevista y sitio de unión de la plantilla, y es útil para analizar la conservación de los bolsillos de sitio de unión.
les/ftp_upload/3259/3259fig8.jpg "/>
Figura 8. Un ejemplo de moderación archivos externos utilizados para la especificación de residuos de residuos de contacto / restricciones a distancia.
Figura 9. Ejemplo de archivos de inmovilización utilizados para la especificación de una proteína de la plantilla en el servidor I-TASSER. El usuario puede especificar la alineación de consulta de plantilla, ya sea en (A) en formato FASTA, o (B) en formato 3D.
Figura 10. Un archivo de ejemplo que se usa para excluir a la plantilla durante el procedimiento de la estructura de I-TASSER modelado. La primera columna contiene la identificación del anteproyecto de presupuesto de las proteínas de la plantilla para ser excluidos. La segunda columna se utiliza para especificar el punto de corte de identidad de secuencia que se utiliza para otros modelos similares en la biblioteca de plantillas.
El protocolo presentado es una guía general para la estructura y la función de modelado usando el servidor de I-TASSER. A pesar de que este procedimiento automatizado funciona muy bien para la mayoría de las proteínas, las intervenciones humanas a menudo ayudan a mejorar significativamente la precisión de modelos, especialmente para las proteínas que carecen de las plantillas de cerca en la biblioteca de AP. Los usuarios pueden intervenir en los modelos I-TASSER de las siguientes maneras: (a) separación de multi-dominio de las proteínas, (b) la prestación de restricciones externas para mejorar el montaje de la estructura, y (c) la eliminación de las plantillas durante el modelado.
Dividir multi-dominio de la proteína:
Muchas secuencias de proteínas de largo con frecuencia contienen múltiples dominios atados por la flexibilidad enlazador regiones, lo que hace su difícil elucidación de la estructura mediante técnicas experimentales y computacionales. Sin embargo, como los dominios son independientes plegables entidades y puede realizar la función molecular distinta, esconveniente dividir a largo multi-dominio de las proteínas y el modelo de cada dominio por separado. Dominios de modelado de forma individual, no sólo acelerará el proceso de predicción, sino que también aumenta la calidad de la alineación de consulta de plantilla, lo que resulta en una estructura más fiable y predicciones de la función.
Los límites del dominio de las secuencias de proteínas se puede predecir el uso de programas externos disponibles gratuitamente en línea, tales como NCBI CDD 24, 25 o PFAM InterProScan 26. Además, si las alineaciones LOMETS threading están disponibles para la proteína de la consulta, los límites del dominio puede ser localizado por la identificación visual de los residuos de largos tramos no alineados en las plantillas de rosca superior (ver Paso 5.4). Estas regiones no alineados en su mayoría corresponden a las zonas de dominio enlazador. Si varios dominios las plantillas ya están disponibles en la biblioteca de plantillas AP con todos los dominios de consulta alineados, entonces la consulta proteína puede ser modelado como de larga duración.
Proporcionar restricciones externas
<pclass = "jove_content"> Las simulaciones montaje de la estructura de I-TASSER son principalmente guiados por restricciones espaciales recogidos a partir de la rosca LOMETS plantillas. Para las proteínas de consulta que han afectado a buena threading (Norm. Z-score> 1) en la biblioteca de plantillas, que se deriven limitaciones espaciales son en su mayoría de alta precisión y I-TASSER va a generar modelos de alta resolución estructural de estas proteínas. Por el contrario, las proteínas de consulta que han débil o no hit threading (Norm. Z-score <1), recogidos restricciones espaciales suelen contener errores debido a la incertidumbre de la plantilla y la alineación. Para estos objetivos de proteínas, especificado por el usuario la información espacial puede ser muy útil para mejorar la calidad del modelo de predecir. Los usuarios pueden proporcionar restricciones externas al servidor I-TASSER de dos maneras:A. Especificar contacto / distancia restricciones
Experimentalmente caracteriza residuos entre contactos / distancias, por ejemplo, a partir de RMN oentrecruzamiento experimentos, se puede especificar mediante la subida de un archivo de la moderación. Un archivo de ejemplo se muestra en la Figura 8, donde la columna 1, se especifica el tipo de restricción, es decir, "DIST" o "Contacto". A la moderación a distancia (DIST), las columnas 2 y 4 contienen posiciones de residuos (i, j), las columnas 3 y 5 contienen el átomo-tipos en el residuo y la columna 6 se especifica la distancia entre los dos átomos especificado. Para sistemas de retención (contacto), las columnas 2 y 3 contienen las posiciones (i, j) de los residuos que deben estar en contacto. La distancia entre el centro de cadenas laterales de estos pares de residuos de contacto se decidió sobre la base de las distancias observadas en estructuras conocidas en el AP. I-TASSER a tratar de sacar estos pares de átomos cerca de la distancia especificada en las simulaciones de la estructura de refinamiento.
B. Especificar una plantilla de estructura de proteínas
LOMETS programas de threading utilizar una biblioteca de AP representante para encontrar pliegues plausible para la prot consultaein. Aunque el uso de una estructura representativa de la biblioteca ayuda a reducir el tiempo necesario para calcular las alineaciones estructura de la secuencia, es posible que una proteína de buena plantilla se pierde en la biblioteca o la plantilla no han sido identificados por los programas de LOMETS threading, a pesar de que es presentes en la biblioteca. En estos casos, el usuario debe especificar la estructura de la proteína deseada en la plantilla.
Para especificar la estructura de la proteína como una plantilla adicional, los usuarios pueden subir un archivo de formato PDB estructura o especificar el ID de AP de una estructura de la proteína depositada en la biblioteca de AP. El I-TASSER va a generar la alineación de consulta de plantilla mediante el programa de Muster 23 y recogerá las limitaciones espaciales tanto de la plantilla especificada por el usuario y las plantillas LOMETS para guiar a la simulación de montaje de la estructura. Debido a la precisión de las restricciones LOMETS es diferente para diferentes objetivos, el peso de las restricciones LOMETS es más fuerte en fácil (homóloga) targets que en el disco duro (no homólogos) los objetivos, que han sido sistemáticamente sintonizado en nuestra formación de referencia.
Los usuarios también pueden especificar su propia plantilla de consulta alineaciones. El servidor acepta la alineación en dos formatos: el formato FASTA (Figura 9) y el formato 3D (Figura 9B). El formato de FASTA es estándar y se describe en http://zhanglab. ccmb.med.umich.edu / FASTA / . El formato 3D es similar al formato estándar PDB ( http://www.wwpdb.org/documentation/format32/sect9.html ), pero dos columnas adicionales derivados de las plantillas se agregan a los registros ATOM (véase la Figura 9B):
Columnas 1-30: Atom (C-alfa solamente) y los residuos de los nombres de la secuencia de consulta.
Columnas 31-54: Coordenadas de los átomos de C-alfa de la consulta copiada de los átomos correspondientes en la plantilla.
Columnas 55-59: número de residuo correspondiente en la plantilla sobre la base de la alineación
Columnas 60-64: nombre de residuo correspondiente en la plantilla
Excluir a las proteínas de plantillas
Las proteínas son moléculas flexibles y pueden adoptar varios estados conformacionales de cambiar su actividad biológica. Por ejemplo, las estructuras de las proteínas quinasas y muchas proteínas de membrana se han resuelto en la conformación de activos e inactivos. También la presencia o ausencia de ligando puede causar grandes movimientos estructurales. Si bien todos los estados de conformación de la plantilla son iguales para los programas de threading, es deseable que el modelo de la consulta el uso de plantillas en un solo estado en particular. Una nueva opción en el servidor permite al usuario excluir las proteínas de la plantilla durante el modelado estructura. Esta característica también permite al usuario elegir el nivel de homología de los modelos que se utilizarán para el modelado. Los usuarios pueden excluir plantilla de proteínas from la biblioteca I-TASSER por:
A. Especificación de un corte de identidad de secuencia
Los usuarios pueden utilizar esta opción para excluir las proteínas homólogas de la biblioteca de plantillas I-TASSER. El nivel de homología se establece en función del punto de corte de identidad de secuencia, es decir, el número de residuos idénticos entre la consulta y la proteína de la plantilla dividida por la longitud de la secuencia de la secuencia de la consulta. Por ejemplo, si el usuario escribe en el "70%" en la forma prevista, todas las proteínas de las plantillas que tienen una identidad de secuencia> 70% a la proteína de consulta I-serán excluidos de la biblioteca de plantillas I-TASSER.
B. Excluir las proteínas específicas de plantilla
Proteínas específicas de la plantilla puede ser excluido de la biblioteca de plantillas I-TASSER al cargar una lista que contiene los identificadores de AP de las estructuras a ser excluidos. Un archivo de ejemplo se muestra en la Figura 10. A medida que la misma proteína puede existir en varias entradas en la biblioteca de AP, I-TASSER síRVer de forma predeterminada excluye las plantillas especificadas (en la columna 1), así como todas las otras plantillas de la biblioteca que tienen una identidad> 90% de las plantillas especificadas. Los usuarios también pueden especificar una identidad de corte diferentes, por ejemplo, 70%, en todas las plantillas con la identidad de> 70% a las proteínas de la plantilla será excluido.
The authors have nothing to disclose.
Material Name | Type | Company | Catalogue Number |
FASTA formatted amino acid sequence of the protein to be modeled (see, <a href="http://www.ncbi.nlm.nih.gov/BLAST/fasta.shtml">http://www.ncbi.nlm.nih.gov/BLAST/fasta.shtml</a>). | |||
A personal computer with access to the internet and a web browser. | |||
Molecular visualizing software, e.g. RASMOL or PYMOL, for analyzing the predicted tertiary structure and functional sites. |