Caracterización estructural de un producto génico metabólico auxiliar viral del suelo
HogarHogar > Noticias > Caracterización estructural de un producto génico metabólico auxiliar viral del suelo

Caracterización estructural de un producto génico metabólico auxiliar viral del suelo

May 15, 2023

Nature Communications volumen 13, Número de artículo: 5485 (2022) Citar este artículo

3456 Accesos

4 citas

159 Altmetric

Detalles de métricas

La metagenómica está desenterrando el mundo previamente oculto de los virus del suelo. Muchas secuencias virales del suelo en los metagenomas contienen genes metabólicos auxiliares putativos (AMG) que no están asociados con la replicación viral. Aquí, establecemos que los AMG en los virus del suelo en realidad producen proteínas activas y funcionales. Nos centramos en los AMG que potencialmente codifican enzimas de quitosanasa que metabolizan la quitina, un polímero de carbono común. Expresamos y analizamos funcionalmente varios genes de quitosanasa identificados a partir de metagenomas ambientales. Una proteína expresada que muestra actividad de endoquitosanasa (V-Csn) se cristaliza y se caracteriza estructuralmente con una resolución ultra alta, lo que representa la estructura de un producto AMG viral del suelo. Esta estructura proporciona detalles sobre el sitio activo y, junto con los modelos de estructura determinados mediante AlphaFold, facilita la comprensión de la especificidad del sustrato y el mecanismo enzimático. Nuestros hallazgos respaldan la hipótesis de que los virus del suelo aportan funciones auxiliares a sus huéspedes.

Encuestas metagenómicas recientes han revelado una gran diversidad de virus de ADN en una variedad de hábitats del suelo, incluido el permafrost1,2, el permafrost descongelado3 y los pastizales4. La mayoría de estos virus son bacteriófagos3,4, aunque también se han detectado varios virus eucariotas1,2. Una pregunta fundamental y en gran parte sin respuesta se refiere a los roles funcionales de estos virus en el hábitat del suelo. Se reconoce que los bacteriófagos del suelo juegan un papel importante en la regulación de la dinámica del huésped5. Curiosamente, los virus del suelo también pueden contribuir directamente a los procesos biogeoquímicos en el suelo a través de la expresión de genes que potencialmente codifican funciones que no se requieren directamente para la reproducción viral. Los genes que corresponden a funciones virales no esenciales se denominan genes metabólicos auxiliares (AMG). Las funciones potenciales codificadas por los AMG incluyen el metabolismo del carbono, la esporulación y la generación de energía6,7. Sin embargo, hasta la fecha solo se ha expresado y caracterizado funcionalmente un AMG viral del suelo3 y no existen estructuras cristalinas para los AMG virales del suelo.

El estudio de los AMG en los virus del suelo va a la zaga del de los ambientes marinos, debido a la gran diversidad y complejidad de los hábitats del suelo que ha confundido el descubrimiento viral. En ecosistemas marinos, los AMG virales que codifican proteínas fotosintéticas han sido ampliamente estudiados8,9. Por ejemplo, se ha demostrado que algunos virus marinos expresan genes psbA, con transcripciones que aumentan durante la infección de los huéspedes10,11. A nivel de proteína, se modeló la estructura de una proteína plastocianina codificada por un fago cianobacteriano (cianofago) basándose en una estructura de referencia relacionada de Synechococcus sp. PCC79428. En comparación con la estructura modelada de manera similar de la plastocianina huésped, fue posible predecir modificaciones específicas de cianófagos en la estructura y el potencial electrostático de la plastocianina codificada por cianófagos. Además, recientemente se ha caracterizado la estructura de una rodopsina viral con una resolución de 1,4 Å. La estructura reveló que las rodopsinas virales son canales únicos activados por la luz que tienen un papel predicho en el apoyo a la fotosíntesis de las algas12. Estos descubrimientos recientes en virus marinos resaltan la importancia ecológica de los AMG que potencialmente maximizan la aptitud de los fagos y huéspedes en el medio ambiente.

Los primeros AMG que se describieron en los virus del suelo fueron genes que codificaban enzimas para la degradación de diversos compuestos orgánicos. Por ejemplo, se detectaron 14 genes de glucósido hidrolasa en metagenomas de permafrost descongelado. Uno de estos, un gen viral que codifica una enzima glicosil hidrolasa del grupo 5 (GH5), se clonó, expresó y se encontró que representaba una endomananasa3 funcional. A la gran mayoría de los AMG virales del suelo predichos se les han asignado funciones potenciales únicamente en función de sus similitudes de secuencia con los genes anotados en las bases de datos genómicas microbianas4,5. Sin embargo, este enfoque está limitado en su capacidad para determinar si la AMG se expresa realmente y si la proteína es funcional.

Se han encontrado AMG en virus del suelo que potencialmente codifican genes involucrados en la descomposición de la quitina4,13, el segundo polímero de carbono más abundante en el planeta después de la celulosa14. En los océanos abiertos, las picocianobacterias utilizan quitina, que es producida principalmente por artrópodos, como fuente de nutrientes clave15. La quitina también puede acumularse en los suelos porque es un componente de las paredes celulares de los hongos y del exoesqueleto de los insectos. Después de la desacetilación del polímero de quitina en quitosano por las quitina desacetilasas, las quitosanasas dividen el quitosano en subunidades más pequeñas que pueden degradarse aún más, proporcionando así fuentes de carbono y nitrógeno para otros miembros de la microbiota15 Los genes de quitosanasa se han anotado previamente en el genoma de un virus gigante, El clorovirus, que infecta a las microalgas verdes de las aguas terrestres16 y las quitosanasas virales detectadas se caracterizaron como pertenecientes al grupo 46 de las glicosilhidrolasas (GH46). Los AMG similares a la quitosanasa que se transportan en los virus del suelo pertenecen principalmente a otro grupo previamente categorizado como quitosanasas fúngicas GH75 (pfam07335) que escinden los beta-1,4-quitosanos con actividad de endodivisión.

Aquí caracterizamos y validamos la función y la estructura de un producto AMG de quitosanasa viral del suelo. Confirmamos que la quitosanasa es realmente funcional al clonar y expresar el gen y realizar ensayos de actividad. Obtenemos una estructura cristalina de ultra alta resolución de la enzima, que proporciona detalles del sitio activo potencial para la familia de quitosanasas GH75.

Los contigs virales que portaban AMG de quitosanasa GH75 se recuperaron de la base de datos Integrated Microbial Genomes and Virome (IMG/VR) (v3.0). Se identificaron un total de 142 AMG similares a quitosanasa GH75 calificados a partir de contigs virales con longitudes que oscilan entre 8 y 202 kb. La mayoría de las secuencias procedían de bacteriófagos con taxonomía no clasificada. Dos de los contigs virales eran genomas completos y circularizados de alta calidad (Tabla complementaria 1).

Se construyó un árbol de proteínas a partir de los datos de secuencia para delinear la relación de las quitosanasas virales con otras quitosanasas microbianas depositadas en bases de datos públicas. Las quitosanasas virales eran filogenéticamente distintas de las quitosanasas GH75 de arqueas, hongos y bacterias (Fig. 1). Las quitosanasas GH75 se agruparon principalmente en clados separados de acuerdo con sus asignaciones taxonómicas, excepto las quitosanasas arqueales, que podrían deberse a una deficiencia de representantes arqueales en la base de datos actual del NCBI. La mayoría de las quitosanasas virales detectadas formaron clados compactos que estaban relacionados con las quitosanasas bacterianas (Fig. 1). La ubicación filogenética de las quitosanasas virales sugiere que se originaron a partir de bacterias a través del intercambio genómico y se modificaron en versiones específicas de virus durante los procesos de deriva genética y diversificación17. Esta hipótesis se ve respaldada por el hallazgo de que los cóntigos virales que contenían quitosanasas GH75 se clasificaron como bacteriófagos (Tabla complementaria 1).

a El árbol filogenético con quitosanasas virales, fúngicas (verde), bacterianas (rosa) y arqueológicas (negras) está enraizado en una lisozima bacteriófaga (YP_006987285.1, nodo rojo). Las hojas de los árboles que representan las quitosanasas virales están coloreadas por hábitat: acuático (azul), modificado (naranja), terrestre (marrón). Los cuatro residuos clave en el sitio activo propuesto están codificados por colores y se muestran en los anillos circulares secuencialmente con el residuo más cercano a la posición N-terminal en el anillo más interno. Las quitosanasas virales seleccionadas para la validación de la función enzimática se destacan con asteriscos. La quitosanasa viral utilizada para la cristalización está marcada con dos asteriscos. b Las frecuencias relativas de cada residuo en los cuatro sitios conservados se calcularon y se muestran en la tabla. c Las estructuras proteicas de las quitosanasas representativas fueron predichas por AlphaFold20 y están coloreadas según los grupos filogenéticos: bacteriano (rosa), fúngico (verde), viral (marrón).

Se construyó una alineación de secuencia múltiple para determinar si las quitosanasas virales contenían cuatro residuos conservados que residían en un presunto sitio activo para secuencias de quitosanasa GH75 bacterianas y fúngicas18,19 (Datos complementarios 1). Las quitosanasas virales GH75 generalmente retienen los mismos cuatro residuos clave para los sitios activos predichos, DDDE, aunque algunas de las secuencias tenían sustituciones. La mayoría de las quitosanasas GH75 tienen aspartato en la primera de las cuatro posiciones, con algunos casos de sustituciones de cisteína o asparagina (anillo más interno en la Fig. 1). Como las sustituciones en los residuos clave pueden afectar la función predicha, dividimos estas quitosanasas virales en subgrupos, ya que parece que las incidencias de las variantes de residuos del sitio activo descritas anteriormente tienden a agruparse. Las quitosanasas virales identificadas se agruparon en tres clados principales ('Clado 1', 'Clado 2' y 'Clado 3' en la Fig. 1). Las sustituciones de cisteína (frecuencia relativa 14,79 %, Fig. 1) y asparagina (frecuencia relativa 7,75 %, Fig. 1) en la primera posición ('D34') solo se observaron en las quitosanasas virales Clade 1 y 3, respectivamente. Las quitosanasas virales de clado 2 y grupo 2 contenían los mismos residuos que la mayoría de las quitosanasas bacterianas y fúngicas. Las quitosanasas virales en el Clado 1 con y sin sustituciones de cisteína se denominaron Grupo 1.1 y Grupo 1.2, respectivamente, y las del Clado 3 con y sin sustituciones de asparagina se denominaron Grupo 3.1 y Grupo 3.2, respectivamente. Algunas de las quitosanasas virales se agruparon según el origen de la muestra y los virus del suelo se agruparon por separado de los virus acuáticos. Las secuencias específicas del suelo estaban principalmente en el Grupo 1.2 y el Clado 3.

Se seleccionaron representantes de los diferentes clados (Fig. 1) para la predicción estructural utilizando el software de predicción de estructuras de proteínas basado en inteligencia artificial AlphaFold20 recientemente introducido. También se predijeron las estructuras de varias quitosanasas GH75 bacterianas y fúngicas que se habían informado y caracterizado previamente en la literatura. Dos regiones características de secuencia compartida por todos los miembros de GH75 formaron un pliegue de dominio de glicosil hidrolasa visto en otras familias, por ejemplo, GH45. Estas regiones compartidas abarcan un dominio no caracterizado, una región variable que contiene inserciones diferentes de diferentes longitudes (Fig. 1 complementaria). En varias estructuras predichas de productos AMG virales, esta inserción se pliega como un dominio no caracterizado de aproximadamente 70 aminoácidos que forma un lado de una hendidura prominente en el medio de toda la estructura. Algunos miembros bacterianos de GH75 parecen contener una inserción homóloga (Fig. 1 complementaria). Otras secuencias AMG de tipo quitosanasa viral y todas las secuencias bacterianas y fúngicas predichas carecen de esta inserción más larga y no parecen formar un dominio sustancial. En la medida en que estas secuencias tengan regiones de secuencia no homólogas, estas predicciones de estructura pueden ser útiles en el análisis comparativo de los diferentes grupos.

Las secuencias de codificación de ADN para 10 de los 142 AMG similares a quitosanasa GH75 se optimizaron por codones para la expresión recombinante en Escherichia coli (las secuencias seleccionadas se indican con asteriscos en la Fig. 1). Se observó expresión para nueve de las 10 proteínas, pero la proteína se observó principalmente en las fracciones insolubles en todos menos dos de los objetivos iniciales. Para los otros dos objetivos, se expresó y purificó suficiente proteína para analizar la actividad de la endoquitosanasa. Solo una proteína expresada, denominada en lo sucesivo V-Csn (por quitosanasa viral), mostró actividad y esta actividad fue máxima cerca de pH 5 (Fig. 2a). La secuencia correspondiente se originó en el Grupo 3.1 y se indica con dos asteriscos en la Fig. 1, con los residuos previstos del sitio activo de DDDE. Esta secuencia específica se originó a partir de un metagenoma del suelo forestal (Tabla complementaria 1). Se predijo que el virus que transportaba V-Csn era un fago de Proteobacteria (Tabla complementaria 1). La actividad de endoquitosanasa para V-Csn se corroboró además mediante dos sustituciones de un solo residuo en las posiciones propuestas para ser parte del sitio activo de quitosanasa. Con base en estudios bioquímicos, cinéticos y mutacionales de las quitosanasas fúngicas GH75 de Aspergillus fumigatus21 y Fusarium solani19, se postuló previamente que dos residuos (D160 y E169 en A. fumigatus, y D175 y E188 en F. solani) eran catalizadores esenciales residuos El análisis de secuencia de una quitosanasa bacteriana GH75 de Streptomyces avermitilis mostró que estos residuos también se conservaron en esta enzima18. Basado en una alineación parcial de las secuencias de V-Csn, A. fumigatus, F. solani y S. avermitilis (Fig. 2b), los residuos correspondientes en V-Csn son D148 y E157. Se generaron dos construcciones V-Csn que albergaban una sustitución D148N o una sustitución E157Q, y se midieron las actividades de las respectivas enzimas mutantes. La actividad se redujo cinco veces para D148N y casi se eliminó para E157Q (Fig. 2c). Ambas construcciones eluyeron con tiempos de retención de cromatografía de filtración en gel idénticos a los de V-Csn nativo, y los espectros de dicroísmo circular indicaron que ambas construcciones estaban plegadas. Posteriormente se llevaron a cabo ensayos de cristalización en V-Csn y las dos enzimas mutantes.

a La actividad de V-Csn se ensayó monitoreando la absorbancia de azurina a 590 nm después de su liberación como fragmentos de azúcar de azurina solubles de un sustrato de quitosano reticulado con azurina insoluble (AZCL-quitosano). Las reacciones se realizaron a temperatura ambiente en un intervalo de valores de pH en tampón de acetato. Los datos representan la media de experimentos repetidos (n = 3) con la desviación estándar indicada por las barras de error. Los datos de origen se proporcionan como un archivo de datos de origen. b Alineación de secuencia parcial de V-Csn con tres enzimas quitosanasa de Aspergillus fumigatus, Fusarium solani y Streptomyces avermitilis. La estructura secundaria para V-Csn se indica arriba de la alineación. Cuatro residuos ácidos conservados potencialmente involucrados en la catálisis están coloreados de azul y rojo. El alineamiento de las secuencias disponibles de enzimas de la familia GH75 muestra que solo se conservan universalmente seis posiciones, estos cuatro residuos ácidos y dos residuos de glicina, como indican los asteriscos debajo del alineamiento. c Liberación de azurina por V-Csn de tipo salvaje y dos construcciones que contienen una sustitución D148N o E157Q, en tampón de acetato a pH 5,1. Los datos representan la media de experimentos repetidos (n = 3) con la desviación estándar indicada por las barras de error. Los datos de origen se proporcionan como un archivo de datos de origen. d Representación en cinta de la forma apo1 de la enzima V-Csn con los dos dominios estructurales de color verde claro (Dominio-1) y rosa (Dominio-2). Se proporciona la nomenclatura de la estructura secundaria, junto con las ubicaciones de los extremos N y C. e Superposición de un dímero construido a partir de V-Csn apo1 (molécula 1, cinta amarilla) y un compañero de simetría cristalográfica (molécula 2, cinta azul) y el homodímero V-Csn apo2 (cintas grises). Se indican los elementos de la estructura secundaria que comprenden la interfaz del dímero. Los elementos de la estructura secundaria etiquetados con un primo representan la molécula apo1 relacionada con la simetría. f El dímero V-Csn apo2 que muestra la molécula 1 como una superficie molecular amarilla y la molécula 2 como una cinta azul. El área de contacto entre las dos moléculas se muestra en azul claro en la superficie amarilla de la molécula 1. Los datos de origen están disponibles como un archivo de datos de origen.

La estructura V-Csn se resolvió en dos formas cristalinas; apo1 que contiene una sola molécula en la unidad asimétrica y apo2 que contiene un dímero en la unidad asimétrica. La estructura de apo1 se resolvió mediante métodos de difracción anómala única (SAD) utilizando la señal de iones de bromuro empapados en cristales de la forma apo1. La estructura se construyó automáticamente con phenix.autobuild22 y se completó con COOT (v0.9.8.2)23. La señal anómala del bromuro se extendió a una resolución de aproximadamente 1,5 Å y la estructura se refinó inicialmente en estos datos. El refinamiento se completó con phenix.refine24 contra un conjunto de datos apo1 de alta resolución que se extiende a una resolución de 0,89 Å. El modelo final constaba de 1811 átomos de proteína en una sola cadena, 398 moléculas de agua, tres de glicerol y un anión sulfato. El Rwork y Rfree finales fueron 0.1198 y 0.1307 para 174,427 reflexiones totales. La forma cristalina de apo2 se resolvió mediante reemplazo molecular utilizando la estructura apo1 refinada como modelo de búsqueda y se refinó con phenix.refine.

Una sola molécula de V-Csn estaba ubicada en la unidad asimétrica apo1. La estructura constaba de dos dominios estructurales no contiguos (Fig. 2d). La parte N-terminal del Dominio-1 (residuos 1-36) se pliega primero y el polipéptido luego pliega todo el Dominio-2 (residuos 37-108) antes de volver a cruzar para completar el Dominio-1 (residuos 109-224). Durante las primeras etapas del refinamiento, se observó una densidad residual en el extremo N equivalente a al menos tres residuos adicionales. La inspección de la secuencia del vector de expresión sugirió que tres residuos (G, H y S) del conector estaban unidos a la metionina N-terminal y estos residuos se añadieron al modelo. La estructura apo2 tiene dos moléculas V-Csn independientes en la unidad asimétrica y las dos moléculas forman un dímero no cristalográfico (Fig. 2e). La superposición de las dos moléculas del dímero apo2 en la estructura apo1 da una desviación cuadrática media (RMSD) de 0,45 Å para ambas moléculas. En la forma de cristal apo1, se observa el mismo dímero, aunque generado por la simetría cristalográfica del grupo espacial C2 (Fig. 2e). Esto es consistente con la observación de que V-Csn existe como un dímero en solución según la cromatografía de exclusión por tamaño, aunque no hay evidencia de que se requiera dimerización para la actividad enzimática. La formación del dímero entierra 1830 Å2 (~9%) de la superficie por monómero. Las regiones de contacto involucran el bucle entre las hebras β β4 y β5 (en el Dominio-2) en una molécula que se ranura entre las hélices α3 y α4 en la segunda molécula (Fig. 2f), unidas a través de enlaces de hidrógeno e interacciones hidrofóbicas con residuos de la dos hélices y cadena β8.

El dominio-1 está compuesto por una hoja β retorcida antiparalela central de seis hebras formada por hebras β1, β2, β3, β7, β8 y β10 (Fig. 3a, b). Dos hebras cortas (β6 y β9) se empaquetan contra la cara cóncava de la lámina β central, y dos hélices (α4 y α5) se envuelven a través de la cara convexa de la lámina. Una búsqueda de Dali25 utilizando el Dominio-1 aislado da más de 1000 aciertos con una puntuación Z superior a 5. Un análisis inicial de los principales aciertos muestra que el Dominio-1 tiene una similitud estructural con una amplia gama de proteínas que tienen un dominio central común que comprende un barril β de doble psi (DPBB) formado por hebras β3, β6, β7, β8, β9 y β10. Estas proteínas incluyen las proteínas de defensa vegetal kiwellina26,27, barwin28 y carwin29, la fitotoxina fúngica ceratoplatanina30, el inhibidor de papaína Streptomyces (SPI)31, el dominio 1 de las expansinas (proteínas que aflojan las paredes celulares de las plantas)32,33, el dominio regulador de ubiquitina de ASPL34, y las endoglucanasas hidrolizantes de carbohidratos35,36,37. Barwin, carwin y las endoglucanasas se clasifican como miembros de la familia de glicosil hidrolasas GH45 (https://pfam.xfam.org/family/PF02015), y la comparación con V-Csn muestra que tanto las enzimas GH45 como las GH75 tienen una fuerte similitud estructural. Ambas familias, sin embargo, no tienen similitud estructural con las enzimas GH46, la mayoría de las cuales están anotadas como quitosanasas pero que tienen una arquitectura α-helicoidal de dos dominios que recuerda a la lisozima T438.

un Dominio-1 de la estructura apo1 orientado para mirar hacia abajo el motivo estructural de barril β de doble psi (DPBB). Los hilos que componen el DPBB están resaltados en verde brillante. b Diagrama de topología del Dominio-1 que resalta el pliegue del motivo DPBB (verde brillante). c Los dos motivos psi (verde y cian) de la estructura V-Csn apo1, que se muestran aproximadamente en la misma orientación para que su similitud estructural sea evidente. d Los dos motivos psi en el contexto de la estructura V-Csn apo1. El motivo psi verde está aproximadamente en la misma orientación que en c y el motivo psi cian está girado unos 180° alrededor de un eje en la página. Juntos forman el motivo estructural de barril β de doble psi (DPBB). e Superposición de V-Csn Domain-1 (verde claro) y kiwellina de Actinidia chinensis (código PDB 4PMK; cinta naranja). Loop1 y Loop2 en kiwellin coinciden aproximadamente con partes del Dominio-2 (cinta rosa) de V-Csn. f Superposición de V-Csn Domain-1 (verde claro) y endoglucanasa V de Humicola insolens (código PDB 4ENG; cinta amarilla). Los bucles 1 y 2 de la endoglucanasa V se corresponden aproximadamente con el dominio 2 (cinta rosa) de V-Csn. g Superposición de V-Csn Domain-1 (verde claro) y expansina de Clavibacter michiganensis (código PDB 4JCW; cinta violeta claro). Loop1 de la expansina corresponde a parte de V-Csn Dominio-2 (cinta rosa), sin embargo, el dominio C-terminal de la expansina (C-dominio) no tiene similitud estructural con V-Csn.

El dominio DPBB, que comprende dos motivos psi entrelazados, se describió por primera vez para aspartato-α-descarboxilasa, endoglucanasa V, DMSO reductasa y barwin39. En V-Csn, cada motivo psi se compone de dos hilos largos antiparalelos, uno doblado casi 90 ° de modo que la mitad del terminal N es casi ortogonal a la mitad del terminal C, y un solo hilo corto que corre paralelo al terminal C. parte de la hebra larga (Fig. 3c). Los dos motivos psi (psi1; β3, β9 y β10, y psi2; β6, β7 y β8) están orientados entre sí de manera que las dos hebras cortas (β6 y β9) forman un par antiparalelo con un eje pseudodoble. entre ellos asignando psi1 a psi2 (Fig. 3d). La superposición de varios de los principales éxitos de Dali que contienen DPBB demuestra la topología conservada de los dos motivos psi en estas proteínas no relacionadas (Fig. 3e-g). Varias extensiones de bucle decoran los dominios DPBB de estas proteínas. Con respecto a la numeración de las cadenas V-Csn, estas son: (i) Loop1, entre la cadena β3 del motivo psi1 y la cadena β6 del motivo psi2, (ii) Loop2 entre β8 de psi2 y β9 de psi1, y (iii) Loop3 entre las hebras β6 y β10 del motivo psi1. En V-Csn, la extensión Loop1 encapsula todo el Dominio-2, y en otras proteínas este bucle varía en longitud y estructura (Fig. 3e-g).

El V-Csn Domain-2 es muy inusual porque muestra una clara falta de estructura secundaria y, a primera vista, parece estar esencialmente sin estructura (Fig. 2d). Un análisis gráfico de Ramachandran de los ángulos phi/psi del Dominio-2 (Fig. 4a) muestra la agrupación de los ángulos de torsión de la cadena principal en las regiones α y β favorecidas como se esperaría para una proteína bien plegada. Sin embargo, a diferencia de una estructura de proteína típica, el Dominio-2 parece carecer de largos tramos continuos de estructura α-helicoidal o β-hebra. El cálculo de las características de la estructura secundaria utilizando varios algoritmos, incluido DSSP (como se implementó en PROCHECK y PyMOL) y el servidor STRIDE40, identifican dos hélices 310 de una sola vuelta (α1 y α2) y dos hebras cortas (β4 y β5), junto con cuatro residuos individuales anotados como puentes β (residuos G56, W63, V68 y P74). Las dos cadenas β cortas corren en sentido antiparalelo entre sí y están conectadas a través de tres enlaces de hidrógeno (Fig. 4b). Los cuatro residuos del puente β están localizados en una pieza de polipéptido entre la hélice α1 y la hebra β4 que se pliega en dos vueltas de horquilla y se mantiene unida por interacciones de enlaces de hidrógeno entre los átomos de la cadena principal de estos residuos del puente β, junto con varias cadenas laterales/ enlaces de hidrógeno de la cadena principal. (Figura 4c). Una predicción AlphaFold de V-Csn, realizada después de que se completó la estructura cristalina, fue notablemente cercana en toda la secuencia (0,6 Å RMSD para 222 átomos de Cα coincidentes), incluido el Dominio-2 no caracterizado (0,8 Å RMSD para 67 átomos de Cα coincidentes ) (Fig. 4d).

un diagrama de Ramachandran para el Dominio-2 de V-Csn apo1. Los ángulos de torsión de la cadena principal (phi y psi) se muestran como triángulos azul claro (glicina), cuadrados azul claro (prolina) y círculos azules (todos los demás residuos). Las tres regiones preferidas para hojas β, hélices α y hélices levógiras están coloreadas de rosa. Las regiones permitidas adicionalmente están coloreadas de amarillo pálido. b Interacciones de enlaces de hidrógeno entre las dos hebras β cortas, β4 y β5, en el Dominio-2. c Interacciones de enlaces de hidrógeno en la región de 20 residuos en el Dominio-2 entre la hélice α1 (una hélice 310) y la hebra β5 (mostrada como barras grises solo para los átomos de la cadena principal). Esta región contiene cuatro residuos designados como puentes β, G56, W63, V68 y P74 (de color magenta). Estos residuos están involucrados en los enlaces de hidrógeno cadena principal-cadena principal con otros residuos del puente β y residuos adyacentes a ellos. La región de 20 residuos se pliega en dos bucles de horquilla, con un residuo ácido (D57 y D69) en cada bucle que estabiliza cada horquilla a través de interacciones de enlaces de hidrógeno con átomos de nitrógeno de amida de la cadena principal. d Superposición de la estructura predicha AlphaFold V-Csn (cinta gris) y la estructura cristalina V-Csn apo1 (cintas verde y rosa que representan el Dominio-1 y el Dominio-2, respectivamente).

La inspección de la estructura de apo1 muestra que los dos residuos identificados como residuos del sitio activo putativo (D148 y E157) están ubicados en una hendidura entre los dos dominios estructurales (Fig. 5a). Dos residuos ácidos adicionales (D34 y D36) también se encuentran en esta hendidura adyacente a D148, y estos residuos también se conservaron en las otras quitosanasas GH75 (Fig. 2b). En V-Csn, la cadena lateral de D148 realiza interacciones de enlaces de hidrógeno con el nitrógeno de amida de la cadena principal de A92 y las cadenas laterales de D34 y D36 (Fig. 5b). Aunque el agrupamiento de residuos ácidos como este es inusual, no tiene precedentes y ocurre en metaloproteínas donde las cadenas laterales ácidas se juntan por sus roles en la unión de metales, o en sitios activos de enzimas donde comparten protones41. Al pH de cristalización (4,6), se esperaría que la mayoría de estos residuos ácidos estuvieran protonados y, por lo tanto, fueran esencialmente neutros, y el cálculo de la superficie electrostática dentro de la hendidura del sitio activo a este pH muestra muy poca carga negativa (Fig. 5c). ). Sin embargo, en el pH óptimo de la enzima (5.1-5.5), los residuos de aspartato estarían un poco menos protonados y habría una carga negativa significativa dentro de la hendidura (Fig. 5d), lo que puede ser importante para atraer el sustrato de quitosano hacia el bolsillo. .

una representación de la superficie accesible por solvente de la estructura V-Csn apo1 con cuatro residuos ácidos conservados (palos amarillos y rojos) que se agrupan dentro de la hendidura entre dominios. Superficie coloreada como en la Fig. 2d: Dominio-1, verde; Dominio-2, rosa. b Primer plano del supuesto sitio activo que destaca los cuatro residuos ácidos conservados. Los enlaces de hidrógeno se muestran como líneas negras discontinuas y las moléculas de agua como esferas rojas. c Superficie electrostática de V-Csn apo1 calculada a pH 4,6. La superficie tiene un contorno de −5 kT/e (rojo) a +5 kT/e (azul). d Superficie electrostática de V-Csn apo1 calculada a pH 5,5. La superficie tiene un contorno de −5 kT/e (rojo) a +5 kT/e (azul). e Representación de la superficie accesible al disolvente del complejo quitohexaosa-V-Csn que muestra la ubicación del resto trisacárido (esferas de CPK amarillas, azules y rojas) en la hendidura del sitio activo. La orientación de la molécula en la vista superior es aproximadamente la misma que en a, y la vista inferior se gira 90° para mostrar la vista lateral. Enzima coloreada por dominios estructurales (Dominio-1, verde; Dominio-2, rosa). f Densidad de electrones Fo-Fc residual (malla rosa) para el sustrato unido contorneado a 2,5 σ. El mapa de densidad electrónica se calculó después del reemplazo molecular y antes de la incorporación del sustrato. La molécula de trisacárido refinado final (GlcN-1, GlcN-2 y GlcN-3) se muestra como barras de cian. g Representación en cinta del complejo quitohexaosa-V-Csn con trisacárido (barras de cian) unido en el sitio activo. Enlaces de hidrógeno indicados por líneas negras discontinuas y moléculas de agua como pequeñas esferas rojas (Dominio-1, verde; Dominio-2, rosa). h Representación de la superficie accesible al disolvente del complejo de celohexosa de la endoglucanasa V de Humicola isolens (Cel45): dominio DPBB, amarillo; dos bucles para subdominios pequeños, marrón (inferior) y naranja (superior). La molécula de celohexosa (magenta) se une en un túnel estrecho entre el dominio DPBB y los dos bucles. La vista del lado derecho del panel se gira 90° para mostrar el sitio activo similar a un túnel, en contraste con el sitio activo abierto en V-Csn. i Representación de la superficie accesible al disolvente de la endoglucanasa CaCel de Cryptopygus antarcticus: dominio DPBB, azul claro; dos bucles son de color azul (inferior) y cian (superior). Ubicación de la hendidura y el túnel de unión del sustrato indicada por la molécula de celohexosaa (barras magenta) derivada del complejo Cel45 en h.

Se construyeron mutantes dirigidos al sitio D148 y E157. En ambos casos, el carboxilato se convirtió en la amida correspondiente, generando las proteínas mutantes D148N y E157Q. Las dos proteínas V-Csn mutantes se cristalizaron en las mismas condiciones que la proteína de tipo salvaje y sus estructuras se determinaron mediante reemplazo molecular a alta resolución. La superposición de las dos estructuras mutantes en la estructura apo1 de tipo salvaje dio RMSD de 0,11 y 0,07 Å, respectivamente, para todas las posiciones de Cα, lo que sugiere muy pocas diferencias conformacionales entre las estructuras mutantes y de tipo salvaje. La cocristalización de ambas proteínas mutantes con quitohexaosa (un polímero unido a β-(1-4) de seis residuos de D-glucosamina (GlcN)) proporcionó un complejo con el mutante E157Q solamente. El sustrato estaba ubicado en la hendidura entre dominios (Fig. 5e), con tres de los seis residuos de GlcN (en adelante denominados GlcN-1, GlcN-2 y GlcN-3) visibles en densidad de electrones Fo-Fc (Fig. 5f), orientado tal que GlcN-1 es el extremo reductor. Los residuos de GlcN-2 y GlcN-3 están en una conformación de silla estándar, sin embargo, la densidad del primer residuo observado (GlcN-1) sugirió una conformación de bote distorsionada.

El residuo de GlcN-1 está anclado por un solo enlace de hidrógeno entre el átomo de O6 y la cadena lateral de Q157 (Fig. 5f). El residuo central de GlcN (GlcN-2) realiza interacciones de enlaces de hidrógeno con las cadenas laterales de D148 y D36 a través de su amina libre, junto con un tercio del oxígeno carbonílico de la columna vertebral de A90 del Dominio-2. El residuo de GlcN-3 hace una interacción de enlace de hidrógeno con el oxígeno carbonílico de T91 a través del átomo de O6 y otra con una molécula de agua. Aunque se observó cierta densidad adicional de Fo-Fc en el extremo no reductor de GlcN-3 (el átomo de O4), la escasez de la densidad no permitió modelar un cuarto GlcN. La ubicación del fragmento de trisacárido y las interacciones que hace con la proteína sugieren que los residuos D36 y D148 forman el subsitio -242 y juegan un papel clave en la unión y orientación del sustrato (en este caso a través del residuo GlcN-2). El residuo E157 representa el subsitio -1 y puede servir como el grupo nucleofílico responsable de la escisión del enlace, suponiendo que la hidrólisis se produjo en el extremo reductor de GlcN-1.

Aunque la función de V-Csn Domain-2 no se comprende completamente, varias pruebas apuntan a que está involucrado en la formación del sitio activo y en la unión del sustrato. Comparación de la estructura V-Csn con estructuras de enzimas de la familia GH45 endoglucanasa V (Cel45) de Humicola insolens (código PDB 3ENG)35,36 y la endo-β−1,4-glucanasa (CaCel45) de Cryptopygus antarcticus (código PDB 5H4U )37 muestra que la hendidura del sitio activo en estas glicosil hidrolasas está formada por un lado por el dominio DPBB y los bucles que transportan los residuos ácidos catalíticamente importantes, y por el otro por Loop-1 (un largo bucle serpenteante en las enzimas GH45 y equivalente a todo el Dominio-2 en V-Csn) y Loop-3 (un paquete de tres hélices en las enzimas GH45) (Figs. 3e, 5h, i). El análisis de subsitios individuales en el complejo de celohexosa de Cel45 (código PDB 4ENG) muestra que los subsitios -1 y +2 están formados parcialmente por residuos de Loop1 y Loop3 respectivamente, y estos subsitios que flanquean el sitio de escisión +1/-1 ser importante para la correcta orientación del sustrato de celulosa antes de la hidrólisis. De hecho, tanto en Cel45 como en CaCel45, las paredes de la hendidura del sitio activo forman un túnel a través del cual se enrosca el sustrato de celulosa (Fig. 5h, i).

Como se señaló anteriormente, un bucle en V-Csn Domain-2 (residuos Ala90 y Thr91) está involucrado en la formación de los subsitios −2 y −3 (Fig. 5g) y se esperaría que oriente correctamente este extremo del sustrato de quitosano para posicionamiento óptimo del sitio de escisión -1/+1. Además, la superposición del complejo celohexoasa-Cel45 en el complejo quitotriosa-V-Csn y el modelado del resto celohexosa en la hendidura del sitio activo V-Csn (Fig. 6a, b) muestra que los residuos Asp50 y Asn54 del Dominio-2 podrían formar el Subsitio +1, anclando efectivamente este extremo del sustrato, con los subsitios +2 y +3 muy probablemente confinados al Dominio-1. La superposición de los modelos predichos AlphaFold para las nueve quitosanasas virales elegidas para la validación de la función enzimática (Fig. 1) en V-Csn muestra que todas tienen un aspartato espacialmente equivalente a Asp50 en V-Csn, y cuatro de las nueve tienen una Asn o Asp en una ubicación equivalente a Asn54. Aunque la hendidura formada entre el Dominio-1 y el Dominio-2 en V-Csn (Fig. 5e) es más ancha que el túnel en las enzimas GH45, las similitudes estructurales entre V-Csn y las enzimas GH45 apuntan a que el Dominio-2 juega un papel clave. papel en el reconocimiento, unión y orientación óptima del sustrato de quitosano en V-Csn.

una representación de la superficie molecular del mutante E157Q-V-Csn (dominios verde y rosa) con celohexosa (barras magenta) modeladas en la hendidura del sitio activo según la superposición del complejo quitohexaosa-Cel45 (código PDB 4ENG). Los tres residuos de GlcN observados en el complejo E157Q-VCsn se muestran como barras de cian. b El supuesto sitio de reconocimiento de GlcN+1 en V-Csn basado en la superposición del complejo quitohexaosa-Cel45. c Alineación parcial de la secuencia basada en la estructura de V-Csn con varias enzimas que contienen dominios DPBB. La alineación se determinó a partir de superposiciones de las enzimas contra V-Csn en función de sus motivos DPBB. Los cuatro residuos ácidos conservados observados en el sitio activo de V-Csn están coloreados de azul y rojo. Los residuos coincidentes en las enzimas GH45 y otras proteínas que contienen DPBB se colorean de manera similar cuando son estructuralmente equivalentes. Las secuencias utilizadas son las siguientes: Cel45, endoglucanasa V de Humicola isolens (Genbank P43316.1); CaCel, endoglucanasa de Cryptopygus antarcticus (Genbank ACV50415.1); MaEG, endoglucanasa de Melanocarpus albomyces (Genbank CAD56665.1); TtCel45A, endoglucanasa de Thielavia terrestris (Genbank 1182607135); EXLX1, expansina de Bacillus subtilis (Genbank O34918); SPI, inhibidor de papaína Steptomyces de Streptomyces mobaraensis (Genbank WP_004951535.1); carwin de Carica papaya (Genbank 4JP6_A); kiwellina de Actinidia chinenesis (Genbank AGC39168.1). d Superposición de V-Csn (cintas verde y rosa, barras verdes y rosas y etiquetas negras en negrita), Cel45 (cinta amarilla, barras finas amarillas y etiquetas naranjas en cursiva, código PDB 3ENG) y EXLX1 expansiva (cinta azul claro, barras azul claro y etiquetas en cursiva cian, código PDB 4FFT). Las estructuras se superpusieron haciendo coincidir los motivos DPBB. e Representación esquemática de la reacción de escisión del enlace glicósido propuesta catalizada por V-Csn. Glu157 actúa como donante catalítico de protones y Asp36 actúa como base catalítica que acepta un protón de una molécula de agua.

Como se señaló anteriormente, los estudios bioquímicos y enzimológicos sobre algunas quitosanasas GH75 conocidas implicaron a dos residuos ácidos (equivalentes a D148 y E157 en V-Csn) como críticamente involucrados en la catálisis18,19,21. Se estableció que las enzimas GH75 son endoglucanasas18 que invierten la estereoquímica en el carbono anomérico, produciendo el anómero α de los productos oligosacáridos19,21, por lo que es probable que V-Csn también sea una enzima inversora. Es notable que en las enzimas DPBB anotadas como enzimas de unión y/o hidrolización de carbohidratos, el residuo ácido en una posición equivalente a E157 en V-Csn se conserva universalmente (ya sea un glutamato o un aspartato), según la superposición de V-Csn con estos DPBB y la generación posterior de una alineación de secuencia parcial basada en la estructura (Fig. 6c). Los datos estructurales de Cel4535,36 y CaCel4537 sugieren que este residuo ácido es el donante catalítico de protones en las enzimas GH45 y, dada la similitud estructural de los dominios DPBB en las enzimas GH45 y GH75, es muy probable que E157 sea el donante catalítico de protones. en V-Csn. Cabe señalar que las enzimas GH45 se clasifican como endoglucanasas que también conducen a la inversión de la configuración en el carbono anomérico del enlace glucosídico escindido43.

La identidad de la base catalítica es menos clara, aunque se basa en la misma superposición y alineación de secuencias (Fig. 6c), Cel45 y CaCel tienen residuos ácidos cerca del extremo N de las respectivas enzimas (D10 en Cel45 y D13 en CaCel) que han sido identificados como la base general que acepta el protón durante la hidrólisis del enlace glucosídico β(1,4)35,37. Estos residuos son estructuralmente equivalentes a D36 en V-Csn (Fig. 6d), lo que sugiere que este residuo también puede estar actuando como base catalítica en la enzima viral. En la Fig. 6e se proporciona una representación esquemática del supuesto mecanismo de reacción para V-Csn. Como se señaló anteriormente, las enzimas GH75 fúngicas y bacterianas tienen un residuo de aspartato en esta misma ubicación (Fig. 2b). Por el contrario, otras enzimas DPBB tentativamente anotadas como enzimas de unión a carbohidratos y/o hidrolíticas carecen de un residuo ácido equivalente a D34 o D36 (Fig. 6c) con la excepción de la proteína inhibidora de papaína de Streptomyces (código PDB 5NTB)31 y la kiwellina (código PDB 4PMK). )26, sin embargo, tienen un aspartato estructuralmente equivalente a D148 que puede estar actuando como base catalítica en estas enzimas. Aunque la función de cada uno de los cuatro residuos ácidos en el sitio activo de V-Csn aún no se comprende por completo, su agrupación dentro de la hendidura y la evidencia corroborante de las enzimas GH45 y GH75 sugieren que es muy probable que tengan funciones en la unión al sustrato (D34 y D148) y el mecanismo catalítico (D36 y D157). La validación de la asignación de función debe esperar más estudios mutacionales y de unión al sustrato.

En resumen, hay varias implicaciones ecológicas de este estudio. Identificamos AMG putativos de secuencias virales del suelo mediante la aplicación de criterios de detección estrictos e inspecciones de regiones de codificación aguas arriba y aguas abajo, y demostramos de manera concluyente que al menos algunos AMG transportados por virus del suelo son funcionales. Nuestros análisis rigurosos no solo dieron como resultado una estructura cristalina de un producto AMG viral del suelo, sino que también nos permitieron proponer el modo de acción de esta enzima quitosanasa previamente no caracterizada en la familia de glicosil hidrolasas GH75. Las secuencias de quitosanasa que se incluyeron y compararon revelaron una distinción filogenética entre las quitosanasas virales y las descritas previamente en bacterias y hongos. Sin embargo, debido a que las quitosanasas virales eran subgrupos dentro de los clados bacterianos y los virus detectados con los AMG de quitosanasa eran bacteriófagos, esto sugiere que se originaron a partir de bacterias. Las quitosanasas virales del suelo también formaron subgrupos que eran distintos de sus contrapartes en los sistemas acuáticos. La enzima V-Csn que caracterizamos funcional y estructuralmente se originó a partir de una secuencia de un suelo forestal (DOI 10.46936/10.25585/60000627, Tabla complementaria 1). Los suelos forestales a menudo se caracterizan por tener más hongos que otros tipos de suelo44. Esta puede ser una razón para la selección de virus que tienen la capacidad de ayudar a descomponer la quitina, un componente principal de las paredes celulares de los hongos y una fuente importante de carbono y nitrógeno. Actualmente se desconoce el motivo de la selección de un virus que porta esta capacidad independientemente de su huésped. Por analogía con los sistemas marinos donde los virus transportan AMG que ayudan a respaldar la generación de energía a través de la fotosíntesis en sus respectivos anfitriones8,9,45, los virus del suelo también pueden ayudar a sus anfitriones a descomponer los recursos de carbono disponibles en el suelo a medida que estén disponibles.

La base de datos de Integrated Microbial Genomes and Virome (IMG/VR) (v3.0)46 se examinó en busca de secuencias correspondientes a los genes de quitosanasa predichos. Los contigs virales con genes anotados por un HMM de quitosanasa (pfam07335) se identificaron por primera vez mediante la aplicación de una tubería de detección viral JGI47. Para una asignación funcional más conservadora, las secuencias de quitosanasa viral se verificaron adicionalmente con las bases de datos de anotaciones que incluyen EggNOG48, la base de datos de enzimas activas de carbohidratos (CAZY)49 y las asignaciones de ontologías funcionales para la base de datos de metagenomas (FOAM)50 usando hmmsearch (Hmmer v3.1b2) 51 y buscando similitudes de secuencia con quitosanasas NCBI usando blastp (v2.9.0+)52. Las quitosanasas virales putativas se examinaron luego frente a un perfil de HMM de lisozima para eliminar las lisozimas mal anotadas (PF13702, PF00959, PF04965, PF18013, PF00062 y una lisozima HMM4 autocurada utilizando las secuencias de lisozima depositadas en los virus NCBI (consultado el 16 de noviembre). 2020).

Para una asignación segura de los genes de quitosanasa como AMG virales, se inspeccionó el contenido genómico de los cóntigos virales que portan genes de quitosanasa seleccionados de los pasos anteriores. Los genes de contigs virales se predijeron y tradujeron usando Prodigal (v2.6.3)53. Las secuencias de proteínas fueron anotadas por las bases de datos de bacterias y arqueas EggNOG y tres bases de datos virales4,54, además de los 7185 HMM específicos de microbios y 8773 específicos de virus implementados en checkV (v0.7.0)55. Los candidatos de quitosanasa AMG se clasificaron en cinco categorías según sus posiciones genéticas en los cóntigos virales y la presencia o ausencia de genes distintivos virales4: Categoría 0, genes distintivos virales (es decir, genes que codifican proteínas estructurales virales, terminasas e integrasas) tanto aguas arriba como aguas abajo; Categoría 1, genes virales específicos tanto aguas arriba como aguas abajo, más genes distintivos virales ya sea aguas arriba o aguas abajo; Categoría 2, genes virales específicos tanto aguas arriba como aguas abajo, pero sin genes distintivos virales; Categoría 3, genes virales específicos ya sea aguas arriba o aguas abajo, pero sin genes distintivos virales; Categoría 4, ubicada en un borde del contig viral. Solo los contigs virales con puntajes de alta confianza (categorías 0-2) para AMG de quitosanasa se retuvieron para análisis posteriores (Tabla complementaria 1).

Los contigs virales con AMG de quitosanasa se agruparon con genomas Viral RefSeq (v201) en función de una matriz de intercambio de proteínas puntuada. Se generó una red de agrupamiento que incluye interacciones por pares aplicando vConTACT utilizando parámetros predeterminados (v2.0.9.10)56. Los contigs virales del suelo no compartían suficientes genes con los virus de referencia previamente depositados para permitir una asignación taxonómica confiable.

Los huéspedes putativos de los cóntigos virales que portaban AMG de quitosanasa se predijeron utilizando tres herramientas bioinformáticas publicadas: 1) WIsH57 (v1.0, mejor éxito), 2) VirHostMatcher58 (v1.0.0, mejor éxito) y 3) Huésped de virus procariótico Predictor (PHP)59 ('consenso'). La taxonomía final del huésped de un cóntigo viral se asignó cuando los resultados de al menos dos de las tres herramientas llegaron a un consenso.

Para delinear la relación filogenética de las quitosanasas virales detectadas con las quitosanasas GH75 en otros taxones, se construyó un árbol filogenético basado en múltiples alineaciones de secuencias de secuencias de proteínas de quitosanasas arqueales, bacterianas, fúngicas y virales. El árbol se volvió a enraizar utilizando un bacteriófago lisozima (YP_006987285.1). Para cubrir el espacio genético diverso en todos los dominios de la vida, primero consultamos 'quitosanasa' de la base de datos de proteínas NCBI (https://www.ncbi.nlm.nih.gov/protein, consultada el 11 de octubre de 2021) y más examinado por el pfam de quitosanasa GH75 (PF07335). Las secuencias de las quitosanasas GH75 bacterianas y fúngicas utilizadas para identificar residuos clave en los sitios activos también se incluyeron como parte de las refs. 18, 19. Luego, las secuencias de referencia se agruparon con una identidad de aminoácidos del 70 % para eliminar la redundancia mediante CD-HIT (v4.8.1)60 y la secuencia representativa de cada grupo con una longitud superior a 150 aminoácidos se incluyó en el conjunto de referencia final. , resultando en dos secuencias de arqueas, 230 de bacterias y 180 de hongos. Las quitosanasas virales desreplicadas y las secuencias de referencia se alinearon utilizando MAFFT con parámetros predeterminados (v7)61. Las alineaciones de secuencias múltiples (MSA) se inspeccionaron y ajustaron manualmente en función de las posiciones de los cuatro residuos clave del sitio activo previsto en las secuencias viral y de referencia. La región en la alineación es desde el primer residuo conservado (sitio activo previsto) hasta el último residuo conservado. Además, conservamos los residuos adyacentes que estaban bien alineados donde <10 % de las secuencias tenían un espacio (Datos complementarios 1). El árbol filogenético se construyó usando RAxML (v1.0.1) con el modelo especificado LG+ G8+ F y 500 bootstraps62.

El gen que codifica una supuesta secuencia de quitosanasa viral del suelo (Ga0126380_1000012531: señalado con un doble asterisco en la Fig. 1) se sintetizó químicamente (Twist Bioscience, San Francisco, CA) y se insertó en el sitio NdeI de pET28a, incluida una extensión de 20 residuos. en el extremo N (MGSSHHHHHHSSGLVPRGSH) que contiene una etiqueta de afinidad de metal de polihistidina (negrita) y un sitio de escisión de proteasa de trombina (subrayado) en la secuencia de aminoácidos primaria de la proteína expresada. El plásmido recombinante se usó para transformar Escherichia coli BL21(DE3) químicamente competente (Invitrogen, Carlsbad, CA) a partir de la cual se prepararon ∼1 mL ∼15 % de stock de glicerol (medio LB, OD600nm = ∼0,8) a partir de una sola colonia y se congelaron ( −80 °C) para uso futuro. Este stock de glicerol se usó para sembrar 25 ml de medio LB que creció hasta una DO600nm de ~0,8 y luego se transfirió a 750 ml de medio LB de autoinducción63 (matraces de 2 L, agitador de 200 rpm, 0,34 ug/uL de kanamicina, 37 °C) . Al alcanzar una DO600nm de aproximadamente 1, la temperatura se redujo a 30 °C. Las células se recolectaron aproximadamente 16 h más tarde (al día siguiente) mediante centrifugación suave y luego se congelaron (-80 °C). Las células se lisaron descongelando el sedimento congelado seguido de sonicación (∼1 min) antes y después de tres pases a través de una French Press (SLM Aminco, Rochester, NY). Después de la centrifugación, la proteína en la fracción soluble se purificó utilizando un protocolo de purificación convencional de dos pasos: cromatografía de afinidad de quelato metálico en una columna FastFlow de Ni-Agarosa 6 de 20 ml (GE Healthcare, Piscataway, NJ) seguida de cromatografía de filtración en gel en una Columna Superdex HiLoad 26/60 (GE Healthcare, Piscataway, NJ)64. Las fracciones que contenían la proteína objetivo después del último paso de la columna se concentraron a 2–5 mg/mL (tampón de proteína: NaCl 100 mM, Tris 20 mM, DTT 1 mM, pH 7) y se almacenaron a 4 °C hasta que se usaron para la cristalización o la enzima. ensayos Se obtuvieron rendimientos de 2 a 4 mg de proteína purificada por litro de medio LB. Se aplicó el mismo protocolo para preparar dos proteínas modificadas, cada una de las cuales contenía la sustitución puntual D148N o E157Q. La mutagénesis se realizó de la siguiente manera65: en resumen, la primera hebra del plásmido molde que contenía el gen de tipo salvaje se cortó con Nt.BbvCI y se digirió con exonucleasa I y III. Se diseñaron oligonucleótidos (Thermo Fisher, Pleasanton, CA) para introducir mutaciones puntuales en las ubicaciones deseadas y se agregaron en una proporción de 1:20 con el ADN molde monocatenario. Las secuencias de cebado se ampliaron con polimerasa Phusion. Después de resolver las mellas con ligasa de ADN Taq, la segunda hebra de tipo salvaje se cortó con Nb.BbvCI, se digirió con exonucleasa I y se regeneró cebando a partir de un segundo oligonucleótido para crear una molécula de ADNdc mutagenizada completa. Todas las enzimas se obtuvieron de NEB, Ipswich, MA. Se verificó la secuencia de las construcciones ensambladas (Pacific Biosciences Sequel IIe, PacBio, Menlo Park, CA).

Se analizó la actividad endoquitosanasa de la V-Csn de tipo salvaje y las dos proteínas modificadas utilizando un sustrato de quitosano reticulado con azurina (AZCL) (AZCL-quitosano; Megazyme, Wicklow, Irlanda)66. Se prepararon soluciones madre (1200 μg/ml) de cada proteína en tampón proteico junto con suspensiones de AZCL-quitosano (2500 μg/ml) a pH 4,3, 5,1 y 6,5 en acetato de sodio 40 mM, NaCl 100 mM, DTT 1 mM. Las reacciones se realizaron por triplicado, a temperatura ambiente, agregando 17 μL de proteína (20 μg) a 100 μL de AZCL-quitosano en un tubo Eppendorf de 500 μL. Los tubos se agitaron mediante rotación (40 rpm) en un rotador de tubos multiusos (Fisher Scientific). La actividad se controló sedimentando el sustrato con una breve centrifugación y midiendo la absorbancia del producto ligado a azurina liberado a 590 nm (NanoDrop 2000c; Thermo Scientific) usando una alícuota de 2 μL. Las reacciones en blanco no mostraron liberación de producto ligado a azurina en ausencia de proteína y las mediciones de pH antes y después de la reacción variaron menos de 0,1 unidades de pH.

Las condiciones iniciales de cristalización para V-Csn se obtuvieron usando el método de gota colgante empleando la pantalla Top96 (Anatrace). Se observaron cristales en múltiples condiciones. Se recolectaron cristales de varias condiciones y se enfriaron rápidamente en nitrógeno líquido en sus respectivas condiciones de cristalización aumentadas con 20% de etilenglicol. Los cristales se enviaron a SSRL para la detección de difracción en la línea de luz BL9-2. Tres condiciones dieron cristales que se difractaron a alta resolución; condición #45 (sulfato de amonio 0,2 M, acetato de sodio 0,1 M pH 4,6, MMePEG2000 al 30 %) en el grupo espacial C2 con dimensiones de celda unitaria a = 108,84 Å, b = 47,63 Å, c = 45,55 Å, β = 97,8°, con una monómero en la unidad asimétrica (AU); condición n.º 38 (citrato 0,1 M pH 5,5, PEG3000 al 20 %) en el grupo espacial C2 con dimensiones de celda unitaria a = 163,30 Å, b = 46,00 Å, c = 73,56 Å, β = 92,3°, con dos monómeros en la AU; y condición #20 (sulfato de amonio 0,2 M, bis-tris 0,1 M pH 5,5, PEG3350 al 25 %) en el grupo espacial C2 con dimensiones de celda unitaria a = 80,47 Å, b = 35,76 Å, c = 80,66 Å, β = 118,5°, con un monómero en el AU.

Los conjuntos de datos se recopilaron de monocristales en las condiciones #45 y #38. Para el cristal de condición #45 (designado como apo1), se recolectaron 1800 imágenes de 0,2° en BL12-2 utilizando rayos X a 17000 eV (0,72929 Å) y un detector Pilatus 6 M PAD funcionando en modo sin obturador. Las imágenes se procesaron con XDS (v. 5 de febrero de 2021)67 y se escalaron con AIMLESS68. El conjunto de datos final comprendía 174574 reflejos únicos con una resolución de 0,89 Å. Para el cristal de condición #38 (apo2), se recolectaron 1800 imágenes de 0,2° en BL9-2 utilizando rayos X a 12658 eV (0,97946 Å) y un detector Pilatus 6 M PAD funcionando en modo sin obturador. Las imágenes se procesaron con XDS67 y se escalaron con AIMLESS68, y el conjunto de datos final comprendía 117982 reflejos únicos con una resolución de 1,35 Å. En la Tabla 1 se proporcionan estadísticas adicionales de recopilación y procesamiento de datos para ambas formas de cristal.

Para la fase experimental, se preparó una solución de remojo de KBr disolviendo KBr sólido en tampón de cristalización de condición n.° 45 aumentado con glicerol al 25 % hasta obtener una solución saturada (según se determina visualmente bajo un microscopio). Esta solución se diluyó con tampón fresco para formar una solución de remojo de cristal saturada 1/8. Varios cristales de apo1 se agitaron rápidamente en esta solución y se enfriaron rápidamente en nitrógeno líquido. Los conjuntos de datos de difracción se recopilaron a partir de cristales de apo1 empapados de KBr en la línea de luz BL12-2 en el borde de bromuro (13.481 eV, 0,91967 Å). Se recogieron un total de 3600 imágenes con un ángulo de rotación de 0,2°/imagen, utilizando el método de haz inverso y cuñas de 20°. Las imágenes se procesaron con XDS67 y se escalaron con AIMLESS (v0.7.7)68. En la Tabla 1 se proporcionan estadísticas adicionales. El análisis inicial de los datos indicó una fuerte señal anómala del bromuro que se extendía a una resolución de aproximadamente 1,7 Å.

La estructura V-Csn se resolvió mediante los métodos Br-SAD (difracción anómala única de bromuro) implementados en PHENIX22. Luego del aplanamiento con solvente y la modificación de la densidad, la figura de mérito general (FOM) fue de 0.363 para 16 sitios de bromuro. La construcción automática en PHENIX (v1.20.1-4487) generó un modelo que comprende 221 de los 224 residuos esperados. El refinamiento inicial con phenix.refine24 dio un Rwork y Rfree de 0,158 y 0,187, respectivamente. El modelo se completó con COOT23 y se refinó aún más con phenix.refine utilizando los datos de apo1 a una resolución de 0,89 Å. Se agregaron moléculas de agua en posiciones estructural y químicamente relevantes, y los parámetros de desplazamiento atómico para todos los átomos en la estructura se refinaron isotrópicamente. La estructura de apo2 se resolvió por reemplazo molecular utilizando el programa MOLREP (v11.9.02)69 de la suite CCP470, utilizando como modelo de búsqueda la estructura apo1 refinada. Las estadísticas de refinamiento final para las dos estructuras apo-V-Csn se dan en la Tabla 2.

Los mutantes V-Csn D148N y E157Q se seleccionaron para la cristalización utilizando las condiciones n.° 20, n.° 38 y n.° 45, y se observaron cristales en los tres. Los conjuntos de datos de difracción se recolectaron de cristales individuales D148N y E157Q de la condición #45. Para los cristales D148N, se recopilaron 1800 imágenes (0,2° de rotación/imagen) en BL12-2, y los datos se procesaron y escalaron con XDS67 y AIMLESS68. Para el cristal E157Q, se recolectaron 1850 imágenes en BL12-2 y los datos se procesaron y escalaron con XDS67 y AIMLESS68. Las estadísticas de recopilación de datos se proporcionan en la Tabla 3. Ambas estructuras se resolvieron mediante reemplazo molecular con MOLREP69 utilizando la estructura V-Csn de tipo salvaje refinada como modelo inicial, con todas las moléculas de agua eliminadas. Las estructuras D148N y E157Q se refinaron con phenix.refine24, y las estadísticas finales también se proporcionan en la Tabla 3.

El complejo E157Q-sustrato se preparó disolviendo 0,06 mg de quitohexaosa (Biosynth) en 10 uL de E157Q a 3,3 mg/ml, dando una concentración final de quitohexaosa de alrededor de 5 mM. El complejo se incubó a 4 °C durante 1 h antes de colocar las gotas sentadas frente a la condición de cristalización #45. Las gotas de cristalización se sembraron por estrías varias horas después de la preparación y se observaron cristales del complejo en todas las gotas durante la noche. Los cristales eran morfológicamente similares a los cristales mutantes y de tipo salvaje cultivados en las mismas condiciones. Los cristales se transfirieron a un tampón de cristalización aumentado con glicerol al 25% y se enfriaron instantáneamente en nitrógeno líquido. Los datos de difracción se recogieron en BL12-2. Se recopilaron un total de 1800 imágenes y los datos se procesaron y escalaron con XDS67 y AIMLESS68. La estructura del complejo E157Q-sustrato se resolvió mediante reemplazo molecular con MOLREP69 utilizando la estructura V-Csn de tipo salvaje refinada con todas las moléculas de agua eliminadas como modelo inicial y refinada con phenix.refine24. Las estadísticas de recopilación y refinamiento de datos se dan en la Tabla 3.

Las predicciones de la estructura AlphaFold se ejecutaron utilizando una versión instalada localmente del software recuperada del repositorio oficial de GitHub (https://github.com/deepmind/alphafold) o el cuaderno AlphaFold colaborativo de Google (https://colab.research. google.com/github/sokrypton/ColabFold/blob/main/AlphaFold2.ipynb). Las superficies accesibles al solvente se calcularon con PyMOL (v2.5.2) (Schrodinger) e ICM-Pro (v3.8-6a) (Molsoft), utilizando un radio de sonda de 1,4 Å (equivalente al radio de una sola molécula de agua). Las superficies electrostáticas se generaron con el complemento Adaptive Poisson-Boltzmann Solver (APBS) para PyMOL (v2.5.2).

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de investigación de Nature vinculado a este artículo.

Los datos que respaldan este estudio están disponibles de los autores correspondientes previa solicitud razonable. Los datos de secuencia viral utilizados para la Fig. 1 están disponibles públicamente en el sitio web de JGI [https://img.jgi.doe.gov/cgi-bin/vr/main.cgi] sin restricción de uso de acuerdo con la política de datos de JGI. Las coordenadas atómicas y los factores de estructura de las estructuras proteicas se han enviado al banco de datos de proteínas RSCB (PDB) con los códigos de acceso 7TVL (V-Csn apo1), 7TVM (V-Csn apo2), 7TVN (V-Csn-D148N), 7TVO (V-Csn-E157Q) y 7TVP (complejo de quitohexaosa V-Csn-E157Q). Los datos de origen subyacentes a la figura 2a, c se proporcionan como archivos de datos de origen. Los datos de origen se proporcionan con este documento.

Christo-Foroux, E. et al. Caracterización de Mollivirus kamchatka, el primer representante moderno de la familia propuesta de molliviridae de virus gigantes. J.Virol. 94, e01997–01919 (2020).

Artículo PubMed PubMed Central Google Académico

Legendre, M. et al. Estudio en profundidad de Mollivirus sibericum, un nuevo virus gigante de 30.000 años de antigüedad que infecta a Acanthamoeba. proc. Academia Nacional. ciencia 112, E5327–E5335 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Emerson, JB y col. Ecología viral del suelo ligada al huésped a lo largo de un gradiente de descongelación de permafrost. Nat. Microbiol. 3, 870–880 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Wu, R. et al. La diversidad, la abundancia y el potencial funcional del ADN viral varían en los suelos de los pastizales con una variedad de regímenes históricos de humedad. mBío. 12, e0259521 (2021).

Artículo PubMed Google Académico

Trubl, G. et al. Interacciones virus-huésped activas a temperaturas bajo cero en suelos de turba del Ártico. Microbioma 9, 208 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Breitbart, M. Virus marinos: verdad o reto. Ana. Rev. Mar. Sci. 4, 425–448 (2012).

Artículo PubMed Google Académico

Trubl, G. et al. Los virus del suelo son jugadores poco explorados en el procesamiento de carbono de los ecosistemas. MSystems 3, e00076–00018 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Puxty, RJ, Millard, AD, Evans, DJ y Scanlan, DJ Arrojando nueva luz sobre la fotosíntesis viral. Fotosintet Res. 126, 71–97 (2015).

Artículo CAS PubMed Google Académico

Crummett, LT, Puxty, RJ, Weihe, C., Marston, MF y Martiny, JBH El contenido genómico y el contexto de los genes metabólicos auxiliares en los cianomiovirus marinos. Virología 499, 219–229 (2016).

Artículo CAS PubMed Google Académico

Lindell, D., Jaffe, JD, Johnson, ZI, Church, GM y Chisholm, SW Los genes de fotosíntesis en virus marinos producen proteínas durante la infección del huésped. Naturaleza 438, 86–89 (2005).

Artículo ADS CAS PubMed Google Scholar

Clokie, MRJ y col. Transcripción de un fago de tipo T4 'fotosintético' durante la infección de una cianobacteria marina. Reinar. Microbiol. 8, 827–835 (2006).

Artículo CAS PubMed Google Académico

Zabelskii, D. et al. Las rodopsinas virales 1 son una familia única de canales catiónicos activados por la luz. Nat. Com. 11, 5707 (2020).

Artículo ADS CAS Google Académico

Jin, M. et al. Diversidades e impactos biogeoquímicos potenciales de los virus del suelo de los manglares. Microbioma 7, 58 (2019).

Artículo PubMed PubMed Central Google Académico

El Knidri, H., Belaabed, R., Addaou, A., Laajeb, A. & Lahsini, A. Extracción, modificación química y caracterización de quitina y quitosano. Int J. Biol. macromol. 120, 1181–1189 (2018).

Artículo CAS PubMed Google Académico

Capovilla, G. et al. Utilización de quitina por picocianobacterias marinas y la evolución de un estilo de vida planctónico. Preimpresión en https://www.biorxiv.org/content/10.1101/2022.06.23.497379v2 (2022).

Jeannard, A. et al. Hacia la definición de los clorovirus: un viaje genómico a través de un género de grandes virus de ADN. BMC Genómica. 14, 158 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Sanjuan , R. & Domingo-Calap P. Diversidad genética y evolución de poblaciones virales. Enciclopedia Virol. 1, 53–61 (2021).

Heggset, EB et al. Modo de acción de una quitosanasa de la familia 75 de Streptomyces avermitilis. Biomacromol 13, 1733–1741 (2012).

Artículo CAS Google Académico

Shimosaka, M., Sato, K., Nishiwaki, N., Miyazawa, T. y Okazaki, M. Análisis de residuos de aminoácidos carboxílicos esenciales para la actividad catalítica de quitosanasas fúngicas mediante mutagénesis dirigida al sitio. J. Biosci. Bioing. 100, 545–550 (2005).

Artículo CAS PubMed Google Académico

Jumper, J. et al. Predicción de estructura de proteínas de alta precisión con AlphaFold. Naturaleza 596, 583–589 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Cheng, C.-Y., Chang, C.-H., Wu, Y.-J. & Li, Y.-K. Exploración de Glycosyl Hydrolase Family 75, una quitosanasa de Aspergillus fumigatus. J. Biol. química 281, 3137–3144 (2005).

Artículo PubMed CAS Google Académico

Adams, PD et al. PHENIX: un sistema integral basado en Python para la solución de estructuras macromoleculares. Acta Crystallogr. D66, 213–221 (2010).

Google Académico

Emsley, P., Lohkamp, ​​B., Scott, WG y Cowtan, K. Características y desarrollo de Focha. Acta Crystallogr. D66, 486–501 (2010).

Google Académico

Afonine, PV et al. Hacia el refinamiento automatizado de la estructura cristalográfica con phenix.refine. Acta Crystallogr. D68, 352–367 (2012).

Google Académico

Holm, L. Uso de Dali para la comparación de estructuras de proteínas. Métodos Mol. Biol. 2112, 29–42 (2020).

Artículo CAS PubMed Google Académico

Hamiaux, C. et al. Estructura cristalina de la kiwellina, una importante proteína de la pared celular del kiwi. J. Estructura. Biol. 187, 276–281 (2014).

Artículo CAS PubMed Google Académico

Offermann, LR et al. Elusivas características estructurales, funcionales e inmunológicas de Act d 5, la kiwellina del kiwi verde. J. Química alimentaria agrícola. 63, 6567–6576 (2015).

Artículo CAS PubMed Google Académico

Ludvigsen, S. & Poulsen, FM Estructura tridimensional en solución de barwin, una proteína de semilla de cebada. Bioquímica 31, 8783–8789 (1992).

Artículo CAS PubMed Google Académico

Huet, J. et al. Estructura de alta resolución de una proteína similar a barwin de defensa de plantas de papaya resuelta por fase interna de azufre-SAD. Acta Crystallogr. D69, 2017–2026 (2013).

Google Académico

de Oliveira, AL et al. La estructura del elicitor cerato-platanina (CP), el primer miembro de la familia de proteínas fúngicas CP, revela un doble pliegue de barril psi beta y unión a carbohidratos. J. Biol. química 286, 17560–17568 (2011).

Artículo PubMed PubMed Central CAS Google Scholar

Juettner, NE et al. Estructura iluminadora y sitios donantes de acilo de un sustrato de transglutaminasa fisiológica de Streptomyces mobaraensis. Ciencia de las proteínas 27, 910–922 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Georgelis, N., Yennawar, NH y Cosgrove, DJ Base estructural para la unión de celulosa impulsada por la entropía mediante un módulo de unión a celulosa (CBM) tipo A y expansión bacteriana. proc. Academia Nacional. ciencia 109, 14830–14835 (2012).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Yennawar, NH, Li, LC, Dudzinski, DM, Tabuchi, A. & Cosgrove, DJ Estructura cristalina y actividades de EXPB1 (Zea m 1), una β-expansina y alérgeno de polen del grupo 1 del maíz. proc. Academia Nacional. ciencia 103, 14664–14671 (2006).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Arumughan, A. et al. El mapeo de interacción cuantitativa revela un dominio UBX extendido en ASPL que interrumpe los hexámeros p97 funcionales. Nat. común 7, 13047–13047 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Davies, GJ et al. Determinación de la estructura y refinamiento de la endoglucanasa V de Humicola insolens a una resolución de 1,5 A. Acta Crystallogr. D52, 7–17 (1996).

CAS Google Académico

Davies, GJ et al. Estructura y función de la endoglucanasa V. Nature 365, 362–364 (1996).

Artículo ANUNCIOS Google Académico

Canción, JM et al. Caracterización genética y estructural de una endo-β-1,4-glucanasa ácida, resistente al frío y termotolerante del colémbolo antártico, Cryptopygus antarcticus. J. Química alimentaria agrícola. 65, 1630–1640 (2017).

Artículo CAS PubMed Google Académico

Marcotte, EM, Monzingo, AF, Ernst, SR, Brzezinski, R. & Robertas, JD Estructura de rayos X de una quitosanasa antifúngica de Streptomyces N174. Nat. Estructura. Biol. 3, 155–162 (1996).

Artículo CAS PubMed Google Académico

Castillo, RM et al. Varias superfamilias de proteínas comparten un barril beta de doble psi de seis hebras. Estructura 7, 227–236 (1999).

Artículo CAS PubMed Google Académico

Heinig, M. & Frishman, D. STRIDE: un servidor web para la asignación de estructuras secundarias a partir de coordenadas atómicas conocidas de proteínas. Núcleo Ácidos Res. 32, W500–W502 (2004).

Artículo CAS PubMed PubMed Central Google Scholar

Flocco, MM & Mowbray, SL Extraños compañeros de cama: interacciones entre cadenas laterales ácidas en proteínas. J. Mol. Biol. 254, 96–105 (1995).

Artículo CAS PubMed Google Académico

Davies, GJ, Wilson, KS & Henrissat, B. Nomenclatura para subsitios de unión a azúcar en glicosil hidrolasas. Bioquímica J. 321, 557–559 (1997).

Artículo CAS PubMed PubMed Central Google Scholar

Schou, C., Rasmussen, G., Kaltoft, M. & Henrissat, B. Schülein M. Estereoquímica, especificidad y cinética de la hidrólisis de celodextrinas reducidas por nueve celulasas. EUR. J. Bioquímica. 217, 947–953 (1993).

Artículo CAS PubMed Google Académico

Pollierer, MM, Dyckmans, J., Scheu, S. & Haubert, D. Flujo de carbono a través de hongos y bacterias en la red alimenticia animal del suelo del bosque según lo indicado por el análisis de ácidos grasos 13C específicos del compuesto. Función Ecol. 26, 978–990 (2012).

Artículo Google Académico

Wang, M. et al. Análisis genómico del fago Synechococcus S-B43 y su adaptación al medio costero. Resolución de virus 289, 198155 (2020).

Artículo CAS PubMed Google Académico

Roux, S. et al. IMG/VR v3: Un marco ecológico y evolutivo integrado para interrogar genomas de virus no cultivados. Núcleo Ácidos Res. 49, D764–D775 (2021).

Artículo CAS PubMed Google Académico

Paez-Espino, D., Pavlopoulos, GA, Ivanova, NN & Kyrpides, NC Canalización de descubrimiento de secuencias de virus no objetivo y agrupación de virus para datos metagenómicos. Nat. Protocolo 12, 1673–1682 (2017).

Artículo CAS PubMed Google Académico

Huerta-Cepas, J. et al. EggNOG 4.5: un marco de ortología jerárquica con anotaciones funcionales mejoradas para secuencias eucariotas, procariotas y virales. Núcleo Ácidos Res. 44, D286–D293 (2016).

Artículo CAS PubMed Google Académico

Cantarel, BL et al. La base de datos de enzimas activas de carbohidratos (CAZy): un recurso experto para la glucogenómica. Núcleo Ácidos Res. 37, D233–D238 (2009).

Artículo CAS PubMed Google Académico

Prestat, E. et al. FOAM (asignaciones de ontología funcional para metagenomas): una base de datos del modelo oculto de Markov (HMM) con enfoque ambiental. Núcleo Ácidos Res. 42, e145 (2014).

Artículo PubMed PubMed Central CAS Google Scholar

Eddy, SR Búsquedas aceleradas de perfiles HMM. PLoS Comput Biol. 7, 1002195 (2011).

Artículo ADS MathSciNet CAS Google Scholar

Johnson, M. et al. NCBI BLAST: una mejor interfaz web. Núcleo Ácidos Res. 36, W5–W9 (2008).

Artículo CAS PubMed PubMed Central Google Scholar

Hyatt, D. et al. Pródigo: Reconocimiento de genes procarióticos e identificación del sitio de iniciación de la traducción. BMC Bioinforme. 11, 119 (2010).

Artículo CAS Google Académico

Wu, R. et al. La humedad modula los reservorios del suelo de virus activos de ADN y ARN. común Biol. 4, 992 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Nayfach, S. et al. CheckV evalúa la calidad y la integridad de los genomas virales ensamblados en el metagenoma. Nat. Biotecnología. 39, 578–585 (2021).

Artículo CAS PubMed Google Académico

Bolduc, B. et al. vConTACT: una herramienta de iVirus para clasificar los virus de ADN de doble cadena que infectan Archaea y Bacteria. PeerJ. 5, e3243 (2017).

Artículo PubMed PubMed Central Google Académico

Galiez, C., Siebert, M., Enault, F., Vincent, J. & Söding, J. WIsH: ¿quién es el anfitrión? Predicción de huéspedes procarióticos a partir de contigs de fagos metagenómicos. Bioinformática 33, 3113–3114 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Ahlgren, NA, Ren, J., Lu, YY, Fuhrman, JA y Sun, F. La medida de disimilitud de frecuencia de oligonucleótidos d2* sin alineación mejora la predicción de huéspedes a partir de secuencias virales derivadas metagenómicamente. Núcleo Ácidos Res. 45, 39–53 (2017).

Artículo CAS PubMed Google Académico

Lu, C. et al. Predictor de hospedador de virus procariotas: un modelo gaussiano para la predicción de hospedadores de virus procariotas en metagenómica. BMC Biol. 19, 5 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Fu, L., Niu, B., Zhu, Z., Wu, S. & Li, W. CD-HIT: Acelerado para agrupar los datos de secuenciación de próxima generación. Bioinformática 28, 3150–3152 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Katoh, K. & Standley, DM Software de alineación de secuencias múltiples MAFFT versión 7: mejoras en el rendimiento y la usabilidad. mol. Biol. Evol. 30, 772–780 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Kozlov, AM, Darriba, D., Flouri, T., Morel, B. & Stamatakis, A. RAxML-NG: una herramienta rápida, escalable y fácil de usar para la inferencia filogenética de máxima verosimilitud. Bioinformática 35, 4453–4455 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Studier, FW Producción de proteínas por autoinducción en cultivos agitados de alta densidad. prot. Expr. Purif. 41, 207–234 (2005).

Artículo CAS Google Académico

Buchko, GW, Clifton, MC, Wallace, EG, Atkins, KA & Myler, PJ Asignaciones de desplazamiento químico de la columna vertebral y análisis de la estructura secundaria de la proteína U1 del virus Bas-Congo. Biomol. Asignación de RMN. 11, 51–56 (2017).

Artículo CAS PubMed Google Académico

Wrenbeck, EE y col. Mutagénesis de saturación en un recipiente basada en plásmidos. Nat. Métodos. 13, 928–930 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Schönbichler, A., Díaz-Moreno, SM, Srivastava, V. & McKee, LS Exploración del potencial de antagonismo fúngico y ataque a la pared celular por Bacillus subtilis natto. Microbiol frontal. 11, 521 (2020).

Artículo PubMed PubMed Central Google Académico

Kabsch, W. XDS. Acta Crystallogr. D66, 125–132 (2010).

Google Académico

Evans, PR & Murshudov, GN ¿Qué tan buenos son mis datos y cuál es la resolución? Acta Crystallogr. D69, 1204–1214 (2013).

Google Académico

Vagin, A. & Teplyakov, A. MOLREP: Un programa automatizado para el reemplazo molecular. J. Appl Cryst. 30, 1022–1025 (1997).

Artículo CAS Google Académico

Winn, MD y col. Descripción general de la suite CCP4 y desarrollos actuales. Acta Cryst. D67, 235–242 (2011).

Google Académico

Weiss, MS Indicadores glocales de la calidad de los datos de rayos X. Aplicación J. cristalogr. 34, 130–135 (2001).

Artículo CAS Google Académico

Karplus, PA & Diederichs, K. Vinculación del modelo cristalográfico y la calidad de los datos. Ciencia 336, 1030–1033 (2012).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Evans, PR Escalamiento y evaluación de la calidad de los datos. Acta Crystallogr. D62, 72–82 (2006).

CAS Google Académico

Chen, VB et al. MolProbity: validación de la estructura de todos los átomos para cristalografía macromolecular. Acta Crystallogr. D66, 12–21 (2010).

Google Académico

Descargar referencias

Este trabajo fue apoyado por la Oficina de Investigación Biológica y Ambiental (BER) del Departamento de Energía (DOE) y es una contribución del Área de enfoque científico "Respuesta fenotípica del microbioma del suelo a las perturbaciones ambientales" a JKJ y KSH. Una parte de este trabajo se realizó en la adjudicación de un proyecto (https://doi.org/10.46936/cpcy.proj.2021.60161/60000437) bajo el programa FICUS para JEM y utilizó recursos en el DOE Joint Genome Institute (JGI) y el Laboratorio de Ciencias Moleculares Ambientales (EMSL), que son instalaciones para usuarios de la Oficina de Ciencias del DOE. Ambas instalaciones están patrocinadas por el programa de Investigación Biológica y Ambiental y son operadas bajo los Contratos No. DE-AC02-05CH11231 (JGI) y DE-AC05-76RL01830 (EMSL). Las estructuras cristalinas se determinaron en la fuente de luz de radiación de sincrotrón de Stanford (SSRL). SSRL es una instalación de usuario nacional operada por la Universidad de Stanford en nombre de la Oficina de Ciencias Energéticas Básicas del Departamento de Energía de los EE. UU. bajo el contrato No. DE-AC02-76SF00515. El Programa de Biología Molecular Estructural de SSRL cuenta con el apoyo del Departamento de Energía, la Oficina de Investigación Biológica y Ambiental y los Institutos Nacionales de Salud (NIGMS) mediante el número de subvención P30GM133894. Los resultados preliminares de la función enzimática fueron proporcionados por Gregor Tegl y Stephen Withers de la Universidad de Columbia Británica.

Estos autores contribuyeron igualmente: Ruonan Wu, Clyde A. Smith.

Dirección de Ciencias Biológicas y de la Tierra, Laboratorio Nacional del Noroeste del Pacífico, Richland, WA, EE. UU.

Ruonan Wu, Garry W. Buchko, Jason E. McDermott, Kirsten S. Hofmockel, John R. Cort y Janet K. Jansson

Fuente de luz de radiación de sincrotrón de Stanford, Universidad de Stanford, Menlo Park, CA, EE. UU.

Clyde A Smith

Escuela de Biociencias Moleculares, Universidad Estatal de Washington, Pullman, WA, EE. UU.

Garry W. Buchko

Instituto Conjunto del Genoma del Departamento de Energía de EE. UU., Laboratorio Nacional Lawrence Berkeley, Berkeley, CA, EE. UU.

Ian K. Blaby, Nikos C. Kyrpides y Yasuo Yoshikuni

Mammoth Biosciences, Brisbane, CA, EE. UU.

David Paez-Espino

Departamento de Microbiología Molecular e Inmunología, Universidad de Ciencias y Salud de Oregon, Portland, OR, EE. UU.

Jason E. McDermott

Instituto de Química Biológica, Universidad Estatal de Washington, Pullman, WA, EE. UU.

Juan R. Cort

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

RW llevó a cabo la mayoría de los análisis de bioinformática. CAS determinó las estructuras cristalinas de las enzimas quitosanasa y aclaró sus mecanismos. GWB expresó las proteínas de quitosanasa, cribó las condiciones de cristalización y realizó ensayos de actividad. IKB y YY llevaron a cabo la síntesis y clonación de genes y mutantes de quitosanasa. NCK proporcionó la recuperación de la base de datos y los DOI de las secuencias de quitosanasa disponibles públicamente. DP-E., JRC y CAS realizaron las predicciones AlphaFold de la estructura de la proteína. KSH, JKJ, JEM y CAS financiaron la investigación. JKJ coordinó el estudio. Todos los autores contribuyeron a la redacción del manuscrito.

Correspondencia a Janet K. Jansson.

Los autores declaran no tener conflictos de intereses.

Nature Communications agradece a Rey-Ting Guo y Ella Sieradzki por su contribución a la revisión por pares de este trabajo. Los informes de los revisores están disponibles.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Wu, R., Smith, CA, Buchko, GW y col. Caracterización estructural de un producto génico metabólico auxiliar viral del suelo: una quitosanasa funcional. Nat Comun 13, 5485 (2022). https://doi.org/10.1038/s41467-022-32993-8

Descargar cita

Recibido: 30 de marzo de 2022

Aceptado: 26 de agosto de 2022

Publicado: 19 septiembre 2022

DOI: https://doi.org/10.1038/s41467-022-32993-8

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Nature Reviews Microbiología (2023)

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.