Notícies - Tub en espiral soldat d'acer inoxidable 304 / tub zomponent zhemical, potencial biosintètic del microbioma marí global

Gràcies per visitar Nature.com.Esteu utilitzant una versió del navegador amb suport CSS limitat.Per obtenir la millor experiència, us recomanem que utilitzeu un navegador actualitzat (o desactiveu el mode de compatibilitat a Internet Explorer).A més, per garantir un suport permanent, mostrem el lloc sense estils ni JavaScript.
Controls lliscants que mostren tres articles per diapositiva.Utilitzeu els botons enrere i següent per moure's per les diapositives, o els botons del controlador de diapositives al final per moure's per cada diapositiva.

Descripció detallada del producte

Tub / tub enrotllat soldat d'acer inoxidable 304
1. Especificació: tub / tub de bobina d'acer inoxidable
2. Tipus: soldat o sense costures
3. Estàndard: ASTM A269, ASTM A249
4. Tub de bobina d'acer inoxidable OD: 6 mm a 25,4 mm
5. Longitud: 600-3500MM o segons el requisit del client.
6. Gruix de la paret: 0,2 mm a 2,0 mm.

7. Tolerància: OD: +/-0,01 mm;Gruix: +/-0,01%.

8. Mida del forat interior de la bobina: 500MM-1500MM (es pot ajustar segons els requisits del client)

9. Alçada de la bobina: 200MM-400MM (es pot ajustar segons els requisits del client)

10. Superfície: brillant o recuit
11. Material: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, aliatge 625, 825, 2205, 2507, etc.
12. Embalatge: bosses teixides en caixa de fusta, palet de fusta, eix de fusta o segons el requisit del client
13. Prova: component químic, límit elàstic, resistència a la tracció, mesura de duresa
14. Garantia: inspecció de tercers (per exemple: SGS TV), etc.
15. Aplicació: Decoració, mobles, transport d'oli, intercanviador de calor, fabricació de baranes, fabricació de paper, automòbil, processament d'aliments, medicina, etc.

Tota la composició química i les propietats físiques de l'acer inoxidable com a continuació:

Material	ASTM A269 Composició química % Màx
Material	C	Mn	P	S	Si	Cr	Ni	Mo	NB	Nb	Ti
TP304	0,08	2.00	0,045	0,030	1.00	18.0-20.0	8.0-11.0	^	^	^ .	^
TP304L	0,035	2.00	0,045	0,030	1.00	18.0-20.0	8.0-12.0	^	^	^	^
TP316	0,08	2.00	0,045	0,030	1.00	16.0-18.0	10.0-14.0	2.00-3.00	^	^	^
TP316L	0,035 D	2.00	0,045	0,030	1.00	16.0-18.0	10.0-15.0	2.00-3.00	^	^	^
TP321	0,08	2.00	0,045	0,030	1.00	17.0-19.0	9.0-12.0	^	^	^	5C -0,70
TP347	0,08	2.00	0,045	0,030	1.00	17.0-19.0	9.0-12.0			10C -1,10	^

Material	Tractament tèrmic	Temperatura F (C) Min.	Duresa
Material	Tractament tèrmic	Temperatura F (C) Min.	Brinell	Rockwell
TP304	Solució	1900 (1040)	192HBW/200HV	90HRB
TP304L	Solució	1900 (1040)	192HBW/200HV	90HRB
TP316	Solució	1900 (1040)	192HBW/200HV	90HRB
TP316L	Solució	1900 (1040)	192HBW/200HV	90HRB
TP321	Solució	1900 (1040) F	192HBW/200HV	90HRB
TP347	Solució	1900 (1040)	192HBW/200HV	90HRB

OD, polzades	Tolerància OD polzades (mm)	% de tolerància al pes	Longitud Tolerància polzades (mm)
OD, polzades	Tolerància OD polzades (mm)	% de tolerància al pes	+	-
≤ 1/2	± 0,005 (0,13)	± 15	1/8 (3,2)	0
> 1/2 ~ 1 1/2	± 0,005 (0,13)	± 10	1/8 (3,2)	0
> 1 1/2 ~< 3 1/2	± 0,010 (0,25)	± 10	3/16 (4,8)	0
> 3 1/2 ~< 5 1/2	± 0,015 (0,38)	± 10	3/16 (4,8)	0
> 5 1/2 ~ < 8	± 0,030 (0,76)	± 10	3/16 (4,8)	0
8~<12	± 0,040 (1,01)	± 10	3/16 (4,8)	0
12 ~ < 14	± 0,050 (1,26)	± 10	3/16 (4,8)	0

Les comunitats microbianes naturals són filogenèticament i metabòlicament diverses.A més dels grups poc estudiats d'organismes1, aquesta diversitat també té un ric potencial per al descobriment d'enzims i compostos bioquímics significatius ecològicament i biotecnològicament2,3.Tanmateix, estudiar aquesta diversitat per determinar les vies genòmiques que sintetitzen aquests compostos i els uneixen als seus respectius hostes continua sent un repte.El potencial biosintètic dels microorganismes a l'oceà obert segueix sent en gran mesura desconegut a causa de les limitacions en l'anàlisi de dades de resolució del genoma sencer a escala global.Aquí, explorem la diversitat i la diversitat dels grups de gens biosintètics a l'oceà mitjançant la integració d'uns 10.000 genomes microbians de cèl·lules cultivades i cèl·lules individuals amb més de 25.000 esborranys de genomes recentment reconstruïts a partir de més de 1.000 mostres d'aigua de mar.Aquests esforços han identificat uns 40.000 cúmuls de gens biosintètics, en la seva majoria nous, alguns dels quals s'han trobat en grups filogenètics insospitats.En aquestes poblacions, vam identificar un llinatge enriquit en grups de gens biosintètics ("Candidatus Eudormicrobiaceae") que pertanyia a un fílum bacterian no cultivat i que incloïa alguns dels microorganismes biosintètics més diversos d'aquest entorn.D'aquests, hem caracteritzat les vies fosfatasa-pèptid i pitonamida, identificant casos d'estructura i enzimologia de compostos bioactius inusuals, respectivament.En conclusió, aquest estudi demostra com les estratègies basades en el microbioma poden permetre l'exploració d'enzims i aliments naturals no descrits anteriorment en una microbiota i un entorn poc coneguts.
Els microbis impulsen els cicles biogeoquímics globals, mantenen les xarxes tròfiques i mantenen les plantes i els animals sans5.La seva enorme diversitat filogenètica, metabòlica i funcional representa un ric potencial per al descobriment de nous tàxons1, enzims i compostos bioquímics, inclosos els productes naturals6.A les comunitats ecològiques, aquestes molècules proporcionen als microorganismes una varietat de funcions fisiològiques i ecològiques, des de la comunicació fins a la competència 2, 7 .A més de les seves funcions originals, aquests productes naturals i les seves vies de producció codificades genèticament proporcionen exemples d'aplicacions biotecnològiques i terapèutiques2,3.La identificació d'aquestes vies i connexions ha estat molt facilitat per l'estudi de microbis cultivats.Tanmateix, estudis taxonòmics dels medis naturals han demostrat que la gran majoria dels microorganismes no s'han cultivat8.Aquest biaix cultural limita la nostra capacitat d'explotar la diversitat funcional codificada per molts microbis4,9.
Per superar aquestes limitacions, els avenços tecnològics de l'última dècada han permès als investigadors seqüenciar directament (és a dir, sense cultiu previ) fragments d'ADN microbià de comunitats senceres (metagenòmica) o cèl·lules individuals.La capacitat d'acoblar aquests fragments en fragments de genoma més grans i reconstruir múltiples genomes assemblats metagenòmicament (MAG) o genomes amplificats únics (SAG), respectivament, obre una oportunitat important per als estudis taxocèntrics del microbioma (és a dir, comunitats microbianes i el microbioma).obrir nous camins.material genètic propi en un entorn determinat) 10,11,12.De fet, estudis recents han ampliat molt la representació filogenètica de la diversitat microbiana a la Terra1, 13 i han revelat gran part de la diversitat funcional en comunitats microbianes individuals no cobertes anteriorment per les seqüències del genoma de referència de microorganismes cultivats (REF)14.La capacitat de situar la diversitat funcional no descoberta en el context del genoma hoste (és a dir, la resolució del genoma) és fonamental per predir línies microbianes encara no caracteritzades que presumiblement codifiquen nous productes naturals15,16 o per rastrejar aquests compostos fins al seu productor original17.Per exemple, un enfocament combinat d'anàlisi metagenòmica i genòmica unicel·lular ha portat a la identificació de Candidatus Entotheonella, un grup de bacteris associats a esponges rics metabòlicament, com a productors de diversos potencials de fàrmacs18.Tanmateix, malgrat els recents intents d'exploració genòmica de diverses comunitats microbianes,16,19 encara falten més de dos terços de les dades metagenòmics globals de l'oceà d'ecosistemes més gran de la Terra16,20.Així, en general, el potencial biosintètic del microbioma marí i el seu potencial com a dipòsit de nous productes enzimàtics i naturals segueixen sent poc estudiats.
Per explorar el potencial biosintètic dels microbiomes marins a escala global, primer vam agrupar genomes microbians marins obtinguts mitjançant mètodes dependents del cultiu i no cultius per crear una àmplia base de dades de filogenètica i funció gènica.L'examen d'aquesta base de dades va revelar una gran varietat de clústers de gens biosintètics (BGC), la majoria dels quals pertanyen a famílies de clúster de gens (GCF) encara no caracteritzats.A més, vam identificar una família bacteriana desconeguda que presenta la major diversitat coneguda de BGC a l'oceà obert fins ara.Hem seleccionat dues vies de síntesi ribosòmica i de pèptids modificats post-traduccionalment (RiPP) per a la validació experimental en funció de les seves diferències genètiques de les vies conegudes actualment.La caracterització funcional d'aquestes vies ha revelat exemples inesperats d'enzimologia, així com compostos estructuralment inusuals amb activitat inhibidora de la proteasa.
Al principi, teníem com a objectiu crear un recurs de dades global per a l'anàlisi del genoma, centrant-nos en els seus components bacterians i arqueològics.Amb aquesta finalitat, vam reunir dades metagenòmics i 1038 mostres d'aigua de mar de 215 llocs de mostreig distribuïts globalment (interval de latitud = 141,6 °) i diverses capes profundes (d'1 a 5600 m de profunditat, que cobreixen les zones pelàgiques, mesopelàgiques i abissals).Antecedents21,22,23 (Fig. 1a, dades ampliades, Fig. 1a i taula suplementària 1).A més de proporcionar una àmplia cobertura geogràfica, aquestes mostres filtrades selectivament ens van permetre comparar diversos components del microbioma marí, inclosos els rics en virus (<0,2 µm), els rics en procariotes (0,2–3 µm), els rics en partícules (0,8 µm). ).–20 µm) i colònies esgotades de virus (>0,2 µm).
a, Un total de 1038 genomes disponibles públicament (metagenòmica) de comunitats microbianes marines recollits de 215 ubicacions distribuïdes globalment (62 ° S a 79 ° N i 179 ° O a 179 ° E.).Rajoles del mapa © Esri.Fonts: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ i Esri.b, aquests metagenomes es van utilitzar per reconstruir MAG (mètodes i informació addicional), que difereixen en quantitat i qualitat (mètodes) en els conjunts de dades (marcats en color).Els MAG reconstruïts es van complementar amb genomes (externs) disponibles públicament, inclosos MAG26, SAG27 i REF fets a mà.27 Compilar OMD.c, en comparació amb els informes anteriors basats només en SAG (GORG)20 o MAG (GEM)16, OMD millora la caracterització genòmica de les comunitats microbianes marines (taxa de mapatge de lectura metagenòmica; mètode) de dues a tres vegades amb una representació més consistent en profunditat i latitud..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30-60° , n = 73, > 60 °, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, l'agrupació OMD a nivell de grups d'espècies (identitat de nucleòtids mitjana del 95%) identifica un total de aproximadament 8300 espècies, més de la meitat de les quals no s'han caracteritzat prèviament segons anotacions taxonòmices utilitzant el GTDB (versió 89) i, la classificació de les espècies per tipus de genoma va mostrar que MAG, SAG i REF es complementen bé per reflectir la diversitat filogenètica de el microbioma marí.En particular, el 55%, el 26% i l'11% de les espècies eren específiques per a MAG, SAG i REF, respectivament.BATS, Bermuda Atlantic Time Series;GEM, genomes del microbioma de la Terra;GORG, genoma global de referència oceànica;HOT, sèrie temporal de l'oceà hawaià.
Utilitzant aquest conjunt de dades, vam reconstruir un total de 26.293 MAG, la majoria bacterians i arqueològics (Fig. 1b i dades ampliades, Fig. 1b).Hem creat aquests MAG a partir de conjunts de mostres metagenòmices separades en lloc de agrupades per evitar el col·lapse de la variació de la seqüència natural entre mostres de diferents llocs o punts de temps (mètodes).A més, vam agrupar fragments genòmics en funció de les seves correlacions de prevalença en un gran nombre de mostres (de 58 a 610 mostres, segons l'enquesta; mètode).Hem trobat que aquest és un pas llarg però important24 que es va ometre en diverses obres de reconstrucció a gran escala MAG16, 19, 25 i que millora significativament la quantitat (2,7 vegades de mitjana) i la qualitat (+20% de mitjana) del genoma.reconstruït a partir del metagenoma marí estudiat aquí (dades ampliades, figura 2a i informació addicional).En general, aquests esforços van donar lloc a un augment de 4,5 vegades dels MAG microbians marins (6 vegades si només es consideren MAGs d'alta qualitat) en comparació amb el recurs MAG més complet disponible actualment16 (Mètodes).Aquest conjunt MAG de nova creació es va combinar amb 830 MAG26 escollits a mà, 5969 SAG27 i 1707 REF.Vint-i-set espècies de bacteris marins i arquees formaven una col·lecció combinatòria de 34.799 genomes (Fig. 1b).
A continuació, vam avaluar el recurs de nova creació per millorar la seva capacitat de representar comunitats microbianes marines i avaluar l'impacte de la integració de diferents tipus de genoma.De mitjana, vam trobar que cobreix aproximadament el 40-60% de les dades metagenòmics marines (figura 1c), dues o tres vegades la cobertura dels informes anteriors només de MAG tant en profunditat com en latitud. Més sèrie 16 o SAG20.A més, per mesurar sistemàticament la diversitat taxonòmica a les col·leccions establertes, vam anotar tots els genomes mitjançant el conjunt d'eines (mètodes) de la base de dades de taxonomia del genoma (GTDB) i vam utilitzar una identitat mitjana de nucleòtids a tot el genoma del 95%.28 per identificar 8.304 grups d'espècies (espècies).Dos terços d'aquestes espècies (inclosos els nous clades) no havien aparegut anteriorment a la GTDB, de les quals 2790 es van descobrir mitjançant el MAG reconstruït en aquest estudi (Fig. 1d).A més, vam trobar que diferents tipus de genomes són altament complementaris: el 55%, el 26% i l'11% de les espècies estan compostes íntegrament per MAG, SAG i REF, respectivament (Fig. 1e).A més, MAG va cobrir els 49 tipus trobats a la columna d'aigua, mentre que SAG i REF només en representaven 18 i 11, respectivament.Tanmateix, SAG representa millor la diversitat dels clades més comuns (dades ampliades, figura 3a), com ara Pelagic Bacteriales (SAR11), amb SAG que cobreix gairebé 1300 espècies i MAG només 390 espècies.En particular, els REF rarament es superposaven amb MAGs o SAG a nivell d'espècie i representaven > 95% dels aproximadament 1000 genomes que no es troben als conjunts metagenòmics d'oceà obert estudiats aquí, principalment a causa de les interaccions amb altres tipus d'espècimens marins representatius aïllats (per exemple, sediments). .o amfitrió associat).Per fer-lo àmpliament disponible per a la comunitat científica, aquest recurs del genoma marí, que també inclou fragments no classificats (per exemple, de fags predits, illes genòmiques i fragments de genoma dels quals no hi ha dades suficients per a la reconstrucció de MAG), es pot comparar amb dades taxonòmics. .Accediu a les anotacions juntament amb la funció gènica i els paràmetres contextuals a la base de dades de microbiologia oceànica (OMD; https://microbiomics.io/ocean/).
A continuació, ens vam proposar explorar la riquesa i la novetat del potencial biosintètic en els microbiomes d'oceà obert.Amb aquesta finalitat, primer vam utilitzar antiSMASH per a tots els MAG, SAG i REF trobats en 1038 metagenomes marins (mètodes) per predir un total de 39.055 BGC.A continuació, els vam agrupar en 6907 GCF no redundants i 151 poblacions de clúster de gens (GCC; Taula suplementària 2 i mètodes) per tenir en compte la redundància inherent (és a dir, el mateix BGC es pot codificar en múltiples genomes) i dades metagenòmics Fragmentació de BGC concentrats.Els BGC incomplets no van augmentar significativament, si n'hi ha cap (informació suplementària), el nombre de GCF i GCC, respectivament, que contenien almenys un membre de BGC intacte en el 44% i el 86% dels casos.
A nivell de GCC, vam trobar una gran varietat de RiPP previstos i altres productes naturals (Fig. 2a).Entre ells, per exemple, els arilpoliens, carotenoides, ectoïnes i sideròfors pertanyen a GCC amb una àmplia distribució filogenètica i una gran abundància en metagenomes oceànics, cosa que pot indicar una àmplia adaptació dels microorganismes al medi marí, inclosa la resistència a les espècies reactives de l'oxigen, estrès oxidatiu i osmòtic..o absorció de ferro (més informació).Aquesta diversitat funcional contrasta amb una anàlisi recent d'aproximadament 1,2 milions de BGC entre aproximadament 190.000 genomes emmagatzemats a la base de dades NCBI RefSeq (BiG-FAM/RefSeq, d'ara endavant denominada RefSeq)29, que va demostrar que els pèptids sintetasa no ribosòmic (NRPS) i la poliketid sintasa. (PKS) BGCs (Informació suplementària).També hem trobat 44 (29%) GCC només relacionats llunyanment amb qualsevol RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; Fig. 2a i mètodes) i 53 (35%) GCC només a MAG, destacant el potencial. per detectar substàncies químiques no descrites anteriorment en OMD.Atès que cadascun d'aquests GCC probablement representen funcions biosintètiques molt diverses, vam analitzar més dades a nivell de GCF per tal de proporcionar una agrupació més detallada de BGC prevista per codificar productes naturals similars29.Un total de 3861 (56%) GCF identificats no es superposaven amb RefSeq, i> 97% dels GCF no estaven presents a MIBiG, una de les bases de dades més grans de BGC validats experimentalment (figura 2b).Tot i que no és d'estranyar descobrir moltes vies noves potencials en entorns que no estan ben representats pel genoma de referència, el nostre mètode per desreplicar BGC en GCF abans de la comparació difereix dels informes anteriors 16 i ens permet oferir una avaluació imparcial de la novetat.La major part de la nova diversitat (3012 GCF o 78%) correspon a terpens predits, RiPP o altres productes naturals, i la majoria (1815 GCF o 47%) està codificada en tipus desconeguts pel seu potencial biosintètic.A diferència dels clústers PKS i NRPS, aquests BGC compactes tenen menys probabilitats de fragmentar-se durant el muntatge metagenòmic 31 i permeten una caracterització funcional més intensiva en temps i recursos dels seus productes.
Un total de 39.055 BGC es van agrupar en 6.907 GCF i 151 GCC.a, representació de dades (interna externa).Agrupació jeràrquica de distàncies BGC basada en GCC, 53 de les quals només estan fixades per MAG.El GCC conté BGC de diferents tàxons (freqüència de porta transformada en ln) i diferents classes de BGC (la mida del cercle correspon a la seva freqüència).Per a cada GCC, la capa exterior representa el nombre de BGC, la prevalença (percentatge de mostres) i la distància (distància mínima del cosinus BGC (min (dMIBiG))) de BiG-FAM a BGC.Els GCC amb BGC estretament relacionats amb BGC verificats experimentalment (MIBiG) es destaquen amb fletxes.b Comparant el GCF amb els BGC predits (BiG-FAM) i validats experimentalment (MIBiG), es van trobar 3861 GCF nous (d–>0,2).La majoria (78%) d'aquests codis per a RiPP, terpens i altres productes naturals putatius.c, tots els genomes de l'OMD trobats en 1038 metagenomes marins es van col·locar a l'arbre base GTDB per mostrar la cobertura filogenètica de l'OMD.Els clades sense genomes a l'OMD es mostren en gris.El nombre de BGC correspon al nombre més gran de BGC predits per genoma en un clade determinat.Per a més claredat, l'últim 15% dels nodes estan col·lapsats.Les fletxes indiquen clades rics en BGC (>15 BGC), amb l'excepció de Mycobacterium, Gordonia (segon només per Rhodococcus) i Crocosphaera (segon només per Synechococcus).d, Desconegut c.Eremiobacterota va mostrar la major diversitat biosintètica (índex de Shannon basat en el tipus de producte natural).Cada banda representa el genoma amb més BGC de l'espècie.T1PKS, PKS tipus I, T2/3PKS, PKS tipus II i tipus III.
A més de la riquesa i la novetat, explorem l'estructura biogeogràfica del potencial biosintètic del microbioma marí.L'agrupació de mostres per la distribució mitjana del nombre de còpies GCF metagenòmica (Mètodes) va mostrar que les comunitats de latitud baixa, superficial, riques en procariotes i pobres en virus, principalment d'aigües superficials o més profundes il·luminades pel sol, eren riques en terpens RiPP i BGC.En canvi, les comunitats polars, d'aigües profundes, riques en virus i partícules es van associar amb majors abundàncies de NRPS i PKS BGC (dades ampliades, figura 4 i informació addicional).Finalment, vam trobar que les comunitats tropicals i pelàgiques ben estudiades són les fonts més prometedores de nous terpens (figura de dades augmentades).Màxim potencial per a PKS, RiPP i altres productes naturals (figura 5a amb dades ampliades).
Per complementar el nostre estudi del potencial biosintètic dels microbiomes marins, vam voler mapejar la seva distribució filogenètica i identificar nous clades enriquits amb BGC.Amb aquesta finalitat, vam col·locar els genomes dels microbis marins en un arbre filogenètic bacterià i arqueològic GTDB13 normalitzat i vam superposar les possibles vies biosintètiques que codifiquen (Fig. 2c).Hem detectat fàcilment diversos clades enriquits amb BGC (representats per més de 15 BGC) en mostres d'aigua de mar (mètodes) conegudes pel seu potencial biosintètic, com ara els cianobacteris (Synechococcus) i els bacteris Proteus, com Tistrella32,33, o recentment hem cridat l'atenció pel seu productes naturals.com Myxococcota (Sandaracinaceae), Rhodococcus i Planctomycetota34,35,36.Curiosament, hem trobat diversos llinatges abans inexplorats en aquests clades.Per exemple, aquelles espècies amb el potencial biosintètic més ric dels fils Planctomycetota i Myxococcota pertanyien a ordres i gèneres candidats no caracteritzats, respectivament (taula suplementària 3).En conjunt, això suggereix que l'OMD proporciona accés a informació filogenètica prèviament desconeguda, inclosos els microorganismes, que poden representar nous objectius per al descobriment d'enzims i productes naturals.
A continuació, vam caracteritzar el clade enriquit amb BGC no només comptant el nombre màxim de BGC codificats pels seus membres, sinó també avaluant la diversitat d'aquests BGC, la qual cosa explica la freqüència de diferents tipus de productes candidats naturals (Fig. 2c i mètodes). )..Vam trobar que les espècies més biosintèticament diverses estaven representades per MAGs bacterians especialment dissenyats en aquest estudi.Aquests bacteris pertanyen al fílum no cultivat Candidatus Eremiobacterota, que roman en gran part inexplorat a part d'alguns estudis genòmics37,38.Cal destacar que “ca.El gènere Eremiobacterota només s'ha analitzat en un medi terrestre39 i no se sap que inclogui cap membre enriquit en BGC.Aquí hem reconstruït vuit MAGs de la mateixa espècie (identitat de nucleòtids > 99%) 23. Per això proposem el nom d'espècie “Candidatus Eudoremicrobium malaspinii”, que porta el nom de la nereida (nimfa marina), un bell regal de la mitologia i les expedicions gregues.'Ka.Segons l'anotació filogenètica 13, E. malaspinii no té familiars coneguts prèviament per sota del nivell de seqüència i, per tant, pertany a una nova família bacteriana que proposem “Ca.E. malaspinii” com a espècie tipus i “Ca.Eudormicrobiaceae” com a nom oficial (informació suplementària).Breu reconstrucció metagenòmica de 'Ca.El projecte del genoma d'E. malaspinii es va validar mitjançant una entrada molt baixa, una seqüenciació metagenòmica de lectura llarga i un muntatge dirigit d'una mostra única (Mètodes) com un únic cromosoma lineal de 9,63 Mb amb una duplicació de 75 kb.com l'única ambigüitat que queda.
Per establir el context filogenètic d'aquesta espècie, es van cercar 40 espècies estretament relacionades en mostres metagenòmiques enriquides amb eucariotes addicionals de l'expedició a l'oceà Tara mitjançant la reconstrucció del genoma dirigida.Breument, hem vinculat les lectures metagenòmica amb fragments genòmics associats amb "Ca.E. malaspinii” i va plantejar la hipòtesi que un augment de la taxa de reclutament en aquesta mostra indica la presència d'altres familiars (mètodes).Com a resultat, vam trobar 10 MAG, una combinació de 19 MAGs que representen cinc espècies de tres gèneres dins d'una família recentment definida (és a dir, "Ca. Eudormicrobiaceae").Després de la inspecció manual i el control de qualitat (dades ampliades, Fig. 6 i informació addicional), vam trobar que “Ca.Les espècies d'Eudormicrobiaceae presenten genomes més grans (8 Mb) i un potencial biosintètic més ric (de 14 a 22 BGC per espècie) que altres membres "Ca".Clade Eremiobacterota (fins a 7 BGC) (Fig. 3a–c).
a, Posicions filogenètiques dels cinc 'Ca.Les espècies d'Eudormicrobiaceae van mostrar una riquesa BGC específica de les línies marines identificades en aquest estudi.L'arbre filogenètic inclou tots els 'Ca.MAG Eremiobacterota i membres d'altres phyla (números de genoma entre parèntesis) proporcionats a GTDB (versió 89) es van utilitzar com a antecedents evolutius (Mètodes).Les capes més externes representen classificacions a nivell familiar (“Ca. Eudormicrobiaceae” i “Ca. Xenobiaceae”) i a nivell de classe (“Ca. Eremiobacteria”).Les cinc espècies descrites en aquest estudi estan representades per codis alfanumèrics i noms binomials proposats (informació suplementària).b, d'acord.Les espècies d'Eudormicrobiaceae comparteixen set nuclis comuns de BGC.L'absència de BGC al clade A2 es va deure a la incompletitud del MAG representatiu (taula suplementària 3).Els BGC són específics de “Ca.Amphitomicrobium” i “Ca.Amphitomicrobium” (clades A i B) no es mostren.c, Tots els BGC codificats com a "Ca.Es va trobar que Eudoremicrobium taraoceanii s'expressava en 623 metatranscriptomes extrets dels oceans de Tara.Els cercles sòlids indiquen la transcripció activa.Els cercles taronges denoten canvis de plecs transformats en log2 per sota i per sobre de la taxa d'expressió gènica de neteja (mètodes).d, corbes d'abundància relativa (mètodes) que mostren 'Ca.Les espècies d'Eudormicrobiaceae estan molt esteses a la majoria de conques oceàniques i a tota la columna d'aigua (des de la superfície fins a una profunditat d'almenys 4000 m).A partir d'aquestes estimacions, vam trobar que 'Ca.E. malaspinii' representa fins al 6% de les cèl·lules procariotes a les comunitats associades a gra pelàgics d'aigües profundes.Considerem que una espècie estava present en un lloc si es trobava en qualsevol fracció de la mida d'una capa de profunditat determinada.IO – Oceà Índic, NAO – Atlàntic Nord, NPO – Pacífic Nord, RS – Mar Roig, SAO – Atlàntic Sud, SO – Oceà Austral, SPO – Pacífic Sud.
Estudi de l'abundància i distribució de Ca.Eudormicrobiaceae, que, com hem trobat, predomina a la majoria de conques oceàniques, així com a tota la columna d'aigua (Fig. 3d).A nivell local, representen el 6% de la comunitat microbiana marina, cosa que els converteix en una part important del microbioma marí global.A més, hem trobat el contingut relatiu de Ca.Les espècies d'Eudormicrobiaceae i els seus nivells d'expressió de BGC van ser més alts a la fracció enriquida eucariota (Fig. 3c i dades ampliades, Fig. 7), cosa que indica una possible interacció amb partícules, inclòs el plàncton.Aquesta observació té certa semblança amb 'Ca.Els BGC d'eudoremicrobium que produeixen productes naturals citotòxics a través de vies conegudes poden mostrar un comportament depredador (informació suplementària i dades ampliades, figura 8), similar a altres depredadors que produeixen específicament metabòlits com Myxococcus41.Descobriment de Ca.Les eudormicrobiaceae en mostres menys disponibles (oceà profund) o eucariotes en lloc de procariotes poden explicar per què aquests bacteris i la seva inesperada diversitat de BGC encara no estan clars en el context de la investigació d'aliments naturals.
Finalment, vam intentar validar experimentalment la promesa del nostre treball basat en el microbioma per descobrir noves vies, enzims i productes naturals.Entre les diferents classes de BGC, se sap que la via RiPP codifica una rica diversitat química i funcional a causa de diverses modificacions post-traduccionals del pèptid central per part d'enzims madurs42.Així que vam triar dos 'Ca.Els BGC RiPP d'Eudoremicrobium (figures 3b i 4a-e) es basen en el mateix que qualsevol BGC conegut (\(\bar{d}\)MIBiG i \(\bar{d}\)RefSeq per sobre de 0,2).
a–c, Expressió heteròloga in vitro i assajos enzimàtics in vitro d'un nou clúster (\(\bar{d}\)RefSeq = 0,29) de biosíntesi de RiPP específica per a espècies de Ca de mar profund.E. malaspinii' va donar lloc a la producció de productes difosforilats.c, modificacions identificades mitjançant MS/MS d'alta resolució (HR) (fragmentació indicada per ions b i y a l'estructura química) i RMN (dades ampliades, figura 9).d, aquest pèptid fosforilat presenta una inhibició micromolar baixa de l'elastasa de neutròfils de mamífers, que no es troba en el pèptid de control i el pèptid deshidratant (deshidratació induïda per eliminació química).L'experiment es va repetir tres vegades amb resultats similars.Per exemple, l'expressió heteròloga d'un segon grup novel·la \(\bar{d}\)RefSeq = 0,33) de biosíntesi de proteïnes dilucida la funció de quatre enzims madurs que modifiquen el pèptid central de 46 aminoàcids.Els residus es tenyeixen segons el lloc de modificació previst per HR-MS/MS, etiquetatge d'isòtops i anàlisi de RMN (informació suplementària).La coloració discontínua indica que la modificació es produeix en qualsevol dels dos residus.La figura és una recopilació de nombroses construccions heteròlogues per mostrar l'activitat de tots els enzims madurs en el mateix nucli.h, Il·lustració de dades de RMN per a la N-metilació de l'amida de la columna vertebral.Els resultats complets es mostren a la fig.10 amb dades ampliades.i, La posició filogenètica de l'enzim madur del clúster de proteïnes FkbM entre tots els dominis FkbM que es troben a la base de dades MIBiG 2.0 revela un enzim d'aquesta família amb activitat N-metiltransferasa (informació suplementària).Es mostren diagrames esquemàtics de BGC (a, e), estructures de pèptids precursors (b, f) i estructures químiques putatives de productes naturals (c, g).
La primera via RiPP (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) només es va trobar en espècies de mar profund "Ca.E. malaspinii” i codifica el precursor del pèptid (Fig. 4a, b).En aquest enzim madur, hem identificat un únic domini funcional homòleg al domini de deshidratació de la lantipèptid sintasa que normalment catalitza la fosforilació i la posterior eliminació de 43 (informació suplementària).Per tant, predim que la modificació del pèptid precursor implica una deshidratació en dos passos.Tanmateix, utilitzant espectrometria de masses en tàndem (MS/MS) i espectroscòpia de ressonància magnètica nuclear (RMN), vam identificar un pèptid lineal polifosforilat (Fig. 4c).Tot i que inesperat, vam trobar diverses línies d'evidència que avalen que és el producte final: dos hostes heteròlegs diferents i sense deshidratació en assajos in vitro, identificació de residus clau mutats al lloc de deshidratació catalítica de l'enzim madur.tot reconstruït per “Ca”.El genoma d'E. malaspinii (dades ampliades, Fig. 9 i informació addicional) i, finalment, l'activitat biològica del producte fosforilat, però no la forma deshidratada sintetitzada químicament (Fig. 4d).De fet, vam trobar que presenta una baixa activitat inhibidora de la proteasa micromolar contra l'elastasa dels neutròfils, comparable a altres productes naturals relacionats en el rang de concentració (IC50 = 14,3 μM) 44 , malgrat que el paper ecològic encara està per dilucidar.A partir d'aquests resultats, proposem anomenar la via "fospeptina".
El segon cas és una via complexa de RiPP específica de 'Ca.Es va predir que el gènere Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) codificava productes proteics naturals (figura 4e).Aquestes vies tenen un interès biotecnològic particular a causa de la densitat esperada i la varietat de modificacions químiques inusuals establertes pels enzims codificats pels BGC relativament curts45.Vam trobar que aquesta proteïna difereix de les proteïnes caracteritzades anteriorment perquè no té tant el motiu principal NX5N de les policeramides com el bucle de lantionina de les lantonamides 46 .Per superar les limitacions dels patrons d'expressió heteròlegs comuns, els vam utilitzar juntament amb un sistema d'aerodenitrificans Microvirgula personalitzat per caracteritzar quatre enzims de la via madur (mètodes).Mitjançant una combinació de MS/MS, marcatge d'isòtops i RMN, vam detectar aquests enzims madurs al nucli de 46 aminoàcids del pèptid (Fig. 4f, g, dades ampliades, Figs. 10-12 i informació addicional).Entre els enzims madurs, vam caracteritzar la primera aparició d'un membre de la família FkbM O-metiltransferasa 47 a la via RiPP i de manera inesperada vam trobar que aquest enzim madur introdueix la N-metilació de la columna vertebral (Fig. 4h, i i informació addicional).Tot i que aquesta modificació es coneix als productes naturals de NRP48, la N-metilació enzimàtica dels enllaços amida és una reacció complexa però biotecnològicament significativa49 que fins ara ha estat d'interès per a la família de borosines RiPP.Especificitat 50,51.La identificació d'aquesta activitat en altres famílies d'enzims i RiPP pot obrir noves aplicacions i ampliar la diversitat funcional de les proteïnes 52 i la seva diversitat química.A partir de les modificacions identificades i la longitud inusual de l'estructura del producte proposat, proposem un nom de via "pythonamide".
El descobriment d'una enzimologia inesperada en una família d'enzims caracteritzada funcionalment il·lustra la promesa de la genòmica ambiental per a nous descobriments i també il·lustra la capacitat limitada d'inferència funcional basada només en l'homologia de seqüències.Així, juntament amb els informes de RiPP polifosforilats bioactius no canònics, els nostres resultats demostren un valor intensiu de recursos però crític per als esforços de biologia sintètica per descobrir completament la riquesa funcional, la diversitat i les estructures inusuals dels compostos bioquímics.
Aquí demostrem la gamma de potencial biosintètic codificat pels microbis i el seu context genòmic en el microbioma marí global, facilitant la investigació futura posant el recurs resultant a disposició de la comunitat científica (https://microbiomics.io/ocean/).Vam trobar que bona part de la seva novetat filogenètica i funcional només es pot obtenir reconstruint MAG i SAG, especialment en comunitats microbianes infrautilitzades que podrien guiar els futurs esforços de bioprospecció.Encara que aquí ens centrarem en 'Ca.Eudormicrobiaceae" com a llinatge especialment biosintètic "talentós", molts dels BGC predits a la microbiota no descoberta probablement codifiquen enzimologies no descrites anteriorment que produeixen compostos amb accions ambientalment i/o biotecnològicament significatives.
Es van incloure conjunts de dades metagenòmics dels principals estudis oceanogràfics i de sèries temporals amb una profunditat de seqüenciació suficient per maximitzar la cobertura de les comunitats microbianes marines globals a les conques oceàniques, les capes profundes i al llarg del temps.Aquests conjunts de dades (taula suplementària 1 i figura 1) inclouen metagenòmica de mostres recollides als oceans de Tara (enriquit viral, n=190; enriquit procariota, n=180)12,22 i l'expedició BioGEOTRACES (n=480).Sèrie temporal oceànica hawaiana (HOT, n = 68), Sèrie temporal Bermuda-Atlantic (BATS, n = 62)21 i l'expedició Malaspina (n = 58)23.Les lectures de seqüenciació de tots els fragments metagenòmics es van filtrar per qualitat mitjançant BBMap (v.38.71) eliminant els adaptadors de seqüenciació de les lectures, eliminant les lectures assignades a seqüències de control de qualitat (genomes PhiX) i utilitzant trimq = 14, maq = 20 descarta la mala qualitat de lectura, maxns = 0 i minlength = 45. Les anàlisis posteriors es van executar o es van combinar amb lectures de control de qualitat si s'especificava (bbmerge.sh minoverlap=16).Les lectures de control de qualitat es van normalitzar (objectiu bbnorm.sh = 40, profunditat mental = 0) abans de construir-les mitjançant metaSPAdes (v.3.11.1 o v.3.12 si cal)53.Els contigs de bastides resultants (d'ara endavant anomenats bastides) es van filtrar finalment per longitud (≥1 kb).
Les 1038 mostres metagenòmics es van dividir en grups i, per a cada grup de mostres, les lectures de control de qualitat metagenòmica de totes les mostres es van relacionar amb els parèntesis de cada mostra per separat, donant lloc al següent nombre de lectures de grups entre parèntesis: Tara Marine Virus - Enriched (190×190 ), Procariotes Enriquits (180×180), BioGEOTRACES, HOT and BATS (610×610) i Malaspina (58×58).El mapeig es va fer mitjançant Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 que permet que les lectures es puguin relacionar amb llocs secundaris (utilitzant la bandera -a).Les alineacions es van filtrar perquè tinguessin almenys 45 bases de longitud, tinguessin una identitat ≥97% i abasten ≥80% de lectures.Els fitxers BAM resultants es van processar mitjançant l'script jgi_summarize_bam_contig_depths per a MetaBAT2 (v.2.12.1)55 per proporcionar una cobertura intra i inter-mostra per a cada grup.Finalment, es van agrupar els claudàtors per augmentar la sensibilitat executant individualment MetaBAT2 en totes les mostres amb –minContig 2000 i –maxEdges 500. Utilitzem MetaBAT2 en lloc d'un boxer conjunt perquè s'ha demostrat en proves independents que és el boxeador individual més eficaç.i de 10 a 50 vegades més ràpid que altres boxejadors d'ús habitual57.Per provar l'efecte de les correlacions d'abundància, una submostra de metagenòmica seleccionada aleatòriament (10 per a cadascun dels dos conjunts de dades de Tara Ocean, 10 per a BioGEOTRACES, 5 per a cada sèrie temporal i 5 per a Malaspina) només va utilitzar mostres.Les mostres internes s'agrupen per obtenir informació de cobertura.(Informació adicional).
Es van incloure genomes (externs) addicionals a l'anàlisi posterior, és a dir, 830 MAG seleccionats manualment d'un subconjunt del conjunt de dades Tara Oceans26, 5287 SAG del conjunt de dades GORG20 i dades de la base de dades MAR (MarDB v. 4) de 1707 REF aïllats i 682 SAGs) 27. Per al conjunt de dades MarDB, els genomes es seleccionen en funció de les metadades disponibles si el tipus de mostra coincideix amb l'expressió regular següent: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] aïllat'.
La qualitat de cada contenidor metagenòmic i genomes externs es va avaluar mitjançant CheckM (v.1.0.13) i Anvi'o's Lineage Workflow (v.5.5.0)58,59.Si CheckM o Anvi'o informa d'un ≥50% d'exhaustivitat/completitud i ≤10% de contaminació/redundància, deseu les cèl·lules metagenòmiques i els genomes externs per a una anàlisi posterior.A continuació, aquestes puntuacions es van combinar en la totalitat mitjana (mcpl) i la contaminació mitjana (mctn) per classificar la qualitat del genoma segons els criteris de la comunitat60 de la següent manera: qualitat alta: mcpl ≥ 90% i mctn ≤ 5%;bona qualitat: mcpl ≥ 70%, mctn ≤ 10%, qualitat mitjana: mcpl ≥ 50% i mctn ≤ 10%, qualitat justa: mcpl ≤ 90% o mctn ≥ 10%.Els genomes filtrats es van correlacionar amb les puntuacions de qualitat (Q i Q') de la següent manera: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (variabilitat de la soca)/100 + 0,5 x log[N50].(implementat a dRep61).
Per permetre l'anàlisi comparativa entre diferents fonts de dades i tipus de genoma (MAG, SAG i REF), es van desreferenciar 34.799 genomes en funció de la identitat mitjana de nucleòtids (ANI) a tot el genoma mitjançant dRep (v.2.5.4).Repeticions)61 amb llindars d'ANI del 95%28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) i gens marcadors d'una còpia única utilitzant SpecI63 que proporciona agrupació del genoma a nivell d'espècie.Es va seleccionar un genoma representatiu per a cada clúster dRep segons la puntuació de qualitat màxima (Q') definida anteriorment, que es va considerar representativa de l'espècie.
Per avaluar la velocitat de mapeig, es va utilitzar BWA (v.0.7.17-r1188, -a) per mapejar tots els 1038 conjunts de lectures metagenòmica amb 34.799 genomes continguts a l'OMD.Les lectures controlades amb qualitat es van mapejar en mode d'un sol extrem i les alineacions resultants es van filtrar per retenir només les alineacions ≥45 bp de longitud.i identitat ≥95%.La relació de visualització de cada mostra és el percentatge de lectures restants després de la filtració dividit pel nombre total de lectures de control de qualitat.Utilitzant el mateix enfocament, cadascun dels 1038 metagenomes es va reduir a 5 milions d'insercions (dades ampliades, Fig. 1c) i es va coincidir amb GORG SAG a OMD i a tots els GEM16.La quantitat de MAG recuperada de l'aigua de mar al catàleg GEM16 es va determinar mitjançant consultes de paraules clau de fonts metagenòmica, seleccionant mostres d'aigua de mar (p. ex., a diferència dels sediments marins).Concretament, seleccionem "aquàtic" com a "categoria_ecosistema", "marí" com a "tipus_ecosistema" i filtrem "hàbitat" com a "oceà profund", "marí", "oceànic marítim", "marí pelàgic", "aigua marina" , "Oceà", "Aigua de mar", "Aigua de mar superficial", "Aigua de mar superficial".Això va donar com a resultat 5903 MAG (734 d'alta qualitat) distribuïts en 1823 OTU (visualitzacions aquí).
Els genomes procariotes es van anotar taxonòmicament mitjançant GTDB-Tk (v.1.0.2)64 amb paràmetres predeterminats orientats a GTDB r89 versió 13. Anvi'o es va utilitzar per identificar genomes eucariotes basant-se en la predicció del domini i el record ≥50% i la redundància ≤ 10%.L'anotació taxonòmica d'una espècie es defineix com un dels seus genomes representatius.Amb l'excepció dels eucariotes (148 MAG), cada genoma es va anotar funcionalment per primera vegada amb prokka (v.1.14.5)65, anomenant gens complets, definint els paràmetres d'"arquea" o "bacteris" segons calia, que també s'informa per a no codificant gens.i regions CRISPR, entre altres característiques genòmiques.Anoteu els gens predits mitjançant la identificació de gens marcadors universals d'una sola còpia (uscMG) mitjançant fetchMG (v.1.2)66, assigneu grups ortòlegs i consulteu mitjançant emapper (v.2.0.1)67 basat en eggNOG (v.5.0)68.Base de dades KEGG (publicada el 10 de febrer de 2020) 69. L'últim pas es va realitzar fent coincidir proteïnes amb la base de dades KEGG mitjançant DIAMOND (v.0.9.30)70 amb una consulta i una cobertura temàtica de ≥70%.Els resultats es van filtrar encara més segons el pipeline d'anotació del genoma procariota NCBI71 basat en una taxa de bits ≥ 50% de la taxa de bits màxima esperada (enllaç mateix).Les seqüències gèniques també es van utilitzar com a entrada per identificar BGC al genoma mitjançant antiSMASH (v.5.1.0)72 amb paràmetres per defecte i diferents explosions de clúster.Tots els genomes i anotacions s'han compilat a OMD juntament amb metadades contextuals disponibles al web (https://microbiomics.io/ocean/).
De manera similar als mètodes descrits anteriorment12,22, vam utilitzar CD-HIT (v.4.8.1) per agrupar> 56,6 milions de gens codificants de proteïnes de genomes bacterians i arqueals de l'OMD en un 95% d'identitat i gens més curts (90% de cobertura)73 fins a > 17,7 milions de clústers de gens.La seqüència més llarga es va escollir com a gen representatiu per a cada grup de gens.Aleshores, els 1038 metagenomes es van emparellar amb> 17, 7 milions de membres del clúster BWA (-a) i els fitxers BAM resultants es van filtrar per retenir només alineacions amb ≥95% per cent d'identitat i ≥45 alineacions de base.L'abundància de gens normalitzats en longitud es va calcular comptant primer les insercions de la millor alineació única i després, per a les insercions amb mapes difusos, afegint recomptes fraccionaris als gens objectiu corresponents proporcionals al seu nombre d'insercions úniques.
Els genomes de l'OMD ampliat (amb MAGs addicionals de "Ca. Eudormicrobiaceae", vegeu a continuació) es van afegir a la base de dades de l'eina d'anàlisi metagenòmica mOTUs74 (v.2.5.1) per crear una base de dades de referència mOTU ampliada.Només sis genomes d'una còpia única (23.528 genomes) van sobreviure de deu uscMG.L'ampliació de la base de dades va donar lloc a 4.494 clústers addicionals a nivell d'espècie.Es van analitzar 1038 metagenomes mitjançant paràmetres mOTU predeterminats (v.2).Un total de 989 genomes continguts en 644 clústers mOTU (95% REF, 5% SAG i 99,9% pertanyents a MarDB) no van ser detectats pel perfil mOTU.Això reflecteix diverses fonts addicionals d'aïllament marí dels genomes MarDB (la majoria dels genomes no detectats estan associats amb organismes aïllats de sediments, hostes marins, etc.).Per continuar centrant-nos en l'entorn de l'oceà obert en aquest estudi, els vam excloure de l'anàlisi aigües avall tret que es detectessin o s'incloguessin a la base de dades mOTU ampliada creada en aquest estudi.
Tots els BGC de MAG, SAG i REF a OMD (vegeu més amunt) es van combinar amb BGC identificats en tots els bastides metagenòmics (antiSMASH v.5.0, paràmetres per defecte) i caracteritzats mitjançant BiG-SLICE (v.1.1) (domini PFAM)75.A partir d'aquestes característiques, vam calcular totes les distàncies de cosinus entre BGC i les vam agrupar (enllaços mitjans) en GCF i GCC mitjançant llindars de distància de 0,2 i 0,8 respectivament.Aquests llindars són una adaptació dels llindars utilitzats anteriorment mitjançant la distància euclidiana75 juntament amb la distància cosinus, cosa que alleuja part de l'error de l'estratègia d'agrupació BiG-SLICE original (informació suplementària).
A continuació, es van filtrar els BGC per retenir només ≥5 kb codificats a les bastides per reduir el risc de fragmentació tal com es va descriure anteriorment16 i per excloure els REF i SAG de MarDB que no es troben en 1038 metagenomes (vegeu més amunt).Això va donar lloc a un total de 39.055 BGC codificats pel genoma OMD, amb 14.106 addicionals identificats en fragments metagenòmics (és a dir, no combinats en MAG).Aquests BGC "metagenòmics" es van utilitzar per estimar la proporció de potencial de biosíntesi del microbioma marí no capturat a la base de dades (informació suplementària).Cada BGC es va caracteritzar funcionalment segons els tipus de productes predictius definits per categories de productes anti-SMASH o més gruixudes definides a BiG-SCAPE76.Per evitar el biaix de mostreig en la quantificació (composició taxonòmica i funcional de GCC/GCF, distància de GCF i GCC a les bases de dades de referència i abundància metagenòmica de GCF), mantenint només el BGC més llarg per GCF per a cada espècie, es van desduplicar més 39.055 BGC, resultant en un total de 17.689 BGC.
La novetat de GCC i GCF es va avaluar en funció de la distància entre la base de dades calculada (base de dades RefSeq a BiG-FAM)29 i el BGC verificat experimentalment (MIBIG 2.0)30.Per a cadascun dels 17.689 BGC representatius, vam triar la distància cosinus més petita a la base de dades respectiva.Aquestes distàncies mínimes es fan una mitjana (mitjana) segons GCF o GCC, segons correspongui.Un GCF es considera nou si la distància a la base de dades és superior a 0,2, que correspon a una separació ideal entre el GCF (mitjana) i la referència.Per a GCC, escollim 0,4, que és el doble del llindar definit per GCF, per bloquejar una relació a llarg termini amb els enllaços.
L'abundància metagenòmica de BGC es va estimar com l'abundància mitjana dels seus gens biosintètics (determinat per anti-SMASH) disponible a partir dels perfils a nivell de gens.A continuació, es va calcular l'abundància metagenòmica de cada GCF o GCC com la suma de BGC representatius (de 17.689).Aquests mapes d'abundància es van normalitzar posteriorment per a la composició cel·lular mitjançant el recompte de mOTU per mostra, que també va tenir en compte els esforços de seqüenciació (dades ampliades, figura 1d).La prevalença de GCF o GCC es va calcular com el percentatge de mostres amb una abundància > 0.
La distància euclidiana entre mostres es va calcular a partir del perfil GCF normalitzat.Aquestes distàncies es van reduir de mida mitjançant UMAP77 i les incrustacions resultants es van utilitzar per a agrupacions basades en densitat no supervisades mitjançant HDBSCAN78.El nombre mínim òptim de punts per a un clúster (i, per tant, el nombre de clústers) utilitzat per HDBSCAN es determina maximitzant la probabilitat acumulada de pertinença al clúster.Els clústers identificats (i una submostra aleatòria equilibrada d'aquests clústers per tenir en compte el biaix en l'anàlisi multivariant de variància permutacional (PERMANOVA)) es van provar per a la seva significació davant distàncies euclidianes no reduïdes mitjançant PERMANOVA.La mida mitjana del genoma de les mostres es va calcular a partir de l'abundància relativa de mOTU i la mida estimada del genoma dels membres dels genomes.En particular, la mida mitjana del genoma de cada mOTU es va estimar com la mitjana de les mides del genoma dels seus membres corregida per a la seva integritat (després del filtratge) (per exemple, un genoma complet del 75% amb una longitud de 3 Mb té una mida ajustada de 4 Mb).per a genomes mitjans amb integritat ≥70%.A continuació, es va calcular la mida mitjana del genoma per a cada mostra com la suma de les mides del genoma mOTU ponderades per l'abundància relativa.
Es mostra un conjunt filtrat de BGC codificats per genoma a l'OMD en arbres GTDB bacterians i arqueals (en marcs ≥5 kb, excloent REF i SAG MarDB que no es troben en 1038 metagenomes, vegeu més amunt) i les seves categories de productes previstes en funció de la filogenètica. posició del genoma (vegeu més amunt).Primer vam reduir les dades per espècies, utilitzant com a representatiu el genoma amb més BGC d'aquesta espècie.Per a la visualització, els representants es van dividir encara més en grups d'arbres i, de nou, per a cada clade cel·lular, es va seleccionar com a representant el genoma que contenia el major nombre de BGC.Les espècies enriquides amb BGC (almenys un genoma amb> 15 BGC) es van analitzar més mitjançant el càlcul de l'índex de diversitat de Shannon per als tipus de productes codificats en aquests BGC.Si tots els tipus de producte previstos són els mateixos, els híbrids químics i altres BGC complexos (tal com prediu l'anti-SMAH) es considera que pertanyen al mateix tipus de producte, independentment del seu ordre al clúster (p. ex. fusió proteïna-bacteriocina i bacteriocina-proteoproteïna). cos).híbrid).
ADN restant (estimat en 6 ng) de la mostra de Malaspina MP1648, corresponent a la mostra biològica SAMN05421555 i associada al conjunt de lectura metagenòmica Illumina SRR3962772 per a una lectura curta, processat segons el protocol de seqüenciació PacBio amb entrada ultra baixa per utilitzar l'amplificació de la mostra gDNA del kit PacBio SMRTbell kit (100-980-000) i kit de preparació de plantilles SMRTbell Express 2.0 (100-938-900).Breument, l'ADN restant es va tallar, reparar i purificar (perles ProNex) mitjançant Covaris (g-TUBE, 52104).A continuació, l'ADN purificat es sotmet a la preparació de la biblioteca, l'amplificació, la purificació (perles ProNex) i la selecció de mida (> 6 kb, Blue Pippin) abans d'un pas final de purificació (perles ProNex) i seqüenciació a la plataforma Sequel II.
Reconstrucció dels dos primers ca.Per a MAG Eremiobacterota, vam identificar sis ANI addicionals > 99% (aquests s'inclouen a la figura 3), que es van filtrar inicialment en funció de les puntuacions de contaminació (identificades posteriorment com a duplicacions de gens, vegeu més avall).També hem trobat una safata amb l'etiqueta "Ca".Eremiobacterota” de diversos estudis23 i els va utilitzar juntament amb vuit MAG del nostre estudi com a referència per a lectures metagenòmica de 633 mostres enriquides eucariotes (> 0,8 µm) utilitzant BWA (v.0.7.17) Ref -r1188, - una bandera) per a mostreig inferior. mapping (5 milions de lectures).A partir de mapes específics d'enriquiment (filtrats per una identitat d'alineació del 95% i una cobertura de lectura del 80%), es van seleccionar 10 metagenomes (cobertura esperada ≥5×) per al muntatge i 49 metagenomes addicionals (cobertura esperada ≥1×) per a la correlació de contingut.Utilitzant els mateixos paràmetres anteriors, aquestes mostres es van agrupar i es van afegir 10 'Ca's addicionals.MAG Eremiobacterota ha estat restaurat.Aquests 16 MAG (sense comptar els dos que ja hi ha a la base de dades) porten el nombre total de genomes a l'OMD ampliat a 34.815.Els MAG se'ls assignen rangs taxonòmics en funció de la seva similitud genòmica i la seva posició a la GTDB.Es van desreplicar 18 MAG mitjançant dRep en 5 espècies (ANI intraespecífic > 99%) i 3 gèneres (ANI intragenèric entre 85% i 94%) dins de la mateixa família79.Els representants de les espècies es van seleccionar manualment en funció de la integritat, la contaminació i l'N50.La nomenclatura suggerida es proporciona a la informació complementària.
Avaluar la integritat i la contaminació de 'Ca.MAG Eremiobacterota, vam avaluar la presència d'uscMG, així com els conjunts de gens marcadors d'una còpia única de llinatge i domini específics utilitzats per CheckM i Anvi'o.La identificació de 2 duplicats de 40 uscMG es va confirmar mitjançant la reconstrucció filogenètica (vegeu més avall) per descartar qualsevol contaminació potencial (això correspon al 5% basat en aquests 40 gens marcadors).Un estudi addicional de cinc MAGs representatius 'Ca.El baix nivell de contaminants en aquests genomes reconstruïts es va confirmar per a les espècies d'Eremiobacterota mitjançant la interfície interactiva Anvi'o basada en correlacions d'abundància i composició de seqüències (informació suplementària)59.
Per a l'anàlisi filogenòmica, vam seleccionar cinc MAGs representatius "Ca".Eudormicrobiaceae”, totes les espècies “Ca.El genoma d'Eremiobacterota i membres d'altres phyla (inclosos UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria i Planctomycetota) està disponible a GTDB (r89)13.Tots aquests genomes es van anotar tal com es va descriure anteriorment per a l'extracció de gens marcadors de còpia única i l'anotació BGC.Els genomes GTDB es van conservar segons els criteris d'integritat i contaminació anteriors.L'anàlisi filogenètica es va realitzar mitjançant el flux de treball Anvi'o Phylogenetics59.L'arbre es va construir mitjançant IQTREE (v.2.0.3) (opcions per defecte i -bb 1000)80 en una alineació de 39 proteïnes ribosòmiques en tàndem identificades per Anvi'o (MUSCLE, v.3.8.1551)81.Les seves posicions es van reduir.per cobrir almenys el 50% del genoma82 i es va utilitzar Planctomycecota com a grup extern basat en la topologia d'arbre GTDB.Es va construir un arbre de 40 uscMG amb les mateixes eines i paràmetres.
Hem utilitzat Traitar (v.1.1.2) amb paràmetres predeterminats (fenotip, a partir de nucleòtids)83 per predir trets microbians comuns.Vam explorar un estil de vida depredador potencial basat en un índex depredador desenvolupat prèviament84 que depèn del contingut d'un gen que codifica proteïnes al genoma.Concretament, utilitzem DIAMOND per comparar proteïnes del genoma amb la base de dades OrthoMCL (v.4)85 mitjançant les opcions –més sensible –id 25 –query-cover 70 –subject-cover 70 –top 20 I comptar els gens corresponents a els gens marcadors de depredadors i no depredadors.L'índex és la diferència entre el nombre de marques depredadores i no depredadores.Com a control addicional, també hem analitzat el genoma "Ca".El factor Entotheonella TSY118 es basa en la seva associació amb Ca.Eudoremicrobium (gran mida del genoma i potencial biosintètic).A continuació, vam provar els enllaços potencials entre gens marcadors depredadors i no depredadors i el potencial biosintètic de Ca.Eudormicrobiaceae” i va trobar que no més d'un gen (de qualsevol tipus de gen marcador, és a dir, gen depredador/no depredador) se solapa amb BGC, cosa que suggereix que BGC no confon els senyals de depredació.Es va realitzar una anotació genòmica addicional de replicons remenats mitjançant TXSSCAN (v.1.0.2) per examinar específicament el sistema de secreció, els pili i els flagels86.
Es van cartografiar cinc 'Ca's representatius cartografiant 623 metatranscriptomes de les fraccions d'enriquiment procariotes i eucariotes dels oceans de Tara22,40,87 (utilitzant BWA, v.0.7.17-r1188, -a flag).Genoma d'Eudormicrobiaceae.Els fitxers BAM es van processar amb FeatureCounts (v.2.0.1)88 després d'un 80% de cobertura de lectura i un 95% de filtratge d'identitats (amb les opcions featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Compta el nombre d'insercions per gen.Els mapes generats es van normalitzar per a la longitud del gen i l'abundància del gen marcador mOTU (recompte mitjà d'inserció normalitzat en longitud per a gens amb recompte d'inserció > 0) i es van transformar en logaritmes a 22, 74 per obtenir l'expressió relativa per cèl·lula de cada nivell de gen, cosa que també explica el variabilitat de mostra a mostra durant la seqüenciació.Aquestes proporcions permeten una anàlisi comparativa, mitigant els problemes de composició quan s'utilitzen dades d'abundància relativa.Només es van considerar mostres amb> 5 dels 10 gens marcadors mOTU per a una anàlisi posterior per permetre detectar una part prou gran del genoma.
El perfil del transcriptoma normalitzat de 'Ca.E. taraoceanii es va sotmetre a una reducció de la dimensionalitat mitjançant UMAP i la representació resultant es va utilitzar per a l'agrupament no supervisat mitjançant HDBSCAN (vegeu més amunt) per determinar l'estat de l'expressió.PERMANOVA prova la importància de les diferències entre els clústers identificats a l'espai de distància original (no reduït).Es va provar l'expressió diferencial entre aquestes condicions a través del genoma (vegeu més amunt) i es van identificar 201 vies KEGG en 6 grups funcionals, a saber: BGC, sistema de secreció i gens flagel·lars de TXSSCAN, enzims de degradació (proteases i peptidases) i depredadors i no. gens depredadors.marcadors d'índex depredador.Per a cada mostra, es va calcular la mitjana d'expressió normalitzada per a cada classe (tingueu en compte que l'expressió BGC en si es calcula com l'expressió mitjana dels gens biosintètics d'aquest BGC) i es va provar la importància entre els estats (prova de Kruskal-Wallis ajustada per FDR).
Els gens sintètics es van comprar a GenScript i els primers de PCR es van comprar a Microsynth.La Phusion polimerasa de Thermo Fisher Scientific es va utilitzar per a l'amplificació de l'ADN.Per a la purificació d'ADN es van utilitzar plasmidis NucleoSpin, gel NucleoSpin i kit de purificació de PCR de Macherey-Nagel.Els enzims de restricció i l'ADN lligasa T4 es van comprar a New England Biolabs.Els productes químics diferents de l'isopropil-β-d-1-tiogalactopiranòsid (IPTG) (Biosynth) i l'1,4-ditiotreitol (DTT, AppliChem) es van comprar a Sigma-Aldrich i es van utilitzar sense més purificació.Els antibiòtics cloranfenicol (Cm), diclorhidrat de espectinomicina (Sm), ampicil·lina (Amp), gentamicina (Gt) i carbenicil·lina (Cbn) es van comprar a AppliChem.Els components de medis Bacto Tryptone i Bacto Yeast Extract es van comprar a BD Biosciences.La tripsina per a la seqüenciació es va comprar a Promega.
Les seqüències gèniques es van extreure del BGC 75.1 predit anti-SMASH.E. malaspinii (Informació complementària).
The genes embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), and embAM (including intergene regions) were sequenced as synthetic constructs in pUC57(AmpR) with and without codons optimized for expression in E Quan.El gen embA es va subclonar al primer lloc de clonació múltiple (MCS1) de pACYCDuet-1 (CmR) i pCDFDuet-1 (SmR) amb llocs de clivatge BamHI i HindIII.Els gens embM i embMopt (optimitzats per codons) es van subclonar a MCS1 pCDFDuet-1 (SmR) amb BamHI i HindIII i es van col·locar al segon lloc de clonació múltiple de pCDFDuet-1 (SmR) i pRSFDuet-1 (KanR) (MCS2) amb NdeI/ChoI.El casset embAM es va subclonar a pCDFDuet1 (SmR) amb llocs de clivatge BamHI i HindIII.El gen orf3/embI (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) es va construir mitjançant PCR d'extensió solapada utilitzant primers EmbI_OE_F_NdeI i EmbI_OE_R_XhoI, digerits amb NdeI/XhoI i lligats amb el mateix pMC-D, i lligats amb la mateixa restricció pMC-D. (Suplementari taula).6).La digestió i la lligadura d'enzims de restricció es van realitzar segons el protocol del fabricant (New England Biolabs).

Hora de publicació: 14-mar-2023