304 hindi kinakalawang na asero welded nakapulupot na tubo /tubing zhemical zomponent, Biosynthetic Potensyal ng Global Marine Microbiome

Salamat sa pagbisita sa Nature.com.Gumagamit ka ng bersyon ng browser na may limitadong suporta sa CSS.Para sa pinakamagandang karanasan, inirerekomenda namin na gumamit ka ng na-update na browser (o huwag paganahin ang Compatibility Mode sa Internet Explorer).Bilang karagdagan, upang matiyak ang patuloy na suporta, ipinapakita namin ang site na walang mga istilo at JavaScript.
Mga slider na nagpapakita ng tatlong artikulo sa bawat slide.Gamitin ang likod at susunod na mga pindutan upang lumipat sa mga slide, o ang mga pindutan ng slide controller sa dulo upang lumipat sa bawat slide.

Detalyadong paglalarawan ng produkto

304 hindi kinakalawang na asero welded coiled tube /tubing
1. Pagtutukoy: Hindi kinakalawang na asero coil tube / tubing
2. Uri: welded o seamless
3. Pamantayan: ASTM A269, ASTM A249
4. Hindi kinakalawang na asero coil tube OD: 6mm hanggang 25.4MM
5. Haba: 600-3500MM o ayon sa pangangailangan ng customer.
6. Kapal ng pader: 0.2mm hanggang 2.0mm.

7. Pagpapahintulot: OD: +/-0.01mm;Kapal: +/-0.01%.

8. Coil inner hole size: 500MM-1500MM (maaaring iakma ayon sa pangangailangan ng customer)

9. Taas ng coil: 200MM-400MM (maaaring iakma ayon sa mga kinakailangan ng customer)

10. Ibabaw: Maliwanag o annealed
11. Materyal: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, haluang metal 625, 825, 2205, 2507, atbp.
12. Pag-iimpake: mga habi na bag sa kahoy na kaso, kahoy na papag, kahoy na baras, o ayon sa pangangailangan ng customer
13. Pagsubok: sangkap ng kemikal, lakas ng ani, lakas ng makunat, pagsukat ng tigas
14. Garantiya: Ang ikatlong partido (halimbawa :SGS TV ) inspeksyon, atbp.
15. Application: Dekorasyon, muwebles, transportasyon ng langis, heat exchanger, paggawa ng rehas, paggawa ng papel, sasakyan, pagproseso ng pagkain, medikal, atbp.

Lahat ng Komposisyon ng Kemikal at Pisikal na Katangian para sa Hindi kinakalawang na Asero tulad ng nasa ibaba:

materyal ASTM A269 Chemical Komposisyon % Max
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0.08 2.00 0.045 0.030 1.00 18.0-20.0 8.0-11.0 ^ ^ ^ . ^
TP304L 0.035 2.00 0.045 0.030 1.00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0.08 2.00 0.045 0.030 1.00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0.035 D 2.00 0.045 0.030 1.00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0.70
TP347 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 10C -1.10 ^

 

materyal Paggamot ng init Temperatura F (C) Min. Katigasan
Brinell Rockwell
TP304 Solusyon 1900 (1040) 192HBW/200HV 90HRB
TP304L Solusyon 1900 (1040) 192HBW/200HV 90HRB
TP316 Solusyon 1900(1040) 192HBW/200HV 90HRB
TP316L Solusyon 1900(1040) 192HBW/200HV 90HRB
TP321 Solusyon 1900(1040) F 192HBW/200HV 90HRB
TP347 Solusyon 1900(1040) 192HBW/200HV 90HRB

 

OD, pulgada OD Tolerance inch(mm) WT Tolerance % Haba ng Tolernace pulgada(mm)
+ -
≤ 1 / 2 ± 0.005 ( 0.13 ) ± 15 1 / 8 ( 3.2 ) 0
> 1 / 2 ~1 1 / 2 ± 0.005(0.13) ± 10 1 / 8 (3.2) 0
> 1 1 / 2 ~< 3 1 / 2 ± 0.010(0.25) ± 10 3 / 16 (4.8) 0
> 3 1 / 2 ~< 5 1 / 2 ± 0.015(0.38) ± 10 3 / 16 (4.8) 0
> 5 1 / 2 ~< 8 ± 0.030(0.76) ± 10 3 / 16 (4.8) 0
8~< 12 ± 0.040(1.01) ± 10 3 / 16 (4.8) 0
12~< 14 ± 0.050(1.26) ± 10 3 / 16 (4.8) 0

Ang mga natural na microbial na komunidad ay phylogenetically at metabolically diverse.Bilang karagdagan sa mga hindi pinag-aralan na mga grupo ng mga organism1, ang pagkakaiba-iba na ito ay nagtataglay din ng isang mayamang potensyal para sa pagtuklas ng mga ecologically at biotechnologically makabuluhang enzymes at biochemical compounds2,3.Gayunpaman, ang pag-aaral ng pagkakaiba-iba na ito upang matukoy ang mga genomic na landas na nag-synthesize ng mga naturang compound at nagbubuklod sa kanila sa kani-kanilang mga host ay nananatiling isang hamon.Ang biosynthetic na potensyal ng mga microorganism sa bukas na karagatan ay nananatiling higit na hindi alam dahil sa mga limitasyon sa pagsusuri ng buong data ng resolusyon ng genome sa isang pandaigdigang sukat.Dito, tinutuklasan namin ang pagkakaiba-iba at pagkakaiba-iba ng mga biosynthetic gene cluster sa karagatan sa pamamagitan ng pagsasama-sama ng humigit-kumulang 10,000 microbial genome mula sa mga cultured cell at single cell na may higit sa 25,000 bagong reconstructed draft genome mula sa mahigit 1,000 seawater sample.Ang mga pagsisikap na ito ay nakilala ang tungkol sa 40,000 putative karamihan ay mga bagong biosynthetic gene clusters, ang ilan sa mga ito ay natagpuan sa dati nang hindi pinaghihinalaang mga phylogenetic na grupo.Sa mga populasyon na ito, natukoy namin ang isang lineage na pinayaman sa mga biosynthetic gene clusters ("Candidatus Eudormicrobiaceae") na kabilang sa isang uncultivated bacterial phylum at kasama ang ilan sa mga pinaka-biosynthetically diverse na microorganism sa kapaligirang ito.Sa mga ito, nailalarawan namin ang mga landas ng phosphatase-peptide at pytonamide, na kinikilala ang mga pagkakataon ng hindi pangkaraniwang istraktura ng bioactive compound at enzymology, ayon sa pagkakabanggit.Sa konklusyon, ipinapakita ng pag-aaral na ito kung paano maaaring paganahin ng mga diskarte na nakabatay sa microbiome ang paggalugad ng dati nang hindi inilarawang mga enzyme at natural na pagkain sa isang hindi gaanong naiintindihan na microbiota at kapaligiran.
Ang mga mikrobyo ay nagtutulak sa mga pandaigdigang biogeochemical cycle, nagpapanatili ng mga sapot ng pagkain, at pinananatiling malusog ang mga halaman at hayop5.Ang kanilang napakalaking phylogenetic, metabolic at functional na pagkakaiba-iba ay kumakatawan sa isang mayamang potensyal para sa pagtuklas ng mga bagong taxa1, enzymes at biochemical compound, kabilang ang mga natural na produkto6.Sa mga ekolohikal na pamayanan, ang mga molekulang ito ay nagbibigay sa mga mikroorganismo ng iba't ibang pisyolohikal at ekolohikal na pag-andar, mula sa komunikasyon hanggang sa kompetisyon 2, 7 .Bilang karagdagan sa kanilang mga orihinal na function, ang mga natural na produkto at ang kanilang genetically coded production pathways ay nagbibigay ng mga halimbawa para sa biotechnological at therapeutic application2,3.Ang pagkakakilanlan ng naturang mga landas at koneksyon ay lubos na pinadali ng pag-aaral ng mga kulturang mikrobyo.Gayunpaman, ipinakita ng taxonomic na pag-aaral ng mga natural na kapaligiran na ang karamihan sa mga microorganism ay hindi pa nalilinang8.Nililimitahan ng kultural na bias na ito ang ating kakayahang samantalahin ang functional diversity na naka-encode ng maraming microbes4,9.
Upang malampasan ang mga limitasyong ito, ang mga teknolohikal na pag-unlad sa nakalipas na dekada ay nagbigay-daan sa mga mananaliksik na direktang (ibig sabihin, nang walang naunang kultura) ang pagkakasunud-sunod ng mga microbial DNA fragment mula sa buong komunidad (metagenomics) o mga solong cell.Ang kakayahang tipunin ang mga fragment na ito sa mas malalaking genome fragment at muling buuin ang maraming metagenomically assembled genomes (MAGs) o single amplified genomes (SAGs), ayon sa pagkakabanggit, ay nagbubukas ng isang mahalagang pagkakataon para sa taxocentric na pag-aaral ng microbiome (ibig sabihin, microbial na komunidad at microbiome).maghanda ng mga bagong landas.sariling genetic material sa isang partikular na kapaligiran) 10,11,12.Sa katunayan, ang mga kamakailang pag-aaral ay lubos na nagpalawak ng phylogenetic na representasyon ng microbial diversity sa Earth1, 13 at nagsiwalat ng marami sa functional na pagkakaiba-iba sa mga indibidwal na microbial na komunidad na hindi pa nasasakop ng kulturang microorganism reference genome sequences (REFs)14.Ang kakayahang maglagay ng hindi natuklasang functional na pagkakaiba-iba sa konteksto ng host genome (ibig sabihin, genome resolution) ay kritikal para sa paghula ng hindi pa nailalarawan na mga linya ng microbial na maaaring mag-encode ng mga bagong natural na produkto15,16 o para sa pagsubaybay sa mga naturang compound pabalik sa kanilang orihinal na producer17.Halimbawa, ang isang pinagsamang metagenomic at single-cell genomic analysis approach ay humantong sa pagkakakilanlan ng Candidatus Entotheonella, isang pangkat ng metabolically rich sponge-associated bacteria, bilang mga producer ng iba't ibang potensyal ng gamot18.Gayunpaman, sa kabila ng kamakailang mga pagtatangka sa genomic exploration ng magkakaibang microbial na komunidad, 16,19 higit sa dalawang-katlo ng global metagenomic data para sa pinakamalaking karagatan ng ecosystem ng Earth16,20 ay nawawala pa rin.Kaya, sa pangkalahatan, ang biosynthetic potensyal ng marine microbiome at ang potensyal nito bilang isang repositoryo ng nobelang enzymatic at natural na mga produkto ay nananatiling higit na hindi pinag-aralan.
Upang galugarin ang biosynthetic na potensyal ng mga marine microbiome sa isang pandaigdigang sukat, una naming pinagsama ang mga marine microbial genome na nakuha gamit ang mga pamamaraan na umaasa sa kultura at hindi kultura upang lumikha ng isang malawak na database ng phylogenetics at pag-andar ng gene.Ang pagsusuri sa database na ito ay nagsiwalat ng isang malawak na iba't ibang mga biosynthetic gene clusters (BGCs), na karamihan ay nabibilang sa mga hindi pa nakikilalang gene cluster (GCF) na pamilya.Bilang karagdagan, natukoy namin ang isang hindi kilalang pamilyang bacterial na nagpapakita ng pinakamataas na kilalang pagkakaiba-iba ng mga BGC sa bukas na karagatan hanggang sa kasalukuyan.Pinili namin ang dalawang ribosomal synthesis at post-translationally modified peptide (RiPP) na mga landas para sa pang-eksperimentong pagpapatunay batay sa kanilang mga pagkakaiba sa genetic mula sa kasalukuyang kilalang mga landas.Ang functional characterization ng mga pathway na ito ay nagsiwalat ng hindi inaasahang mga halimbawa ng enzymology pati na rin ang hindi pangkaraniwang mga compound na may protease inhibitory na aktibidad.
Sa una, nilalayon naming lumikha ng isang pandaigdigang mapagkukunan ng data para sa pagsusuri ng genome, na nakatuon sa mga bacterial at archaeal na bahagi nito.Sa layuning ito, pinagsama namin ang metagenomic data at 1038 na mga sample ng tubig-dagat mula sa 215 globally distributed sampling site (latitude range = 141.6°) at ilang malalim na layer (mula 1 hanggang 5600 m ang lalim, na sumasaklaw sa pelagic, mesopelagic at abyssal zones).Background21,22,23 (Fig. 1a, pinalawig na data, Fig. 1a at Karagdagang Talahanayan 1).Bilang karagdagan sa pagbibigay ng malawak na saklaw ng heograpiya, ang mga napiling na-filter na sample na ito ay nagbigay-daan sa amin na ihambing ang iba't ibang bahagi ng marine microbiome, kabilang ang mayaman sa virus (<0.2 µm), mayaman sa prokaryotic (0.2–3 µm), mayaman sa particle (0.8 µm). ).–20 µm) at mga kolonya ng virus-depleted (>0.2 µm).
a, Isang kabuuan ng 1038 na magagamit sa publiko na mga genome (metagenomics) ng mga marine microbial na komunidad na nakolekta mula sa 215 na mga lokasyong ipinamamahagi sa buong mundo (62°S hanggang 79°N at 179°W hanggang 179°E.).Mga tile ng mapa © Esri.Mga Pinagmulan: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ, at Esri.b, ang mga metagenom na ito ay ginamit upang muling buuin ang mga MAG (mga pamamaraan at karagdagang impormasyon), na naiiba sa dami at kalidad (mga pamamaraan) sa mga dataset (minarkahan ng kulay).Ang mga muling itinayong MAG ay dinagdagan ng mga genome na magagamit ng publiko (panlabas), kabilang ang ginawang kamay na MAG26, SAG27 at REF.27 Compile OMD.c, kumpara sa mga naunang ulat batay lamang sa SAG (GORG)20 o MAG (GEM)16, pinapabuti ng OMD ang genomic characterization ng marine microbial communities (metagenomic read mapping rate; method) nang dalawa hanggang tatlong beses na may mas pare-parehong representasyon sa lalim at latitude..<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, ang OMD na pagpapangkat sa antas ng mga cluster ng species (95% mean nucleotide identity) ay kinikilala ang kabuuang humigit-kumulang 8300 species, higit sa kalahati nito ay hindi pa dati nailalarawan ayon sa taxonomic annotation gamit ang GTDB (bersyon 89) e, ang pag-uuri ng mga species ayon sa genome type ay nagpakita na ang MAG, SAG at REFs ay nagpupuno ng mabuti sa isa't isa sa pagpapakita ng phylogenetic diversity ng ang marine microbiome.Sa partikular, 55%, 26% at 11% ng mga species ay tiyak para sa MAG, SAG at REF, ayon sa pagkakabanggit.BATS, Bermuda Atlantic Time Series;GEM, mga genome ng microbiome ng Earth;GORG, global ocean reference genome;HOT, Hawaiian Ocean time series.
Gamit ang dataset na ito, nag-reconstruct kami ng kabuuang 26,293 MAG, karamihan ay bacterial at archaeal (Fig. 1b at pinalawak na data, Fig. 1b).Nilikha namin ang mga MAG na ito mula sa mga asembliya mula sa hiwalay kaysa sa mga pinagsama-samang metagenomic na sample upang maiwasan ang pagbagsak ng natural na pagkakaiba-iba ng pagkakasunud-sunod sa pagitan ng mga sample mula sa iba't ibang lokasyon o time point (mga pamamaraan).Bilang karagdagan, pinagsama namin ang mga genomic fragment batay sa kanilang mga ugnayan sa pagkalat sa isang malaking bilang ng mga sample (mula 58 hanggang 610 na mga sample, depende sa survey; pamamaraan).Nalaman namin na ito ay isang nakakaubos ng oras ngunit mahalagang hakbang24 na nilaktawan sa ilang malalaking gawain sa muling pagtatayo ng MAG16, 19, 25 at makabuluhang nagpapabuti sa dami (2.7-tiklop sa karaniwan) at kalidad (+20% sa karaniwan) ng genome.muling itinayo mula sa marine metagenome na pinag-aralan dito (pinalawak na data, Fig. 2a at karagdagang impormasyon).Sa pangkalahatan, ang mga pagsisikap na ito ay nagresulta sa isang 4.5-tiklop na pagtaas sa mga marine microbial MAG (6 na beses kung isasaalang-alang lamang ang mga de-kalidad na MAG) kumpara sa pinakakomprehensibong mapagkukunan ng MAG na magagamit ngayon16 (Mga Paraan).Ang bagong likhang MAG set na ito ay pinagsama sa 830 na piniling MAG26, 5969 SAG27 at 1707 REF.Dalawampu't pitong species ng marine bacteria at archaea ang bumubuo sa isang combinatorial na koleksyon ng 34,799 genome (Larawan 1b).
Pagkatapos ay sinuri namin ang bagong nilikha na mapagkukunan upang mapabuti ang kakayahang kumatawan sa mga komunidad ng microbial sa dagat at masuri ang epekto ng pagsasama ng iba't ibang uri ng genome.Sa karaniwan, nalaman namin na saklaw nito ang humigit-kumulang 40-60% ng marine metagenomic data (Larawan 1c), dalawa hanggang tatlong beses ang saklaw ng mga nakaraang ulat ng MAG-lamang sa parehong depth at latitude Higit pang serial 16 o SAG20.Bilang karagdagan, upang sistematikong sukatin ang pagkakaiba-iba ng taxonomic sa mga naitatag na koleksyon, inilarawan namin ang lahat ng genome gamit ang toolkit (pamamaraan) ng Genome Taxonomy Database (GTDB) at gumamit ng average na genome-wide nucleotide identity na 95%.28 upang makilala ang 8,304 na kumpol ng mga species (species).Dalawang-katlo ng mga species na ito (kabilang ang mga bagong clades) ay hindi pa lumitaw dati sa GTDB, kung saan 2790 ang natuklasan gamit ang MAG na muling itinayo sa pag-aaral na ito (Fig. 1d).Bilang karagdagan, natagpuan namin na ang iba't ibang uri ng genome ay lubos na komplementaryo: 55%, 26%, at 11% ng mga species ay ganap na binubuo ng MAG, SAG, at REF, ayon sa pagkakabanggit (Fig. 1e).Bilang karagdagan, sinakop ng MAG ang lahat ng 49 na uri na matatagpuan sa column ng tubig, habang ang SAG at REF ay kumakatawan lamang sa 18 at 11 sa kanila, ayon sa pagkakabanggit.Gayunpaman, mas mahusay na kinakatawan ng SAG ang pagkakaiba-iba ng mga pinakakaraniwang clades (pinalawak na data, Fig. 3a), tulad ng Pelagic Bacteriales (SAR11), na may SAG na sumasaklaw sa halos 1300 species at MAG 390 species lamang.Kapansin-pansin, ang mga REF ay bihirang nag-overlap sa mga MAG o SAG sa antas ng species at kinakatawan ang> 95% ng humigit-kumulang 1000 genome na hindi natagpuan sa open ocean metagenomic set na pinag-aralan dito, pangunahin dahil sa mga pakikipag-ugnayan sa iba pang mga uri ng mga nakahiwalay na kinatawan ng marine specimens (hal. .o host-associate).Upang gawing malawak itong magagamit sa komunidad ng siyentipiko, ang marine genome resource na ito, na kinabibilangan din ng mga hindi natukoy na fragment (hal., mula sa mga hinulaang phage, genomic islands, at genome fragment kung saan walang sapat na data para sa MAG reconstruction), ay maihahambing sa taxonomic data .I-access ang mga anotasyon kasama ang function ng gene at mga parameter ng konteksto sa Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/).
Pagkatapos ay itinakda namin upang galugarin ang kayamanan at bagong bagay ng biosynthetic na potensyal sa mga bukas na microbiome sa karagatan.Sa layuning ito, ginamit muna namin ang antiSMASH para sa lahat ng MAG, SAG, at REF na natagpuan sa 1038 marine metagenomes (paraan) upang mahulaan ang kabuuang 39,055 BGC.Pagkatapos ay pinagsama namin ang mga ito sa 6907 non-redundant GCFs at 151 gene cluster populations (GCCs; Karagdagang Talahanayan 2 at mga pamamaraan) upang i-account ang likas na redundancy (ibig sabihin, ang parehong BGC ay maaaring ma-encode sa maraming genome) at metagenomic data Fragmentation ng concentrated BGCs .Ang mga hindi kumpletong BGC ay hindi tumaas nang malaki, kung mayroon man (Karagdagang Impormasyon), ang bilang ng mga GCF at GCC, ayon sa pagkakabanggit, na naglalaman ng hindi bababa sa isang buo na miyembro ng BGC sa 44% at 86% ng mga kaso.
Sa antas ng GCC, natagpuan namin ang isang malawak na iba't ibang mga hinulaang RiPP at iba pang mga natural na produkto (Larawan 2a).Kabilang sa mga ito, halimbawa, ang mga arylpolyene, carotenoids, ectoines, at siderophores ay nabibilang sa mga GCC na may malawak na pamamahagi ng phylogenetic at isang mataas na kasaganaan sa mga metagenome ng karagatan, na maaaring magpahiwatig ng malawak na pagbagay ng mga microorganism sa kapaligiran ng dagat, kabilang ang paglaban sa mga reaktibo na species ng oxygen, oxidative at osmotic stress..o pagsipsip ng bakal (higit pang impormasyon).Ang pagkakaiba-iba ng pagganap na ito ay kaibahan sa isang kamakailang pagsusuri ng humigit-kumulang 1.2 milyong BGC sa humigit-kumulang 190,000 genome na nakaimbak sa database ng NCBI RefSeq (BiG-FAM/RefSeq, pagkatapos ay tinutukoy bilang RefSeq)29, na nagpakita na ang nonribosomal Synthetase peptides (NRPS) at polyketide synthase (PKS) BGCs (Karagdagang Impormasyon).Natagpuan din namin ang 44 (29%) na GCC na malayong nauugnay lamang sa anumang RefSeq BGC (\(\bar{d}\)RefSeq > 0.4; Fig. 2a at mga pamamaraan) at 53 (35%) na GCC lamang sa MAG , na nagha-highlight sa potensyal upang makita ang mga dating hindi inilarawang kemikal sa OMD.Dahil ang bawat isa sa mga GCC na ito ay malamang na kumakatawan sa lubos na magkakaibang mga biosynthetic na function, sinuri pa namin ang data sa antas ng GCF sa pagsisikap na magbigay ng mas detalyadong pagpapangkat ng mga BGC na hinulaang magko-code para sa mga katulad na natural na produkto29.Isang kabuuan ng 3861 (56%) na natukoy na mga GCF ay hindi nag-overlap sa RefSeq, at> 97% ng mga GCF ay wala sa MIBiG, isa sa pinakamalaking database ng mga eksperimentong napatunayan na BGC (Larawan 2b).Bagama't hindi nakakagulat na matuklasan ang maraming potensyal na landas ng nobela sa mga setting na hindi mahusay na kinakatawan ng reference genome, ang aming pamamaraan para sa pag-dereplicate ng mga BGC sa mga GCF bago ang benchmarking ay naiiba sa mga nakaraang ulat 16 at nagbibigay-daan sa amin na magbigay ng walang pinapanigan na pagtatasa ng bago.Karamihan sa bagong pagkakaiba-iba (3012 GCF o 78%) ay tumutugma sa hinulaang terpenes, RiPP o iba pang natural na produkto, at karamihan (1815 GCF o 47%) ay naka-encode sa mga hindi kilalang uri dahil sa kanilang biosynthetic na potensyal.Hindi tulad ng mga cluster ng PKS at NRPS, ang mga compact na BGC na ito ay mas malamang na mahati sa panahon ng metagenomic assembly 31 at nagbibigay-daan sa mas maraming oras at resource-intensive functional characterization ng kanilang mga produkto.
Isang kabuuan ng 39,055 BGC ay pinagsama-sama sa 6,907 GCF at 151 GCC.a, representasyon ng data (panloob na panlabas).Hierarchical clustering ng BGC distances batay sa GCC, 53 sa mga ito ay naayos ng MAG lang.Naglalaman ang GCC ng mga BGC mula sa iba't ibang taxa (ln-transformed gate frequency) at iba't ibang klase ng BGC (ang laki ng bilog ay tumutugma sa dalas nito).Para sa bawat GCC, kinakatawan ng panlabas na layer ang bilang ng mga BGC, ang prevalence (porsyento ng mga sample), at ang distansya (minimum na BGC cosine distance (min(dMIBiG))) mula sa BiG-FAM hanggang BGC.Ang mga GCC na may mga BGC na malapit na nauugnay sa mga na-verify na eksperimentong BGC (MIBiG) ay naka-highlight gamit ang mga arrow.b Ang paghahambing ng GCF sa mga hinulaang (BiG-FAM) at na-validate sa eksperimento (MIBiG) na mga BGC, 3861 na bagong (d–>0.2) na mga GCF ang natagpuan.Karamihan (78%) ng mga code na ito para sa RiPP, terpenes, at iba pang natural na produkto.c, lahat ng genome sa OMD na natagpuan sa 1038 marine metagenomes ay inilagay sa GTDB base tree upang ipakita ang phylogenetic coverage ng OMD.Ang mga clade na walang anumang genome sa OMD ay ipinapakita sa kulay abo.Ang bilang ng mga BGC ay tumutugma sa pinakamalaking bilang ng mga hinulaang BGC sa bawat genome sa isang naibigay na clade.Para sa kalinawan, ang huling 15% ng mga node ay na-collapse.Ang mga arrow ay nagpapahiwatig ng mga clade na mayaman sa BGC (>15 BGC), maliban sa Mycobacterium, Gordonia (pangalawa lamang sa Rhodococcus), at Crocosphaera (pangalawa lamang sa Synechococcus).d, Hindi alam c.Ang Eremiobacterota ay nagpakita ng pinakamataas na biosynthetic diversity (Shannon index batay sa natural na uri ng produkto).Ang bawat banda ay kumakatawan sa genome na may pinakamaraming BGC sa species.T1PKS, PKS type I, T2/3PKS, PKS type II at type III.
Bilang karagdagan sa kayamanan at bago, ginalugad namin ang biogeographic na istraktura ng biosynthetic na potensyal ng marine microbiome.Ang pagpapangkat ng mga sample sa pamamagitan ng average na metagenomic GCF copy number distribution (Methods) ay nagpakita na ang low-latitude, surface, prokaryotic-rich at virus-poor na komunidad, karamihan ay mula sa ibabaw o mas malalim na tubig na naliliwanagan ng araw, ay mayaman sa RiPP at BGC terpenes.Sa kaibahan, ang mga polar, deep-sea, virus- at particle-rich na komunidad ay nauugnay sa mas mataas na kasaganaan ng NRPS at PKS BGC (pinalawak na data, Fig. 4 at karagdagang impormasyon).Sa wakas, nalaman namin na ang mahusay na pinag-aralan na mga tropikal at pelagic na komunidad ay ang pinaka-promising na mapagkukunan ng mga bagong terpenes (Augmented Data Figure).Pinakamataas na potensyal para sa PKS, RiPP at iba pang natural na produkto (Larawan 5a na may pinalawak na data).
Upang makadagdag sa aming pag-aaral ng biosynthetic na potensyal ng marine microbiome, nilalayon naming imapa ang kanilang phylogenetic distribution at tukuyin ang mga bagong BGC-enriched clades.Sa layuning ito, inilagay namin ang mga genome ng marine microbes sa isang normalized na GTDB13 bacterial at archaeal phylogenetic tree at na-overlay ang putative biosynthetic na mga landas na kanilang na-encode (Fig. 2c).Madali naming na-detect ang ilang BGC-enriched clades (kinakatawan ng mahigit 15 BGCs) sa mga sample ng seawater (paraan) na kilala sa kanilang biosynthetic na potensyal, gaya ng cyanobacteria (Synechococcus) at Proteus bacteria, gaya ng Tistrella32,33, o kamakailang nakakuha ng atensyon para sa kanilang natural na mga produkto.tulad ng Myxococcota (Sandaracinaceae), Rhodococcus at Planctomycetota34,35,36.Nang kawili-wili, nakakita kami ng ilang dati nang hindi na-explore na mga linya sa mga clade na ito.Halimbawa, ang mga species na iyon na may pinakamayamang potensyal na biosynthetic sa phyla Planctomycetota at Myxococcota ay kabilang sa mga hindi na-characterized na mga order ng kandidato at genera, ayon sa pagkakabanggit (Karagdagang Talahanayan 3).Kung sama-sama, iminumungkahi nito na ang OMD ay nagbibigay ng access sa dati nang hindi kilalang phylogenetic na impormasyon, kabilang ang mga microorganism, na maaaring kumakatawan sa mga bagong target para sa pagtuklas ng enzyme at natural na produkto.
Susunod, nailalarawan namin ang clade na pinayaman ng BGC sa pamamagitan ng hindi lamang pagbibilang ng maximum na bilang ng mga BGC na naka-encode ng mga miyembro nito, kundi pati na rin sa pamamagitan ng pagtatasa ng pagkakaiba-iba ng mga BGC na ito, na nagpapaliwanag sa dalas ng iba't ibang uri ng mga natural na produkto ng kandidato (Fig. 2c at mga pamamaraan )..Natagpuan namin na ang pinaka-biosynthetically diverse species ay kinakatawan ng espesyal na engineered bacterial MAG sa pag-aaral na ito.Ang mga bakteryang ito ay nabibilang sa hindi nalilinang na phylum na Candidatus Eremiobacterota, na nananatiling higit na hindi ginalugad bukod sa ilang genomic na pag-aaral37,38.Kapansin-pansin na “ca.Ang genus na Eremiobacterota ay nasuri lamang sa isang terrestrial na kapaligiran39 at hindi kilala na kinabibilangan ng anumang mga miyembrong pinayaman sa BGC.Dito ay muling itinayo namin ang walong MAG ng parehong species (nucleotide identity > 99%) 23. Samakatuwid, iminumungkahi namin ang pangalan ng species na "Candidatus Eudoremicrobium malaspinii", na ipinangalan sa nereid (sea nymph), isang magandang regalo sa mitolohiya at ekspedisyon ng Greek.'Ka.Ayon sa phylogenetic annotation 13, ang E. malaspinii ay walang dating kilalang kamag-anak sa ibaba ng sequence level at sa gayon ay kabilang sa isang bagong bacterial family na aming iminumungkahi na "Ca.E. malaspinii" bilang uri ng species at "Ca.Eudormicrobiaceae" bilang opisyal na pangalan (Karagdagang Impormasyon).Maikling metagenomic reconstruction ng 'Ca.Ang E. malaspinii genome project ay napatunayan sa pamamagitan ng napakababang input, matagal na nabasang metagenomic sequencing at naka-target na pagpupulong ng isang sample (Methods) bilang isang solong 9.63 Mb linear chromosome na may 75 kb duplication.bilang ang tanging natitirang kalabuan.
Upang maitatag ang phylogenetic na konteksto ng species na ito, naghanap kami ng 40 malapit na nauugnay na species sa karagdagang eukaryotic-enriched metagenomic sample mula sa Tara Ocean expedition sa pamamagitan ng naka-target na genome reconstruction.Sa madaling sabi, iniugnay namin ang metagenomic reads sa mga genomic fragment na nauugnay sa "Ca.E. malaspinii” at nag-hypothesize na ang tumaas na recruitment rate sa sample na ito ay nagpapahiwatig ng pagkakaroon ng ibang mga kamag-anak (paraan).Bilang resulta, nakakita kami ng 10 MAG, isang kumbinasyon ng 19 MAG na kumakatawan sa limang species sa tatlong genera sa loob ng bagong tinukoy na pamilya (ibig sabihin, "Ca. Eudormicrobiaceae").Pagkatapos ng manu-manong inspeksyon at kontrol sa kalidad (pinalawak na data, Fig. 6 at karagdagang impormasyon), nalaman namin na "Ca.Ang mga species ng Eudormicrobiaceae ay nagpapakita ng mas malalaking genome (8 Mb) at mas mayamang biosynthetic na potensyal (14 hanggang 22 BGC bawat species) kaysa sa iba pang miyembro ng "Ca".Clade Eremiobacterota (hanggang 7 BGC) (Larawan 3a–c).
a, Phylogenetic na posisyon ng limang 'Ca.Ang mga species ng Eudormicrobiaceae ay nagpakita ng yaman ng BGC na tiyak sa mga linya ng dagat na natukoy sa pag-aaral na ito.Kasama sa phylogenetic tree ang lahat ng 'Ca.MAG Eremiobacterota at mga miyembro ng iba pang phyla (genome number sa mga bracket) na ibinigay sa GTDB (bersyon 89) ay ginamit para sa evolutionary background (Methods).Ang mga pinakalabas na layer ay kumakatawan sa mga klasipikasyon sa antas ng pamilya ("Ca. Eudormicrobiaceae" at "Ca. Xenobiaceae") at sa antas ng klase ("Ca. Eremiobacteria").Ang limang species na inilarawan sa pag-aaral na ito ay kinakatawan ng mga alphanumeric code at iminungkahing binomial na pangalan (Karagdagang Impormasyon).b, okay.Ang mga species ng Eudormicrobiaceae ay nagbabahagi ng pitong karaniwang BGC nuclei.Ang kawalan ng BGC sa A2 clade ay dahil sa hindi kumpleto ng kinatawan ng MAG (Karagdagang Talahanayan 3).Ang mga BGC ay partikular sa “Ca.Amphithomicrobium" at "Ca.Amphithomicrobium” (clades A at B) ay hindi ipinapakita.c, Lahat ng BGC ay naka-encode bilang “Ca.Ang Eudoremicrobium taraoceanii ay natagpuang ipinahayag sa 623 metatranscriptomes na kinuha mula sa mga karagatan ng Tara.Ang mga solidong bilog ay nagpapahiwatig ng aktibong transkripsyon.Ang mga orange na bilog ay nagsasaad ng mga pagbabago sa log2-transformed fold sa ibaba at sa itaas ng housekeeping gene expression rate (mga pamamaraan).d, relatibong abundance curves (paraan) na nagpapakita ng 'Ca.Ang mga species ng Eudormicrobiaceae ay laganap sa karamihan ng mga basin ng karagatan at sa buong column ng tubig (mula sa ibabaw hanggang sa lalim na hindi bababa sa 4000 m).Batay sa mga pagtatantya na ito, nalaman namin na ang 'Ca.Ang E. malaspinii' ay bumubuo ng hanggang 6% ng mga prokaryotic cell sa deep-sea pelagic grain-associated na komunidad.Itinuring namin ang isang species na naroroon sa isang site kung ito ay matatagpuan sa anumang bahagi ng laki ng isang partikular na depth layer.IO – Indian Ocean, NAO – North Atlantic, NPO – North Pacific, RS – Red Sea, SAO – South Atlantic, SO – Southern Ocean, SPO – South Pacific.
Pag-aaral sa kasaganaan at pamamahagi ng Ca.Ang Eudormicrobiaceae, na, tulad ng nakita namin, ay nangingibabaw sa karamihan ng mga basin ng karagatan, gayundin sa buong haligi ng tubig (Larawan 3d).Sa lokal, bumubuo sila ng 6% ng marine microbial community, ginagawa silang mahalagang bahagi ng global marine microbiome.Bilang karagdagan, natagpuan namin ang kamag-anak na nilalaman ng Ca.Ang mga species ng Eudormicrobiaceae at ang kanilang mga antas ng expression ng BGC ay pinakamataas sa eukaryotic enriched fraction (Larawan 3c at pinalawak na data, Fig. 7), na nagpapahiwatig ng posibleng pakikipag-ugnayan sa particulate matter, kabilang ang plankton.Ang pagmamasid na ito ay may ilang pagkakahawig sa 'Ca.Ang mga Eudoremicrobium BGC na gumagawa ng mga likas na produkto ng cytotoxic sa pamamagitan ng mga kilalang landas ay maaaring magpakita ng mapanlinlang na pag-uugali (Karagdagang Impormasyon at Pinalawak na Data, Larawan 8), katulad ng iba pang mga mandaragit na partikular na gumagawa ng mga metabolite tulad ng Myxococcus41.Pagtuklas ng Ca.Maaaring ipaliwanag ng Eudormicrobiaceae sa hindi gaanong available (malalim na karagatan) o eukaryotic kaysa sa mga prokaryotic na sample kung bakit nananatiling hindi malinaw ang mga bacteria na ito at ang hindi inaasahang pagkakaiba-iba ng BGC sa konteksto ng natural na pananaliksik sa pagkain.
Sa huli, hinangad naming i-eksperimentong patunayan ang pangako ng aming gawaing nakabatay sa microbiome sa pagtuklas ng mga bagong pathway, enzymes, at natural na produkto.Kabilang sa iba't ibang klase ng BGCs, ang RiPP pathway ay kilala sa pag-encode ng isang rich chemical at functional diversity dahil sa iba't ibang post-translational modification ng core peptide ng mature enzymes42.Kaya pumili kami ng dalawang 'Ca.Ang Eudoremicrobium' RiPP BGCs (Figures 3b at 4a-e) ay nakabatay sa kapareho ng anumang kilalang BGC (\(\bar{d}\)MIBiG at \(\bar{d}\)RefSeq above 0.2) .
a–c, In vitro heterologous expression at in vitro enzymatic assays ng isang nobela (\(\bar{d}\)RefSeq = 0.29) cluster ng RiPP biosynthesis na tiyak para sa deep sea Ca species.Ang E. malaspinii' ay humantong sa paggawa ng mga produktong diphosphorylated.c, natukoy ang mga pagbabago gamit ang high-resolution (HR) MS/MS (fragmentation na ipinahiwatig ng b at y ions sa chemical structure) at NMR (expanded data, Fig. 9).d, ang phosphorylated peptide na ito ay nagpapakita ng mababang micromolar inhibition ng mammalian neutrophil elastase, na hindi matatagpuan sa control peptide at ang dehydrating peptide (chemical removal induced dehydration).Ang eksperimento ay inulit ng tatlong beses na may katulad na mga resulta.Halimbawa, ang heterologous na pagpapahayag ng pangalawang nobela \(\bar{d}\)RefSeq = 0.33) na kumpol ng biosynthesis ng protina ay nagpapaliwanag sa paggana ng apat na mature na enzyme na nagbabago sa 46 amino acid core peptide.Ang mga nalalabi ay nabahiran ayon sa site ng pagbabago na hinulaang ng HR-MS/MS, isotope labeling, at NMR analysis (Karagdagang Impormasyon).Ang mga gitling na kulay ay nagpapahiwatig na ang pagbabago ay nangyayari sa alinman sa dalawang nalalabi.Ang figure ay isang compilation ng maraming heterologous constructs upang ipakita ang aktibidad ng lahat ng mature enzymes sa parehong nucleus.h, Ilustrasyon ng data ng NMR para sa backbone amide N-methylation.Ang buong resulta ay ipinapakita sa fig.10 na may pinahabang data.i, Ang posisyon ng Phylogenetic ng mature na FkbM protein cluster enzyme sa lahat ng mga domain ng FkbM na natagpuan sa MIBiG 2.0 database ay nagpapakita ng isang enzyme ng pamilyang ito na may aktibidad na N-methyltransferase (Karagdagang Impormasyon).Ang mga schematic diagram ng BGCs (a, e), precursor peptide structures (b, f), at putative chemical structures ng mga natural na produkto (c, g) ay ipinapakita.
Ang unang RiPP pathway (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) ay natagpuan lamang sa deep-sea species na "Ca.E. malaspinii” at mga code para sa Peptide-precursor (Fig. 4a, b).Sa mature na enzyme na ito, natukoy namin ang isang solong functional domain na homologous sa dehydration domain ng lantipeptide synthase na normal na nag-catalyze ng phosphorylation at kasunod na pag-alis ng 43 (Karagdagang Impormasyon).Samakatuwid, hinuhulaan namin na ang pagbabago ng precursor peptide ay nagsasangkot ng tulad ng isang dalawang hakbang na pag-aalis ng tubig.Gayunpaman, gamit ang tandem mass spectrometry (MS/MS) at nuclear magnetic resonance spectroscopy (NMR), natukoy namin ang isang polyphosphorylated linear peptide (Fig. 4c).Bagaman hindi inaasahan, nakakita kami ng ilang mga linya ng ebidensya upang suportahan ang pagiging huling produkto nito: dalawang magkaibang heterologous na host at walang dehydration sa in vitro assays, pagkilala sa mga pangunahing nalalabi na na-mutate sa catalytic dehydration site ng mature enzyme.lahat ay muling itinayo ng "Ca".Ang E. malaspinii genome (pinalawak na data, Fig. 9 at karagdagang impormasyon) at, sa wakas, ang biological na aktibidad ng phosphorylated na produkto, ngunit hindi ang chemically synthesized na dehydrated form (Fig. 4d).Sa katunayan, nalaman namin na ito ay nagpapakita ng isang mababang micromolar protease inhibitory na aktibidad laban sa neutrophil elastase, na maihahambing sa iba pang mga kaugnay na likas na produkto sa hanay ng konsentrasyon (IC50 = 14.3 μM) 44, sa kabila ng katotohanan na ang papel na ekolohikal ay nananatiling ipaliwanag.Batay sa mga resultang ito, ipinapanukala naming pangalanan ang pathway na "phospheptin".
Ang pangalawang kaso ay isang kumplikadong RiPP pathway na tiyak sa 'Ca.Ang genus Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) ay hinulaang mag-encode ng mga natural na produkto ng protina (Fig. 4e).Ang mga landas na ito ay may partikular na biotechnological na interes dahil sa inaasahang density at iba't ibang mga hindi pangkaraniwang pagbabago sa kemikal na itinatag ng mga enzyme na naka-encode ng medyo maikling BGCs45.Natagpuan namin na ang protina na ito ay naiiba sa dating nailalarawan na mga protina dahil kulang ito sa parehong pangunahing NX5N motif ng polyceramides at ang lanthionine loop ng landornamides 46 .Upang malampasan ang mga limitasyon ng mga karaniwang heterologous expression pattern, ginamit namin ang mga ito kasama ng isang custom na Microvirgula aerodenitrificans system upang makilala ang apat na mature na pathway enzymes (paraan).Gamit ang kumbinasyon ng MS/MS, isotope labeling, at NMR, nakita namin ang mga mature na enzyme na ito sa 46-amino acid core ng peptide (Fig. 4f,g, pinalawak na data, Fig. 10–12 at karagdagang impormasyon).Sa mga mature na enzyme, nailalarawan namin ang unang hitsura ng isang FkbM O-methyltransferase na miyembro ng pamilya 47 sa RiPP pathway at hindi inaasahang natagpuan na ang mature na enzyme na ito ay nagpapakilala ng backbone N-methylation (Fig. 4h, i at karagdagang impormasyon).Bagama't kilala ang pagbabagong ito sa mga natural na produkto ng NRP48, ang enzymatic N-methylation ng mga amide bond ay isang kumplikado ngunit biotechnologically makabuluhang reaksyon49 na sa ngayon ay interesado sa RiPP na pamilya ng mga borosines.Pagtitiyak 50,51.Ang pagkakakilanlan ng aktibidad na ito sa ibang mga pamilya ng mga enzyme at RiPP ay maaaring magbukas ng mga bagong aplikasyon at palawakin ang functional na pagkakaiba-iba ng mga protina 52 at ang kanilang kemikal na pagkakaiba-iba.Batay sa mga natukoy na pagbabago at hindi pangkaraniwang haba ng iminungkahing istraktura ng produkto, nagmumungkahi kami ng pangalan ng pathway na "pythonamide".
Ang pagtuklas ng hindi inaasahang enzymology sa isang functionally characterized na pamilya ng mga enzyme ay naglalarawan ng pangako ng environmental genomics para sa mga bagong pagtuklas, at inilalarawan din ang limitadong kapasidad para sa functional inference batay sa sequence homology lamang.Kaya, kasama ang mga ulat ng non-canonical bioactive polyphosphorylated RiPPs, ang aming mga resulta ay nagpapakita ng mapagkukunan-intensive ngunit kritikal na halaga sa mga pagsisikap ng synthetic biology upang ganap na matuklasan ang functional na kayamanan, pagkakaiba-iba, at hindi pangkaraniwang mga istruktura ng mga biochemical compound.
Dito ipinapakita namin ang hanay ng mga potensyal na biosynthetic na naka-encode ng mga mikrobyo at ang kanilang genomic na konteksto sa pandaigdigang marine microbiome, na pinapadali ang pananaliksik sa hinaharap sa pamamagitan ng paggawa ng nagresultang mapagkukunan na magagamit sa komunidad na pang-agham (https://microbiomics.io/ocean/).Natagpuan namin na ang karamihan sa kanyang phylogenetic at functional novelty ay maaari lamang makuha sa pamamagitan ng muling pagtatayo ng mga MAG at SAG, lalo na sa mga underutilized na microbial na komunidad na maaaring gumabay sa hinaharap na mga pagsusumikap sa bioprospecting.Bagama't tututukan natin dito ang 'Ca.Eudormicrobiaceae" bilang isang lineage lalo na sa biosynthetically "talented", marami sa mga BGC na hinulaang sa hindi natuklasang microbiota ay malamang na nag-encode ng mga dati nang hindi inilarawang enzymologies na nagbubunga ng mga compound na may mga aksyong pangkapaligiran at/o biotechnologically.
Ang mga metagenomic na dataset mula sa mga pangunahing pag-aaral ng oceanographic at time series na may sapat na lalim ng pagkakasunud-sunod ay isinama upang ma-maximize ang saklaw ng mga pandaigdigang marine microbial na komunidad sa mga basin ng karagatan, malalim na mga layer at sa paglipas ng panahon.Ang mga dataset na ito (Karagdagang Talahanayan 1 at Larawan 1) ay kinabibilangan ng metagenomics mula sa mga sample na nakolekta sa mga karagatan ng Tara (viral enriched, n=190; prokaryotic enriched, n=180) 12,22 at ang BioGEOTRACES expedition (n=480).Hawaiian Oceanic Time Series (HOT, n = 68), Bermuda-Atlantic Time Series (BATS, n = 62)21 at ang Malaspina Expedition (n = 58)23.Ang mga sequencing read mula sa lahat ng metagenomic fragment ay na-filter para sa kalidad gamit ang BBMap (v.38.71) sa pamamagitan ng pag-alis ng mga sequencing adapter mula sa mga reads, pag-alis ng mga read na nakamapa sa quality control sequence (PhiX genomes), at paggamit ng trimq=14, maq=20 ay nagtatapon ng mahinang kalidad ng pagbabasa, maxns = 0 at minlength = 45. Ang mga kasunod na pagsusuri ay pinatakbo o pinagsama sa mga QC reads kung tinukoy (bbmerge.sh minoverlap=16).Ang mga pagbabasa ng QC ay na-normalize (target ng bbnorm.sh = 40, minddepth = 0) bago ang pagbuo gamit ang metaSPAdes (v.3.11.1 o v.3.12 kung kinakailangan)53.Ang mga nagresultang scaffold contigs (mula rito ay tinutukoy bilang scaffolds) ay sa wakas ay na-filter ng haba (≥1 kb).
Ang 1038 metagenomic sample ay hinati sa mga grupo, at para sa bawat grupo ng mga sample, ang metagenomic quality control reads ng lahat ng sample ay itinugma sa mga bracket ng bawat sample nang hiwalay, na nagreresulta sa sumusunod na bilang ng pairwise bracketed group reads: Tara Marine Viruses – Enriched (190×190 ), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT at BATS (610×610) at Malaspina (58×58).Ginawa ang pagmamapa gamit ang Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 na nagpapahintulot sa mga pagbabasa na maitugma sa mga pangalawang site (gamit ang -a flag).Na-filter ang mga alignment na hindi bababa sa 45 base ang haba, may ≥97% na pagkakakilanlan, at span ng ≥80% na pagbabasa.Ang mga nagresultang BAM file ay naproseso gamit ang jgi_summarize_bam_contig_depths script para sa MetaBAT2 (v.2.12.1)55 upang magbigay ng intra- at inter-sample na saklaw para sa bawat pangkat.Sa wakas, pinagsama-sama ang mga bracket upang mapataas ang sensitivity sa pamamagitan ng indibidwal na pagpapatakbo ng MetaBAT2 sa lahat ng mga sample na may –minContig 2000 at –maxEdges 500. Ginagamit namin ang MetaBAT2 sa halip na isang ensemble boxer dahil ipinakita ito sa mga independyenteng pagsubok bilang ang pinakaepektibong single boxer.at 10 hanggang 50 beses na mas mabilis kaysa sa iba pang karaniwang ginagamit na boksingero57.Para masubukan ang epekto ng abundance correlations, isang random na napiling subsample ng metagenomics (10 para sa bawat isa sa dalawang Tara Ocean datasets, 10 para sa BioGEOTRACES, 5 para sa bawat time series, at 5 para sa Malaspina) ay gumamit lamang ng mga sample.Ang mga panloob na sample ay pinagsama-sama upang makakuha ng impormasyon sa saklaw.(Karagdagang impormasyon).
Ang mga karagdagang (panlabas) na genome ay kasama sa kasunod na pagsusuri, katulad ng 830 na manu-manong piniling MAG mula sa isang subset ng Tara Oceans26 dataset, 5287 SAG mula sa GORG20 dataset, at data mula sa database ng MAR (MarDB v. 4) mula sa 1707 nakahiwalay na REF at 682 SAGs) 27. Para sa dataset ng MarDB, pinipili ang mga genome batay sa magagamit na metadata kung ang uri ng sample ay tumutugma sa sumusunod na regular na expression: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] ihiwalay'.
Ang kalidad ng bawat metagenomic na lalagyan at mga panlabas na genome ay tinasa gamit ang CheckM (v.1.0.13) at Anvi'o's Lineage Workflow (v.5.5.0)58,59.Kung ang CheckM o Anvi'o ay nag-ulat ng ≥50% na pagkakumpleto/pagkakumpleto at ≤10% ng kontaminasyon/kalabisan, pagkatapos ay i-save ang metagenomic na mga cell at mga panlabas na genome para sa pagsusuri sa ibang pagkakataon.Ang mga markang ito ay pinagsama-sama sa mean completeness (mcpl) at mean contamination (mctn) upang uriin ang kalidad ng genome ayon sa pamantayan ng komunidad60 tulad ng sumusunod: mataas na kalidad: mcpl ≥ 90% at mctn ≤ 5%;magandang kalidad: mcpl ≥ 70%, mctn ≤ 10%, katamtamang kalidad: mcpl ≥ 50% at mctn ≤ 10%, patas na kalidad: mcpl ≤ 90% o mctn ≥ 10%.Ang mga na-filter na genome ay pagkatapos ay iniugnay sa mga marka ng kalidad (Q at Q') tulad ng sumusunod: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (strain variability)/100 + 0.5 x log[N50] .(ipinatupad sa dRep61).
Upang payagan ang paghahambing na pagsusuri sa pagitan ng iba't ibang mga mapagkukunan ng data at mga uri ng genome (MAG, SAG at REF), 34,799 na genome ang na-dereference batay sa genome-wide average nucleotide identity (ANI) gamit ang dRep (v.2.5.4).Umuulit)61 ​​na may 95% ANI threshold28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) at single-copy marker genes gamit ang SpecI63 na nagbibigay ng genome clustering sa antas ng species.Ang isang kinatawan ng genome ay napili para sa bawat kumpol ng dRep ayon sa pinakamataas na marka ng kalidad (Q') na tinukoy sa itaas, na itinuturing na kinatawan ng mga species.
Upang suriin ang bilis ng pagmamapa, ginamit ang BWA (v.0.7.17-r1188, -a) upang i-map ang lahat ng 1038 set ng metagenomic reads na may 34,799 genome na nakapaloob sa OMD.Ang mga pagbabasa na kinokontrol ng kalidad ay na-map sa single-ended mode at ang mga resultang alignment ay na-filter upang mapanatili lamang ang mga alignment na ≥45 bp ang haba.at pagkakakilanlan ≥95%.Ang display ratio para sa bawat sample ay ang porsyento ng mga natitira sa pagbabasa pagkatapos ng pagsasala na hinati sa kabuuang bilang ng mga pagbabasa ng kontrol sa kalidad.Gamit ang parehong diskarte, ang bawat isa sa 1038 metagenomes ay nabawasan sa 5 milyong pagsingit (pinalawak na data, Fig. 1c) at naitugma sa GORG SAG sa OMD at sa lahat ng GEM16.Ang dami ng mga MAG na nakuhang muli mula sa tubig-dagat sa GEM16 catalog ay natukoy sa pamamagitan ng mga keyword query ng metagenomic sources, pagpili ng mga sample ng tubig-dagat (hal., kumpara sa marine sediments).Sa partikular, pipiliin namin ang "aquatic" bilang "ecosystem_category", "marine" bilang "ecosystem_type", at sinasala ang "habitat" bilang "deep ocean", "marine", "maritime oceanic", "pelagic marine", "marine water" , "Karagatan", "Tubig sa Dagat", "Tubig sa Ibabaw ng Dagat", "Tubig sa Ibabaw ng Dagat".Nagresulta ito sa 5903 MAG (734 mataas na kalidad) na ipinamahagi sa 1823 OTU (mga view dito).
Ang mga prokaryotic genome ay may taxonomically annotated gamit ang GTDB-Tk (v.1.0.2)64 na may mga default na parameter na nagta-target sa GTDB r89 version 13. Ginamit ang Anvi'o upang matukoy ang mga eukaryotic genome batay sa domain prediction at recall ≥50% at redundancy ≤ 10%.Ang taxonomic annotation ng isang species ay tinukoy bilang isa sa mga kinatawan nitong genome.Maliban sa mga eukaryotes (148 MAG), ang bawat genome ay unang na-annotate gamit ang prokka (v.1.14.5)65, na pinangalanan ang kumpletong mga gene, na tumutukoy sa mga parameter na "archaea" o "bacteria" kung kinakailangan, na iniulat din para sa hindi- coding genes.at mga rehiyon ng CRISPR, bukod sa iba pang mga genomic na tampok.I-annotate ang mga hinulaang gene sa pamamagitan ng pagtukoy ng unibersal na single-copy marker genes (uscMG) gamit ang fetchMG (v.1.2)66, magtalaga ng mga ortholog group at query gamit ang emapper (v.2.0.1)67 batay sa eggNOG (v.5.0)68.KEGG database (na-publish noong Pebrero 10, 2020) 69. Ang huling hakbang ay isinagawa sa pamamagitan ng pagtutugma ng mga protina sa KEGG database gamit ang DIAMOND (v.0.9.30)70 na may saklaw ng query at paksa na ≥70%.Ang mga resulta ay na-filter pa ayon sa NCBI Prokaryotic Genome Annotation Pipeline71 batay sa bitrate ≥ 50% ng maximum na inaasahang bitrate (link mismo).Ginamit din ang mga sequence ng gene bilang input upang makilala ang mga BGC sa genome gamit ang antiSMASH (v.5.1.0)72 na may mga default na parameter at iba't ibang pagsabog ng kumpol.Ang lahat ng genome at annotation ay pinagsama-sama sa OMD kasama ang contextual metadata na available sa web (https://microbiomics.io/ocean/).
Katulad ng naunang inilarawan na mga pamamaraan12,22 gumamit kami ng CD-HIT (v.4.8.1) upang kumpol >56.6 milyong protina-coding genes mula sa bacterial at archaeal genome mula sa OMD sa 95% identity at mas maiikling genes (90% coverage)73 hanggang sa >17.7 milyong mga kumpol ng gene.Ang pinakamahabang pagkakasunud-sunod ay pinili bilang kinatawan ng gene para sa bawat kumpol ng gene.Ang 1038 metagenom ay pagkatapos ay naitugma sa> 17.7 milyong BWA (-a) na mga miyembro ng cluster at ang mga nagresultang BAM file ay na-filter upang mapanatili lamang ang mga pagkakahanay na may ≥95% na porsyento na pagkakakilanlan at ≥45 na mga base alignment.Ang haba-normalized na kasaganaan ng gene ay kinakalkula sa pamamagitan ng unang pagbibilang ng mga pagsingit mula sa pinakamahusay na natatanging pagkakahanay at pagkatapos, para sa malabo-mapa na mga pagsingit, pagdaragdag ng mga fractional na bilang sa kaukulang target na mga gene na proporsyonal sa kanilang bilang ng mga natatanging pagsingit.
Ang mga genome mula sa pinalawak na OMD (na may mga karagdagang MAG mula sa "Ca. Eudormicrobiaceae", tingnan sa ibaba) ay idinagdag sa mOTUs74 metagenomic analysis tool database (v.2.5.1) upang lumikha ng pinahabang mOTU reference database.Anim na single-copy genome lamang (23,528 genome) ang nakaligtas sa sampung uscMGs.Ang pagpapalawak ng database ay nagresulta sa 4,494 karagdagang mga kumpol sa antas ng species.1038 metagenomes ay nasuri gamit ang default na mga parameter ng mOTU (v.2).Isang kabuuan ng 989 genome na nakapaloob sa 644 mOTU clusters (95% REF, 5% SAG at 99.9% na kabilang sa MarDB) ay hindi nakita ng mOTU profile.Sinasalamin nito ang iba't ibang mga karagdagang mapagkukunan ng marine isolation ng MarDB genome (karamihan sa mga hindi natukoy na genome ay nauugnay sa mga organismo na nakahiwalay sa mga sediment, marine host, atbp.).Upang patuloy na tumuon sa bukas na kapaligiran ng karagatan sa pag-aaral na ito, hindi namin sila kasama sa pagsusuri sa ibaba ng agos maliban kung sila ay nakita o kasama sa pinalawak na database ng mOTU na nilikha sa pag-aaral na ito.
Ang lahat ng BGC mula sa MAG, SAG at REF sa OMD (tingnan sa itaas) ay pinagsama sa mga BGC na natukoy sa lahat ng metagenomic scaffolds (antiSMASH v.5.0, mga default na parameter) at nailalarawan gamit ang BiG-SLICE (v.1.1) (PFAM domain )75.Batay sa mga feature na ito, kinakalkula namin ang lahat ng cosine distance sa pagitan ng mga BGC at pinagsama-sama ang mga ito (mean links) sa GCF at GCC gamit ang mga threshold ng distansya na 0.2 at 0.8 ayon sa pagkakabanggit.Ang mga threshold na ito ay isang adaptasyon ng mga threshold na dati nang ginamit gamit ang Euclidean distance75 kasama ang cosine distance, na nagpapagaan ng ilan sa mga error sa orihinal na diskarte sa clustering ng BiG-SLICE (Karagdagang Impormasyon).
Ang mga BGC ay pagkatapos ay na-filter upang mapanatili lamang ang ≥5 kb na naka-encode sa mga scaffold upang mabawasan ang panganib ng fragmentation tulad ng naunang inilarawan16 at upang ibukod ang mga MarDB REF at SAG na hindi natagpuan sa 1038 metagenomes (tingnan sa itaas).Nagresulta ito sa kabuuang 39,055 BGC na na-encode ng OMD genome, na may karagdagang 14,106 na natukoy sa mga metagenomic na fragment (ibig sabihin, hindi pinagsama sa MAGs).Ang mga "metagenomic" na BGC na ito ay ginamit upang matantya ang proporsyon ng potensyal na biosynthesis ng marine microbiome na hindi nakuha sa database (Karagdagang Impormasyon).Ang bawat BGC ay functionally na nailalarawan ayon sa mga predictive na uri ng produkto na tinukoy ng mga anti-SMASH o coarser na mga kategorya ng produkto na tinukoy sa BiG-SCAPE76.Para maiwasan ang sampling bias sa quantification (taxonomic at functional na komposisyon ng GCC/GCF, distansya ng GCF at GCC sa mga database ng sanggunian, at metagenomic abundance ng GCF), sa pamamagitan ng pagpapanatili lamang ng pinakamahabang BGC bawat GCF para sa bawat species, 39,055 BGC ang higit pang na-deduplicate, na nagresulta sa kabuuang 17,689 BGC.
Ang novelty ng GCC at GCF ay nasuri batay sa distansya sa pagitan ng kinakalkula na database (RefSeq database sa BiG-FAM)29 at ang eksperimentong na-verify (MIBIG 2.0)30 BGC.Para sa bawat isa sa 17,689 na kinatawan ng BGC, pinili namin ang pinakamaliit na distansya ng cosine sa kani-kanilang database.Ang mga pinakamababang distansya na ito ay ina-average (mean) ayon sa GCF o GCC, kung naaangkop.Ang isang GCF ay itinuturing na bago kung ang distansya sa database ay higit sa 0.2, na tumutugma sa isang perpektong paghihiwalay sa pagitan ng (average) GCF at ang reference.Para sa GCC, pipiliin namin ang 0.4, na dalawang beses sa threshold na tinukoy ng GCF, upang mai-lock ang isang pangmatagalang relasyon sa mga link.
Ang metagenomic na kasaganaan ng BGC ay tinatantya bilang ang average na kasaganaan ng mga biosynthetic genes nito (tulad ng tinutukoy ng anti-SMASH) na magagamit mula sa mga profile sa antas ng gene.Ang metagenomic abundance ng bawat GCF o GCC ay kinakalkula bilang kabuuan ng mga kinatawan ng BGC (mula sa 17,689).Ang mga mapa ng kasaganaan na ito ay kasunod na na-normalize para sa komposisyon ng cellular gamit ang per-sample na bilang ng mOTU, na isinasaalang-alang din ang mga pagsusumikap sa pagkakasunud-sunod (pinalawak na data, Fig. 1d).Ang paglaganap ng GCF o GCC ay kinakalkula bilang porsyento ng mga sample na may kasaganaan > 0.
Ang distansya ng Euclidean sa pagitan ng mga sample ay kinakalkula mula sa na-normalize na profile ng GCF.Ang mga distansyang ito ay nabawasan sa laki gamit ang UMAP77 at ang mga nagresultang pag-embed ay ginamit para sa unsupervised density-based clustering gamit ang HDBSCAN78.Ang pinakamainam na minimum na bilang ng mga puntos para sa isang cluster (at samakatuwid ang bilang ng mga cluster) na ginagamit ng HDBSCAN ay tinutukoy sa pamamagitan ng pag-maximize sa pinagsama-samang posibilidad ng pagiging miyembro ng cluster.Ang natukoy na mga kumpol (at isang random na balanseng subsample ng mga kumpol na ito upang isaalang-alang ang bias sa permutational multivariate analysis of variance (PERMANOVA)) ay sinubukan para sa kahalagahan laban sa hindi nabawasan na mga distansya ng Euclidean gamit ang PERMANOVA.Ang average na laki ng genome ng mga sample ay kinakalkula batay sa kamag-anak na kasaganaan ng mOTU at ang tinantyang laki ng genome ng mga miyembro ng genome.Sa partikular, ang average na laki ng genome ng bawat mOTU ay tinatantya bilang ang average ng mga laki ng genome ng mga miyembro nito na naitama para sa pagkakumpleto (pagkatapos ng pag-filter) (halimbawa, ang isang 75% kumpletong genome na may haba na 3 Mb ay may nababagay na laki ng 4 Mb).para sa mga medium genome na may integridad ≥70%.Ang average na laki ng genome para sa bawat sample ay pagkatapos ay kinakalkula bilang kabuuan ng mga laki ng genome ng mOTU na natimbang ng kamag-anak na kasaganaan.
Ang isang na-filter na set ng genome-encoded BGCs sa OMD ay ipinapakita sa bacterial at archaeal GTDB trees (sa ≥5 kb frameworks, hindi kasama ang REF at SAG MarDB na hindi natagpuan sa 1038 metagenomes, tingnan sa itaas) at ang kanilang hinulaang mga kategorya ng produkto batay sa phylogenetic posisyon ng genome (tingnan sa itaas).Una naming binawasan ang data ayon sa mga species, gamit ang genome na may pinakamaraming BGC sa species na iyon bilang kinatawan.Para sa visualization, ang mga kinatawan ay higit na nahahati sa mga grupo ng puno, at muli, para sa bawat celled clade, ang genome na naglalaman ng pinakamalaking bilang ng mga BGC ay napili bilang isang kinatawan.Ang mga species na pinayaman ng BGC (hindi bababa sa isang genome na may> 15 BGC) ay higit pang nasuri sa pamamagitan ng pagkalkula ng Shannon Diversity Index para sa mga uri ng produkto na naka-encode sa mga BGC na iyon.Kung pareho ang lahat ng hinulaang uri ng produkto, ang mga kemikal na hybrid at iba pang kumplikadong BGC (gaya ng hinulaang ng anti-SMAH) ay itinuturing na kabilang sa parehong uri ng produkto, anuman ang pagkakasunud-sunod ng mga ito sa cluster (hal. protein-bacteriocin at bacteriocin-proteoprotein fusion katawan).hybrid).
Natitirang DNA (tinatayang 6 ng) mula sa Malaspina sample na MP1648, na tumutugma sa biological sample na SAMN05421555 at tumugma sa Illumina SRR3962772 metagenomic read set para sa maikling pagbasa, naproseso ayon sa PacBio sequencing protocol na may ultra-low input para magamit ang PacBio kit na sample amplification gDNA kit (100-980-000) at SMRTbell Express 2.0 template preparation kit (100-938-900).Sa madaling sabi, ang natitirang DNA ay pinutol, inayos at nilinis (ProNex beads) gamit ang Covaris (g-TUBE, 52104).Ang purified DNA ay sasailalim sa paghahanda ng library, amplification, purification (ProNex beads) at pagpili ng laki (>6 kb, Blue Pippin) bago ang huling hakbang sa purification (ProNex beads) at sequencing sa Sequel II platform.
Muling pagtatayo ng unang dalawang ca.Para sa MAG Eremiobacterota, nakilala namin ang anim na karagdagang ANI> 99% (ito ay kasama sa Figure 3), na una ay na-filter batay sa mga marka ng kontaminasyon (na kalaunan ay nakilala bilang mga pagdoble ng gene, tingnan sa ibaba).Nakakita rin kami ng tray na may label na "Ca".Eremiobacterota" mula sa iba't ibang pag-aaral23 at ginamit ang mga ito kasama ng walong MAG mula sa aming pag-aaral bilang sanggunian para sa metagenomic reads mula sa 633 eukaryotic enriched (>0.8 µm) sample gamit ang BWA (v.0.7.17) Ref -r1188, – isang flag) para sa downsampled pagmamapa (5 milyong nabasa).Batay sa mga mapa na partikular sa pagpapayaman (na-filter ng 95% pagkakakilanlan ng pagkakahanay at 80% na saklaw ng pagbasa), 10 metagenomes (inaasahang saklaw ≥5 ×) ang napili para sa pagpupulong at isang karagdagang 49 metagenomes (inaasahang saklaw ≥1 ×) para sa ugnayan ng nilalaman.Gamit ang parehong mga parameter tulad ng sa itaas, ang mga sample na ito ay binned at 10 karagdagang 'Ca's ay idinagdag.Ang MAG Eremiobacterota ay naibalik na.Ang 16 MAG na ito (hindi binibilang ang dalawa na nasa database) ay nagdala ng kabuuang bilang ng mga genome sa pinalawak na OMD sa 34,815.Ang mga MAG ay itinalaga ng mga taxonomic na ranggo batay sa kanilang genomic na pagkakapareho at posisyon sa GTDB.Ang 18 MAG ay na-dereplicated gamit ang dRep sa 5 species (intraspecific ANI>99%) at 3 genera (intrageneric ANI 85% hanggang 94%) sa loob ng parehong pamilya79.Ang mga kinatawan ng species ay manu-manong pinili batay sa integridad, kontaminasyon, at N50.Ang iminumungkahing katawagan ay ibinibigay sa Karagdagang Impormasyon.
Tayahin ang integridad at kontaminasyon ng 'Ca.MAG Eremiobacterota, sinuri namin ang pagkakaroon ng uscMG, pati na rin ang lineage- at domain-specific na single-copy marker gene set na ginagamit ng CheckM at Anvi'o.Ang pagkakakilanlan ng 2 duplicate sa 40 uscMGs ay nakumpirma ng phylogenetic reconstruction (tingnan sa ibaba) upang mamuno sa anumang potensyal na kontaminasyon (ito ay tumutugma sa 5% batay sa 40 marker genes na ito).Isang karagdagang pag-aaral ng limang kinatawan ng MAGs 'Ca.Ang mababang antas ng mga contaminant sa mga reconstructed genome na ito ay nakumpirma para sa Eremiobacterota species gamit ang interactive na interface ng Anvi'o batay sa kasaganaan at pagkakasunud-sunod na mga ugnayan ng komposisyon (Karagdagang Impormasyon)59.
Para sa pagsusuri ng phylogenomic, pumili kami ng limang kinatawan ng MAG "Ca".Eudormicrobiaceae", lahat ng species "Ca.Ang genome ng Eremiobacterota at mga miyembro ng iba pang phyla (kabilang ang UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria at Planctomycetota) ay makukuha mula sa GTDB (r89)13.Ang lahat ng mga genome na ito ay na-annotate tulad ng naunang inilarawan para sa solong kopya ng marker gene extraction at BGC annotation.Ang mga genome ng GTDB ay natipid ayon sa integridad at pamantayan sa kontaminasyon sa itaas.Ang pagsusuri ng phylogenetic ay isinagawa gamit ang Anvi'o Phylogenetics59 workflow.Ang puno ay itinayo gamit ang IQTREE (v.2.0.3) (mga default na opsyon at -bb 1000)80 sa isang pagkakahanay ng 39 tandem ribosomal na protina na kinilala ng Anvi'o (MUSCLE, v.3.8.1551)81.Nabawasan ang kanyang mga posisyon.upang masakop ang hindi bababa sa 50% ng genome82 at ang Planctomycecota ay ginamit bilang isang outgroup batay sa GTDB tree topology.Isang puno ng 40 uscMG ang ginawa gamit ang parehong mga tool at parameter.
Ginamit namin ang Traitar (v.1.1.2) na may mga default na parameter (phenotype, mula sa mga nucleotides)83 upang mahulaan ang mga karaniwang microbial na katangian.Ginalugad namin ang isang potensyal na predatory lifestyle batay sa isang dating binuo na predatory index84 na nakasalalay sa nilalaman ng isang protina-coding gene sa genome.Sa partikular, ginagamit namin ang DIAMOND upang ihambing ang mga protina sa genome laban sa OrthoMCL database (v.4)85 gamit ang mga opsyon –mas-sensitive –id 25 –query-cover 70 –subject-cover 70 –top 20 AT bilangin ang mga gene na tumutugma sa ang mga marker genes para sa mga mandaragit at hindi mandaragit.Ang index ay ang pagkakaiba sa pagitan ng bilang ng mga markang mandaragit at hindi mandaragit.Bilang karagdagang kontrol, sinuri din namin ang genome ng "Ca".Ang kadahilanan ng Entotheonella TSY118 ay batay sa kaugnayan nito sa Ca.Eudoremicrobium (malaking laki ng genome at potensyal na biosynthetic).Susunod, sinubukan namin ang mga potensyal na link sa pagitan ng predator at non-predator marker genes at ang biosynthetic na potensyal ng Ca.Eudormicrobiaceae" at nalaman na hindi hihigit sa isang gene (mula sa anumang uri ng marker gene, ibig sabihin, predator/non-predator gene) ang magkakapatong sa BGC, na nagmumungkahi na ang BGC ay hindi nalilito ang mga signal ng predation.Ang karagdagang genomic annotation ng mga scrambled replicon ay isinagawa gamit ang TXSSCAN (v.1.0.2) upang partikular na suriin ang secretion system, pili, at flagella86.
Limang kinatawan ng 'Ca's ang na-map sa pamamagitan ng pagmamapa ng 623 metatranscriptome mula sa prokaryotic at eukaryotic enrichment fractions ng Tara oceans22,40,87 (gamit ang BWA, v.0.7.17-r1188, -a flag).Eudormicrobiaceae genome.Ang mga BAM file ay naproseso gamit ang FeatureCounts (v.2.0.1)88 pagkatapos ng 80% read coverage at 95% identity filtering (na may mga opsyon na featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Binibilang ang bilang ng mga pagsingit sa bawat gene.Ang mga nabuong mapa ay na-normalize para sa haba ng gene at marker gene abundance mOTU (length-normalized average insertion count para sa mga gene na may insertion count>0) at log-transformed sa 22.74 upang makuha ang relative expression sa bawat cell ng bawat gene level, na nagpapaliwanag din sa pagkakaiba-iba mula sa sample hanggang sa sample sa panahon ng sequencing.Ang ganitong mga ratio ay nagbibigay-daan para sa paghahambing na pagsusuri, pagpapagaan ng mga problema sa komposisyon kapag gumagamit ng kamag-anak na data ng kasaganaan.Ang mga sample lamang na may> 5 ng 10 mOTU marker genes ang isinasaalang-alang para sa karagdagang pagsusuri upang payagan ang isang malaking sapat na bahagi ng genome na matukoy.
Ang normalized transcriptome profile ng 'Ca.Ang E. taraoceanii ay sumailalim sa dimensionality reduction gamit ang UMAP at ang resultang representasyon ay ginamit para sa unsupervised clustering gamit ang HDBSCAN (tingnan sa itaas) upang matukoy ang katayuan ng expression.Ang PERMANOVA ay sumusubok sa kahalagahan ng mga pagkakaiba sa pagitan ng mga natukoy na kumpol sa orihinal (hindi binawasan) na espasyo ng distansya.Ang pagkakaiba-iba ng pagpapahayag sa pagitan ng mga kundisyong ito ay nasubok sa buong genome (tingnan sa itaas) at 201 na mga landas ng KEGG ay nakilala sa 6 na functional na grupo, katulad ng: BGC, sistema ng pagtatago at mga flagellar na gene mula sa TXSSCAN, mga degradasyon na enzyme (protease at peptidases), at predatory at non- mga predatory genes.predatory index marker.Para sa bawat sample, kinakalkula namin ang median na normalized na expression para sa bawat klase (tandaan na ang BGC expression mismo ay kinakalkula bilang median expression ng biosynthetic genes para sa BGC na iyon) at sinubukan para sa kahalagahan sa mga estado (Kruskal-Wallis test na naayos para sa FDR).
Ang mga sintetikong gene ay binili mula sa GenScript at ang mga PCR primer ay binili mula sa Microsynth.Ang Phusion polymerase mula sa Thermo Fisher Scientific ay ginamit para sa DNA amplification.Ang NucleoSpin plasmids, NucleoSpin gel at PCR purification kit mula sa Macherey-Nagel ay ginamit para sa paglilinis ng DNA.Ang mga restriction enzymes at T4 DNA ligase ay binili mula sa New England Biolabs.Ang mga kemikal maliban sa isopropyl-β-d-1-thiogalactopyranoside (IPTG) (Biosynth) at 1,4-dithiothreitol (DTT, AppliChem) ay binili mula sa Sigma-Aldrich at ginamit nang walang karagdagang paglilinis.Ang mga antibiotic na chloramphenicol (Cm), spectinomycin dihydrochloride (Sm), ampicillin (Amp), gentamicin (Gt), at carbenicillin (Cbn) ay binili mula sa AppliChem.Ang mga bahagi ng media ng Bacto Tryptone at Bacto Yeast Extract ay binili mula sa BD Biosciences.Ang Trypsin para sa sequencing ay binili mula sa Promega.
Ang mga pagkakasunud-sunod ng gene ay nakuha mula sa anti-SMASH na hinulaang BGC 75.1.E. malaspinii (Karagdagang impormasyon).
Ang mga gene na embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), at embAM (kabilang ang mga intergene na rehiyon) ay na-sequence bilang mga synthetic na konstruksyon at A na may pdonR57 na mga konstruksyon(EmbAM) na walang synthetic na pdonR. kailan.Ang embA gene ay na-subclone sa unang multiple cloning site (MCS1) ng pACYCDuet-1(CmR) at pCDFDuet-1(SmR) kasama ang BamHI at HindIII na mga cleavage site.Ang embM at embMopt genes (codon-optimized) ay na-subclone sa MCS1 pCDFDuet-1(SmR) kasama ang BamHI at HindIII at inilagay sa pangalawang multiple cloning site ng pCDFDuet-1(SmR) at pRSFDuet-1(KanR) (MCS2) na may NdeI/ChoI.Ang embAM cassette ay na-subclone sa pCDFDuet1(SmR) kasama ang BamHI at HindIII na mga cleavage site.Ang orf3/embI gene (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) ay itinayo sa pamamagitan ng overlap extension PCR gamit ang mga primer na EmbI_OE_F_NdeI at EmbI_OE_R_XhoI, digested na may NdeI/XhoIFDuction na enzyme (re-1) na may parehong NdeI/XhoIFD, at na-ligated sa parehong NdeI/XhoIFDE, at na-ligated na enzyme (re-1 sMC1) Pandagdag talahanayan).6).Ang paghihigpit sa pagtunaw ng enzyme at ligation ay isinagawa ayon sa protocol ng tagagawa (New England Biolabs).

 


Oras ng post: Mar-14-2023