Spawana zwijana rura / rurka ze stali nierdzewnej 304 zomponent, potencjał biosyntetyczny globalnego mikrobiomu morskiego

Dziękujemy za odwiedzenie Nature.com.Używasz wersji przeglądarki z ograniczoną obsługą CSS.Aby uzyskać najlepszą jakość, zalecamy użycie zaktualizowanej przeglądarki (lub wyłączenie trybu zgodności w przeglądarce Internet Explorer).Dodatkowo, aby zapewnić bieżące wsparcie, pokazujemy witrynę bez stylów i JavaScript.
Suwaki pokazujące trzy artykuły na slajd.Użyj przycisków Wstecz i Dalej, aby poruszać się po slajdach, lub przycisków kontrolera slajdów na końcu, aby poruszać się po poszczególnych slajdach.

Szczegółowy opis produktu

Zwijana rura / rurka ze stali nierdzewnej 304
1. Specyfikacja: Rura / rurka ze stali nierdzewnej
2. Typ: spawany lub bez szwu
3. Norma: ASTM A269, ASTM A249
4. Rurka cewki ze stali nierdzewnej OD: 6 mm do 25,4 mm
5. Długość: 600-3500 MM lub zgodnie z wymaganiami klienta.
6. Grubość ścianki: 0,2 mm do 2,0 mm.

7. Tolerancja: OD: +/-0,01 mm;Grubość: +/-0,01%.

8. Rozmiar wewnętrznego otworu cewki: 500 MM-1500 MM (można dostosować do wymagań klienta)

9. Wysokość cewki: 200 MM-400 MM (można dostosować do wymagań klienta)

10. Powierzchnia: jasna lub wyżarzana
11. Materiał: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, stop 625, 825, 2205, 2507 itd.
12. Pakowanie: tkane torby w drewnianej skrzynce, drewnianej palecie, drewnianym wale lub zgodnie z wymaganiami klienta
13. Badanie: składnik chemiczny, granica plastyczności, wytrzymałość na rozciąganie, pomiar twardości
14. Gwarancja: Kontrola strony trzeciej (na przykład: SGS TV) itp.
15. Zastosowanie: dekoracja, meble, transport oleju, wymiennik ciepła, produkcja balustrad, produkcja papieru, motoryzacja, przetwórstwo spożywcze, medycyna itp.

Cały skład chemiczny i właściwości fizyczne stali nierdzewnej jak poniżej:

Materiał ASTM A269 Skład chemiczny % Max
C Mn P S Si Cr Ni Mo Uwaga Nb Ti
TP304 0,08 2.00 0,045 0,030 1,00 18,0-20,0 8,0-11,0 ^ ^ ^ . ^
TP304L 0,035 2.00 0,045 0,030 1,00 18,0-20,0 8,0-12,0 ^ ^ ^ ^
TP316 0,08 2.00 0,045 0,030 1,00 16,0-18,0 10,0-14,0 2.00-3.00 ^ ^ ^
TP316L 0,035 D 2.00 0,045 0,030 1,00 16,0-18,0 10,0-15,0 2.00-3.00 ^ ^ ^
TP321 0,08 2.00 0,045 0,030 1,00 17,0-19,0 9,0-12,0 ^ ^ ^ 5C -0,70
TP347 0,08 2.00 0,045 0,030 1,00 17,0-19,0 9,0-12,0 10C -1.10 ^

 

Materiał Obróbka cieplna Temperatura F (C) Min. Twardość
Brinella Rockwella
TP304 Rozwiązanie 1900 (1040) 192HBW/200HV 90HRB
TP304L Rozwiązanie 1900 (1040) 192HBW/200HV 90HRB
TP316 Rozwiązanie 1900(1040) 192HBW/200HV 90HRB
TP316L Rozwiązanie 1900(1040) 192HBW/200HV 90HRB
TP321 Rozwiązanie 1900(1040) F 192HBW/200HV 90HRB
TP347 Rozwiązanie 1900(1040) 192HBW/200HV 90HRB

 

średnica zewnętrzna, cale Tolerancja średnicy zewnętrznej cale (mm) Tolerancja wagowa% Tolerancja długości cale (mm)
+ -
≤ 1 / 2 ± 0,005 ( 0,13 ) ± 15 1/8 (3,2) 0
> 1/2 ~1 1/2 ± 0,005(0,13) ± 10 1 / 8 (3,2) 0
> 1 1 / 2 ~< 3 1 / 2 ± 0,010(0,25) ± 10 3 / 16 (4,8) 0
> 3 1/2 ~< 5 1/2 ± 0,015(0,38) ± 10 3 / 16 (4,8) 0
> 5 1 / 2 ~< 8 ± 0,030(0,76) ± 10 3 / 16 (4,8) 0
8 ~ < 12 ± 0,040(1,01) ± 10 3 / 16 (4,8) 0
12 ~ < 14 ± 0,050(1,26) ± 10 3 / 16 (4,8) 0

Naturalne zbiorowiska drobnoustrojów są zróżnicowane filogenetycznie i metabolicznie.Oprócz niedostatecznie zbadanych grup organizmów1, różnorodność ta kryje w sobie również bogaty potencjał odkrywania ważnych ekologicznie i biotechnologicznie enzymów i związków biochemicznych2,3.Jednakże badanie tej różnorodności w celu określenia szlaków genomowych syntetyzujących takie związki i wiążących je z odpowiednimi gospodarzami pozostaje wyzwaniem.Potencjał biosyntetyczny mikroorganizmów w otwartym oceanie pozostaje w dużej mierze nieznany ze względu na ograniczenia w analizie danych dotyczących rozdzielczości całego genomu w skali globalnej.Tutaj badamy różnorodność i różnorodność skupisk genów biosyntetycznych w oceanie, integrując około 10 000 genomów drobnoustrojów z hodowanych komórek i pojedynczych komórek z ponad 25 000 nowo zrekonstruowanych genomów roboczych z ponad 1000 próbek wody morskiej.Wysiłki te pozwoliły zidentyfikować około 40 000 przypuszczalnych, głównie nowych, biosyntetycznych klastrów genów, z których część odkryto we wcześniej nieoczekiwanych grupach filogenetycznych.W tych populacjach zidentyfikowaliśmy linię wzbogaconą w biosyntetyczne klastry genów („Candidatus Eudormicrobiaceae”), które należały do ​​nieuprawnego typu bakterii i obejmowały niektóre z najbardziej zróżnicowanych biosyntetycznie mikroorganizmów w tym środowisku.Spośród nich scharakteryzowaliśmy szlaki fosfatazy-peptydu i pytonamidu, identyfikując odpowiednio przypadki niezwykłej struktury związku bioaktywnego i enzymologii.Podsumowując, badanie to pokazuje, w jaki sposób strategie oparte na mikrobiomie mogą umożliwić eksplorację wcześniej nieopisanych enzymów i naturalnej żywności w słabo poznanej mikrobiocie i środowisku.
Mikroby napędzają globalne cykle biogeochemiczne, utrzymują sieci troficzne oraz utrzymują rośliny i zwierzęta w zdrowiu5.Ich ogromna różnorodność filogenetyczna, metaboliczna i funkcjonalna stanowi bogaty potencjał odkrywania nowych taksonów1, enzymów i związków biochemicznych, w tym produktów naturalnych6.W społecznościach ekologicznych cząsteczki te zapewniają mikroorganizmom różnorodne funkcje fizjologiczne i ekologiczne, od komunikacji po konkurencję 2, 7 .Oprócz swoich pierwotnych funkcji, te naturalne produkty i ich genetycznie zakodowane ścieżki produkcji dostarczają przykładów zastosowań biotechnologicznych i terapeutycznych2,3.Identyfikacja takich ścieżek i połączeń została znacznie ułatwiona dzięki badaniu hodowanych drobnoustrojów.Badania taksonomiczne środowisk przyrodniczych wykazały jednak, że zdecydowana większość mikroorganizmów nie była uprawiana8.To uprzedzenie kulturowe ogranicza naszą zdolność do wykorzystania różnorodności funkcjonalnej kodowanej przez wiele drobnoustrojów4,9.
Aby przezwyciężyć te ograniczenia, postęp technologiczny, jaki dokonał się w ciągu ostatniej dekady, umożliwił naukowcom bezpośrednie (tj. bez wcześniejszej hodowli) sekwencjonowanie fragmentów DNA drobnoustrojów z całych zbiorowisk (metagenomika) lub pojedynczych komórek.Możliwość złożenia tych fragmentów w większe fragmenty genomu i rekonstrukcji odpowiednio wielu genomów złożonych metagenomicznie (MAG) lub pojedynczych amplifikowanych genomów (SAG), otwiera ważną szansę na taksocentryczne badania mikrobiomu (tj. zbiorowisk drobnoustrojów i mikrobiomu).wytyczyć nowe ścieżki.własny materiał genetyczny w danym środowisku) 10,11,12.Rzeczywiście, ostatnie badania znacznie rozszerzyły filogenetyczną reprezentację różnorodności drobnoustrojów na Ziemi1, 13 i ujawniły znaczną część różnorodności funkcjonalnej w poszczególnych zbiorowiskach drobnoustrojów, która wcześniej nie była objęta referencyjnymi sekwencjami genomu hodowanych mikroorganizmów (REF)14.Zdolność do umieszczenia nieodkrytej różnorodności funkcjonalnej w kontekście genomu gospodarza (tj. rozdzielczości genomu) ma kluczowe znaczenie dla przewidywania jeszcze niescharakteryzowanych linii drobnoustrojów, które prawdopodobnie kodują nowe produkty naturalne15,16 lub śledzenia takich związków aż do ich pierwotnego producenta17.Na przykład łączone podejście do analizy metagenomicznej i analizy genomu pojedynczych komórek doprowadziło do identyfikacji Candidatus Entotheonella, grupy bogatych metabolicznie bakterii związanych z gąbkami, jako producentów leków o różnorodnym potencjale18.Jednak pomimo niedawnych prób genomicznej eksploracji różnorodnych społeczności drobnoustrojów16,19 nadal brakuje ponad dwóch trzecich globalnych danych metagenomicznych dotyczących największego oceanu ekosystemów na Ziemi16,20.Ogólnie rzecz biorąc, potencjał biosyntetyczny mikrobiomu morskiego i jego potencjał jako repozytorium nowych produktów enzymatycznych i naturalnych pozostaje w dużej mierze niedostatecznie zbadany.
Aby zbadać potencjał biosyntetyczny mikrobiomów morskich w skali globalnej, najpierw połączyliśmy genomy drobnoustrojów morskich uzyskane przy użyciu metod zależnych od kultury i metod innych niż kulturowe, aby stworzyć obszerną bazę danych na temat filogenetyki i funkcji genów.Badanie tej bazy danych ujawniło szeroką gamę biosyntetycznych klastrów genów (BGC), z których większość należy do jeszcze niescharakteryzowanych rodzin klastrów genów (GCF).Ponadto zidentyfikowaliśmy nieznaną rodzinę bakterii, która wykazuje jak dotąd największą znaną różnorodność BGC w otwartym oceanie.Wybraliśmy dwa szlaki syntezy rybosomów i peptydów modyfikowanych potranslacyjnie (RiPP) do walidacji eksperymentalnej w oparciu o ich różnice genetyczne w stosunku do obecnie znanych szlaków.Funkcjonalna charakterystyka tych szlaków ujawniła nieoczekiwane przykłady enzymologii, a także niezwykłe strukturalnie związki o działaniu hamującym proteazy.
Początkowo chcieliśmy stworzyć globalne źródło danych do analizy genomu, koncentrując się na jego składnikach bakteryjnych i archeologicznych.W tym celu połączyliśmy dane metagenomiczne i 1038 próbek wody morskiej z 215 punktów pobierania próbek rozmieszczonych na całym świecie (zakres szerokości geograficznej = 141,6°) i kilku głębokich warstw (od 1 do 5600 m głębokości, obejmujących strefy pelagiczne, mezopelagiczne i głębinowe).Tło21,22,23 (ryc. 1a, dane rozszerzone, ryc. 1a i tabela dodatkowa 1).Oprócz zapewnienia szerokiego zasięgu geograficznego, te selektywnie filtrowane próbki pozwoliły nam porównać różne składniki mikrobiomu morskiego, w tym bogate w wirusy (<0,2 µm), bogate w prokarioty (0,2–3 µm), bogate w cząstki (0,8 µm) ).–20 µm) i kolonie zubożone w wirusy (>0,2 µm).
a, Łącznie 1038 publicznie dostępnych genomów (metagenomika) morskich zbiorowisk drobnoustrojów zebranych z 215 lokalizacji rozmieszczonych na całym świecie (62°S do 79°N i 179°W do 179°E.).Kafelki mapy © Esri.Źródła: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ i Esri.b, te metagenomy wykorzystano do rekonstrukcji MAG (metody i dodatkowe informacje), które różnią się ilością i jakością (metody) w zbiorach danych (oznaczonych kolorem).Zrekonstruowane MAG uzupełniono publicznie dostępnymi (zewnętrznymi) genomami, w tym ręcznie wykonanymi MAG26, SAG27 i REF.27 Skompiluj OMD.c, w porównaniu z poprzednimi raportami opartymi wyłącznie na SAG (GORG)20 lub MAG (GEM)16, OMD poprawia charakterystykę genomu zbiorowisk drobnoustrojów morskich (współczynnik mapowania odczytu metagenomicznego; metoda) od dwóch do trzech razy z bardziej spójną reprezentacją dogłębną i szerokość..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD grupowanie na poziomie klastrów gatunkowych (95% średniej identyczności nukleotydów) identyfikuje łącznie około 8300 gatunków, z czego ponad połowa nie została wcześniej scharakteryzowana zgodnie z adnotacjami taksonomicznym przy użyciu GTDB (wersja 89) e, klasyfikacja gatunków według typu genomu wykazała, że ​​MAG, SAG i REF dobrze się uzupełniają, odzwierciedlając różnorodność filogenetyczną mikrobiom morski.W szczególności 55%, 26% i 11% gatunków było specyficznych odpowiednio dla MAG, SAG i REF.BATS, Bermudzkie Atlantyckie Serie Czasowe;GEM, genomy mikrobiomu Ziemi;GORG, globalny genom referencyjny oceanu;HOT, seria czasowa Oceanu Hawajskiego.
Korzystając z tego zestawu danych, zrekonstruowaliśmy łącznie 26 293 MAG, głównie bakteryjnych i archeologicznych (ryc. 1b i dane rozszerzone, ryc. 1b).Stworzyliśmy te MAG z zespołów z oddzielnych, a nie zbiorczych próbek metagenomicznych, aby zapobiec załamaniu się naturalnej zmienności sekwencji między próbkami z różnych lokalizacji lub punktów czasowych (metody).Ponadto pogrupowaliśmy fragmenty genomu na podstawie korelacji ich częstości występowania w dużej liczbie próbek (od 58 do 610 próbek, w zależności od badania; metody).Ustaliliśmy, że jest to czasochłonny, ale ważny krok24, który został pominięty w kilku zakrojonych na szeroką skalę pracach rekonstrukcyjnych MAG16, 19, 25 i znacznie poprawia ilość (średnio 2,7-krotnie) i jakość (średnio +20%) genom.zrekonstruowany z badanego tutaj metagenomu morskiego (dane rozszerzone, ryc. 2a i dodatkowe informacje).Ogólnie rzecz biorąc, wysiłki te zaowocowały 4,5-krotnym wzrostem liczby MAG drobnoustrojów morskich (6-krotny, jeśli weźmie się pod uwagę tylko MAG wysokiej jakości) w porównaniu z najbardziej wszechstronnymi dostępnymi obecnie zasobami MAG16 (Metody).Ten nowo stworzony zestaw MAG został następnie połączony z 830 ręcznie wybranymi MAG26, 5969 SAG27 i 1707 REF.Dwadzieścia siedem gatunków bakterii morskich i archeonów utworzyło kombinatoryczny zbiór 34 799 genomów (ryc. 1b).
Następnie oceniliśmy nowo utworzony zasób, aby poprawić jego zdolność do reprezentowania społeczności drobnoustrojów morskich i ocenić wpływ integracji różnych typów genomu.Średnio odkryliśmy, że obejmuje on około 40–60% morskich danych metagenomicznych (ryc. 1c), co stanowi dwa do trzech razy więcej niż poprzednie raporty tylko MAG, zarówno pod względem głębokości, jak i szerokości geograficznej. Więcej serial 16 lub SAG20.Ponadto, aby systematycznie mierzyć różnorodność taksonomiczną w ustalonych kolekcjach, opatrzyliśmy adnotacjami wszystkie genomy przy użyciu zestawu narzędzi (metod) bazy danych taksonomii genomu (GTDB) i zastosowaliśmy średnią identyczność nukleotydów w całym genomie wynoszącą 95%.28 w celu zidentyfikowania 8304 skupisk gatunków (gatunków).Dwie trzecie tych gatunków (w tym nowe klady) nie pojawiało się wcześniej w GTDB, z czego 2790 odkryto za pomocą MAG zrekonstruowanego w tym badaniu (ryc. 1d).Ponadto odkryliśmy, że różne typy genomów są wysoce komplementarne: 55%, 26% i 11% gatunków składa się w całości odpowiednio z MAG, SAG i REF (ryc. 1e).Ponadto MAG objął wszystkie 49 typów występujących w słupie wody, podczas gdy SAG i REF reprezentowały odpowiednio tylko 18 i 11 z nich.Jednak SAG lepiej reprezentuje różnorodność najpowszechniejszych kladów (rozszerzone dane, ryc. 3a), takich jak Pelagic Bacteriales (SAR11), przy czym SAG obejmuje prawie 1300 gatunków, a MAG tylko 390 gatunków.Warto zauważyć, że REF rzadko pokrywały się z MAG lub SAG na poziomie gatunku i reprezentowały> 95% z około 1000 genomów, których nie znaleziono w badanych tutaj zestawach metagenomicznych otwartego oceanu, głównie z powodu interakcji z innymi typami izolowanych reprezentatywnych okazów morskich (np. osadami) .lub współpracownik gospodarza).Aby udostępnić je społeczności naukowej, ten zasób genomu morskiego, który obejmuje również fragmenty niesklasyfikowane (np. z przewidywanych fagów, wysp genomowych i fragmentów genomu, dla których nie ma wystarczających danych do rekonstrukcji MAG), można porównać z danymi taksonomicznymi .Uzyskaj dostęp do adnotacji wraz z funkcją genu i parametrami kontekstowymi w bazie danych Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/).
Następnie rozpoczęliśmy badanie bogactwa i nowości potencjału biosyntetycznego w mikrobiomach otwartego oceanu.W tym celu najpierw zastosowaliśmy antiSMASH dla wszystkich MAG, SAG i REF znalezionych w 1038 metagenomach morskich (metody), aby przewidzieć łącznie 39 055 BGC.Następnie pogrupowaliśmy je w 6907 nieredundantnych GCF i 151 populacji klastrów genów (GCC; tabela uzupełniająca 2 i metody), aby uwzględnić wrodzoną nadmiarowość (tj. ten sam BGC może być kodowany w wielu genomach) i dane metagenomiczne Fragmentacja skoncentrowanych BGC.Niekompletne BGC nie zwiększyły znacząco, jeśli w ogóle, (informacje uzupełniające) liczby odpowiednio GCF i GCC, zawierających co najmniej jednego nienaruszonego członka BGC w 44% i 86% przypadków.
Na poziomie GCC znaleźliśmy szeroką gamę przewidywanych RiPP i innych produktów naturalnych (ryc. 2a).Wśród nich np. arylopolieny, karotenoidy, ektoiny i siderofory należą do GCC o szerokim rozmieszczeniu filogenetycznym i dużej liczebności w metagenomach oceanicznych, co może świadczyć o szerokiej adaptacji mikroorganizmów do środowiska morskiego, w tym oporności na reaktywne formy tlenu, stres oksydacyjny i osmotyczny..lub wchłanianie żelaza (więcej informacji).Ta różnorodność funkcjonalna kontrastuje z niedawną analizą około 1,2 miliona BGC spośród około 190 000 genomów przechowywanych w bazie danych NCBI RefSeq (BiG-FAM/RefSeq, zwanej dalej RefSeq)29, która wykazała, że ​​nierybosomalne peptydy syntetazy (NRPS) i syntaza poliketydowa (PKS) BGC (Informacje uzupełniające).Znaleźliśmy również 44 (29%) GCC tylko odlegle powiązane z dowolnym RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; ryc. 2a i metody) i 53 (35%) GCC tylko w MAG, podkreślając potencjał do wykrywania wcześniej nieopisanych substancji chemicznych w OMD.Biorąc pod uwagę, że każda z tych GCC prawdopodobnie reprezentuje bardzo zróżnicowane funkcje biosyntetyczne, dokonaliśmy dalszej analizy danych na poziomie GCF, starając się zapewnić bardziej szczegółowe grupowanie BGC, które według przewidywań będą kodować podobne produkty naturalne29.W sumie 3861 (56%) zidentyfikowanych GCF nie pokrywało się z RefSeq, a> 97% GCF nie było obecnych w MIBiG, jednej z największych baz danych BGC potwierdzonych eksperymentalnie (ryc. 2b).Chociaż nie jest zaskakujące odkrycie wielu potencjalnych nowych ścieżek w środowiskach, które nie są dobrze reprezentowane przez genom referencyjny, nasza metoda dereplikacji BGC do GCF przed benchmarkingiem różni się od poprzednich raportów 16 i pozwala nam zapewnić bezstronną ocenę nowości.Większość nowej różnorodności (3012 GCF lub 78%) odpowiada przewidywanym terpenom, RiPP lub innym produktom naturalnym, a większość (1815 GCF lub 47%) jest zakodowana w nieznanych typach ze względu na ich potencjał biosyntetyczny.W przeciwieństwie do klastrów PKS i NRPS, te kompaktowe BGC są mniej podatne na fragmentację podczas składania metagenomicznego 31 i umożliwiają bardziej czasochłonną i wymagającą zasobów funkcjonalną charakterystykę swoich produktów.
W sumie 39 055 BGC pogrupowano w 6907 GCF i 151 GCC.a, reprezentacja danych (wewnętrzna zewnętrzna).Hierarchiczne grupowanie odległości BGC w oparciu o GCC, z których 53 są ustalane tylko przez MAG.GCC zawiera BGC z różnych taksonów (częstotliwość bramek z transformacją ln) i różnych klas BGC (rozmiar koła odpowiada jego częstotliwości).Dla każdego GCC warstwa zewnętrzna reprezentuje liczbę BGC, częstość występowania (procent próbek) i odległość (minimalna odległość cosinusowa BGC (min(dMIBiG))) od BiG-FAM do BGC.GCC z BGC blisko spokrewnionymi z BGC zweryfikowanymi eksperymentalnie (MIBiG) zaznaczono strzałkami.b Porównując GCF z przewidywanymi (BiG-FAM) i potwierdzonymi eksperymentalnie (MIBiG) BGC, znaleziono 3861 nowych (d–>0,2) GCF.Większość (78%) z nich koduje RiPP, terpeny i inne domniemane produkty naturalne.c, wszystkie genomy w OMD znalezione w 1038 metagenomach morskich umieszczono w drzewie podstawowym GTDB, aby pokazać filogenetyczny zasięg OMD.Klady bez żadnych genomów w OMD pokazano na szaro.Liczba BGC odpowiada największej liczbie przewidywanych BGC na genom w danym kladzie.Dla przejrzystości ostatnie 15% węzłów jest zwiniętych.Strzałki wskazują klady bogate w BGC (> 15 BGC), z wyjątkiem Mycobacterium, Gordonia (ustępując tylko Rhodococcus) i Crocosphaera (ustępując tylko Synechococcus).d, nieznany c.Największą różnorodność biosyntetyczną wykazały Eremiobacterota (indeks Shannona w oparciu o rodzaj produktu naturalnego).Każdy prążek reprezentuje genom z największą liczbą BGC w gatunku.T1PKS, PKS typ I, T2/3PKS, PKS typ II i typ III.
Oprócz bogactwa i nowości badamy strukturę biogeograficzną potencjału biosyntetycznego mikrobiomu morskiego.Grupowanie próbek według średniego rozkładu liczby kopii metagenomicznego GCF (metody) wykazało, że społeczności zamieszkujące niskie szerokości geograficzne, powierzchniowe, bogate w prokarioty i ubogie w wirusy, głównie z powierzchniowych lub głębiej nasłonecznionych wód, były bogate w terpeny RiPP i BGC.Natomiast społeczności polarne, głębinowe, bogate w wirusy i cząstki powiązano z wyższą liczebnością NRPS i PKS BGC (rozszerzone dane, ryc. 4 i dodatkowe informacje).Wreszcie odkryliśmy, że dobrze zbadane społeczności tropikalne i pelagiczne są najbardziej obiecującymi źródłami nowych terpenów (rysunek danych rozszerzonych).Największy potencjał dla PKS, RiPP i innych produktów naturalnych (Rysunek 5a z rozszerzonymi danymi).
Aby uzupełnić nasze badania potencjału biosyntetycznego mikrobiomów morskich, chcieliśmy zmapować ich rozmieszczenie filogenetyczne i zidentyfikować nowe klady wzbogacone w BGC.W tym celu umieściliśmy genomy drobnoustrojów morskich w znormalizowanym drzewie filogenetycznym bakterii i archeonów GTDB13 i nałożyliśmy na domniemane szlaki biosyntezy, które kodują (ryc. 2c).Z łatwością wykryliśmy kilka kladów wzbogaconych w BGC (reprezentowanych przez ponad 15 BGC) w próbkach wody morskiej (metody) znanych ze swojego potencjału biosyntetycznego, takich jak cyjanobakterie (Synechococcus) i bakterie Proteus, takie jak Tistrella32,33, lub ostatnio przyciągnęły uwagę ze względu na ich naturalne produkty .takie jak Myxococcota (Sandaracinaceae), Rhodococcus i Planctomycetota34,35,36.Co ciekawe, w tych kladach znaleźliśmy kilka wcześniej niezbadanych linii rodowych.Na przykład gatunki o najbogatszym potencjale biosyntetycznym w typie Planctomycetota i Myxococcota należały odpowiednio do niescharakteryzowanych rzędów kandydujących i rodzajów (tabela uzupełniająca 3).Podsumowując, sugeruje to, że OMD zapewnia dostęp do nieznanych wcześniej informacji filogenetycznych, w tym mikroorganizmów, które mogą stanowić nowe cele w odkrywaniu enzymów i produktów naturalnych.
Następnie scharakteryzowaliśmy klad wzbogacony w BGC, nie tylko licząc maksymalną liczbę BGC zakodowanych przez jego członków, ale także oceniając różnorodność tych BGC, co wyjaśnia częstotliwość występowania różnych typów naturalnych produktów kandydujących (ryc. 2c i metody )..Odkryliśmy, że w tym badaniu specjalnie zaprojektowane bakteryjne MAG reprezentowały najbardziej zróżnicowane biosyntetycznie gatunki.Bakterie te należą do nieuprawnego typu Candidatus Eremiobacterota, który z wyjątkiem kilku badań genomicznych pozostaje w dużej mierze niezbadany37,38.Warto zauważyć, że „ok.Rodzaj Eremiobacterota analizowano wyłącznie w środowisku lądowym39 i nie wiadomo, czy obejmuje on żadnych przedstawicieli wzbogaconych w BGC.Tutaj zrekonstruowaliśmy osiem MAG tego samego gatunku (identyczność nukleotydów > 99%) 23. Dlatego proponujemy nazwę gatunku „Candidatus Eudoremicrobium malaspinii”, nazwaną na cześć nereidy (nimfy morskiej), pięknego prezentu w mitologii greckiej i wyprawach.„Ka.Zgodnie z adnotacją filogenetyczną 13, E. malaspinii nie ma wcześniej znanych krewnych poniżej poziomu sekwencji i dlatego należy do nowej rodziny bakterii, którą proponujemy „Ca.E. malaspinii” jako gatunek typowy i „Ca.Eudormicrobiaceae” jako oficjalna nazwa (informacje uzupełniające).Krótka rekonstrukcja metagenomiczna „Ca.Projekt genomu E. malaspinii został zweryfikowany poprzez sekwencjonowanie metagenomiczne o bardzo niskim nakładzie danych wejściowych i długim odczycie oraz ukierunkowane składanie pojedynczej próbki (metody) w postaci pojedynczego liniowego chromosomu o wielkości 9,63 Mb z duplikacją 75 kb.jako jedyną pozostałą niejasność.
Aby ustalić kontekst filogenetyczny tego gatunku, poszukiwaliśmy 40 blisko spokrewnionych gatunków w dodatkowych, wzbogaconych w eukarioty próbkach metagenomicznych z wyprawy Tara Ocean, poprzez ukierunkowaną rekonstrukcję genomu.W skrócie, połączyliśmy odczyty metagenomiczne z fragmentami genomowymi związanymi z „Ca.E. malaspinii” i postawiono hipotezę, że zwiększony współczynnik rekrutacji w tej próbie wskazuje na obecność innych krewnych (metody).W rezultacie znaleźliśmy 10 MAG, czyli kombinację 19 MAG reprezentujących pięć gatunków w trzech rodzajach w ramach nowo zdefiniowanej rodziny (tj. „Ca. Eudormicrobiaceae”).Po ręcznej inspekcji i kontroli jakości (dane rozszerzone, ryc. 6 i informacje dodatkowe) stwierdzono, że „Ca.Gatunki Eudormicrobiaceae mają większe genomy (8 Mb) i bogatszy potencjał biosyntetyczny (14 do 22 BGC na gatunek) niż inne gatunki „Ca”.Klad Eremiobacterota (do 7 BGC) (ryc. 3a – c).
a, Pozycje filogenetyczne pięciu „Ca.Gatunki Eudormicrobiaceae wykazały bogactwo BGC specyficzne dla linii morskich zidentyfikowanych w tym badaniu.Drzewo filogenetyczne obejmuje wszystkie „Ca.MAG Eremiobacterota i członkowie innych typów (numery genomów w nawiasach) podane w GTDB (wersja 89) zostały wykorzystane do tła ewolucyjnego (Metody).Najbardziej zewnętrzne warstwy reprezentują klasyfikacje na poziomie rodziny („Ca. Eudormicrobiaceae” i „Ca. Xenobiaceae”) oraz na poziomie klasy („Ca. Eremiobacteria”).Pięć gatunków opisanych w tym badaniu jest reprezentowanych za pomocą kodów alfanumerycznych i proponowanych nazw dwumianowych (informacje uzupełniające).b. ok.Gatunki Eudormicrobiaceae mają siedem wspólnych jąder BGC.Brak BGC w kladzie A2 wynikał z niekompletności reprezentatywnego MAG (tabela uzupełniająca 3).BGC są specyficzne dla „Ca.Amphithomicrobium” i „Ca.Amphithomicrobium” (klady A i B) nie są pokazane.c, Wszystkie BGC zakodowane jako „Ca.Stwierdzono, że Eudoremicrobium taraoceanii ulega ekspresji w 623 metatranskryptomach pobranych z oceanów Tary.Pełne kółka wskazują aktywną transkrypcję.Pomarańczowe kółka oznaczają krotność transformacji log2 poniżej i powyżej szybkości ekspresji genu metabolizmu podstawowego (metody).d, krzywe względnej liczebności (metody) pokazujące „Ca.Gatunki Eudormicrobiaceae są szeroko rozpowszechnione w większości basenów oceanicznych oraz w całym słupie wody (od powierzchni do głębokości co najmniej 4000 m).Na podstawie tych szacunków ustaliliśmy, że „Ca.E. malaspinii” stanowi do 6% komórek prokariotycznych w głębinowych zbiorowiskach pelagicznych związanych ze zbożami.Uznawaliśmy, że gatunek występuje na danym stanowisku, jeśli został znaleziony w jakimkolwiek ułamku wielkości danej warstwy głębokościowej.IO – Ocean Indyjski, NAO – Północny Atlantyk, NPO – Północny Pacyfik, RS – Morze Czerwone, SAO – Południowy Atlantyk, SO – Ocean Południowy, SPO – Południowy Pacyfik.
Badanie liczebności i rozmieszczenia Ca.Eudormicrobiaceae, która, jak odkryliśmy, dominuje w większości basenów oceanicznych, a także w całym słupie wody (ryc. 3d).Lokalnie stanowią 6% społeczności drobnoustrojów morskich, co czyni je ważną częścią globalnego mikrobiomu morskiego.Ponadto stwierdziliśmy względną zawartość Ca.Gatunki Eudormicrobiaceae i ich poziomy ekspresji BGC były najwyższe we wzbogaconej frakcji eukariotycznej (ryc. 3c i dane rozszerzone, ryc. 7), co wskazuje na możliwą interakcję z cząstkami stałymi, w tym planktonem.Obserwacja ta przypomina w pewnym stopniu obserwację „Ca.Eudoremicrobium BGC, które wytwarzają cytotoksyczne produkty naturalne znanymi szlakami, mogą wykazywać zachowania drapieżne (informacje uzupełniające i dane rozszerzone, ryc. 8), podobne do innych drapieżników, które specyficznie wytwarzają metabolity, takie jak Myxococcus41.Odkrycie ok.Eudormicrobiaceae w mniej dostępnych (głębokie oceany) lub próbkach eukariotycznych, a nie prokariotycznych, może wyjaśniać, dlaczego te bakterie i ich nieoczekiwana różnorodność BGC pozostają niejasne w kontekście badań nad naturalną żywnością.
Ostatecznie staraliśmy się eksperymentalnie potwierdzić obietnice płynące z naszej pracy opartej na mikrobiomie w zakresie odkrywania nowych szlaków, enzymów i produktów naturalnych.Wiadomo, że wśród różnych klas BGC szlak RiPP koduje bogatą różnorodność chemiczną i funkcjonalną ze względu na różne modyfikacje potranslacyjne peptydu rdzeniowego przez dojrzałe enzymy42.Wybraliśmy więc dwa 'Ca.BGC RiPP Eudoremicrobium (ryc. 3b i 4a-e) są oparte na tym samym, co inne znane BGC (\(\bar{d}\)MIBiG i \(\bar{d}\)RefSeq powyżej 0,2).
a – c, Heterologiczna ekspresja in vitro i testy enzymatyczne in vitro nowego (\(\bar{d}\)RefSeq = 0,29) klastra biosyntezy RiPP specyficznego dla gatunków Ca z głębin morskich.E. malaspinii” doprowadziła do wytworzenia produktów difosforylowanych.c, modyfikacje zidentyfikowane za pomocą MS/MS o wysokiej rozdzielczości (HR) (fragmentacja oznaczona jonami b i y w strukturze chemicznej) i NMR (dane rozszerzone, ryc. 9).d, ten fosforylowany peptyd wykazuje niskie mikromolarne hamowanie ssaczej elastazy neutrofilowej, czego nie stwierdza się w peptydzie kontrolnym i peptydzie odwadniającym (odwodnienie wywołane usuwaniem chemicznym).Doświadczenie powtórzono trzykrotnie z podobnymi wynikami.Na przykład heterologiczna ekspresja drugiego nowego klastra \(\bar{d}\)RefSeq = 0,33) biosyntezy białek wyjaśnia funkcję czterech dojrzałych enzymów, które modyfikują 46-aminokwasowy peptyd rdzeniowy.Pozostałości barwi się zgodnie z miejscem modyfikacji przewidywanym przez HR-MS/MS, znakowaniem izotopowym i analizą NMR (informacje uzupełniające).Zabarwienie przerywane wskazuje, że modyfikacja zachodzi w jednej z dwóch reszt.Rysunek jest zestawieniem licznych konstruktów heterologicznych, pokazującym aktywność wszystkich dojrzałych enzymów w tym samym jądrze.h, Ilustracja danych NMR dla N-metylacji amidu szkieletowego.Pełne wyniki przedstawiono na ryc.10 z rozszerzonymi danymi.i, Pozycja filogenetyczna dojrzałego enzymu klastra białkowego FkbM wśród wszystkich domen FkbM znalezionych w bazie danych MIBiG 2.0 ujawnia enzym tej rodziny o aktywności N-metylotransferazy (informacje uzupełniające).Pokazano schematyczne diagramy BGC (a, e), struktur peptydów prekursorowych (b, f) i przypuszczalnych struktur chemicznych produktów naturalnych (c, g).
Pierwszy szlak RiPP (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) stwierdzono jedynie u gatunków głębinowych „Ca.E. malaspinii” i kody prekursora peptydu (ryc. 4a, b).W tym dojrzałym enzymie zidentyfikowaliśmy pojedynczą domenę funkcjonalną homologiczną z domeną odwodnienia syntazy lantypeptydu, która normalnie katalizuje fosforylację, a następnie usunięcie 43 (informacje uzupełniające).Dlatego przewidujemy, że modyfikacja peptydu prekursorowego obejmuje takie dwuetapowe odwodnienie.Jednakże stosując tandemową spektrometrię mas (MS/MS) i spektroskopię magnetycznego rezonansu jądrowego (NMR) zidentyfikowaliśmy polifosforylowany peptyd liniowy (ryc. 4c).Chociaż było to nieoczekiwane, znaleźliśmy kilka dowodów potwierdzających, że jest to produkt końcowy: dwóch różnych gospodarzy heterologicznych i brak odwodnienia w testach in vitro, identyfikacja kluczowych reszt zmutowanych w miejscu katalitycznego odwodnienia dojrzałego enzymu.wszystko zrekonstruowane przez „Ca”.Genom E. malaspinii (dane rozszerzone, ryc. 9 i informacje dodatkowe) i wreszcie aktywność biologiczna fosforylowanego produktu, ale nie syntetyzowanej chemicznie postaci odwodnionej (ryc. 4d).W rzeczywistości odkryliśmy, że wykazuje on niską mikromolarną aktywność hamującą proteazę wobec elastazy neutrofilowej, porównywalną z innymi pokrewnymi produktami naturalnymi w zakresie stężeń (IC50 = 14,3 μM) 44 , pomimo faktu, że rola ekologiczna pozostaje do wyjaśnienia.Na podstawie tych wyników proponujemy nazwać szlak „fosfeptyną”.
Drugi przypadek to złożony szlak RiPP specyficzny dla „Ca.Przewidywano, że rodzaj Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) będzie kodować naturalne produkty białkowe (ryc. 4e).Szlaki te mają szczególne znaczenie biotechnologiczne ze względu na oczekiwaną gęstość i różnorodność nietypowych modyfikacji chemicznych wprowadzanych przez enzymy kodowane przez stosunkowo krótkie BGC45.Stwierdziliśmy, że białko to różni się od wcześniej scharakteryzowanych białek tym, że brakuje mu zarówno głównego motywu NX5N policeramidów, jak i pętli lantioninowej landornamidów 46 .Aby przezwyciężyć ograniczenia typowych heterologicznych wzorców ekspresji, wykorzystaliśmy je wraz z niestandardowym systemem Microvirgula aerodenitrificans do scharakteryzowania czterech dojrzałych enzymów szlaku (metody).Stosując kombinację MS/MS, znakowania izotopowego i NMR, wykryliśmy te dojrzałe enzymy w 46-aminokwasowym rdzeniu peptydu (ryc. 4f, g, rozszerzone dane, ryc. 10–12 i dodatkowe informacje).Wśród dojrzałych enzymów scharakteryzowaliśmy pierwsze pojawienie się członka rodziny O-metylotransferazy FkbM 47 w szlaku RiPP i nieoczekiwanie odkryliśmy, że ten dojrzały enzym wprowadza N-metylację szkieletu (ryc. 4h, i oraz dodatkowe informacje).Chociaż modyfikacja ta jest znana w naturalnych produktach NRP48, enzymatyczna N-metylacja wiązań amidowych jest złożoną, ale istotną biotechnologicznie reakcją49, która dotychczas była przedmiotem zainteresowania rodziny borozyny RiPP.Specyficzność 50,51.Identyfikacja tej aktywności w innych rodzinach enzymów i RiPP może otworzyć nowe zastosowania i rozszerzyć różnorodność funkcjonalną białek 52 i ich różnorodność chemiczną.W oparciu o zidentyfikowane modyfikacje i niezwykłą długość proponowanej struktury produktu proponujemy nazwę ścieżki „pytonamid”.
Odkrycie nieoczekiwanej enzymologii w funkcjonalnie scharakteryzowanej rodzinie enzymów ilustruje obietnicę genomiki środowiskowej dla nowych odkryć, a także ilustruje ograniczoną zdolność do wnioskowania funkcjonalnego w oparciu wyłącznie o homologię sekwencji.Zatem, wraz z doniesieniami o niekanonicznych bioaktywnych polifosforylowanych RiPP, nasze wyniki wykazują wymagające dużej ilości zasobów, ale krytyczną wartość dla wysiłków biologii syntetycznej, mających na celu pełne odkrycie bogactwa funkcjonalnego, różnorodności i niezwykłych struktur związków biochemicznych.
Tutaj pokazujemy zakres potencjału biosyntetycznego kodowanego przez drobnoustroje i ich kontekst genomowy w globalnym mikrobiomie morskim, ułatwiając przyszłe badania, udostępniając powstałe zasoby społeczności naukowej (https://microbiomics.io/ocean/).Odkryliśmy, że wiele z jego nowości filogenetycznych i funkcjonalnych można uzyskać jedynie poprzez rekonstrukcję MAG i SAG, szczególnie w niewykorzystanych społecznościach drobnoustrojów, które mogłyby kierować przyszłymi wysiłkami w zakresie poszukiwań biologicznych.Chociaż skupimy się tutaj na „Ca.Eudormicrobiaceae” jako linię szczególnie „utalentowaną” biosyntetycznie, wiele BGC przewidzianych w nieodkrytej mikrobiocie prawdopodobnie koduje wcześniej nieopisane enzymologie, które dają związki o działaniu znaczącym dla środowiska i/lub biotechnologii.
Uwzględniono zbiory danych metagenomicznych z głównych badań oceanograficznych i badań szeregów czasowych o wystarczającej głębokości sekwencjonowania, aby zmaksymalizować pokrycie globalnych zbiorowisk drobnoustrojów morskich w basenach oceanicznych, głębokich warstwach i na przestrzeni czasu.Te zbiory danych (tabela uzupełniająca 1 i ryc. 1) obejmują metagenomię z próbek zebranych w oceanach Tary (wzbogacone wirusami, n = 190; wzbogacone prokariotyczne, n = 180) 12,22 i wyprawę BioGEOTRACES (n = 480).Hawajski szereg czasowy oceaniczny (HOT, n = 68), szereg czasowy Bermudy-Atlantyk (BATS, n = 62)21 i wyprawa Malaspina (n = 58)23.Odczyty sekwencjonowania ze wszystkich fragmentów metagenomicznych zostały przefiltrowane pod kątem jakości przy użyciu BBMap (v.38.71) poprzez usunięcie adapterów sekwencjonowania z odczytów, usunięcie odczytów mapowanych na sekwencje kontroli jakości (genomy PhiX) i użycie trimq=14, maq=20 odrzuca słabą jakość odczytu, maxns = 0 i minlength = 45. Kolejne analizy przeprowadzono lub połączono z odczytami kontroli jakości, jeśli tak określono (bbmerge.sh minoverlap=16).Odczyty kontroli jakości znormalizowano (docelowy bbnorm.sh = 40, głębokość umysłu = 0) przed kompilacją przy użyciu metaSPAdes (w razie potrzeby wersja 3.11.1 lub wersja 3.12)53.Powstałe kontigi rusztowania (zwane dalej rusztowaniami) ostatecznie przefiltrowano według długości (≥1 kb).
1038 próbek metagenomicznych podzielono na grupy i dla każdej grupy próbek odczyty kontroli jakości metagenomicznej wszystkich próbek dopasowano do nawiasów każdej próbki oddzielnie, uzyskując następującą liczbę odczytów grup ujętych parami w nawiasy: Wirusy morskie Tara – wzbogacone (190×190 ), Wzbogacone Prokarioty (180×180), BioGEOTRACES, HOT i NIETALETY (610×610) i Malaspina (58×58).Mapowanie wykonano przy użyciu programu Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54, który umożliwia dopasowanie odczytów do miejsc drugorzędnych (przy użyciu flagi -a).Dopasowania filtrowano tak, aby miały długość co najmniej 45 zasad, miały ≥97% identyczności i zakres odczytów ≥80%.Powstałe pliki BAM zostały przetworzone przy użyciu skryptu jgi_summarize_bam_contig_lengths dla MetaBAT2 (wersja 2.12.1)55, aby zapewnić pokrycie wewnątrz i między próbkami dla każdej grupy.Na koniec zamki zostały pogrupowane w celu zwiększenia czułości poprzez indywidualne uruchomienie MetaBAT2 na wszystkich próbkach z –minContig 2000 i –maxEdges 500. Używamy MetaBAT2 zamiast boksera zespołowego, ponieważ niezależne testy wykazały, że jest on najskuteczniejszym pojedynczym bokserem.i 10 do 50 razy szybciej niż inni powszechnie używani bokserzy57.Aby przetestować wpływ korelacji liczebności, losowo wybrana podpróba metagenomiki (10 dla każdego z dwóch zbiorów danych Tara Ocean, 10 dla BioGEOTRACES, 5 dla każdej serii czasowej i 5 dla Malaspina) dodatkowo wykorzystała tylko próbki.Próbki wewnętrzne są grupowane w celu uzyskania informacji o zasięgu.(Dodatkowe informacje).
Do późniejszej analizy uwzględniono dodatkowe (zewnętrzne) genomy, a mianowicie 830 ręcznie wybranych MAG z podzbioru zbioru danych Tara Oceans26, 5287 SAG ze zbioru danych GORG20 oraz dane z bazy danych MAR (MarDB v. 4) z 1707 izolowanych REF i 682 SAG) 27. W przypadku zbioru danych MarDB genomy wybiera się na podstawie dostępnych metadanych, jeśli typ próbki odpowiada następującemu wyrażeniu regularnemu: „[S|s]ingle.?[C|c]ell|[C|c]ulture| [Ja|ja] izolowany”.
Jakość każdego pojemnika metagenomicznego i genomów zewnętrznych oceniano za pomocą CheckM (wersja 1.0.13) i przepływu pracy Anvi'o's Lineage Workflow (wersja 5.5.0)58,59.Jeśli CheckM lub Anvi'o zgłosi ≥50% kompletności/kompletności i ≤10% zanieczyszczenia/nadmiarowości, wówczas zapisz komórki metagenomiczne i genomy zewnętrzne do późniejszej analizy.Wyniki te następnie połączono ze średnią kompletnością (mcpl) i średnim zanieczyszczeniem (mctn), aby sklasyfikować jakość genomu zgodnie z kryteriami społeczności60 w następujący sposób: wysoka jakość: mcpl ≥ 90% i mctn ≤ 5%;jakość dobra: mcpl ≥ 70%, mctn ≤ 10%, jakość średnia: mcpl ≥ 50% i mctn ≤ 10%, jakość zadowalająca: mcpl ≤ 90% lub mctn ≥ 10%.Przefiltrowane genomy następnie korelowano z wynikami jakości (Q i Q') w następujący sposób: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (zmienność szczepu)/100 + 0,5 x log[N50].(zaimplementowane w dRep61).
Aby umożliwić analizę porównawczą między różnymi źródłami danych i typami genomu (MAG, SAG i REF), wyłuskano 34 799 genomów w oparciu o średnią tożsamość nukleotydów dla całego genomu (ANI) przy użyciu dRep (wersja 2.5.4).Powtórzenia)61 z progami 95% ANI28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) i geny markerowe o pojedynczej kopii przy użyciu SpecI63 zapewniające grupowanie genomu na poziomie gatunku.Dla każdego klastra dRep wybrano reprezentatywny genom zgodnie z określoną powyżej maksymalną oceną jakości (Q'), którą uznano za reprezentatywną dla gatunku.
Aby ocenić szybkość mapowania, zastosowano BWA (v.0.7.17-r1188, -a) do zmapowania wszystkich 1038 zestawów odczytów metagenomicznych z 34 799 genomami zawartymi w OMD.Odczyty kontrolowane pod względem jakości mapowano w trybie single-ended, a powstałe dopasowania filtrowano, aby zachować tylko dopasowania o długości ≥45 pz.i tożsamość ≥95%.Współczynnik wyświetlania dla każdej próbki to procent odczytów pozostałych po filtracji podzielony przez całkowitą liczbę odczytów kontroli jakości.Stosując to samo podejście, każdy z 1038 metagenomów został zredukowany do 5 milionów wstawek (rozszerzone dane, ryc. 1c) i dopasowany do GORG SAG w OMD i we wszystkich GEM16.Ilość MAG odzyskanych z wody morskiej w katalogu GEM16 określono na podstawie zapytań opartych na słowach kluczowych źródeł metagenomicznych, wybierając próbki wody morskiej (np. w przeciwieństwie do osadów morskich).W szczególności wybieramy „wodny” jako „kategoria_ekosystemu”, „morski” jako „typ_ekosystemu” i filtrujemy „siedlisko” jako „głęboki ocean”, „morski”, „morski oceaniczny”, „pelagiczny morski”, „morska woda” , „Ocean”, „Woda morska”, „Woda powierzchniowa morza”, „Woda powierzchniowa morza”.W rezultacie powstało 5903 MAG (734 wysokiej jakości) rozmieszczonych w 1823 OTU (widok tutaj).
Genomy prokariotyczne opatrzono adnotacjami taksonomicznym przy użyciu GTDB-Tk (v.1.0.2)64 z domyślnymi parametrami ukierunkowanymi na GTDB r89 wersja 13. Anvi'o wykorzystano do identyfikacji genomów eukariotycznych w oparciu o przewidywanie domeny i przypominanie ≥50% oraz redundancję ≤ 10%.Adnotację taksonomiczną gatunku definiuje się jako jeden z jego reprezentatywnych genomów.Z wyjątkiem eukariontów (148 MAG), każdy genom został najpierw opatrzony adnotacją funkcjonalną przy użyciu prokka (v.1.14.5)65, nazywając kompletne geny, definiując w razie potrzeby parametry „archeonów” lub „bakterii”, co jest również zgłaszane w przypadku nie- kodowanie genów.i regiony CRISPR, wśród innych cech genomicznych.Opisywanie przewidywanych genów poprzez identyfikację uniwersalnych genów markerowych pojedynczej kopii (uscMG) przy użyciu fetchMG (v.1.2)66, przypisywanie grup ortologów i wysyłanie zapytań przy użyciu emapper (v.2.0.1)67 w oparciu o EggNOG (v.5.0)68.Baza danych KEGG (opublikowano 10 lutego 2020 r.) 69. Ostatni krok wykonano poprzez dopasowanie białek do bazy KEGG za pomocą narzędzia DIAMOND (v.0.9.30)70 z zapytaniem i pokryciem tematu ≥70%.Wyniki poddano dalszej filtracji zgodnie z NCBI Prokaryotic Genome Annotation Pipeline71 w oparciu o przepływność ≥ 50% maksymalnej oczekiwanej przepływności (same łącze).Sekwencje genów wykorzystano także jako dane wejściowe do identyfikacji BGC w genomie przy użyciu narzędzia antiSMASH (wersja 5.1.0)72 z parametrami domyślnymi i różnymi eksplozjami klastrów.Wszystkie genomy i adnotacje zostały wkompilowane w OMD wraz z metadanymi kontekstowymi dostępnymi w Internecie (https://microbiomics.io/ocean/).
Podobnie do wcześniej opisanych metod12,22 użyliśmy CD-HIT (wersja 4.8.1) do skupienia >56,6 miliona genów kodujących białka z genomów bakterii i archeonów z OMD w geny o 95% identyczności i krótsze (pokrycie 90%)73 aż do >17,7 miliona klastrów genowych.Jako gen reprezentatywny dla każdego klastra genów wybrano najdłuższą sekwencję.Następnie 1038 metagenomów dopasowano do > 17,7 milionów członków klastra BWA (-a), a powstałe pliki BAM przefiltrowano w celu zachowania jedynie dopasowań o ≥95% procentu identyczności i ≥45 dopasowań zasad.Obfitość genów znormalizowaną pod względem długości obliczono najpierw zliczając wstawki z najlepszego unikalnego dopasowania, a następnie, w przypadku wstawek z mapą rozmytą, dodając zliczenia ułamkowe do odpowiednich genów docelowych proporcjonalnie do ich liczby unikalnych wstawek.
Genomy z rozszerzonego OMD (z dodatkowymi MAG z „Ca. Eudormicrobiaceae”, patrz poniżej) dodano do bazy danych narzędzia do analizy metagenomicznej mOTUs74 (wersja 2.5.1) w celu stworzenia rozszerzonej referencyjnej bazy danych mOTU.Z dziesięciu uscMG przetrwało tylko sześć genomów o pojedynczej kopii (23 528 genomów).Rozbudowa bazy danych zaowocowała powstaniem 4494 dodatkowych skupień na poziomie gatunku.Przeanalizowano 1038 metagenomów przy użyciu domyślnych parametrów mOTU (wersja 2).W sumie 989 genomów zawartych w 644 klastrach mOTU (95% REF, 5% SAG i 99,9% należących do MarDB) nie zostało wykrytych w profilu mOTU.Odzwierciedla to różne dodatkowe źródła morskiej izolacji genomów MarDB (większość niewykrytych genomów jest powiązana z organizmami wyizolowanymi z osadów, żywicielami morskimi itp.).Aby w tym badaniu nadal skupiać się na środowisku otwartego oceanu, wykluczyliśmy je z dalszej analizy, chyba że zostały wykryte lub uwzględnione w rozszerzonej bazie danych mOTU utworzonej w tym badaniu.
Wszystkie BGC z MAG, SAG i REF w OMD (patrz wyżej) połączono z BGC zidentyfikowanymi we wszystkich rusztowaniach metagenomicznych (antiSMASH v.5.0, parametry domyślne) i scharakteryzowano przy użyciu BiG-SLICE (v.1.1) (domena PFAM)75.W oparciu o te cechy obliczyliśmy wszystkie odległości cosinusowe między BGC i pogrupowaliśmy je (średnie połączenia) w GCF i GCC, stosując progi odległości odpowiednio 0,2 i 0,8.Progi te stanowią adaptację progów stosowanych wcześniej przy użyciu odległości euklidesowej75 wraz z odległością cosinus, co łagodzi część błędów w oryginalnej strategii grupowania BiG-SLICE (informacje uzupełniające).
Następnie BGC przefiltrowano, aby zachować tylko ≥5 kb zakodowanych na rusztowaniach, aby zmniejszyć ryzyko fragmentacji, jak opisano wcześniej 16 i wykluczyć MarDB REF i SAG, których nie znaleziono w 1038 metagenomach (patrz powyżej).W rezultacie genom OMD zakodowało łącznie 39 055 BGC, a dodatkowe 14 106 zidentyfikowano na fragmentach metagenomicznych (tj. nie połączonych w MAG).Te „metagenomiczne” BGC wykorzystano do oszacowania proporcji potencjału biosyntezy mikrobiomu morskiego nieujętego w bazie danych (informacje uzupełniające).Każdy BGC scharakteryzowano funkcjonalnie zgodnie z przewidywanymi typami produktów zdefiniowanymi przez kategorie produktów anty-SMASH lub bardziej gruboziarniste zdefiniowane w BiG-SCAPE76.Aby zapobiec stronniczości próbkowania w kwantyfikacji (skład taksonomiczny i funkcjonalny GCC/GCF, odległość GCF i GCC od referencyjnych baz danych oraz liczebność metagenomiczna GCF), poprzez zachowanie tylko najdłuższego BGC na GCF dla każdego gatunku, 39 055 BGC poddano dalszej deduplikacji, co daje łącznie 17 689 BGC.
Nowość GCC i GCF oceniano na podstawie odległości pomiędzy obliczoną bazą danych (baza RefSeq w BiG-FAM)29 a zweryfikowaną eksperymentalnie (MIBIG 2.0)30 BGC.Dla każdego z 17 689 reprezentatywnych BGC wybraliśmy najmniejszą odległość cosinusową do odpowiedniej bazy danych.Te minimalne odległości są następnie uśredniane (średnie) zgodnie z GCF lub GCC, odpowiednio.GCF uważa się za nowy, jeśli odległość od bazy danych jest większa niż 0,2, co odpowiada idealnemu odstępowi pomiędzy (przeciętnym) GCF a odniesieniem.Dla GCC wybieramy 0,4, czyli dwukrotność progu określonego przez GCF, aby zablokować długoterminową relację z linkami.
Liczebność metagenomiczną BGC oszacowano jako średnią liczebność jego genów biosyntetycznych (określoną metodą anty-SMASH) dostępną z profili na poziomie genów.Następnie obliczono liczebność metagenomiczną każdego GCF lub GCC jako sumę reprezentatywnych BGC (z 17 689).Te mapy liczebności zostały następnie znormalizowane pod kątem składu komórkowego przy użyciu liczby mOTU na próbkę, co również uwzględniało wysiłki związane z sekwencjonowaniem (rozszerzone dane, ryc. 1d).Częstość występowania GCF lub GCC obliczono jako procent próbek o liczebności > 0.
Odległość euklidesową pomiędzy próbkami obliczono ze znormalizowanego profilu GCF.Odległości te zmniejszono przy użyciu protokołu UMAP77, a powstałe osadzania wykorzystano do klastrowania opartego na gęstości bez nadzoru przy użyciu HDBSCAN78.Optymalna minimalna liczba punktów dla klastra (a tym samym liczba klastrów) wykorzystywana przez HDBSCAN jest określana poprzez maksymalizację skumulowanego prawdopodobieństwa przynależności do klastra.Zidentyfikowane skupienia (oraz losowo zrównoważona podpróbka tych skupień w celu uwzględnienia błędu systematycznego w permutacyjnej wielowymiarowej analizie wariancji (PERMANOVA)) zostały przetestowane pod kątem istotności w porównaniu z niezredukowanymi odległościami euklidesowymi przy użyciu narzędzia PERMANOVA.Średni rozmiar genomu próbek obliczono na podstawie względnej obfitości mOTU i szacowanej wielkości genomu członków genomów.W szczególności średni rozmiar genomu każdego mOTU oszacowano jako średnią rozmiarów genomu jego członków skorygowanych pod kątem kompletności (po filtrowaniu) (na przykład kompletny genom w 75% o długości 3 Mb ma skorygowany rozmiar 4 MB).dla średnich genomów o integralności ≥70%.Następnie obliczono średni rozmiar genomu dla każdej próbki jako sumę rozmiarów genomu mOTU ważoną względną liczebnością.
Filtrowany zestaw kodowanych genomowo BGC w OMD pokazano w bakteryjnych i archeologicznych drzewach GTDB (w ramach zrębowych ≥ 5 kb, z wyłączeniem REF i SAG MarDB nie znalezionych w 1038 metagenomach, patrz wyżej) i ich przewidywanych kategorii produktów na podstawie filogenetyki pozycja genomu (patrz wyżej).Najpierw ograniczyliśmy dane według gatunków, wykorzystując jako reprezentatywny genom z największą liczbą BGC w tym gatunku.W celu wizualizacji przedstawicieli podzielono dalej na grupy drzew i ponownie dla każdego kladu komórkowego jako reprezentatywny wybrano genom zawierający największą liczbę BGC.Gatunki wzbogacone w BGC (co najmniej jeden genom z >15 BGC) poddano dalszej analizie poprzez obliczenie wskaźnika różnorodności Shannona dla typów produktów zakodowanych w tych BGC.Jeżeli wszystkie przewidywane typy produktów są takie same, hybrydy chemiczne i inne złożone BGC (jak przewiduje anty-SMAH) uznaje się za należące do tego samego typu produktu, niezależnie od ich kolejności w klastrze (np. fuzja białko-bakteriocyna i bakteriocyna-proteoproteina ciało).hybrydowy).
Pozostały DNA (szacowany na 6 ng) z próbki Malaspina MP1648, odpowiadający próbce biologicznej SAMN05421555 i dopasowany do zestawu odczytu metagenomicznego Illumina SRR3962772 do krótkiego odczytu, przetworzony zgodnie z protokołem sekwencjonowania PacBio z bardzo niskim wejściem do użycia zestawu PacBio SMRTbell do amplifikacji próbki gDNA zestaw (100-980-000) i zestaw do przygotowania szablonu SMRTbell Express 2.0 (100-938-900).W skrócie, pozostały DNA pocięto, naprawiono i oczyszczono (perełki ProNex) przy użyciu Covaris (g-TUBE, 52104).Oczyszczone DNA poddaje się następnie przygotowaniu biblioteki, amplifikacji, oczyszczaniu (perełki ProNex) i selekcji wielkości (>6 kb, Blue Pippin) przed końcowym etapem oczyszczania (kulki ProNex) i sekwencjonowaniem na platformie Sequel II.
Rekonstrukcja dwóch pierwszych ok.W przypadku MAG Eremiobacterota zidentyfikowaliśmy sześć dodatkowych ANI > 99% (uwzględniono je na ryc. 3), które początkowo przefiltrowano na podstawie wyników zanieczyszczenia (później zidentyfikowano jako duplikacje genów, patrz poniżej).Znaleźliśmy także tacę z napisem „Ca”.Eremiobacterota” z różnych badań23 i użył ich razem z ośmioma MAG z naszego badania jako odniesienie dla odczytów metagenomicznych z 633 wzbogaconych próbek eukariotycznych (> 0,8 µm) przy użyciu BWA (v.0.7.17) Ref -r1188, – flaga) dla próbkowanych w dół mapowanie (5 milionów odczytów).W oparciu o mapy specyficzne dla wzbogacania (przefiltrowane przez 95% tożsamości dopasowania i 80% zasięgu odczytu) wybrano do złożenia 10 metagenomów (oczekiwane pokrycie ≥5×) i dodatkowe 49 metagenomów (oczekiwane pokrycie ≥1×) do korelacji treści.Stosując te same parametry jak powyżej, próbki te rozdzielono i dodano 10 dodatkowych Ca.MAG Eremiobacterota została przywrócona.Te 16 MAG (nie licząc dwóch już znajdujących się w bazie danych) zwiększa całkowitą liczbę genomów w rozszerzonym OMD do 34 815.MAGom przypisuje się rangi taksonomiczne na podstawie ich podobieństwa genomowego i pozycji w GTDB.18 MAG uległo dereplikacji przy użyciu dRep na 5 gatunków (wewnątrzgatunkowy ANI > 99%) i 3 rodzaje (wewnątrzrodzajowy ANI 85% do 94%) w obrębie tej samej rodziny79.Przedstawiciele gatunków zostali wybrani ręcznie na podstawie integralności, skażenia i N50.Sugerowana nomenklatura znajduje się w Informacjach uzupełniających.
Ocenić integralność i zanieczyszczenie Ca.MAG Eremiobacterota oceniliśmy obecność uscMG, a także zestawów genów markerów o pojedynczej kopii specyficznych dla linii i domeny używanych przez CheckM i Anvi'o.Identyfikację 2 duplikatów z 40 uscMG potwierdzono przez rekonstrukcję filogenetyczną (patrz poniżej), aby wykluczyć jakiekolwiek potencjalne zanieczyszczenie (odpowiada to 5% w oparciu o te 40 genów markerowych).Dodatkowe badanie pięciu reprezentatywnych MAG „Ca.Niski poziom zanieczyszczeń w tych zrekonstruowanych genomach potwierdzono dla gatunków Eremiobacterota przy użyciu interaktywnego interfejsu Anvi'o w oparciu o korelacje liczebności i składu sekwencji (informacje uzupełniające)59.
Do analizy filogenomicznej wybraliśmy pięć reprezentatywnych MAG „Ca”.Eudormicrobiaceae”, wszystkie gatunki „Ca.Genom Eremiobacterota i członków innych gromad (w tym UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria i Planctomycetota) jest dostępny w GTDB (r89)13.Wszystkie te genomy opatrzono adnotacjami, jak opisano wcześniej dla ekstrakcji genu markera pojedynczej kopii i adnotacji BGC.Genomy GTDB konserwowano zgodnie z powyższymi kryteriami integralności i zanieczyszczenia.Analizę filogenetyczną przeprowadzono przy użyciu przepływu pracy Anvi'o Phylogenetics59.Drzewo skonstruowano przy użyciu IQTREE (v.2.0.3) (opcje domyślne i -bb 1000)80 na podstawie ułożenia 39 tandemowych białek rybosomalnych zidentyfikowanych przez Anvi'o (MUSCLE, v.3.8.1551)81.Jego stanowiska zostały zmniejszone.aby pokryć co najmniej 50% genomu82, a Planctomycecota użyto jako grupy zewnętrznej w oparciu o topologię drzewa GTDB.Jedno drzewo składające się z 40 karabinów UScMG zbudowano przy użyciu tych samych narzędzi i parametrów.
Wykorzystaliśmy Traitar (wersja 1.1.2) z domyślnymi parametrami (fenotyp, z nukleotydów)83, aby przewidzieć typowe cechy drobnoustrojów.Zbadaliśmy potencjalny drapieżny styl życia w oparciu o wcześniej opracowany indeks drapieżnictwa84, który zależy od zawartości genu kodującego białko w genomie.W szczególności używamy DIAMOND do porównywania białek w genomie z bazą danych OrthoMCL (v.4)85 przy użyciu opcji –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 ORAZ liczymy geny odpowiadające geny markerowe drapieżników i niedrapieżników.Indeks to różnica między liczbą oznaczeń drapieżnych i niedrapieżnych.Jako dodatkową kontrolę przeanalizowaliśmy także genom „Ca”.Czynnik Entotheonella TSY118 opiera się na jego powiązaniu z Ca.Eudoremicrobium (duży rozmiar genomu i potencjał biosyntetyczny).Następnie przetestowaliśmy potencjalne powiązania między genami markerowymi drapieżników i niedrapieżników oraz potencjałem biosyntetycznym Ca.Eudormicrobiaceae” i odkrył, że nie więcej niż jeden gen (z dowolnego typu genu markerowego, tj. genu drapieżnika/niedrapieżnika) pokrywa się z BGC, co sugeruje, że BGC nie zakłóca sygnałów dotyczących drapieżnictwa.Dodatkową adnotację genomową wymieszanych replikonów przeprowadzono przy użyciu TXSSCAN (wersja 1.0.2), aby szczegółowo zbadać układ wydzielniczy, pilusy i wici86.
Pięć reprezentatywnych Ca zmapowano poprzez mapowanie 623 metatranskryptomów z prokariotycznych i eukariotycznych frakcji wzbogaconych oceanów Tara22,40,87 (przy użyciu BWA, v.0.7.17-r1188, -a flag).Genom Eudormicrobiaceae.Pliki BAM zostały przetworzone za pomocą FeatureCounts (v.2.0.1)88 po 80% pokryciu odczytu i 95% filtrowaniu tożsamości (z opcjami featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Zlicza liczba wstawek na gen.Wygenerowane mapy normalizowano pod kątem długości genu i liczebności genów markerowych mOTU (znormalizowana do długości średnia liczba insercji dla genów z liczbą insercji > 0) i przekształcano log do 22,74, aby uzyskać względną ekspresję każdego poziomu genu na komórkę, co również wyjaśnia zmienność między próbkami podczas sekwencjonowania.Takie stosunki pozwalają na analizę porównawczą, łagodząc problemy ze składem przy wykorzystaniu danych względnej liczebności.Do dalszej analizy wzięto pod uwagę tylko próbki zawierające > 5 z 10 genów markerowych mOTU, aby umożliwić wykrycie wystarczająco dużej części genomu.
Znormalizowany profil transkryptomu „Ca.E. taraoceanii poddano redukcji wymiarowości przy użyciu UMAP, a otrzymaną reprezentację wykorzystano do grupowania bez nadzoru przy użyciu HDBSCAN (patrz wyżej) w celu określenia statusu ekspresji.PERMANOVA bada istotność różnic pomiędzy zidentyfikowanymi klastrami w pierwotnej (nie zredukowanej) przestrzeni odległości.Zbadano zróżnicowaną ekspresję tych warunków w całym genomie (patrz wyżej) i zidentyfikowano 201 szlaków KEGG w 6 grupach funkcjonalnych, a mianowicie: BGC, geny układu wydzielniczego i wici z TXSSCAN, enzymy degradujące (proteaza i peptydazy) oraz drapieżne i nie- drapieżne geny.drapieżne markery indeksowe.Dla każdej próbki obliczyliśmy medianę znormalizowanej ekspresji dla każdej klasy (należy zauważyć, że sama ekspresja BGC jest obliczana jako mediana ekspresji genów biosyntetycznych dla tej BGC) i testowaliśmy pod kątem istotności w różnych stanach (test Kruskala-Wallisa skorygowany o FDR).
Syntetyczne geny zakupiono od GenScript, a startery PCR zakupiono od Microsynth.Do amplifikacji DNA zastosowano polimerazę Phusion firmy Thermo Fisher Scientific.Do oczyszczania DNA wykorzystano plazmidy NucleoSpin, żel NucleoSpin i zestaw do oczyszczania PCR firmy Macherey-Nagel.Enzymy restrykcyjne i ligazę DNA T4 zakupiono od New England Biolabs.Substancje chemiczne inne niż izopropylo-β-d-1-tiogalaktopiranozyd (IPTG) (Biosynth) i 1,4-ditiotreitol (DTT, AppliChem) zakupiono od Sigma-Aldrich i zastosowano bez dalszego oczyszczania.Antybiotyki chloramfenikol (Cm), dichlorowodorek spektynomycyny (Sm), ampicylina (Amp), gentamycyna (Gt) i karbenicylina (Cbn) zakupiono od AppliChem.Składniki pożywki Bacto Tryptone i Bacto Yeast Extract zakupiono od BD Biosciences.Trypsynę do sekwencjonowania zakupiono od firmy Promega.
Sekwencje genów ekstrahowano z przewidywanego anty-SMASH BGC 75.1.E. malaspinii (informacja uzupełniająca).
Geny embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4) i embAM (w tym regiony międzygenowe) zsekwencjonowano jako syntetyczne konstrukty w pUC57(AmpR) z kodonami i bez kodonów zoptymalizowanych pod kątem ekspresji w E Kiedy.Gen embA subklonowano w pierwszym miejscu wielokrotnego klonowania (MCS1) pACYCDuet-1(CmR) i pCDFDuet-1(SmR) z miejscami cięcia BamHI i HindIII.Geny embM i embMopt (zoptymalizowane pod względem kodonów) subklonowano do MCS1 pCDFDuet-1(SmR) za pomocą BamHI i HindIII i umieszczano w drugim miejscu wielokrotnego klonowania pCDFDuet-1(SmR) i pRSFDuet-1(KanR) (MCS2) za pomocą NdeI/ChoI.Kasetę embAM subklonowano do pCDFDuet1(SmR) z miejscami cięcia BamHI i HindIII.Gen orf3/embI (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) skonstruowano metodą PCR z wydłużaniem zachodzących na siebie przy użyciu starterów EmbI_OE_F_NdeI i EmbI_OE_R_XhoI, trawionych NdeI/XhoI i ligowanych z pCDFDuet-1-EmbM (MCS1) przy użyciu tych samych enzymów restrykcyjnych (Supp podstawowy tabela).6).Trawienie enzymami restrykcyjnymi i ligację przeprowadzono zgodnie z protokołem producenta (New England Biolabs).

 


Czas publikacji: 14 marca 2023 r