June 6th, 2025
W tym artykule opisano AMOS, internetową bazę danych Analytical Methods and Open Spectra, aplikację cheminoinformatyczną zaprojektowaną w celu zapewnienia naukowcom łatwego dostępu do metod analitycznych i danych spektralnych.
Chcemy stworzyć łatwy sposób dla naukowców EPA na znajdowanie metod analitycznych z różnych rozproszonych zasobów, tak aby nasi naukowcy mogli spędzać mniej czasu na przeszukiwaniu Internetu, a zamiast tego mieli wyselekcjonowane zasoby zintegrowane z naszym istniejącym systemem informatyki chemicznej. To, co zbudowaliśmy, to zasadniczo lekki system zarządzania dokumentami, który mapuje te dokumenty na wyekstrahowane substancje chemiczne. W rezultacie, tysiące metod analitycznych można przeszukiwać przy użyciu różnych identyfikatorów chemicznych, aby znaleźć metody już zastosowane do wykrywania tych chemikaliów. Nie istnieje żadna inna bezpłatna internetowa baza danych metod analitycznych, którą społeczność mogłaby przeszukiwać w celu uzyskania istniejącej referencyjnej metody analitycznej dla danej substancji chemicznej lub dobrego zestawu warunków wyjściowych dla danej metody. Protokół ten uczy czytelnika, jak używać AMOS do zbierania użytecznych danych, które wspierają prace nad rozwojem metody. Nauczyliśmy się wiele o tym, jak zbierać i integrować dane z metod analitycznych z naszą bazą danych i aplikacją. Agregując te tysiące dokumentów i mapując je do powiązanych z nimi substancji chemicznych, mamy teraz doskonały zestaw danych do zbadania wykorzystania tych dokumentów i rozszerzenia dużego modelu sztucznej inteligencji w dużym języku, który naukowcy mogą przeszukiwać.
[Narrator] Aby rozpocząć, przejdź do pola tekstowego w lewym górnym rogu paska nawigacyjnego lub pola wyszukiwania na stronie głównej i wprowadź nazwę substancji, numer rejestru CAS, InChIKey lub identyfikator substancji DSSTox. Naciśnij Enter lub kliknij Wyszukaj, aby przeprowadzić wyszukiwanie. Zaznacz wiersz w tabeli wynikowej, aby wyświetlić skojarzony rekord po prawej stronie strony. Aby przeprowadzić wyszukiwanie wsadowe, wprowadź listę identyfikatorów substancji DSSTox w polu danych wejściowych, umieszczając jeden identyfikator w każdym wierszu. Użyj pól wyboru w obszarze Opcje wyszukiwania, aby filtrować wyniki lub dodawać dodatkowe informacje do rekordów. Kliknij przycisk wyszukiwania u dołu strony, aby wygenerować i pobrać plik arkusza kalkulacyjnego, który zawiera informacje o wszystkich rekordach w bazie danych, które są powiązane z danym wykazem substancji. Po zakończeniu wyszukiwania kliknij Dodatkowe wyszukiwania, a następnie Wyszukiwanie struktury podobieństwa. Wprowadź identyfikator substancji, ustaw minimalne podobieństwo substancji filtra na 0,8 i kliknij przycisk Szukaj, aby uzyskać tabelę zakładek. Następnie wybierz wiersz w tabeli, aby wyświetlić porównanie strukturalne między poszukiwaną substancją a substancją wybraną z tabeli. Aby przeprowadzić wyszukiwanie klasyfikatora, wybierz pierwszy poziom klasyfikacji przy użyciu pola w górnej części strony. Następnie kliknij przycisk poniżej pola, aby wyświetlić listę klasyfikacji dla następnego poziomu. Powtórz ten proces dla drugiego i trzeciego poziomu, za każdym razem wybierając klasyfikację i klikając przycisk, aby kontynuować. Po wybraniu czwartego poziomu należy kliknąć w poniższy przycisk, aby uruchomić wyszukiwanie i wyświetlić listę wszystkich substancji, które należą do wybranych czterech poziomów klasyfikacji klasyfikatora. Przeszukaj bazę danych w poszukiwaniu wszystkich arkuszy informacyjnych i metod, wykonując wyszukiwanie na liście metod i w arkuszach informacyjnych. Po załadowaniu tabeli wyników użyj pól wejściowych u góry każdej kolumny, aby przefiltrować dane według określonych pól. Aby przeprowadzić wyszukiwanie widma masowego, należy wprowadzić zakres masowy dla substancji docelowej w daltonach wraz z marginesem błędu w daltonach lub częściach na milion. Ustaw wartość okna dla piku podobieństwa na 0,05 daltona. Należy wybrać metodologię: chromatografia gazowa ze spektrometrią mas lub chromatografia cieczowa ze spektrometrią mas. Wprowadź widmo masowe jako listę par masa-ładunek i intensywność. Po wypełnieniu wszystkich pól kliknij przycisk Szukaj, aby pobrać listę dopasowań widma masowego z bazy danych na podstawie widma dostarczonego przez użytkownika. Wybierz wiersz w tabeli wynikowej do wyświetlenia spektralnego. Teraz, aby zwizualizować klasyfikację zastosowań funkcjonalnych, użyj pola Wyszukaj klasy, aby przeszukać listę klas użycia funkcjonalnego. Najedź kursorem na nazwę klasy na liście, aby podświetlić odpowiedni węzeł na wykresie. Jeśli eksplorujesz wykres bezpośrednio, umieść kursor na węźle, aby wyświetlić krótki opis klasy i wyróżnić wszystkie bezpośrednie klasy nadrzędne lub podrzędne dla tego węzła. Przedstawiono tutaj trójskładnikowy wykres glebowy klasyfikujący typy tekstur na podstawie proporcji gliny, mułu i piasku z oznaczonymi strefami, takimi jak glina, glina i glina piaszczysta. To narzędzie klasyfikacyjne umożliwiło użytkownikom AMOS powiązanie typów tekstury gleby z odpowiednimi arkuszami informacyjnymi, metodami analitycznymi i widmami eksperymentalnymi, ułatwiając wydajne przepływy pracy od danych o składzie do ukierunkowanych wyszukiwań substancji w oparciu o klasyfikacje funkcjonalne.
Ten artykuł opisuje AMOS, internetową bazę danych dotyczącą metod analitycznych i otwartych spektrów, aplikację cheminformatyczną zaprojektowaną, aby zapewnić badaczom łatwy dostęp do metod analitycznych i danych spektralnych.