August 18th, 2023
Ten protokół zapewnia podejście do optymalizacji receptur w stosunku do czynników badania mieszanego, ciągłego i kategorycznego, które minimalizuje subiektywne wybory w konstrukcji eksperymentalnego projektu. W fazie analizy stosowana jest skuteczna i łatwa w użyciu procedura modelowania dopasowania.
Ten artykuł zawiera przepływ pracy dla naukowców w celu skonstruowania eksperymentalnej tabeli projektowej i przeanalizowania wyników eksperymentalnych dla różnych czynników mieszaniny i procesu, bez konieczności podejmowania żmudnych i potencjalnie niestabilnych decyzji statystycznych. Powstałe w ten sposób modele mogą być wspólnie optymalizowane pod kątem wielu odpowiedzi i wykorzystywane do tworzenia grafik informacyjnych podsumowujących zarówno wspólną powierzchnię odpowiedzi, jak i przewidywania poszczególnych reakcji. Te grafiki są łatwiejsze do zinterpretowania niż oszacowania parametrów z podstawowych modeli statystycznych i są pomocne w reprezentowaniu ustawień czynników, które dają najbardziej pożądane odpowiedzi.
Naukowcy zajmujący się formułowaniem lipidów i nanocząsteczek często muszą konstruować nowe receptury dla różnych ładunków lub podczas zmiany lipidów lub ustawień procesu. Zapewniamy solidne podejście do optymalizacji receptur, które minimalizuje ryzyko błędów w konstrukcji projektu i pozwala uniknąć konieczności korzystania z obszernych danych statystycznych i wiedzy podczas analizy. Podsumuj cel eksperymentu w dokumencie z datownikiem.
Wymień odpowiedzi, które będą mierzone podczas eksperymentu. Wybierz czynniki, które będą zróżnicowane i te, które będą utrzymywane na stałym poziomie podczas badania. Ustal zakresy dla różnych czynników i odpowiednią dokładność dziesiętną dla każdego z nich.
Zdecyduj o wielkości projektu badania, korzystając z minimalnej i maksymalnej heurystyki. Otwórz skok i przejdź na pasku menu do DOI, Special Purpose, Space Filling Design. Wprowadź odpowiedzi udzielone w badaniu.
Wprowadź czynniki badania i zakresy. Wprowadź z góry określoną liczbę przebiegów dla projektu. Wygeneruj tabelę obliczeniową wypełniania przestrzeni dla wybranych czynników i wielkości serii.
Dodaj kolumnę notatek do tabeli, aby dodawać adnotacje do wszystkich ręcznie utworzonych przebiegów. W razie potrzeby ręcznie włącz przebiegi kontrolne testów porównawczych do tabeli konfiguracji. Należy dołączyć replikację dla jednego z kontrolowanych wskaźników porównawczych.
Zaznacz nazwę testu porównawczego w kolumnie notatek i oznacz kolorem wiersze replikacji testu porównawczego w celu łatwej prawidłowej identyfikacji. Zaokrąglić mieszaninę poziomów czynników do odpowiedniej szczegółowości. Skopiuj zaokrąglone wartości i wklej je do oryginalnych kolumn.
Usuń nadmiarowe kopie zaokrąglonych kolumn. Po zaokrągleniu czynników lipidowych sprawdź, czy ich suma wynosi 100%Jeśli suma któregokolwiek wiersza nie jest równa jeden, ręcznie dostosuj jeden z czynników mieszaniny, upewniając się, że pozostaje w zakresie współczynników. Usuń kolumnę sumy po dokonaniu korekt.
Należy postępować zgodnie z tą samą procedurą, co przy zaokrąglaniu współczynników mieszaniny, aby zaokrąglić czynniki procesu do ich odpowiedniej ziarnistości. Sformatuj kolumny lipidowe tak, aby były wyświetlane jako wartości procentowe z żądaną liczbą miejsc po przecinku. Jeśli dodano przebiegi ręczne, takie jak testy porównawcze, ponownie losowo zlosuj kolejność wierszy tabeli, dodaj nową kolumnę z zaokrąglonymi wartościami.
Posortuj tę kolumnę w kolejności rosnącej, klikając prawym przyciskiem myszy jej nagłówek kolumny, a następnie usuń kolumnę. Generuj wykresy trójskładnikowe, aby zwizualizować punkty projektowe nad czynnikami lipidowymi. Zbadaj również rozkład przebiegów w czynnikach procesu.
Naukowcy zajmujący się preparatem powinni potwierdzić wykonalność wszystkich przebiegów. Jeśli istnieją niewykonalne przebiegi, uruchom ponownie projekt, biorąc pod uwagę nowo odkryte ograniczenia. Uruchom eksperyment w kolejności podanej w tabeli konfiguracji.
Zapisz odczyty w kolumnie wbudowanej w tabelę eksperymentalną. Narysuj odczyty i zbadaj rozkład odpowiedzi. Zbadaj względną odległość między seriami powtórzeń oznaczonymi kolorami, jeśli jeden z nich został uwzględniony, co pozwala na zrozumienie całego procesu i zmienności analitycznej w punkcie odniesienia, w porównaniu ze zmiennością wynikającą ze zmian ustawień czynników w całej przestrzeni czynników.
Twórz biegi na działkach trójskładnikowych. Pokoloruj punkty zgodnie z odpowiedziami, aby uzyskać niezależny od modelu widok zachowania w odniesieniu do czynników mieszanki. Kliknij prawym przyciskiem myszy dowolny z wynikowych wykresów, wybierz pozycję Legenda wiersza, a następnie wybierz kolumnę odpowiedzi.
Powtórz tę czynność dla każdej odpowiedzi. Zbuduj niezależny model dla każdej odpowiedzi w funkcji badanych czynników. Usuń skrypty modelu, które zostały utworzone przez projekt wypełnienia przestrzeni.
Wybierz opcję Analizuj, Dopasuj model. Skonstruuj pełny model zawierający wszystkie potencjalne efekty. Model ten powinien obejmować główne efekty każdego czynnika, oddziaływania dwu- i trójstronne, wyrazy kwadratowe i częściowe sześcienne w czynnikach procesu oraz wyrażenia sześcienne Scheffego dla czynników mieszaniny.
Zaznacz wszystkie czynniki badania. Zmień wpis stopnia na trzy z domyślnego wyrażonego na dwa. Następnie wybierz silnię do stopnia.
Zaznacz tylko czynniki niebędące mieszanką, a następnie wybierz opcję Makra, Częściowy sześcienny. Zaznacz tylko współczynniki mieszania, a następnie wybierz Makra, Scheffe Cubic. Wyłącz domyślną opcję bez przechwytywania.
Określ kolumnę odpowiedzi, zmień Osobowość na Regresja uogólniona. Zapisz ten model w tabeli danych, aby ułatwić jego przywołanie. Wybierz pozycję Zapisz w tabeli danych.
Kliknij przycisk Uruchom. Jako metodę szacowania wybierz SVEM Forward Selection (Wybór SVEM do przodu). Rozwiń menu Zaawansowane elementy sterujące Force Terms i odznacz pola odpowiadające głównym efektom mieszanki.
Tylko warunek przechwycenia pozostanie zaznaczony. Kliknij przycisk Przejdź.Wykreśl rzeczywiste odpowiedzi według ich przewidywanych odpowiedzi z modelu SVEM, aby zweryfikować rozsądną przewidywalność. Kliknij czerwony trójkąt obok opcji SVEM Forward Selection i wybierz Zapisz kolumny, Zapisz formułę przewidywania.
Spowoduje to utworzenie nowej kolumny zawierającej formułę przewidywania w tabeli danych Powtórz kroki tworzenia modelu dla każdej odpowiedzi. Po tym, jak wszystkie odpowiedzi mają kolumny przewidywania zapisane w tabeli danych, wykreśl ślady odpowiedzi dla wszystkich przewidywanych kolumn odpowiedzi przy użyciu funkcji profilera. Wybierz pozycję Graph Profiler i zaznacz wszystkie kolumny przewidywania utworzone w poprzednim kroku dla formuły przewidywania Y, kliknij przycisk OK.
Zidentyfikuj potencjalne optymalne receptury. Ustaw funkcję pożądalności dla każdej odpowiedzi, czy powinna być zmaksymalizowana, zminimalizowana czy dopasowana do celu. Wiąże się to również z ustaleniem względnych wag ważności dla każdej odpowiedzi.
Aby wygenerować pierwszego kandydata, ustaw wszystkie odpowiedzi podstawowe tak, aby używały wagi ważności 1,0, a wszystkie odpowiedzi pomocnicze używały wagi ważności 0,2. Poinstruuj profilera, aby znalazł optymalne ustawienia czynnika, które maksymalizują funkcję pożądania. Wybierz opcję Optymalizacja Atrakcyjność, Maksymalizuj atrakcyjność.
Zapisz optymalne ustawienia czynników wraz z notatką na temat wag ważności użytych dla każdej odpowiedzi. W przypadku czynników kategorycznych, takich jak typ lipidów jonizowalnych, znajdź warunkowo optymalne preparaty dla każdego poziomu czynnika. Najpierw ustaw żądany poziom każdego czynnika w profilerze.
Następnie przytrzymaj Control i kliknij lewym przyciskiem myszy wewnątrz wykresu tego czynnika i wybierz Zablokuj ustawienie współczynnika. Ta optymalizacja wyboru i atrakcyjność maksymalizują atrakcyjność znalezienia optimum warunkowego z tym czynnikiem zablokowanym w jego bieżącym ustawieniu. Po zakończeniu odblokuj ustawienia czynnika przed kontynuowaniem.
Powtórz proces optymalizacji po zmodyfikowaniu wag ważności odpowiedzi, być może optymalizując tylko odpowiedzi podstawowe lub ustawiając niektóre odpowiedzi drugorzędne tak, aby miały większą lub mniejszą wagę ważności, przy czym ustawiając ich cel na brak. Nagraj nowego optymalnego kandydata. Twórz graficzne podsumowania optymalnych obszarów przestrzeni czynników.
Utwórz tabelę danych zawierającą 50 000 wierszy, które są wypełniane losowo wygenerowanymi ustawieniami czynników w dozwolonej przestrzeni czynników, wraz z odpowiadającymi im przewidywanymi wartościami z modeli zredukowanych dla każdej z odpowiedzi, a także wspólną funkcją pożądania. Wybierz opcję Output Random Table (Wyjdź losową tabelę). Zmień wartość liczby przebiegów do symulacji na 50 000 i kliknij przycisk OK.
W nowo utworzonej tabeli dodaj nową kolumnę, która oblicza percentyl kolumny atrakcyjności. Użyj tej kolumny percentyla na wykresach trójskładnikowych zamiast kolumny nieprzetworzonej atrakcyjności. Kliknij prawym przyciskiem myszy nagłówek kolumny Atrakcyjność i wybierz pozycję Nowa kolumna formuły, Dystrybucja, Skumulowane prawdopodobieństwo.
Wygeneruj następującą grafikę. Wielokrotnie zmieniaj schemat kolorów grafiki w celu wyświetlenia przewidywań dla każdej odpowiedzi oraz dla kolumny skumulowanego prawdopodobieństwa. Skonstruuj wykresy trójskładnikowe dla czterech czynników lipidowych.
W tabeli przejdź do wykresu wykresu trójskładnikowego. Wybierz współczynniki mieszaniny dla wykresu X i kliknij przycisk OK. Kliknij prawym przyciskiem myszy jeden z wynikowych wykresów, wybierz pozycję Legenda wiersza, a następnie wybierz przewidywaną kolumnę odpowiedzi.
Zmień listę rozwijaną kolorów na Jet. To pokaże najlepsze i najgorsze regiony pod względem czynników lipidowych. Obecny rysunek pokazuje percentyle atrakcyjności stawów, gdy rozważa się maksymalizację potencji z ważnym następstwem 1 i minimalizację rozmiaru z ważnym następstwem 0,2.
Podczas uśredniania wszystkich czynników, które nie są pokazane na trójskładnikowej osi wykresu. Wielokrotnie zmieniaj schemat kolorów grafiki, aby wyświetlić przewidywania dla każdej odpowiedzi. Podobnie, wykreśl 50 000 oznaczonych kolorami punktów reprezentujących unikalne formuły w stosunku do czynników procesu niebędących mieszaniną, pojedynczo lub łącznie, i poszukaj relacji między odpowiedziami a czynnikami.
Szukaj ustawień współczynników, które powodują, że punkty przynoszą najwyższą atrakcyjność. Rysunek ten pokazuje łączną atrakcyjność wszystkich preparatów, które można utworzyć z każdym z trzech zjonizowanych typów lipidów. Najbardziej pożądane preparaty wykorzystują H102, przy czym H101 zapewnia pewne potencjalnie konkurencyjne alternatywy.
Zbadaj różne kombinacje czynników, które mogą prowadzić do różnych reakcji. Zapisz profiler predykcji i jego zapamiętane ustawienia z powrotem w tabeli danych. Przygotuj tabelę z listą optymalnych kandydatów zidentyfikowanych wcześniej.
Dołącz kontrolkę testu porównawczego do zestawu kandydujących przebiegów, które zostaną sformułowane i zmierzone. Jeśli okaże się, że którakolwiek z formuł z eksperymentu przynosi pożądane wyniki, być może przewyższając wynik porównawczy, wybierz najlepsze do dodania do tabeli kandydatów i przetestuj ponownie wraz z nowymi preparatami. Kliknij prawym przyciskiem myszy zapamiętaną tabelę ustawień w profilerze i wybierz polecenie Utwórz w tabeli danych.
Przeprowadź przebiegi potwierdzające, skonstruuj receptury i zbierz odczyty. Porównaj wydajność proponowanych optymalnych preparatów. Przepływ pracy został wykorzystany w wielu aplikacjach.
W większości przypadków zaobserwowaliśmy co najmniej cztero- do pięciokrotną poprawę siły działania, gdy porównamy je z formułami wzorcowymi, które zostały ustalone przy użyciu optymalizacji czynnik po czynniku. Poprawa jest szczególnie zauważalna, gdy odpowiedzi wtórne są ukierunkowane wspólnie. Możliwe jest również wykorzystanie symulacji do pokazania oczekiwanej jakości optymalnych kandydatów wytworzonych w wyniku tej procedury.
Korzystając ze znanej funkcji generowania danych dla przykładowego eksperymentu opisanego w artykule, możemy porównać jakość kandydujących optymalnych preparatów uzyskanych z projektów wypełniania przestrzeni i analizy opartej na SVEM stosowanych w tym procesie pracy z tymi uzyskanymi przy użyciu tradycyjnych technik analizy mieszanin. Przy jakości optymalnego sformułowania pokazanej na osi pionowej i liczbie przebiegów w projekcie pokazanej na osi poziomej, niebieskie punkty reprezentują wydajność niezredukowanego pełnego modelu statystycznego w ponad 150 symulacjach. Bursztynowe punkty reprezentują wydajność tradycyjnego wyboru pojedynczego strzału do przodu w oparciu o funkcję celu AICC.
Zielone punkty reprezentują wydajność podejścia selekcji do przodu opartego na SVEM stosowanego w tym przepływie pracy. Analiza SVEM pozwala nam na pozyskanie lepszych optymalnych kandydatów i mniejszej liczby runów. Sporadycznie zdarzają się badania o dodatkowej złożoności, które wymagają pomocy statystyka przy projektowaniu i analizie.
Statystyk może inaczej podejść do badań, które mają bardzo wysoki priorytet, w których wielkość serii jest bardziej ograniczona niż zwykle, lub występuje duża liczba czynników kategorycznych lub pojedynczy czynnik kategoryczny z dużą liczbą poziomów. Stosowanie projektów optymalnych lub hybrydowych zamiast projektu wypełnienia przestrzeni określonego w przepływie pracy.
View the full transcript and gain access to thousands of scientific videos
Ten artykuł zapewnia przepływ pracy do budowania tabel projektu eksperymentu i analizowania wyników dla różnych czynników mieszanki i procesu. Minimalizuje subiektywne decyzje statystyczne i produkuje pouczające grafiki dla lepszej interpretacji wyników.