$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
I. Analizy podsystemów
1. Podsystem oddechowy/ Oddychanie dla mowy
Podsystem oddechowy jest oceniany za pomocą Fonacyjnego Systemu Aerodynamicznego (PAS). System pozwala na jednoczesne rejestrowanie ciśnienia w jamie ustnej, przepływu powietrza i akustyki mowy (lista sprzętu i producentów znajduje się w tabeli 1). Do nagrań niezbędna jest jednorazowa maska na twarz i jednorazowa rurka wykrywająca ciśnienie. Przed rejestracją kanały przepływu i ciśnienia są kalibrowane zgodnie ze specyfikacją producenta.
- Pojemność życiowa (VC) to maksymalna objętość powietrza, która jest wydychana po maksymalnym wdechu. VC ocenia się za pomocą jednorazowej maski na twarz, która jest dołączona do pneumotachografu.
- Do nagrania wybierany jest protokół PAS "Vital Capacity".
- Uczestnik jest instruowany, aby wdychać tak maksymalnie, jak to możliwe i wydychać maksymalnie do maski; zadanie jest powtarzane trzy razy.
- Maksymalną objętość wydechową określa się za pomocą oprogramowania PAS.
- Ciśnienie podgłośniowe (Ps) to ciśnienie powietrza dostępne w płucach do produkcji spółgłosek "ciśnieniowych". Ps ocenia się pośrednio, mierząc ciśnienie szczytowe w jamie ustnej podczas wytwarzania ciągu sylabowego2,3.
- Do nagrania wybierany jest protokół PAS "Voicing Efficiency".
- Aby zarejestrować ciśnienie w jamie ustnej podczas /pa/, rurkę wykrywającą ciśnienie umieszcza się wewnątrz jamy ustnej na powierzchni języka.
- Przewody nosowe są zasłonięte klipsem na nos, aby wyeliminować potencjalną ucieczkę przepływu powietrza przez nos.
- Uczestnik jest instruowany, aby wdychać około dwa razy więcej niż normalnie i powiedzieć /pa/ do maski na twarz. Sylaba /pa/ jest powtarzana siedem razy podczas jednego wydechu, zachowując stałą wysokość i głośność. Szybkość jest utrzymywana na poziomie 1,5 sylab na sekundę.
- Szczytowe ciśnienie w jamie ustnej mierzy się dla pięciu (środkowych) powtórzeń /pa/. Średnia z tych pięciu produkcji jest uzyskiwana w celu reprezentowania Ps podczas mowy.
- Ponieważ Ps współzmienia się z poziomem ciśnienia akustycznego (SPL)4,5, SPL jest również zbierany dla każdej sylaby. Jest on następnie wykorzystywany jako współzmienna podczas analiz.
- Oddychanie mowy jest oceniane podczas mowy połączonej, podczas gdy uczestnicy czytają standardowy akapit składający się z 60 słów (Załącznik 1) opracowany specjalnie do dokładnego, automatycznego wykrywania granic pauzy6.
- Do nagrania wybierany jest protokół PAS "Maximum Phonation".
- Sygnał przepływu powietrza jest zbierany za pomocą jednorazowej maski, która jest dopasowana do twarzy.
- Uczestnik jest instruowany, aby przeczytać akapit w normalnym, komfortowym tempie mówienia i głośności.
- Ślady przepływu powietrza są eksportowane do niestandardowego oprogramowania do analizy mowy i pauzy (SPA)7 w Matlabie. W tym programie identyfikowane są przerwy w połączonej mowie. Oprogramowanie oblicza między innymi procentowy czas pauzy, który jest miarą czasu spędzonego na pauzie podczas czytania fragmentu.
2. Podsystem fonacyjny
Podsystem fonacyjny jest oceniany za pomocą nagrań głosowych przy użyciu wysokiej jakości sprzętu do nagrywania akustycznego (Tabela 1).
- Mikrofon umieszcza się w odległości około 15 cm od ust.
- Klips do nosa służy do wyeliminowania potencjalnego wpływu nieadekwatności wewnętrzno-gardłowej na jakość fonacji.
- Uczestnik proszony jest o wyprodukowanie "Maksymalnej Fonacji". Zostaje on poinstruowany, aby wdychać maksymalną ilość powietrza, a następnie fonować /a/ w normalnej wysokości i głośności tak długo, jak to możliwe. To zadanie jest ćwiczone co najmniej raz przed nagraniem. Podkreśla się znaczenie maksymalnego wysiłku.
- Maksymalny czas trwania fonacji jest mierzony w sekundach za pomocą fali akustycznej.
- Zdigitalizowany przebieg fali akustycznej jest ładowany do oprogramowania Multidimensional Voice Profile (MDVP) w celu analizy. Miary tendencji centralnej i zmienności częstotliwości podstawowej (F0), stosunku szumu do harmonicznych (NHR) i procentowego fluktuacji uzyskuje się m.in. dla środkowych pięciu sekund interwału fonacji.
3. Podsystem rezonansowy
Podsystem rezonansowy jest oceniany za pomocą Nasometeru. To urządzenie składa się z zestawu słuchawkowego z przegrodą, która jest umieszczona pod nosem i oddziela jamę ustną i nosową. Dwa mikrofony, które wykrywają ustne i nosowe sygnały akustyczne, są przymocowane po przeciwnych stronach płytki.
- Urządzenie jest kalibrowane przed każdym nagraniem.
- Zestaw słuchawkowy umieszcza się na głowie z przegrodą spoczywającą nad górną wargą i ustawia równolegle do podłoża.
- Uczestnik jest proszony o trzykrotne powtórzenie jednego zdania "nosowego" (np. Mama zrobiła dżem cytrynowy) i jednego zdania "nonosowego" (np. Kup Bobby'emu szczeniaka) przy zwykłym tempie mówienia i głośności.
- Zmierzone natężenia dźwięcznej części ustnych i nosowych sygnałów akustycznych są przeliczane na wynik nosowy, który definiuje się jako stosunek energii akustycznej nosa / nosa + jamy ustnej i jest wyrażony w procentach. Wynik nosowości odzwierciedla względną proporcję energii akustycznej nosa do dźwięku ustnego w strumieniu mowy8.
- Oprogramowanie Nasometer oblicza liczne statystyki opisowe na podstawie kształtu fali nosowej.
- Odległość nosowa, którą oblicza się przez odjęcie średniej nosowości obliczonej dla zdań ustnych (BBP) od średniej nosowości dla zdań nosowych (MMJ)9, może być również używana jako wskaźnik upośledzenia ruchu wewnątrzgardłowego.
4. Podsystem artykulacyjny: Twarz
Ruchy twarzy (wargi i szczęki) są rejestrowane w 3D za pomocą optycznego systemu przechwytywania ruchu o wysokiej rozdzielczości10. Cyfrowe kamery wideo na podczerwień rejestrują pozycje 15 odblaskowych znaczników, które są przymocowane do głowy i twarzy każdego uczestnika w określonych anatomicznych punktach orientacyjnych. Akustyczny sygnał mowy jest rejestrowany jednocześnie z kinematyką mowy.
- System jest kalibrowany przed nagraniami zgodnie ze specyfikacją producenta.
- Cztery markery są przymocowane do czoła uczestnika za pomocą opaski na głowę. Markery są również przymocowane do lewej i prawej brwi, grzbietu i czubka nosa, cynobrowej granicy górnej i dolnej wargi, lewego i prawego kącika ust oraz do trzech różnych miejsc na brodzie. Jest to typowa tablica znaczników używana w tym protokole, ale w tym systemie można używać nieograniczonej liczby znaczników.
- Uczestnik jest proszony o czytanie zdań i zwrotów (patrz Tabela 2) w swoim zwykłym tempie mówienia i głośności.
- Nagranie pliku "spoczynku" jest uzyskiwane i wykorzystywane w przetwarzaniu końcowym w celu normalizacji różnic w rozmieszczeniu znaczników między sesjami i ponownego wyrażania danych w stosunku do spójnego anatomicznego układu współrzędnych w razie potrzeby.
- Podczas przetwarzania końcowego ruchy markerów twarzy są sprawdzane pod kątem błędów śledzenia i korygowane na głowie na podstawie odejmowania zarówno translacyjnych, jak i rotacyjnych składowych ruchu głowy.
- Dane są ładowane do SMASH, oprogramowania opartego na Matlabie opracowanego w naszym laboratorium. W SMASH dane są filtrowane i analizowane. Szczytowa prędkość ruchu jest uzyskiwana z każdego śladu i używana jako podstawowy wskaźnik funkcji artykulacyjnej szczęki i warg. Prędkość 3D jest obliczana jako pochodna pierwszego rzędu historii czasu odległości euklidesowej każdego artykulatora w SMASH.
5. Podsystem artykulacyjny: Język
Śledzenie języka odbywa się za pomocą elektromagnetycznego urządzenia śledzącego (WAVE), które rejestruje pozycję i rotację czujników przymocowanych do języka. W przeciwieństwie do optycznego śledzenia ruchu, które służy do rejestrowania zewnętrznych struktur twarzy, technologia elektromagnetyczna umożliwia dokładne śledzenie ruchów języka podczas mowy11. System wykorzystuje kombinację czujników 5 i 6 stopni swobody (5DOF i 6DOF) do rejestrowania ruchów artykulacyjnych w skalibrowanej objętości (30 x 30 x 30 cm). Dane o ruchu i dane akustyczne są pozyskiwane jednocześnie.
- Dwa czujniki są przymocowane do artykulatorów za pomocą kleju dentystycznego (PeriAcryl Periodontal Adhesive). Jedno odniesienie jest przymocowane do grzbietu nosa, aby rejestrować ruchy głowy. Jeden mały czujnik 5DOF (lokalizacja 3D i pomiary kątowe 2D) jest przymocowany do języka w linii środkowej, około 2 cm za końcem języka.
- Aby uzyskać ruchy języka, które są niezależne od leżącej pod spodem szczęki, każdy uczestnik jest wyposażony w wcześniej wykonany blok zgryzowy o średnicy 5 mm. Blok zgryzowy wykonany jest z nietoksycznej szpachli kondensacyjnej (Henry Schein).
- Blok zgryzu umieszcza się między zębami trzonowymi z boku jamy ustnej. Sznurek przymocowany do bloku gryzowego jest przymocowany do twarzy uczestnika, aby zapobiec połknięciu bloku gryzienia.
- Uczestnik proszony jest o czytanie zdań i zwrotów (patrz Tabela 2).
- Ruchy języka są rejestrowane w stosunku do pozycji głowy.
- Po akwizycji dane są przesyłane do SMASH, gdzie są filtrowane dolnoprzepustowo, analizowane na podstawie śladu ruchu pionowego i wykorzystywane do obliczania prędkości 3D. Średnia i maksymalna prędkość ruchu podczas każdej wypowiedzi jest podawana jako wskaźnik zmiany tej artykulatora związanej z chorobą.
II. Ocena na poziomie systemu
Oprócz zmiennych na poziomie podsystemu, mierzona jest zrozumiałość mowy i szybkość mówienia. Pomiary te są niezbędne, ponieważ są to aktualne kliniczne "standardy celów" charakteryzujące wydajność mowy opuszkowej. Wskazują one na stan funkcjonalny systemu produkcji mowy jako całości i określają ilościowo stopień upośledzenia mowy. Miary te uzyskuje się za pomocą Testu Zrozumiałości Zdań (SIT)12.
- Przed nagraniem oprogramowanie SIT generuje losową listę 10 zdań o rosnącej długości (od 5 do 15 słów).
- Mikrofon umieszcza się na głowie, w odległości około 15 cm od ust.
- Uczestnik jest proszony o zapoznanie się z listą w swoim zwyczajowym tempie mówienia i głośności. Zdania są nagrywane cyfrowo w rozdzielczości 44,1 tys. pikseli przy użyciu rozdzielczości 16 bitów.
- Kilku wyszkolonych sędziów, którzy nie są zaznajomieni z uczestnikiem, transkrybuje zdania ortograficznie i mierzy czas trwania zdań.
- Oprogramowanie SIT automatycznie oblicza zrozumiałość mowy, która jest podawana jako procent poprawnie transkrybowanych słów z całkowitej liczby wytworzonych słów. Szybkość mówienia jest również podawana jako liczba słów czytanych na minutę.
Podsystemu
Sprzęt / Oprogramowanie
sygnał
Ustawienia akwizycji
Oddechowy
Fonacyjny System Aerodynamiczny (PAS), KayPENTAX, Lincoln Park, NJ, Stany Zjednoczone
Akustyka, ciśnienie i przepływ
Częstotliwość próbkowania = 200 Hz, filtr dolnoprzepustowy = 30 Hz
Fonacyjny
Kompaktowy rejestrator flash (np. PMD660),
Mikrofon profesjonalnej jakości,
Miernik SPL, Extech Instruments
Oprogramowanie: MDVP, KAYPentax
akustyczny
Częstotliwość próbkowania = 44,01 kHz, 16 bitów liniowy PCM
Rezonator
Nazometr, model 6400, KAYPentax
akustyczny
Częstotliwość próbkowania=11025 Hz
Artykulacja: Twarz
Eagle Digital System, Motion Analysis Corp.
Kinematyka i akustyka
Częstotliwość próbkowania = 120 Hz, filtr dolnoprzepustowy = 10 Hz
Artykulacja: Język
WAVE, Northern Digital Inc, Kanada
Kinematyka i akustyka
Częstotliwość próbkowania = 100 Hz, filtr dolnoprzepustowy = 20 Hz
Tabela 1: Ustawienia instrumentacji i akwizycji dla zbierania danych podsystemu
poziom
zadanie
Pomiary
Referencje i normy
Oddechowy
Vc
Maksymalna objętość płuc wydechowych
13
/pa/ x 7
Ciśnienie podgłośniowe
2, 3
Bambusowe przejście
% czasu pauzy
6, 7, 14
Fonacyjny
Maksymalna fonacja /a/
Maksymalny czas trwania fonacji, średnia F0, jitter, SNR
15, 16, 17, 3
Rezonator
Mama zrobiła trochę dżemu cytrynowego; Kup Bobby'emu szczeniaka
Nazalność
18, 19
Artykulacja: Twarz
Kup Bobby'emu szczeniaka; Powiedz _ jeszcze raz (nietoperz, przypływ, utrzymanie, narzędzie)
Prędkość ruchu
20, 21
Artykulacja: Język
/ta/ x 5, Powiedz jeszcze raz serwetkę
Na poziomie systemu
SIT, Zdania
Zrozumiałość mowy i szybkość mówienia
12
Tabela 2: Pomiary uzyskane dla każdego podsystemu i zadania
Dodatek 1: Bambusowe przejście
Bambusowe ściany stają się coraz bardziej popularne. Są mocne, łatwe w użyciu i dobrze wyglądają. Stanowią dobre tło i tworzą nastrój w ogrodach japońskich. to trawa i jest jedną z najszybciej rosnących traw na świecie. Wiele odmian bambusa jest uprawianych w Azji, chociaż uprawia się go również w Ameryce. W zeszłym roku kupiliśmy nowy dom i pracowaliśmy nad ogrodami kwiatowymi. Za kilka dni skończymy z bambusową ścianą w jednym z naszych ogrodów. Projekt bardzo nam się podobał.