Budowa całkowicie bezprzewodowego urządzenia głosowego hearable fitness — część 2: przetwarzanie dźwięku

Przez: Stephen Evanczuk

Przekazane przez: Północnoamerykańscy redaktorzy DigiKey

Uwaga od redakcji: choć urządzenia głosowe hearable fitness mają duży potencjał, stanowią one poważne wyzwanie konstrukcyjne w trzech kluczowych obszarach: biopomiaru, przetwarzania dźwięku i ładowania bezprzewodowego. Ta seria trzech artykułów bada każde z tych wyzwań z osobna i pokazuje konstruktorom, w jaki sposób mogą wykorzystywać urządzenia o bardzo niskiej mocy do skutecznego tworzenia urządzeń głosowych hearable fitness. Część 1 dotyczyła biopomiaru tętna i SpO2. Część 2 zajmuje się przetwarzaniem dźwięku. Część 3 omówi rozwiązania dotyczące bezprzewodowego ładowania i zarządzania energią w konstrukcjach urządzeń głosowych hearable fitness.

Jak omówiono w części 1, douszne, inteligentne słuchawki bezprzewodowe, nazywane również całkowicie bezprzewodowymi urządzeniami głosowymi hearable, okazały się popularnymi urządzeniami do odtwarzania dźwięku, szczególnie podczas zajęć fitness, kiedy przewody mogą przeszkadzać w ruchu lub zaplątać się w sprzęcie. Dodając do tych projektów pomiary wskaźników kondycji, konstruktorzy mogą tworzyć „urządzenia głosowe hearable fitness”, które zapewniają zarówno odtwarzanie dźwięku, jak i zbieranie danych o kondycji.

Podczas gdy dodanie funkcji biopomiarów jest ekscytującym osiągnięciem, projektanci nie mogą stracić z pola widzenia podstawowej funkcji urządzeń głosowych hearable: wysokiej jakości odtwarzania dźwięku. Problem polega teraz na tym, jak utrzymać wysoką jakość odtwarzania dźwięku, a jednocześnie dodawać nowe funkcje w tak małej obudowie z zachowaniem zadowalającego czasu pracy baterii.

W tym artykule omówiona zostanie rola kodeków oraz procesorów audio i nakreślone zostaną główne elementy architektury systemu audio urządzeń głosowych hearable. Przedstawiony zostanie następnie zaawansowany kodek audio firmy Maxim Integrated ze wskazaniem, jak konstruktorzy mogą go wykorzystać do zapewnienia wysokiej jakości dźwięku w kompaktowej formie i z wydłużonym czasem pracy baterii.

Kodeki i procesory audio

Kodeki audio i wyspecjalizowane procesory audio już od lat są wykorzystywane w wysokowydajnych konstrukcjach audio. Każdy z nich łączy w sobie kompletny łańcuch sygnałowy do próbkowania, konwersji i kondycjonowania sygnału audio. Chociaż kodeki (których nazwa to połączenie słów koder-dekoder) zazwyczaj mają możliwości ograniczone do kodowania i dekodowania sygnału dźwiękowego przy użyciu trwale zapisanego oprogramowania układowego, procesory dźwięku zazwyczaj tworzą tę funkcjonalność wokół programowalnego procesora sygnału cyfrowego (DSP). Coraz częściej granice pomiędzy tymi klasami produktów zacierają się wraz z pojawieniem się przeprogramowywanych kodeków i procesorów audio o trwale zapisanej charakterystyce. W obu przypadkach konstruktorzy mają do dyspozycji zaawansowane urządzenia do przetwarzania sygnału audio, które są w stanie sprostać wymaganiom najbardziej wymagających audiofilów.

Szeroka popularność małych dousznych słuchawek audio, czyli wkładek dousznych dodatkowo napędza ewolucję tych urządzeń do przetwarzania sygnału audio w kierunku zapewnienia kompletnego podsystemu audio w mikroukładzie. W połączeniu z technologiami bezprzewodowej łączności i ładowania, urządzenia te mogą stanowić podstawę dla całkowicie bezprzewodowych (True Wireless) słuchawek dousznych, które mogą zapewnić użytkownikom niezwykle bogaty dźwięk bez kłopotliwych kabli.

Ewolucja urządzeń głosowych hearable

Jednak w przeciwieństwie do bardziej konwencjonalnych przewodowych słuchawek dousznych, całkowicie bezprzewodowe słuchawki douszne znacznie rozszerzają wyzwania stojące przed ich twórcami. Produkty te muszą zaspokajać potrzeby słuchacza w zakresie jakości dźwięku, spełniając jednocześnie oczekiwania użytkowników urządzeń przenośnych w zakresie wygody i użyteczności. W związku z tym konstrukcja musi zapewniać wyjątkową jakość dźwięku i inne cechy ogólne, a jednocześnie zapewniać minimalną wielkość i maksymalny czas pracy baterii. Na szczęście konstruktorzy mają do dyspozycji szeroką gamę kodeków i procesorów audio, które są w stanie spełnić ten szeroki zbiór wymagań.

Tak zwane słuchawki inteligentne lub urządzenia głosowe hearable stanowią naturalną ewolucję słuchawek całkowicie bezprzewodowych. Wraz z innymi zaawansowanymi funkcjami, urządzenia głosowe hearable oferują czujniki do biopomiarów, detekcji ruchu i innych funkcji mających na celu poprawę samopoczucia użytkownika i świadomości otoczenia.

Choć konstrukcje urządzeń głosowych hearable fitness są funkcjonalnie skomplikowane, to mogą opierać się na platformie sprzętowej łatwo dostępnych urządzeń typu system-on-chip (SoC, system w mikroukładzie) zaprojektowanych specjalnie do tych zastosowań o niskiej mocy. Jako wskazano w części 1 tej serii, bioczujnik MAXM86161 firmy Maxim Integrated zapewnia wszystkie możliwości biopomiaru wymagane w takich produktach. Również kodek audio MAX98090 firmy Maxim Integrated zapewnia kompletny podsystem audio, który może obsługiwać szeroki zakres możliwości audio, które są projektowane z myślą o nowo powstających urządzeniach głosowych hearable fitness. Używając tych urządzeń, wraz z kontrolerem częstotliwości radiowej (RF) Bluetooth (BT) i układami scalonymi zarządzania energią (PMIC), konstruktorzy mogą zaimplementować podstawy sprzętowe skomplikowanych konstrukcji urządzeń głosowych hearable fitness (ilustracja 1).

Schemat możliwości całkowicie bezprzewodowych słuchawek dousznych z układem Maxim z funkcjami bioczujnika (kliknij, aby powiększyć)Ilustracja 1: urządzenia głosowe hearable fitness rozszerzają możliwości całkowicie bezprzewodowych słuchawek dousznych o funkcje bioczujnika, lecz muszą spełnić te same wymagania dotyczące wysokiej jakości odtwarzania dźwięku i wydłużonego czasu pracy baterii. (Źródło ilustracji: DigiKey, na podstawie materiałów źródłowych od Maxim Integrated)

Wszechstronny podsystem audio

Zaprojektowany specjalnie do zastosowań mobilnych, kodek audio MAX98090 łączy w sobie bardzo niską moc z wysoce konfigurowalnymi możliwościami przetwarzania sygnału audio. Procesor sygnału cyfrowego (DSP) FlexSound firmy Maxim Integrated, który jest sercem urządzenia, może przyjmować na wejściu różne połączenia sygnałów analogowych i cyfrowych. Z kolei urządzenie może dostarczać dźwięk przekształcony przez FlexSound do oddzielnych torów sygnału wyjściowego zoptymalizowanych dla różnych typów głośników (ilustracja 2).

Schemat kodeka audio MAX98090 Maxim Integrated zaprojektowanego do dousznych urządzeń ubieralnych (kliknij, aby powiększyć)Ilustracja 2: zaprojektowany specjalnie z myślą o dousznych urządzeniach ubieralnych zintegrowany kodek audio Maxim MAX98090 łączy w sobie wszechstronny zbiór funkcji wejścia, wyjścia i przetwarzania, zapewniając kompletny podsystem audio, który jest w stanie sprostać ograniczeniom mocy i rozmiaru urządzeń głosowych hearable. (Źródło ilustracji: Maxim Integrated)

Podsystem cyfrowego interfejsu audio MAX98090 (DAI) obsługuje częstotliwości próbkowania od 8 kiloherców (kHz) dźwięku do rozmów telefonicznych po 96 kHz dźwięku o wysokiej rozdzielczości w różnych standardowych formatach modulacji impulsowo-kodowej (PCM). W typowej konstrukcji cyfrowe wejście audio przechodzi bezpośrednio ze źródła do podsystemu DAI. Dla źródeł analogowych MAX98090 oferuje wielokanałowy front-end analogowy składający się z multiplekserów wejściowych, mikserów, przedwzmacniaczy i programowalnych wzmacniaczy mocy (PGA). Wejścia analogowe i cyfrowe łączą się z oddzielnymi mikserami lewego i prawego kanału, z których każdy podaje sygnał do dedykowanych przetworników analogowo-cyfrowych (ADC). Sygnał wyjściowy z przetwornika ADC dla lewego i prawego kanału przechodzi z kolei do podsystemu DAI, który ostatecznie podaje cyfrowy sygnał audio do rdzenia FlexSound DSP.

Rdzeń DSP zapewnia podstawową funkcjonalność przetwarzania sygnału potrzebną w produktach do odtwarzania dźwięku, ale zazwyczaj nieobsługiwaną w tradycyjnych kodekach audio. Użytkownicy oczekują, że ich douszne urządzenia ubieralne zapewnią odpowiednią głośność, aby pokonać hałaśliwe środowisko, takie jak siłownia, a jednocześnie zapewnią czysty sygnał audio na wszystkich poziomach głośności. Rdzeń DSP MAX98090 FlexSound spełnia te wymagania dzięki podsystemowi odtwarzania składającemu się z wielu stopni, w tym z oddzielnego, siedmiopasmowego korektora parametrycznego, automatycznej regulacji poziomu (ALC) oraz wielu filtrów dla lewego i prawego kanału (ilustracja 3).

Schemat rdzenia FlexSound DSP kodeka audio MAX98090 firmy Maxim Integrated (kliknij, aby powiększyć)Ilustracja 3: sercem kodeka audio Maxim Integrated MAX98090 jest rdzeń FlexSound DSP, który zapewnia dedykowane, wielostopniowe tory do przetwarzania oddzielnie lewego i prawego kanału audio. (Źródło ilustracji: Maxim Integrated)

Funkcje te zapewniają bardzo elastyczne możliwości przetwarzania dźwięku, które są w stanie sprostać różnorodnym wymaganiom każdego zastosowania. Na przykład, oprócz trybu siedmiopasmowego, korektor można również przełączyć na trzy lub pięć pasm, które mogą być potrzebne w produktach z prostszym interfejsem użytkownika. Podobnie funkcja ALC obejmuje zintegrowaną, programowalną kontrolę zakresu dynamiki (DRC), która może zapobiegać zarówno przycinaniu sygnału audio w wysokim końcu pasma, jak i wzmacnianiu szumów tła na niskim końcu. W celu oczyszczania cyfrowych danych audio zestaw filtrów cyfrowych urządzenia zawiera filtr skończonej odpowiedzi impulsowej (FIR) dla muzyki i dźwięku wysokiej częstotliwości, a także filtr nieskończonej odpowiedzi impulsowej (IIR) dla zastosowań głosowych 8 kHz lub 16 kHz. Oprócz filtra FIR do muzyki i filtra IIR do głosu można dodawać filtr górnoprzepustowy z blokowaniem prądu stałego w celu tłumienia dźwięków o niskiej częstotliwości.

Na wyjściu rdzenia DSP dedykowany przetwornik cyfrowo-analogowy (DAC) dla lewego i prawego kanału przekazuje uzyskany sygnał analogowy do mikserów wyjściowych układu MAX98090. Podobnie jak w przypadku podsystemu wejściowego, MAX98090 obsługuje szeroką gamę konfiguracji wyjść audio i typów głośników ze zintegrowanymi sterownikami wyjściowymi głośników klasy D, sterownikami wyjściowymi słuchawek klasy H oraz konfigurowalnymi sterownikami klasy AB. Dla każdego typu wyjścia konstruktorzy po prostu ustawiają powiązane rejestry, aby skonfigurować układ MAX98090 do sterowania wyjściem stereo lub mono z lewego lub prawego kanału do sterownika wyjściowego odpowiedniego dla danej konstrukcji.

Ulepszone urządzenia głosowe hearable niskiej mocy

W przypadku urządzeń głosowych hearable fitness konstruktorzy zwykle konfigurują układ MAX98090, aby korzystał z wyjścia dla słuchawek klasy H w celu sterowania mikrogłośnikami, czyli nowymi systemami mikroelektromechanicznymi (MEMS) takimi jak UT-P 2017 firmy Usound opracowanymi specjalnie dla zastosowań dousznych. W urządzeniach głosowych hearable fitness dźwięk cyfrowy przepływa przez złącze Bluetooth bezpośrednio do podsystemu cyfrowego wejścia audio MAX98090. W związku z tym konstruktorzy mogą oszczędzać energię, konfigurując układ MAX98090 tak, aby omijał wbudowany mikser podsystemu słuchawek, ponieważ opcje wejścia analogowego i cyfrowego nie są wymagane w konfiguracji podstawowej (ilustracja 4).

Schemat konfiguracji niższej mocy kodeka audio MAX98090 firmy Maxim Integrated (kliknij, aby powiększyć)Ilustracja 4: w przypadku urządzeń odtwarzających takich jak słuchawki douszne, kodek audio MAX98090 Maxim Integrated może działać w konfiguracji o niższej mocy, która przesyła cyfrowy sygnał audio bezpośrednio do zintegrowanego podsystemu słuchawkowego urządzenia. (Źródło ilustracji: Maxim Integrated)

W tej konfiguracji układ MAX98090 zużywa tylko około 6 miliwatów (mW). Aby jeszcze bardziej zredukować zużycie energii, słuchawkowy podsystem wyjściowy układu MAX98090 można skonfigurować do pracy w specjalnym trybie niskiej mocy, który obniża zużycie energii do około 3,85mW.

Aby zaspokoić typowo ograniczony zasób energii w słuchawkach dousznych, konstruktorzy mogą również selektywnie wyłączać poszczególne bloki wejściowe i wyjściowe w układzie MAX98090. W okresach bezczynności urządzenie może być programowo ustawiane w trybie wyłączenia, który zużywa tylko kilka mikroamperów. W tym trybie interfejs szeregowy I2C urządzenia pozostaje aktywny, pozwalając konstruktorom na ładowanie nowych konfiguracji przed ponownym uruchomieniem urządzenia przez ustawienie bitu w jego rejestrze wyłączania. W tym momencie urządzenie powraca do trybu pełnej aktywności w ciągu zaledwie 10 milisekund (ms), zapewniając użytkownikowi niemal natychmiastowe rozpoczęcie pracy.

Jeżeli chodzi o projekt systemu urządzenia głosowego hearable, konstruktorzy łączą układ MAX98090 przez interfejs szeregowy I2C z mikrokontrolerem o bardzo niskiej mocy z funkcją Bluetooth, takim jak RSL10 firmy ON Semiconductor (patrz, „Szybkie wdrożenie zasilanego z baterii wieloczujnikowego urządzenia IoT z certyfikatem Bluetooth 5”). Wszechstronny zestaw bloków wejściowych, przetwarzających i wyjściowych zintegrowanych z układem MAX98090 oznacza, że do pełnej integracji systemu potrzebnych jest tylko kilka dodatkowych elementów (Ilustracja 5).

Schemat interfejsu sprzętowego kodeka audio MAX98090 firmy Maxim Integrated (kliknij, aby powiększyć)Ilustracja 5: konstruktorzy mogą realizować projekt interfejsu sprzętowego kodeka audio MAX98090 firmy Maxim Integrated, stosując tylko kilka dodatkowych elementów. (Źródło ilustracji: Maxim Integrated)

Przy minimalnym wysiłku podstawowa konstrukcja odtwarzania opisana powyżej może zostać wzbogacona o dodatkowe funkcje, takie jak korzystanie z wejścia audio dla interfejsów asystenta głosowego podłączonego przez Bluetooth lub rozmowy przez telefon komórkowy. Aby przechwytywać głos użytkownika, taka konstrukcja może korzystać z mikrofonów elektretowych niskiej mocy takich jak mikrofony 50-mikroamperowe (μA) serii FG firmy Knowles lub mikrofonów analogowych MEMS, takich jak 25 μA ICS-40310 od TDK InvenSense lub 5 μA VM1010 od firmy Vesper Technologies.

Dzięki kilku dodatkowym ustawieniom rejestru konstruktorzy mogą skonfigurować MAX98090 tak, aby przyjmował dźwięk z tych mikrofonów analogowych lub cyfrowych, stosownie do potrzeb. Oddzielne stopnie wejścia mikrofonu analogowego i cyfrowego zapewniają niezbędne stopnie front-end do kondycjonowania sygnału analogowego lub sterowania cyfrowego (ilustracja 6).

Schemat kompletnego front-endu analogowego i interfejsu cyfrowego układu Maxim MAX98090 (kliknij, aby powiększyć)Ilustracja 6: kodek audio w układzie MAX98090 firmy Maxim Integrated zapewnia kompletny front-end analogowy (A) i interfejs cyfrowy (B) do podłączania odpowiednio mikrofonów analogowych i cyfrowych. (Źródło ilustracji: Maxim Integrated)

Po stopniu wejściowym strumień danych wejściowych wchodzi do oddzielnego podsystemu rejestrowania w rdzeniu DSP FlexSound, który poprzedza podsystem odtwarzania DSP opisany wcześniej. Podobnie jak funkcja odtwarzania, funkcja nagrywania obejmuje wiele sekwencyjnych etapów przetwarzania. W tym przypadku przetwarzanie składa się z zestawu filtrów cyfrowych obejmujących filtr IIR dla głosu, filtr FIR dla muzyki oraz filtr blokujący prąd stały (ilustracja 7).

Schemat wielostopniowego toru rejestracji w kodeku audio MAX98090 firmy Maxim Integrated (kliknij, aby powiększyć)Ilustracja 7: oprócz obsługi wejść analogowych i cyfrowych kodek audio MAX98090 Maxim Integrated zawiera wielostopniowy tor rejestracji w rdzeniu DSP FlexSound. (Źródło ilustracji: Maxim Integrated)

System odtwarzania DSP łączy następnie ten nagrany dźwięk z głównym cyfrowym strumieniem muzycznym audio w celu dalszego przetwarzania i dostarczenia do podsystemu wyjściowego MAX98090.

Podsumowanie

Całkowicie bezprzewodowe urządzenia głosowe hearable fitness muszą być zdolne do zapewnienia rozległej funkcjonalności niezbędnej do spełnienia oczekiwań użytkowników w zakresie najnowszych funkcji, a jednocześnie działać przy ograniczonej mocy i rozmiarach. W odniesieniu do odtwarzania dźwięku kodek audio MAX98090 firmy Maxim Integrated łączy analogowe i cyfrowe podsystemy wejściowe i wyjściowe z zaawansowanym cyfrowym procesorem sygnału audio, aby zapewniać wszechstronną funkcjonalność audio niezbędną w konstrukcjach urządzeń głosowych hearable fitness. Jak wykazano, używając układu MAX98090 wraz z podobnie zoptymalizowanymi urządzeniami SoC, konstruktorzy mogą budować elastyczną podstawę sprzętową dla zaawansowanych urządzeń głosowych hearable fitness.

DigiKey logo

Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.

Informacje o autorze

Image of Stephen Evanczuk

Stephen Evanczuk

Stephen Evanczuk has more than 20 years of experience writing for and about the electronics industry on a wide range of topics including hardware, software, systems, and applications including the IoT. He received his Ph.D. in neuroscience on neuronal networks and worked in the aerospace industry on massively distributed secure systems and algorithm acceleration methods. Currently, when he's not writing articles on technology and engineering, he's working on applications of deep learning to recognition and recommendation systems.

Informacje o wydawcy

Północnoamerykańscy redaktorzy DigiKey