Cruxbox
Cruxbox - czyli co by się stało gdybyśmy mogli podsumować każde służbowe spotkanie?
Zbudować urządzenie które nagrywa i rozumie spotkania firmowe i dostarcza łatwą w odbiorze wizualizację dotycząca tematów spotkań.
Proces
Nim rozpoczęliśmy pracę nad urządzeniem, zbadaliśmy istniejące na rynku rozwiązania w poszukiwaniu fundamentów na których moglibyśmy zbudować nasz projekt. Najbliższy naszym potrzebą okazał się projekt Google AIY.
Po złożeniu, rozebraniu i ponownym złożeniu zarówno oprogramowania jak i sprzętu nabyliśmy rozeznanie jak zbudować nasz prototyp szybko, korzystając z gotowych rozwiązań i podejścia rapid prototyping.
![](https://lab.180hb.com/_Resources/Persistent/d/2/a/8/d2a8064b6816230daa683de07a7be736dd7fb9e8/crux-process-2-180x181.jpg)
![](https://lab.180hb.com/_Resources/Persistent/c/4/6/1/c46117b0cd975e877d402ac6604cc0d5f8113589/magpi-2-180x254.jpg)
Akustyka stanowiła dla nas duże wyzwanie. Jakość transkrypcji i wyświetlanych słów kluczowych jest zależna od dwóch czynników - nad którymi nie mamy pełnej kontroli - jakości algorytmów używanych przez Google (i innych dostawców) przy rozpoznawaniu mowy, oraz warunków panujących podczas spotkania. W trosce o dobrą jakość, przetestowaliśmy różnego rodzaju mikofony aby zbadać, czy mają znaczący wpływ na jakość transkryptów. Co zaskakujące, okazało się, że największym ograniczeniem jest sama technologia rozpoznawania głosu - dotychczasowe rozwiązania są przeznaczone do rozpoznawania głosu jednej osoby. Firmy napędzające rozwój tej technologii skupiły się na eliminacji jakichkolwiek zakłóceń i możliwości wyłapania głosu jednej osoby, właściciela wydającego komendy (Google Assistant, Amazon Echo, etc)
![](https://lab.180hb.com/_Resources/Persistent/1/c/5/4/1c5410c41e7331c0310cf15fecf346c0ff7917a7/File_000%283%29-180x180.jpeg)
![](https://lab.180hb.com/_Resources/Persistent/a/a/8/3/aa83ba598c58c4c8c071cfbff2ec047b995a41bf/File_000%20%281%29-180x180.jpeg)
![](https://lab.180hb.com/_Resources/Persistent/2/b/0/9/2b09489e0afb69db1ad28c27491a473d83c71ecb/File_000%281%29-180x180.jpeg)
Zaprojektowaliśmy obudowę, elektronikę i oprogramowanie które razem stanowi Cruxbox. Cruxbox po podłączeniu do sieci WiFi (przy pomocy jakiegokolwiek smartfonu), transkrybuje nagrane spotkanie przy pomocy usługi Google Voice i wyświetla wynik po przetworzeniu danych w chmurze. Wyniki transkrypcji zapisywane są w bazie danych i poddawane są analizie słów kluczowych - na podstawie której budowana jest wizualizacja - chmura tagów - która pozwala zapoznać się z kluczowymi tematami poruszonymi podczas spotkania. Urządzenie rozumie 80 języków i nie wymaga żadnej "rejestracji" ze strony użytkownika - autoryzacja następuje automatycznie.
![](https://lab.180hb.com/_Resources/Persistent/c/a/8/9/ca890361b3927b4fd75be45d0536e076f838fd34/Screen%20Shot%202017-11-13%20at%2016.10.25-fullpage-180x97.png)