Мерач буке - Стекните дубље разумевање потискивања буке
Након што разумемо основне разлике између потискивања буке (сузбијање буке из околине звучника да би удаљени слушаоци јасно чули) и активне редукције буке (компензације сопствене буке у околини слушаоца), хајде да се усредсредимо на то како постићи потискивање буке.
Једна метода је употреба више микрофона за потискивање података. Прикупљање података са више локација ће довести до тога да уређаји примају сличне (али ипак различите) сигнале. Гласовни сигнал који микрофон прима у близини говорне популације је знатно јачи од сигнала секундарног микрофона. Два микрофона ће примити негласовни позадински звук са сличном јачином сигнала. Одузмите информације о звуку прикупљене снажним гласовним микрофоном и секундарним микрофоном, а преостала већина су гласовне информације. Што је већа удаљеност између микрофона, већа је разлика у сигналу између ближих и даљих микрофона, што олакшава коришћење овог једноставног алгоритма за сузбијање шума. Међутим, када не говорите или када очекујете да ће се гласовни подаци променити током времена (као што је када ходате или трчите, а телефон се стално тресе), ефикасност ове методе ће се смањити. Пригушивање шума са више микрофона је свакако поуздано, али постоје недостаци додатног хардвера и обраде.
Па, шта ако постоји само један микрофон? Ако се додатни извори звука не користе за верификацију/поређење, решење за један микрофон ће се ослањати на разумевање примљених карактеристика буке и њихово филтрирање. Ово је повезано са претходно наведеним дефиницијама стационарног и нестационарног шума. Шум у стабилном стању може се ефикасно филтрирати преко ДСП алгоритама, док нестационарни шум представља изазов, дубоке неуронске мреже (ДНН) могу помоћи у решавању проблема.
Овај метод захтева скуп података за обуку мреже. Овај скуп података се састоји од различитог (стабилног и нестационарног) шума и јасног говора, стварајући синтетизовани бучни говорни образац. Убаците скуп података као улаз у ДНН и изнесите га јасним гласом. Ово ће створити модел неуронске мреже који ће елиминисати буку и само емитовати јасан говор.
Чак и са обученим ДНН-овима, још увек постоје неки изазови и индикатори које треба размотрити. Ако желите да радите у реалном времену са малим кашњењем, потребна вам је јака процесорска снага или мањи ДНН. Што је више параметара у ДНН-у, то је спорија брзина његовог рада. Брзина узорковања звука има сличан ефекат на потискивање звука. Већа стопа узорковања значи да ДНН треба да обрађује више параметара, али ће заузврат постићи већи квалитет излаза. Ускопојасна гласовна комуникација је идеалан избор за сузбијање буке у реалном времену.
Ова врста обраде су све интензивни задаци, а рачунарство у облаку је веома вешто у извршавању таквих задатака, али овај метод значајно повећава латенције. Узимајући у обзир да људи могу поуздано разликовати кашњења од приближно 108 милисекунди или више, додатно кашњење узроковано обрадом рачунарства у облаку очигледно није идеалан резултат. Међутим, покретање ДНН-а на ивици захтева нека паметна подешавања. ЦЕВА је увек посвећена побољшању наших могућности обраде гласа и говора. Ово укључује валидирану јасноћу говора и алгоритме за препознавање команди – ови алгоритми пружају јасну комуникацију и контролу гласа чак и на ивицама. Добродошли да нас контактирате и саслушате лично.
