Röstigenkänningsmoduler: Arbetsförfarande och applikationer

Prova Vårt Instrument För Att Eliminera Problem





Framsteg inom teknik har utvecklat en intelligent teknik för man-maskin-gränssnitt som underlättar datorer eller maskiner eller robotar som manövreras med hjälp av en människas röstkommandon utan att använda några inmatningssystem, som tangentbord eller mus. Detta gränssnitt för mänsklig maskin (HMI) kan uppnås med röstigenkänning moduler. I den här artikeln kommer vi att diskutera röstigenkänningsmodulerna tillsammans med deras arbetssätt och applikationer.

Röstmodul

Röstmodul



Röstigenkänningsmodul

Röstigenkänning är en teknik som underlättar en naturlig och bekväm gränssnitt mellan människa och maskin med röstigenkänningsmodulen. Den extraherar och analyserar röstfunktioner hos människor som levereras till en maskin eller dator via mikrofonen. Röstigenkänningsteknik klassificeras i många typer baserat på olika kriterier, såsom användarens omfattning, ett antal ord som används för igenkänning, naturligheten i att tala. Om röstigenkänningsnivån är mer än 95% används endast röstigenkänning praktiskt taget.


Röstigenkänningsmodulens arbetsprincip

HM2007 är ett chip CMOS röstigenkänningsmodul. Det är en on-chip analog frontend storskalig integrerad krets med röstanalys, taligenkänning och röstigenkänning systemkontrollprocesser. HM2007 kan användas i två lägen: manuellt läge och CPU-kontrolläge.



HM2007

HM2007 stiftdiagram

I det manuella driftsättet används röstigenkänningsmodulen HM2007 för att bygga ett enkelt igenkänningssystem genom att ansluta komponenter som en knappsats, SRAM på 8Kbyte-minne och andra komponenter. Om strömmen är på startar HM2007 en initialiseringsprocess och, om WAIT-stiftet är L, kontrollerar HM2007 externt minne: 8Kbyte SRAM - oavsett om det är perfekt eller inte. Men om VÄNTET är H, hoppas minneskontrollprocessen över av HM2007. Efter denna initialiseringsprocess går HM2007 in i igenkänningsläge. Om WAIT-stiftet är H i igenkänningsläget är HM2007 redo att acceptera rösten och påbörjar igenkänningsprocessen. Om WAIT-stiftet är L accepterar HM2007 inte rösten som ska kännas igen. Träning av nya mönster genom att rensa utbildade mönster är de två operationerna som utförs med funktionstangenterna: TRN och CLR. Alla mönster i HM2007 kan rensas genom att mata in siffertangenten 99 och trycka på CLR.

I CPU-styrningsläget finns flera funktioner såsom RECOG, TRAIN, RESULT, UPLOAD, DOWNLOAD, RESET-funktioner för röstigenkänningsmodulen HM2007 i detta läge. I likhet med ett manuellt driftsätt, i detta läge utförs även påslagning, igenkänning, träning, resulterande, uppladdning, nedladdning och återställning baserat på olika kriterier.

Tillämpningar av röstigenkänningsmodul

Röststyrd robotfordon

Röststyrd robotprojektkit

Röststyrd robotprojektkit

Ett röststyrt robotfordon med ett långavståndsigenkänningssystem är utformat för att styras med hjälp av ett gränssnitt mellan människa och maskin och röstkommandon för robotfordonets fjärrstyrning. En 8051 mikrokontroller används tillsammans med en röstigenkänningsmodul eller taligenkänningsmodul för att uppnå önskad operation. Riktningen för robotfordonets rörelse kan kontrolleras med röstkommandon eller tryckknappar. Röstkommandona skickas av RF från den sändande änden mot den mottagande änden. Således rör sig robotfordonet framåt, bakåt, åt vänster eller höger baserat på kommandona som mottagits av mottagaren.


Sändarblockdiagram för röststyrd robotfordon

Sändarblockdiagram för röststyrd robotfordon

Denna rörelse av robotfordon i en viss riktning kan styras med två motorer som är gränssnitt med 8051-serien mikrokontroller. RF-sändare konverterar kommandona med en omkopplare eller röstkommandon som omvandlas till kodad digital data till förmån för acceptabelt räckvidd (upp till 200 meter) från robotfordonet. De kodade data som mottages vid mottagarkretsen avkodas för att sändas till en annan mikrokontroller för att driva likströmsmotorer med användning av motorförare IC för att styra motorns riktning och rörelse med hjälp av avkodade data för röstkommandona.

Mottagarblockdiagram för röststyrd robotfordon

Mottagarblockdiagram för röststyrd robotfordon

Detta röststyrda robotfordon med långavståndsprojekt för taligenkänning kan integreras med en DTMF-teknik som underlättar kontrollen av robotfordonet med hjälp av en mobiltelefon. Denna DTMF-teknik ger en mycket långväga kommunikation jämfört med RF-tekniken - sålunda kan robotfordon fjärrstyras från ett mycket långt avstånd.

Röstinspelning och uppspelningskrets

APR 9301 IC

APR 9301 IC

APR 9301 IC

APR 9301 IC består av 28 stift och icke-flyktigt flashminne. Det underlättar inspelningen av 100K-cykler och lagring av minne i cirka 100 år. Endast lågspänning 5V och 25mA ström krävs för normal drift av den integrerade kretsen APR 9301.

Arbeta med röstinspelning och uppspelningskrets

APR 9301 IC utför röstinspelning och uppspelning operationer. Inspelning kan utföras genom att ta emot röstsignaler med god kvalitet (av något slag) kondensatormikrofon ansluten till 17 och 18 stift i en integrerad krets. Om vi ​​stänger omkopplaren S1 kan inspelningsläget startas för att enkelt spela in ett röstmeddelande i 20-30 sekunder. Som en indikation på inspelningslampa ansluten till stift 25 i APR 9301 IC blinkar så länge L-stift 27 är jordat.

Röstinspelning och uppspelningskrets

Röstinspelning och uppspelningskrets

Efter avslutad 20 cykler med det sista minnet avslutas inspelningsprocessen automatiskt genom att ändra värdet på ett motstånd R1 anslutet till stiften 6 och 7 på APR 9301 IC. En maximal inspelningstid på 20 sekunder, 24 sekunder och 30 sekunder kan erhållas genom att ändra värdena på motståndet R1 till 52K, 67K respektive 89K.

Ingångssektionen stängs av automatiskt under uppspelningsläget. Om omkopplaren S2 är stängd kommer ett meddelande från högtalaren från början av de inspelade meddelandena. Om inspelnings- eller uppspelningsfunktionerna är slutförda kommer APR 9301 IC att gå i standbyläge.

Denna krets kan ackumuleras på ett gemensamt kretskort. Löd APR 9301 IC-basen försiktigt så att ingen kortslutning uppstår mellan stiften på den integrerade kretsen. Kontrollera kretsen efter att ha monterat den på kretskortet och anslut sedan IC i IC-basen. Kontrollera noggrant stiftanslutningarna innan strömförsörjningen till kretsen ges. 5-volts regulator IC-baserad strömförsörjning används för att ge strömförsörjning till kretsen. En högtalare av hög kvalitet av 2 tum och 8 ohm används för att få ett tydligt ljud. Inspelning kan göras genom att trycka på omkopplaren S1. Ljudsignalerna (tal eller musik) plockas upp av mikrofonen och skickas till IC där röstsignalerna lagras i minnescellerna. Om vi ​​stänger omkopplaren S2, startar uppspelningen och vi kan höra det inspelade meddelandet via högtalaren.

Röstigenkänningsmodul kan användas i många applikationer, såsom för att styra flygplanssystemen med pilots röstkommandon, för att styra motoriserad hjulbil med röstaktiverad multiprocessor, och så vidare. Om du är intresserad av att veta om el- och elektronikprojekt baserat på röstigenkänningsmodulen kan du kontakta oss genom att lägga upp dina kommentarer i kommentarsektionen nedan.

Fotokrediter: