Home
Unterstützt Vector Machine Based Erkennung von Sprachgefühlen
Barnes and Noble
Unterstützt Vector Machine Based Erkennung von Sprachgefühlen
Current price: $66.00
Barnes and Noble
Unterstützt Vector Machine Based Erkennung von Sprachgefühlen
Current price: $66.00
Size: OS
Loading Inventory...
*Product information may vary - to confirm product availability, pricing, shipping and return information please contact Barnes and Noble
Die in diesem System unter Verwendung von MFCC+LPCC mit SVM erzielten Ergebnisse sind lobenswert. Die Erkennungsrate des Systems beträgt 81,2 % für IITKGP-SESC, 78,6 % für EmodB und 70 % für die in Echtzeit aufgezeichnete Datenbank. Die MFCCs und LPCCs, die jeder Äußerung jeder Emotion aus Datenbanken entsprechen, wurden berechnet und ihre Fusion wird zusammen mit ihren Delta- und Doppel-Delta-Koeffizienten zur Merkmalsextraktion verwendet. Diese extrahierten Merkmale der Trainingsdateien werden auf das SVM-Modell trainiert. Später werden die Merkmale der Testdateien zur Vorhersage als Eingabe an den SVM-Klassifikator übergeben. Anschließend erfolgt die Klassifizierung der Testproben und der Prozentsatz der übereinstimmenden und nicht übereinstimmenden Emotionen wird mithilfe einer Verwirrungsmatrix berechnet. Die Leistung der in Echtzeit aufgezeichneten Datenbank wird durch externe Faktoren begrenzt, die die Äußerungen des Sprechers beeinflussen, wie z. B. Rauschen im Signal und die Umgebung, in der die Aufzeichnung durchgeführt wird. Die Leistung kann durch den Einsatz hochwertiger Audiogeräte in einer geräuschfreien Umgebung gesteigert werden. Auch eine große Anzahl von Trainingsbeispielen steigert die Leistung. Zusammenfassend lässt sich festhalten, dass dieses System trotz gewisser Einschränkungen eine beachtliche Effizienz und Genauigkeit bietet.