VKontakte hat seine Spracherkennungstechnologien geöffnet

VKontakte hat seine Spracherkennungstechnologien geöffnet

22.09.2022 0 By admin

Das VKontakte-Team kündigte gute Nachrichten für Drittentwickler an. Jetzt können Entwickler die VKontakte-Technologie kostenlos in ihren Projekten verwenden, die die Stimme liest und in Text übersetzt.

VKontakte hat seine Spracherkennungstechnologien geöffnet

Alexander Tobol, technischer Direktor von VKontakte, sprach darüber bei der Eröffnung der Konferenz Saint HighLoad ++. Die Spracherkennungstechnologie oder ASR, Automatic Speech Recognition, ist mit wenigen Klicks implementiert. Neuronale Netze eignen sich gut für Audio mit Nebengeräuschen, viel Slang und Abkürzungen.

Für die Erkennung können Sie eines von zwei Modellen wählen. Neutral ist gut für verständliche Sprache, wie in einer Fernsehsendung oder einem Interview, während spontan hilfreich ist, wenn Sie lockerere Sprache mit Slang und Obszönität verarbeiten müssen. Die neuronalen Netzwerke von VKontakte verarbeiten Dateien in wenigen Sekunden, können Rauschen und Pausen aus der Dekodierung entfernen, unverständliche Sprache verstehen und sogar ein festes Zeichen klingen lassen.

Die Technologie kann über die Weboberfläche auf einer speziellen Seite getestet oder über die öffentliche API von VKontakte integriert werden. Auf dem Portal steht eine breite Palette von Methoden zur Verfügung, mit denen Sie VKontakte-Minianwendungen erstellen oder in Projekten von Drittanbietern verwenden können. Die Version mit Audiobearbeitung bis zu 100 Minuten pro Tag ist für jeden Zweck einsetzbar. Und für die unbegrenzte Nutzung der Technologie können Sie eine Anfrage per E-Mail senden.