Connexion

Espace de collecte audio pour l'entraînement du modèle ASR.

Enregistrement
Chargement... 0%
Mise en situation
Chargement...
Improvisez en Mina selon cette situation — ne lisez pas, parlez naturellement
Appuyez pour enregistrer
La transcription sera complétée par l'admin après écoute.
Tableau de bord
-
Phrases
-
Audios
-
Speakers
-
Complet
Progression globale du dataset -
Ajouter un utilisateur
Utilisateurs
Chargement...
Mes enregistrements
Chargement...
Clients API
Créer un client API
💡 Le username/mot de passe permettent au client de se connecter sur /client pour voir ses appels API.
Chargement...
À propos de KUMA
KUMA
Know, Understand, Map, Act

KUMA est un système de détection d'intention vocale conçu pour les langues d'Afrique de l'Ouest — principalement le Mina et l'Ewe, parlés par plusieurs millions de locuteurs au Togo et au Bénin.

L'utilisateur parle en Mina ou Ewe ; KUMA comprend ce qui est dit et retourne une réponse structurée prête à l'emploi — destination, montant, produit, intention.

Comment ça marche ?
1
Tu parles — le modèle écoute
Tu enregistres un audio en Mina ou Ewe. Le modèle de reconnaissance vocale, entraîné sur ces langues, transcrit ce que tu as dit en français.
2
Le modèle comprend l'intention
Le texte transcrit est analysé par un modèle de langage qui extrait l'intention (trajet, virement, achat...) et les informations clés (destination, montant, produit).
3
Vérification des lieux
Si une destination est mentionnée, KUMA la vérifie contre une liste de 91 lieux connus à Lomé (marchés, hôpitaux, écoles, quartiers...). Si le lieu n'est pas reconnu, KUMA répond "inconnu" plutôt que d'inventer une adresse.
4
Réponse JSON structurée
KUMA retourne un JSON clair avec l'intention détectée, les entités extraites et la transcription. Si l'audio est de mauvaise qualité, un mode tolérant est activé automatiquement.
Schéma du pipeline
🎙 Audio vocal
Tu parles en Mina ou Ewe
ASR
Transcrit l'audio en texte français
LLM
Comprend l'intention et extrait les infos
Réponse JSON
Intention + entités + transcription
Intentions reconnues
COMMANDE_TRAJET
Destination + type de véhicule (moto, voiture)
Taxi, moto, Zem
COMMANDE_LIVRAISON
Destination + type de livraison (colis, repas, courses, médicaments)
Colis, repas
SALUTATION
Bonjour, merci, au revoir...
Akpe, Alo, Woezor
INCONNU
Intention non reconnue ou lieu inconnu
Hors scope
Lieux reconnus à Lomé

KUMA connaît 91 lieux géolocalisés à Lomé, répartis en plusieurs catégories :

🏪 13 marchés 🏥 10 hôpitaux & pharmacies 🎓 7 écoles & universités 🏦 7 banques & Mobile Money ✈️ 5 gares & transports 🏛 7 lieux emblématiques 🛒 5 supermarchés ⛪ 12 églises & mosquées 🏨 9 hôtels 🏘 11 quartiers
Exemples de réponses
Commande de trajet
{
  "intent": { "type": "COMMANDE_TRAJET", "confidence": 0.97 },
  "entities": {
    "destination_canonical": "Grand marché de Lomé",
    "type_vehicule": "moto"
  },
  "transcript": { "text": "emmène-moi au grand marché", "confidence": 0.91 },
  "status": "OK",
  "fallback_used": false
}
Commande de livraison
{
  "intent": { "type": "COMMANDE_LIVRAISON", "confidence": 0.94 },
  "entities": {
    "article": "plat de fufu",
    "vendeur": "Nopégali",
    "destination_livraison": null
  },
  "transcript": { "text": "je veux commander un plat de fufu chez Nopégali", "confidence": 0.89 },
  "status": "OK",
  "fallback_used": false
}
Salutation
{
  "intent": { "type": "SALUTATION", "confidence": 0.99 },
  "entities": { "type_salutation": "merci" },
  "transcript": { "text": "akpe", "confidence": 0.95 },
  "status": "OK",
  "fallback_used": false
}
Intention non reconnue
{
  "intent": { "type": "INCONNU", "confidence": 0.18 },
  "entities": {},
  "transcript": { "text": "euh... hmm", "confidence": 0.42 },
  "status": "INCONNU",
  "fallback_used": true
}
Objectifs de qualité
Mesure Ce qu'on mesure Cible
Transcription Taux d'erreur sur les mots transcrits (Mina → français) < 30%
Intention Bonne détection de l'intention (trajet, virement...) > 85%
Destination Bon lieu retourné parmi les 91 connus > 80%
Hallucination Adresses inventées retournées (doit être zéro) = 0%