j'ai fais un agent vocal sur elevenlabs conversationnal ai sur leur UI que j'ai lie a un numero de | ElevenLabs | Page 1

spark merlinBOT Oct 30, 2025, 12:30 PM

#

AI-generated Answer for thed99

Voici les réglages et contrôles à appliquer (tous confirmés par la doc ElevenLabs) pour corriger les glitchs/artefacts audio et les “déraillages” du flux conversationnel sur téléphonie:

Audio téléphonie (codec/rate)

Alignez formats d’entrée ET de sortie en μ‑law 8000 Hz (téléphonie). Dans l’agent, définissez:
- TTS output: μ‑law 8000 Hz
- User input/STT: μ‑law 8000 Hz
  C’est le format recommandé pour Twilio/SIP, et la doc du guide Twilio indique de régler l’entrée et la sortie en μ‑law 8 kHz. L’API WebSocket d’agent expose d’ailleurs explicitement agent_output_audio_format et user_input_audio_format. (elevenlabs.io)

Latence de streaming (source majeure d’artefacts)

Désactivez “Optimiser la latence de streaming = 3”. Le paramètre optimize_streaming_latency est déprécié et réduit la qualité (le niveau 4 coupe même le normalizer). Revenir à 0/None. (help.elevenlabs.io)

Modèle TTS pour appels

Vous utilisez Turbo v2.5 (OK pour conversation). Si les barge‑ins/réponses très rapides priment, testez Flash v2.5 (latence ~75 ms) au lieu de Turbo (~300 ms). Les deux sont conçus pour un usage conversationnel; Flash privilégie la latence, Turbo l’équilibre qualité/latence. (help.elevenlabs.io)

Réglages de voix (stabilité/similarité/vitesse/style)

Valeurs “safe par défaut” souvent utilisées: stabilité ≈0,5 et similarité ≈0,75; vitesse = 1,00. Évitez les extrêmes qui dégradent la qualité. Gardez “style exaggeration” à 0 (peut introduire instabilité/sons parasites). (elevenlabs.io)
La plage de vitesse 0,7–1,2 est supportée; des valeurs extrêmes peuvent affecter la qualité. (help.elevenlabs.io)

Prompting LLM pour éviter les “déraillages”

Ajoutez dans le système prompt: “Réponds exclusivement par le texte à lire à l’utilisateur” et demandez d’expanser nombres/dates/adresses à l’oral (ex: 555‑555‑5555 → “cinq cinq cinq…”). C’est la recommandation officielle pour agents vocaux. (elevenlabs.io)
Pour la normalisation des nombres/symboles (fréquent en téléphonie), suivez le guide Normalization ou faites réaliser cette expansion côté LLM. (elevenlabs.io)

RAG / base de connaissances

Votre choix d’embeddings intfloat/e5‑mistral‑7b‑instruct est supporté. Activez RAG et ajustez “maximum document chunks” et “maximum vector distance” pour limiter le contexte injecté (trop de contexte augmente le risque de digressions et la latence ~500 ms). N’utilisez le mode “Prompt” que pour les documents critiques; sinon laissez “Auto” pour éviter de dépasser le contexte. (elevenlabs.io)

LLM et robustesse

GPT‑4.1 est supporté nativement. Conservez temperature=0 pour la déterminisme, et activez un “Backup LLM” pour éviter les coupures si le modèle principal est indisponible. (elevenlabs.io)

Attentes de latence en téléphonie

La téléphonie ajoute typiquement ~200 ms en intra‑région (jusqu’à ~500 ms en inter‑région). Cela n’explique pas des artefacts audio, mais aide à calibrer les barge‑ins. (elevenlabs.io)

Diagnostics utiles

Si un appel tombe en erreur, vérifiez Call History pour le motif exact (messages explic

cold python Oct 30, 2025, 12:56 PM

#

j'ai toujours les artefacts et c'est pire maintenant aussi certaines de tes instructions ne sont plus a jours

spark merlinBOT Oct 30, 2025, 12:56 PM

#

AI-generated Answer for thed99

Merci pour le signalement. Deux points ont effectivement changé récemment, ce qui peut expliquer une partie des problèmes et des instructions périmées:

Conversational AI s’appelle désormais ElevenLabs Agents dans l’UI et la doc. (elevenlabs.io)
Le paramètre optimize_streaming_latency est déprécié et n’est plus recommandé. (help.elevenlabs.io)

Actions correctives vérifiées dans la doc ElevenLabs

Modèle TTS pour agents

Vous utilisez Turbo v2.5. Ce modèle est classé “Older Models” et ElevenLabs recommande d’utiliser Flash v2.5 à la place. Flash v2.5 est ultra‑faible latence (<75 ms) et adapté aux usages conversationnels multilingues. Passez le modèle de la voix de Turbo v2.5 vers Flash v2.5. (help.elevenlabs.io)

Latence de streaming

Désactivez tout réglage “Optimize streaming latency”/optimize_streaming_latency dans l’UI ou vos appels, car ce paramètre est déprécié. (help.elevenlabs.io)

Format audio téléphonie

Conserver μ‑law 8000 Hz est conforme aux formats pris en charge par l’API (μ‑law 8 kHz et A‑law 8 kHz). (help.elevenlabs.io)

Réglages de voix (stabilité/similarité)

Une stabilité trop basse accroît la variabilité entre générations. Si vous observez des dérives/variations, augmentez la stabilité et, au besoin, la similarité dans Voice Settings. (help.elevenlabs.io)
Gardez la vitesse proche de 1.0, car des valeurs extrêmes peuvent dégrader la qualité. (help.elevenlabs.io)

Voix issues de la Voice Library et latence

Si la voix choisie a “Live Moderation” activée, cela peut ajouter de la latence. Testez avec une autre voix (par ex. une Default/PVC sans Live Moderation) pour comparaison. (help.elevenlabs.io)

Contenu (nombres, dates, sigles)

Pour éviter des lectures hésitantes, forcez l’LLM à écrire les nombres/dates/sigles en toutes lettres; côté API TTS, la normalisation peut aussi être activée mais ajoute de la latence. (help.elevenlabs.io)

RAG/Connaissances

Dans Agents, vous pouvez activer RAG pour augmenter la taille par fichier dans la base de connaissances (jusqu’à 10 MB) et rester dans les limites prévues; vérifiez que vos fichiers respectent ces bornes. (help.elevenlabs.io)

Langue de l’agent

Les agents prennent en charge les langues supportées par Flash v2.5/Turbo v2.5 (dont le français). Assurez‑vous que la voix et le modèle sont cohérents avec la langue ciblée. (help.elevenlabs.io)

Si les artefacts persistent après ces changements, enregistrez un extrait et ouvrez un ticket au support en joignant l’audio et l’ID d’appel; consultez aussi Call

cold python Oct 30, 2025, 2:09 PM

#

ok un autre soucis c'est que l'agent elevenlabs n'arrive pas a raccroche l'appel , j'utilise kamailio pour convertir tcp(elevenlabs) et udp(manifone) everything is good excepte the agent can't end call and when i end call on the phone the agennt is still running

spark merlinBOT Oct 30, 2025, 2:09 PM

#

AI-generated Answer for thed99

Here’s what ElevenLabs officially supports for call teardown and what to check in your setup:

Transport/protocol: ElevenLabs SIP trunking supports TCP or TLS for SIP signaling; UDP transport is not available. Make sure the ElevenLabs-facing leg of your Kamailio bridge is TCP or TLS and that your SIP URI uses transport=tcp (e.g., sip:sip.rtc.elevenlabs.io:5060;transport=tcp). Using UDP on the EL side is unsupported.
Agent-initiated hangup: Enable the End Call system tool. It is added by default for agents created in the dashboard; for agents created via API/SDK you must add it explicitly as a system tool so the agent can terminate the call. You can also prompt conditions for when to end.
Detecting call completion in your backend: Use Post-call Webhooks. ElevenLabs sends a webhook after a call ends and analysis completes; this is the reliable signal to clean up any lingering application state if the telephony side has already disconnected.
Codec expectations: For SIP trunks, ElevenLabs sends/receives audio in G.711 (8 kHz) or G.722 (16 kHz). This is independent of any audio format you set for WebSocket integrations; ensure your SIP bridge handles these codecs correctly.

If after enforcing TCP/TLS on the ElevenLabs leg and enabling the End Call tool the issue persists, please share the exact SIP trunk configuration you imported into ElevenLabs (transport, media encryption, and number format), since those fields must match the docs’ requirements.

cold python Oct 30, 2025, 3:13 PM

#

j'ai une latence de la part de l'agent elevenlabs apres le premier message pourquoi? et apres dans la conversation je n'ai pas de latence

#j'ai fais un agent vocal sur elevenlabs conversationnal ai sur leur UI que j'ai lie a un numero de