#j'ai fais un agent vocal sur elevenlabs conversationnal ai sur leur UI que j'ai lie a un numero de
1 messages · Page 1 of 1 (latest)
Voici les rĂ©glages et contrĂŽles Ă appliquer (tous confirmĂ©s par la doc ElevenLabs) pour corriger les glitchs/artefacts audio et les âdĂ©raillagesâ du flux conversationnel sur tĂ©lĂ©phonie:
Audio téléphonie (codec/rate)
- Alignez formats dâentrĂ©e ET de sortie en ÎŒâlaw 8000 Hz (tĂ©lĂ©phonie). Dans lâagent, dĂ©finissez:
- TTS output: ÎŒâlaw 8000 Hz
- User input/STT: ÎŒâlaw 8000 Hz
Câest le format recommandĂ© pour Twilio/SIP, et la doc du guide Twilio indique de rĂ©gler lâentrĂ©e et la sortie en ÎŒâlaw 8 kHz. LâAPI WebSocket dâagent expose dâailleurs explicitement agent_output_audio_format et user_input_audio_format. (elevenlabs.io)
Latence de streaming (source majeure dâartefacts)
- DĂ©sactivez âOptimiser la latence de streaming = 3â. Le paramĂštre optimize_streaming_latency est dĂ©prĂ©ciĂ© et rĂ©duit la qualitĂ© (le niveau 4 coupe mĂȘme le normalizer). Revenir Ă 0/None. (help.elevenlabs.io)
ModĂšle TTS pour appels
- Vous utilisez Turbo v2.5 (OK pour conversation). Si les bargeâins/rĂ©ponses trĂšs rapides priment, testez Flash v2.5 (latence ~75 ms) au lieu de Turbo (~300 ms). Les deux sont conçus pour un usage conversationnel; Flash privilĂ©gie la latence, Turbo lâĂ©quilibre qualitĂ©/latence. (help.elevenlabs.io)
Réglages de voix (stabilité/similarité/vitesse/style)
- Valeurs âsafe par dĂ©fautâ souvent utilisĂ©es: stabilitĂ© â0,5 et similaritĂ© â0,75; vitesse = 1,00. Ăvitez les extrĂȘmes qui dĂ©gradent la qualitĂ©. Gardez âstyle exaggerationâ Ă 0 (peut introduire instabilitĂ©/sons parasites). (elevenlabs.io)
- La plage de vitesse 0,7â1,2 est supportĂ©e; des valeurs extrĂȘmes peuvent affecter la qualitĂ©. (help.elevenlabs.io)
Prompting LLM pour Ă©viter les âdĂ©raillagesâ
- Ajoutez dans le systĂšme prompt: âRĂ©ponds exclusivement par le texte Ă lire Ă lâutilisateurâ et demandez dâexpanser nombres/dates/adresses Ă lâoral (ex: 555â555â5555 â âcinq cinq cinqâŠâ). Câest la recommandation officielle pour agents vocaux. (elevenlabs.io)
- Pour la normalisation des nombres/symboles (fréquent en téléphonie), suivez le guide Normalization ou faites réaliser cette expansion cÎté LLM. (elevenlabs.io)
RAG / base de connaissances
- Votre choix dâembeddings intfloat/e5âmistralâ7bâinstruct est supportĂ©. Activez RAG et ajustez âmaximum document chunksâ et âmaximum vector distanceâ pour limiter le contexte injectĂ© (trop de contexte augmente le risque de digressions et la latence ~500 ms). Nâutilisez le mode âPromptâ que pour les documents critiques; sinon laissez âAutoâ pour Ă©viter de dĂ©passer le contexte. (elevenlabs.io)
LLM et robustesse
- GPTâ4.1 est supportĂ© nativement. Conservez temperature=0 pour la dĂ©terminisme, et activez un âBackup LLMâ pour Ă©viter les coupures si le modĂšle principal est indisponible. (elevenlabs.io)
Attentes de latence en téléphonie
- La tĂ©lĂ©phonie ajoute typiquement ~200 ms en intraârĂ©gion (jusquâĂ ~500 ms en interârĂ©gion). Cela nâexplique pas des artefacts audio, mais aide Ă calibrer les bargeâins. (elevenlabs.io)
Diagnostics utiles
- Si un appel tombe en erreur, vérifiez Call History pour le motif exact (messages explic
j'ai toujours les artefacts et c'est pire maintenant aussi certaines de tes instructions ne sont plus a jours
Merci pour le signalement. Deux points ont effectivement changé récemment, ce qui peut expliquer une partie des problÚmes et des instructions périmées:
- Conversational AI sâappelle dĂ©sormais ElevenLabs Agents dans lâUI et la doc. (elevenlabs.io)
- Le paramĂštre optimize_streaming_latency est dĂ©prĂ©ciĂ© et nâest plus recommandĂ©. (help.elevenlabs.io)
Actions correctives vérifiées dans la doc ElevenLabs
- ModĂšle TTS pour agents
- Vous utilisez Turbo v2.5. Ce modĂšle est classĂ© âOlder Modelsâ et ElevenLabs recommande dâutiliser Flash v2.5 Ă la place. Flash v2.5 est ultraâfaible latence (<75 ms) et adaptĂ© aux usages conversationnels multilingues. Passez le modĂšle de la voix de Turbo v2.5 vers Flash v2.5. (help.elevenlabs.io)
- Latence de streaming
- DĂ©sactivez tout rĂ©glage âOptimize streaming latencyâ/optimize_streaming_latency dans lâUI ou vos appels, car ce paramĂštre est dĂ©prĂ©ciĂ©. (help.elevenlabs.io)
- Format audio téléphonie
- Conserver ÎŒâlaw 8000 Hz est conforme aux formats pris en charge par lâAPI (ÎŒâlaw 8 kHz et Aâlaw 8 kHz). (help.elevenlabs.io)
- Réglages de voix (stabilité/similarité)
- Une stabilité trop basse accroßt la variabilité entre générations. Si vous observez des dérives/variations, augmentez la stabilité et, au besoin, la similarité dans Voice Settings. (help.elevenlabs.io)
- Gardez la vitesse proche de 1.0, car des valeurs extrĂȘmes peuvent dĂ©grader la qualitĂ©. (help.elevenlabs.io)
- Voix issues de la Voice Library et latence
- Si la voix choisie a âLive Moderationâ activĂ©e, cela peut ajouter de la latence. Testez avec une autre voix (par ex. une Default/PVC sans Live Moderation) pour comparaison. (help.elevenlabs.io)
- Contenu (nombres, dates, sigles)
- Pour Ă©viter des lectures hĂ©sitantes, forcez lâLLM Ă Ă©crire les nombres/dates/sigles en toutes lettres; cĂŽtĂ© API TTS, la normalisation peut aussi ĂȘtre activĂ©e mais ajoute de la latence. (help.elevenlabs.io)
- RAG/Connaissances
- Dans Agents, vous pouvez activer RAG pour augmenter la taille par fichier dans la base de connaissances (jusquâĂ 10 MB) et rester dans les limites prĂ©vues; vĂ©rifiez que vos fichiers respectent ces bornes. (help.elevenlabs.io)
- Langue de lâagent
- Les agents prennent en charge les langues supportĂ©es par Flash v2.5/Turbo v2.5 (dont le français). Assurezâvous que la voix et le modĂšle sont cohĂ©rents avec la langue ciblĂ©e. (help.elevenlabs.io)
Si les artefacts persistent aprĂšs ces changements, enregistrez un extrait et ouvrez un ticket au support en joignant lâaudio et lâID dâappel; consultez aussi Call
ok un autre soucis c'est que l'agent elevenlabs n'arrive pas a raccroche l'appel , j'utilise kamailio pour convertir tcp(elevenlabs) et udp(manifone) everything is good excepte the agent can't end call and when i end call on the phone the agennt is still running
Hereâs what ElevenLabs officially supports for call teardown and what to check in your setup:
-
Transport/protocol: ElevenLabs SIP trunking supports TCP or TLS for SIP signaling; UDP transport is not available. Make sure the ElevenLabs-facing leg of your Kamailio bridge is TCP or TLS and that your SIP URI uses transport=tcp (e.g., sip:sip.rtc.elevenlabs.io:5060;transport=tcp). Using UDP on the EL side is unsupported.
-
Agent-initiated hangup: Enable the End Call system tool. It is added by default for agents created in the dashboard; for agents created via API/SDK you must add it explicitly as a system tool so the agent can terminate the call. You can also prompt conditions for when to end.
-
Detecting call completion in your backend: Use Post-call Webhooks. ElevenLabs sends a webhook after a call ends and analysis completes; this is the reliable signal to clean up any lingering application state if the telephony side has already disconnected.
-
Codec expectations: For SIP trunks, ElevenLabs sends/receives audio in G.711 (8 kHz) or G.722 (16 kHz). This is independent of any audio format you set for WebSocket integrations; ensure your SIP bridge handles these codecs correctly.
If after enforcing TCP/TLS on the ElevenLabs leg and enabling the End Call tool the issue persists, please share the exact SIP trunk configuration you imported into ElevenLabs (transport, media encryption, and number format), since those fields must match the docsâ requirements.
j'ai une latence de la part de l'agent elevenlabs apres le premier message pourquoi? et apres dans la conversation je n'ai pas de latence