#j'ai fais un agent vocal sur elevenlabs conversationnal ai sur leur UI que j'ai lie a un numero de

1 messages · Page 1 of 1 (latest)

spark merlinBOT
#
AI-generated Answer for thed99

Voici les rĂ©glages et contrĂŽles Ă  appliquer (tous confirmĂ©s par la doc ElevenLabs) pour corriger les glitchs/artefacts audio et les “dĂ©raillages” du flux conversationnel sur tĂ©lĂ©phonie:

Audio téléphonie (codec/rate)

  • Alignez formats d’entrĂ©e ET de sortie en Ό‑law 8000 Hz (tĂ©lĂ©phonie). Dans l’agent, dĂ©finissez:
    • TTS output: Ό‑law 8000 Hz
    • User input/STT: Ό‑law 8000 Hz
      C’est le format recommandĂ© pour Twilio/SIP, et la doc du guide Twilio indique de rĂ©gler l’entrĂ©e et la sortie en Ό‑law 8 kHz. L’API WebSocket d’agent expose d’ailleurs explicitement agent_output_audio_format et user_input_audio_format. (elevenlabs.io)

Latence de streaming (source majeure d’artefacts)

  • DĂ©sactivez “Optimiser la latence de streaming = 3”. Le paramĂštre optimize_streaming_latency est dĂ©prĂ©ciĂ© et rĂ©duit la qualitĂ© (le niveau 4 coupe mĂȘme le normalizer). Revenir Ă  0/None. (help.elevenlabs.io)

ModĂšle TTS pour appels

  • Vous utilisez Turbo v2.5 (OK pour conversation). Si les barge‑ins/rĂ©ponses trĂšs rapides priment, testez Flash v2.5 (latence ~75 ms) au lieu de Turbo (~300 ms). Les deux sont conçus pour un usage conversationnel; Flash privilĂ©gie la latence, Turbo l’équilibre qualitĂ©/latence. (help.elevenlabs.io)

Réglages de voix (stabilité/similarité/vitesse/style)

  • Valeurs “safe par dĂ©faut” souvent utilisĂ©es: stabilitĂ© ≈0,5 et similaritĂ© ≈0,75; vitesse = 1,00. Évitez les extrĂȘmes qui dĂ©gradent la qualitĂ©. Gardez “style exaggeration” Ă  0 (peut introduire instabilitĂ©/sons parasites). (elevenlabs.io)
  • La plage de vitesse 0,7–1,2 est supportĂ©e; des valeurs extrĂȘmes peuvent affecter la qualitĂ©. (help.elevenlabs.io)

Prompting LLM pour Ă©viter les “dĂ©raillages”

  • Ajoutez dans le systĂšme prompt: “RĂ©ponds exclusivement par le texte Ă  lire Ă  l’utilisateur” et demandez d’expanser nombres/dates/adresses Ă  l’oral (ex: 555‑555‑5555 → “cinq cinq cinq
”). C’est la recommandation officielle pour agents vocaux. (elevenlabs.io)
  • Pour la normalisation des nombres/symboles (frĂ©quent en tĂ©lĂ©phonie), suivez le guide Normalization ou faites rĂ©aliser cette expansion cĂŽtĂ© LLM. (elevenlabs.io)

RAG / base de connaissances

  • Votre choix d’embeddings intfloat/e5‑mistral‑7b‑instruct est supportĂ©. Activez RAG et ajustez “maximum document chunks” et “maximum vector distance” pour limiter le contexte injectĂ© (trop de contexte augmente le risque de digressions et la latence ~500 ms). N’utilisez le mode “Prompt” que pour les documents critiques; sinon laissez “Auto” pour Ă©viter de dĂ©passer le contexte. (elevenlabs.io)

LLM et robustesse

  • GPT‑4.1 est supportĂ© nativement. Conservez temperature=0 pour la dĂ©terminisme, et activez un “Backup LLM” pour Ă©viter les coupures si le modĂšle principal est indisponible. (elevenlabs.io)

Attentes de latence en téléphonie

  • La tĂ©lĂ©phonie ajoute typiquement ~200 ms en intra‑rĂ©gion (jusqu’à ~500 ms en inter‑rĂ©gion). Cela n’explique pas des artefacts audio, mais aide Ă  calibrer les barge‑ins. (elevenlabs.io)

Diagnostics utiles

  • Si un appel tombe en erreur, vĂ©rifiez Call History pour le motif exact (messages explic
cold python
#

j'ai toujours les artefacts et c'est pire maintenant aussi certaines de tes instructions ne sont plus a jours

spark merlinBOT
#
AI-generated Answer for thed99

Merci pour le signalement. Deux points ont effectivement changé récemment, ce qui peut expliquer une partie des problÚmes et des instructions périmées:

  • Conversational AI s’appelle dĂ©sormais ElevenLabs Agents dans l’UI et la doc. (elevenlabs.io)
  • Le paramĂštre optimize_streaming_latency est dĂ©prĂ©ciĂ© et n’est plus recommandĂ©. (help.elevenlabs.io)

Actions correctives vérifiées dans la doc ElevenLabs

  1. ModĂšle TTS pour agents
  • Vous utilisez Turbo v2.5. Ce modĂšle est classĂ© “Older Models” et ElevenLabs recommande d’utiliser Flash v2.5 Ă  la place. Flash v2.5 est ultra‑faible latence (<75 ms) et adaptĂ© aux usages conversationnels multilingues. Passez le modĂšle de la voix de Turbo v2.5 vers Flash v2.5. (help.elevenlabs.io)
  1. Latence de streaming
  • DĂ©sactivez tout rĂ©glage “Optimize streaming latency”/optimize_streaming_latency dans l’UI ou vos appels, car ce paramĂštre est dĂ©prĂ©ciĂ©. (help.elevenlabs.io)
  1. Format audio téléphonie
  • Conserver Ό‑law 8000 Hz est conforme aux formats pris en charge par l’API (Ό‑law 8 kHz et A‑law 8 kHz). (help.elevenlabs.io)
  1. Réglages de voix (stabilité/similarité)
  • Une stabilitĂ© trop basse accroĂźt la variabilitĂ© entre gĂ©nĂ©rations. Si vous observez des dĂ©rives/variations, augmentez la stabilitĂ© et, au besoin, la similaritĂ© dans Voice Settings. (help.elevenlabs.io)
  • Gardez la vitesse proche de 1.0, car des valeurs extrĂȘmes peuvent dĂ©grader la qualitĂ©. (help.elevenlabs.io)
  1. Voix issues de la Voice Library et latence
  • Si la voix choisie a “Live Moderation” activĂ©e, cela peut ajouter de la latence. Testez avec une autre voix (par ex. une Default/PVC sans Live Moderation) pour comparaison. (help.elevenlabs.io)
  1. Contenu (nombres, dates, sigles)
  • Pour Ă©viter des lectures hĂ©sitantes, forcez l’LLM Ă  Ă©crire les nombres/dates/sigles en toutes lettres; cĂŽtĂ© API TTS, la normalisation peut aussi ĂȘtre activĂ©e mais ajoute de la latence. (help.elevenlabs.io)
  1. RAG/Connaissances
  • Dans Agents, vous pouvez activer RAG pour augmenter la taille par fichier dans la base de connaissances (jusqu’à 10 MB) et rester dans les limites prĂ©vues; vĂ©rifiez que vos fichiers respectent ces bornes. (help.elevenlabs.io)
  1. Langue de l’agent
  • Les agents prennent en charge les langues supportĂ©es par Flash v2.5/Turbo v2.5 (dont le français). Assurez‑vous que la voix et le modĂšle sont cohĂ©rents avec la langue ciblĂ©e. (help.elevenlabs.io)

Si les artefacts persistent aprùs ces changements, enregistrez un extrait et ouvrez un ticket au support en joignant l’audio et l’ID d’appel; consultez aussi Call

cold python
#

ok un autre soucis c'est que l'agent elevenlabs n'arrive pas a raccroche l'appel , j'utilise kamailio pour convertir tcp(elevenlabs) et udp(manifone) everything is good excepte the agent can't end call and when i end call on the phone the agennt is still running

spark merlinBOT
#
AI-generated Answer for thed99

Here’s what ElevenLabs officially supports for call teardown and what to check in your setup:

  • Transport/protocol: ElevenLabs SIP trunking supports TCP or TLS for SIP signaling; UDP transport is not available. Make sure the ElevenLabs-facing leg of your Kamailio bridge is TCP or TLS and that your SIP URI uses transport=tcp (e.g., sip:sip.rtc.elevenlabs.io:5060;transport=tcp). Using UDP on the EL side is unsupported.

  • Agent-initiated hangup: Enable the End Call system tool. It is added by default for agents created in the dashboard; for agents created via API/SDK you must add it explicitly as a system tool so the agent can terminate the call. You can also prompt conditions for when to end.

  • Detecting call completion in your backend: Use Post-call Webhooks. ElevenLabs sends a webhook after a call ends and analysis completes; this is the reliable signal to clean up any lingering application state if the telephony side has already disconnected.

  • Codec expectations: For SIP trunks, ElevenLabs sends/receives audio in G.711 (8 kHz) or G.722 (16 kHz). This is independent of any audio format you set for WebSocket integrations; ensure your SIP bridge handles these codecs correctly.

If after enforcing TCP/TLS on the ElevenLabs leg and enabling the End Call tool the issue persists, please share the exact SIP trunk configuration you imported into ElevenLabs (transport, media encryption, and number format), since those fields must match the docs’ requirements.

cold python
#

j'ai une latence de la part de l'agent elevenlabs apres le premier message pourquoi? et apres dans la conversation je n'ai pas de latence