アゴラは、低遅延の応答とリアルタイムの割り込み処理により、より自然な音声対話を可能にします。また、内蔵のバックグラウンドノイズ抑制、エコーキャンセル、選択的注意ロックにより、どのような環境でもAIがユーザーの声を明確に認識できます。さらに、アゴラのグローバルリアルタイムネットワークにより、世界中どこでも安定した接続と高いパフォーマンスを提供します。
アゴラの会話型AIエンジンには、OpenAI互換のLLMを接続できます。具体的には、OpenAIのGPTモデル、Google Gemini、DeepSeek、およびOpenAI互換のカスタムモデルが利用可能です。さらに、今後追加のLLMのサポートも予定されています。
Review our documentation on connecting LLMs here: https://docs.agora.io/en/conversational-ai/models/llm/overview
音声AIエージェントを実装するには、LLM(大規模言語モデル)とテキスト読み上げ(TTS:Text-to-Speech)サービスをアゴラの会話型AIエンジンに接続する必要があります。これにより、LLMや音声を自由にカスタマイズし、最適な音声AI体験を提供できます。
Review our documentation on connecting ASR models here: https://docs.agora.io/en/conversational-ai/models/asr/overview
Agora’s Conversational AI Engine currently supports the following TTS providers:
Review our documentation on connecting TTS models here: https://docs.agora.io/en/conversational-ai/models/tts/overview
Agora’s Conversational AI Engine currently supports the following AI avatar providers:
Review our documentation on connecting avatar providers here: https://docs.agora.io/en/conversational-ai/models/avatar/overview
To implement a voice AI agent, you need to connect an LLM and a text-to-speech service to Agora’s Conversational AI Engine. This enables full customization of the experience, with the LLM and voice of your choice.
カスケードモデルは、
いいえ、本エンジンは既存のLLMとの音声対話を可能にするものであり、 LLMの作成やトレーニング機能はありません。