HumAIne-Chatbot:強化学習によるリアルタイムパーソナライズ会話型AI
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.04303v2 発表種別: replace-cross
要約: 現在の会話型AIシステムは、個々のユーザー特性を見過ごした画一的で汎用的なやり取りが多く、適応的な対話管理に欠けています。この問題に対処するため、本稿では、新規ユーザープロファイリングフレームワークを通じて応答をパーソナライズするAI駆動型会話エージェント、**HumAIne-chatbot** を紹介します。本システムは、多様なGPT生成仮想ペルソナで事前学習を行い、ユーザータイプの広範な事前確率を確立します。ライブインタラクションの間、オンライン強化学習エージェントは、暗黙的なシグナル(例:タイピング速度、感情、エンゲージメント時間)と明示的なフィードバック(例:好き嫌いの反応)を組み合わせることで、ユーザーごとのモデルを洗練します。このプロファイルは、チャットボットの対話ポリシーを動的に指示し、コンテンツとスタイルの両方をリアルタイムで適応させることを可能にします。システムの評価として、複数の会話ドメインにおいて50の合成ペルソナを用いた管理された実験を行いました。結果は、パーソナライゼーション機能が有効になっている場合、ユーザー満足度、パーソナライゼーション精度、タスク達成率が常に向上することを示しました。統計分析により、パーソナライズされた条件とパーソナライズされていない条件との間に有意差があり、主要な指標全体で効果サイズが大きいことが確認されました。これらの知見は、AI駆動型ユーザープロファイリングの有効性を強調し、将来の実世界検証のための強力な基盤を提供します。
原文(英語)を表示
Title (EN): HumAIne-Chatbot: Real-Time Personalized Conversational AI via Reinforcement Learning
arXiv:2509.04303v2 Announce Type: replace-cross
Abstract: Current conversational AI systems often provide generic, one-size-fits-all interactions that overlook individual user characteristics and lack adaptive dialogue management. To address this gap, we introduce \textbf{HumAIne-chatbot}, an AI-driven conversational agent that personalizes responses through a novel user profiling framework. The system is pre-trained on a diverse set of GPT-generated virtual personas to establish a broad prior over user types. During live interactions, an online reinforcement learning agent refines per-user models by combining implicit signals (e.g. typing speed, sentiment, engagement duration) with explicit feedback (e.g., likes and dislikes). This profile dynamically informs the chatbot dialogue policy, enabling real-time adaptation of both content and style. To evaluate the system, we performed controlled experiments with 50 synthetic personas in multiple conversation domains. The results showed consistent improvements in user satisfaction, personalization accuracy, and task achievement when personalization features were enabled. Statistical analysis confirmed significant differences between personalized and nonpersonalized conditions, with large effect sizes across key metrics. These findings highlight the effectiveness of AI-driven user profiling and provide a strong foundation for future real-world validation.
Published: 2025-09-24 19:00 UTC