学際的研究における対話:言語文書化のための計算形態論に関する事例研究
なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。
arXiv:2509.10644v2 発表種別:差し替え
要約:計算形態論は、形態素解析やインターリニア・グロスト・テキスト(IGT)生成といったタスクを通して、言語ドキュメンテーションを支援する可能性を秘めている。しかしながら、我々の研究成果は、現実世界の言語ドキュメンテーションにおいて限定的な利用にとどまっている。本論考は、計算形態論と言語ドキュメンテーションの乖離を、NLPにおける研究と実践のより広範な不一致という文脈において位置づけ、ユーザー中心設計(UCD)の体系的な統合なしには、当該分野が文脈から切り離され、無効なものとなるリスクがあると主張する。UCDの原則が研究課題をどのように変革できるかを示すために、最先端の多言語IGT生成モデルであるGlossLMの事例研究を紹介する。3人のドキュメンタリー言語学者を対象とした小規模なユーザー調査を通じて、指標に基づく高い性能にもかかわらず、システムが現実のドキュメンテーション環境における主要なユーザビリティニーズを満たしていないことが判明した。これらの知見は、モデルの制約、ラベルの標準化、セグメンテーション、パーソナライゼーションに関する新たな研究課題を提起する。我々は、ユーザーを重視することで、より効果的なツールが生まれるだけでなく、より豊かで、より関連性の高い研究方向が明らかになると主張する。
原文(英語)を表示
Title (EN): Interdisciplinary Research in Conversation: A Case Study in Computational Morphology for Language Documentation
arXiv:2509.10644v2 Announce Type: replace
Abstract: Computational morphology has the potential to support language documentation through tasks like morphological segmentation and the generation of Interlinear Glossed Text (IGT). However, our research outputs have seen limited use in real-world language documentation settings. This position paper situates the disconnect between computational morphology and language documentation within a broader misalignment between research and practice in NLP and argues that the field risks becoming decontextualized and ineffectual without systematic integration of User-Centered Design (UCD). To demonstrate how principles from UCD can reshape the research agenda, we present a case study of GlossLM, a state-of-the-art multilingual IGT generation model. Through a small-scale user study with three documentary linguists, we find that despite strong metric based performance, the system fails to meet core usability needs in real documentation contexts. These insights raise new research questions around model constraints, label standardization, segmentation, and personalization. We argue that centering users not only produces more effective tools, but surfaces richer, more relevant research directions
Published: 2025-09-24 19:00 UTC