デコーダのみを用いたトランスフォーマにおける回路トレースによるグラフ推論の解明

デコーダのみを用いたトランスフォーマにおける回路トレースによるグラフ推論の解明 なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。 ソースを読む(export.arxiv.org) a … 続きを読む

判定がノイズとなる時:LLM 判定ベンチマークにおける設計上の欠陥が、妥当性を静かに損なう方法

判定がノイズとなる時:LLM 判定ベンチマークにおける設計上の欠陥が、妥当性を静かに損なう方法 なぜ重要か: パフォーマンス指標が更新され、選定・置換の判断材料になります。 ソースを読む(export.arxiv.org … 続きを読む

機械翻訳の評価とメタ評価における、正確性と流暢性のトレードオフ:「二兎追う者は一兎をも得ず」か?

機械翻訳の評価とメタ評価における、正確性と流暢性のトレードオフ:「二兎追う者は一兎をも得ず」か? なぜ重要か: 企業や社会への影響が見込まれ、一般メディアにも波及する可能性があります。 ソースを読む(export.arx … 続きを読む