Evaluation of Automatic Speech Recognition Using Generative Large Language Models
生成型LLMをASR評価に活用する新手法が論文として公開され、人間アノテータとの一致率92〜94%を達成した。従来のWER(単語誤り率)が63%の一致率にとどま...
生成型LLMをASR評価に活用する新手法が論文として公開され、人間アノテータとの一致率92〜94%を達成した。従来のWER(単語誤り率)が63%の一致率にとどま...
連続学習ベンチマークの評価結果が、データ分割方法だけで大きく変わることを示す論文が2026年4月24日に公開された。同じストリームを9日・30日・44日で分割す...
2026年4月23日、ビデオの「時間の流れ」をAIが学習・操作する研究論文がarXivで公開された。自己教師あり学習で速度変化を検出し、44,632本のスローモ...