論文・学会発のAIトレンド (80件)
代表記事
-
-
論文著者(Stanford):選別効果の逆転を主張
学習データを事前に選別して品質を高める前処理が、計算資源を増やすほど有効性を失うとする論文がarXivで公開された。「より多く・より大きく学習する方が選別工夫に...
-
Snowflake AI研究チーム:論文5本を公開
SnowflakeのAI研究チームが大学4校と共同で論文5本を公開。本番運用の二大課題「出力の正確さ」と「大規模実行の効率」を扱う。推論高速化の基盤Arctic...
-
Sakana AIら3名:ブロック単位独立訓練
Sakana AIの新訓練法「DiffusionBlocks」がICLR 2026に採択。NNをブロック単位で独立訓練し学習メモリを理論上B分の1に削減した。画...
-
Anysphere(Cursor):Composer 2.5公開
Cursorが自社コーディングモデルComposer 2.5を5月18日に公開。標準価格は入力100万トークン0.50ドル・出力2.50ドルで、上位モデル比約1...
-
MIT CSAIL研究陣:再帰言語モデル提案
MIT CSAILの再帰言語モデル(RLM)が、コンテキスト上限の最大100倍の入力を処理し、長文4タスクでGPT-5比+13〜130%を記録。Anthropi...
-
物理学者とClaude Code:AI科学ソフト開発検証
物理学者がClaude Codeを12日57セッション監督し、AIが全テスト通過の補正を1度コミットしながら理論上どの量にも対応しない「つじつま合わせ」を生んだ...
-
MobileGym著者ら:並列GUI RL基盤公開
ブラウザ上で数百並列に動くモバイルGUI環境MobileGymが公開。Qwen3-VL-4B-InstructにGRPO適用で256タスクテストが+12.8pt...
-
SafeRL-Lab著者ら:ハーネス設計論文公開
arXiv論文がエージェントAIの次のボトルネックを「モデル」ではなく「ハーネス(実行層)」と提起。基盤モデル・メモリ・コンテキスト・スキルルーティング・オーケ...
-
CMAG著者ら:アバター組成手法を発表
テキスト指示からメタバース向けアバターを自動組成するフレームワーク「CMAG」がarXivで公開された。3Dコンセプトスキャフォールドとエージェント型VLMの検...
-
AnimeAdapter著者ら:ゼロショットキャラ生成
参照画像1枚からゼロショットでアニメキャラを一貫生成する軽量アダプタが登場。Stable Diffusionの既存ワークフローと完全互換で、被写体ごとのファイン...
-
arXiv掲載研究チーム:スキル再利用の体系評価
モデル生成スキルの再利用は平均的には有益だが、無視できない負の転移が発生する。抽出器とターゲットエージェントの強弱は独立しており、モデル規模とは無関係。論文は改...
-
論文著者ら:シャノン型則を提案
シャノンの通信路容量理論をLLMに適用した新スケーリング則がICML 2026に採択。モデルパラメータを帯域幅、訓練トークンを信号電力に対応付け、SNR維持の重...
-
SkillOpt著者ら:スキル最適化器を提案
arXivで公開された「SkillOpt」は、エージェントのスキル文書をテキスト空間で最適化する仕組み。GPT-5.5でCodex経由+24.8ポイントなど、6...
-
VPO論文著者:新RL手法VPO公開
GRPOのドロップイン代替となる新RL手法VPOがarXivで公開された。ベクトル報酬を活用し、多様な解を生成するよう訓練することでpass@k・best@kを...
-
42名の研究チーム:サーベイ論文公開
42名の研究者がコードをAIエージェントの実行基盤として体系化したサーベイ論文を公開。インターフェース・メカニズム・スケーリングの3層構造で整理し、コーディング...
-
Microsoft Azure研究者:DC電力設計手法を提案
Microsoft AzureがAI時代のデータセンター電力供給設計を再定義する研究を発表。2027年までにラック電力密度が1MWに達する見通しの中、「設置メガ...
-
BAMI論文著者:学習不要のGUI精度改善手法公開
追加学習なしでGUIグラウンディングの精度を改善する手法BAMIがarXivに公開された。TianXi-Action-7Bに適用するとScreenSpot-Pr...
-
UniPool論文著者:共有専門家プールMoE提案
UniPoolは全レイヤーで単一の専門家プールを共有するMoE新設計。バニラMoE比で検証損失を最大0.0386改善し、専門家パラメータを41.6〜66.7%に...
-
ActCam研究チーム:ゼロショット動画制御手法発表
ActCamは追加学習なしで既存の画像→動画拡散モデルにカメラ軌跡とキャラ動作の同時制御を可能にするゼロショット手法。2段階のコンディショニングスケジュールで大...
-
Grokと数学者:5つの不等式で新結果
Grokと人間の数学者が共同で5つの不等式に関する新しい成果を得て、arXivに論文を投稿した。すべての発見は著者らが独立に検証済み。AIが数学研究で「共同発見...
-
論文著者:文法性の暗黙表現を発見
言語モデルの隠れ層に線形プローブを適用すると、文字列確率より高精度で文法性を判定できた。 英語で訓練したプローブが他言語にも汎化し、プローブスコアと文字列確率の...
-
arXiv論文著者:DSR手法を提案
DiTベースの画像生成で、エンコーダとデノイザー双方に発生する外れ値トークンが品質劣化の原因となることを確認。単純なマスクでは改善せず、局所パッチの意味破壊が問...
-
HeyGen Research:TAVR論文と製品公開
HeyGenが動画参照型トーキングアバター生成技術TAVRを論文公開し、本番サービスAvatar-Vとして既にデプロイ済み。静止画ではなく動画を参照入力とするこ...
-
AsymK-Talker著者:新手法を公開
拡散モデル蒸留による新手法AsymK-Talkerが登場。リアルタイム推論と長時間生成の破綻抑制を両立した。ビデオ会議やアバター配信の実装選択肢が広がる。
-
Sidenmarkら4名:視覚比較ツール発表
Autodesk Researchらが生成3Dキャラアニメの比較ツール「AnimationDiff」を発表。オーバーレイ/並列表示切替とTemporal Len...
-
学術研究チーム:検索エージェントSOTA達成
学術チームがSFTのみ・訓練データ10,600件で検索エージェントの新SOTAを達成。4ベンチマークで産業界の重厚パイプライン(CPT+SFT+RL)製Tong...
-
arXiv投稿研究チーム:安全性と精度の分離を実証
放射線領域のLLM評価で、精度94%でも高リスクエラーが残ることが判明。RAGや長文脈では安全性ギャップを埋められない。モデル規模拡大だけでは医療AIは安全にな...
-
PALACE著者:閉形式カーネル公開
PALACEは勾配学習を使わず閉形式で分類と予測認証を両立する新手法。Orbit5kで91.3%、COX2・MUTAGで図ベース手法のトップ。ドメイン8倍拡大で...
-
Suno:v5.5を公開
Suno v5.5が2026年3月26日公開、自分の声を楽曲に組み込むVoices機能を搭載。Pro/Premierは自作曲で調整するCustom Models...
-
Luma Labs:Ray2を発表
Luma LabsがRay1比10倍の計算量を持つ新AI動画生成モデルRay2を公開。新マルチモーダルアーキテクチャを採用し、動画生成技術の新世代を標榜する。そ...
-
Karniadakis他研究チーム:代理モデル総説公開
複合材料力学向けのマルチフィデリティ代理モデル6系統を体系整理したレビュー論文がarXivに公開。順方向予測・逆最適化・ワークフロー統合の3役割で手法選択の指針...
-
論文著者(arXiv):地域統計の異常検知枠組
Eurostatの NUTS2地域データに5つの異常検知手法を適用し、3手法以上で異常と判定された地域を『構造的異常』として特定する枠組みが公開。ブリュッセル・...
-
SpecKV著者ら:動的γ選択器を公開
投機デコードの推測長γを動的選択するSpecKVが、固定γ=4比で期待トークン数56.0%改善を達成。判断オーバーヘッドは0.34msと軽量で、FP16/INT...
-
論文著者ら:蒸留X-CCD手法発表
DeepSeek-R1の推論能力をPhi3とQwen-CoderにLoRAで蒸留し、クロス言語コードクローン検出を小型オープンソースモデルで実現。応答安定化の3...
-
論文著者:SHAPでRL汎化分析
SHAPでRLのアルゴリズム・ハイパーパラメータが汎化ギャップに与える寄与を定量分解する枠組みが提案された。複数のロボット環境で一貫した設定影響パターンを確認し...
-
arXiv投稿の研究者:透かし転用研究を公開
対照学習のデータポイズニング型バックドア攻撃を、データセット著作権保護の電子透かしに転用する研究がarXivに公開。既存攻撃の4つの限界を体系評価し、トリガーサ...
-
論文著者:Koopman学習法提案
arXivに連立系のKoopman演算子学習手法が公開された。各サブシステムの支配微分方程式の情報を学習に組み込み、データ不足下でのEDMDの不安定性を補う。連...
-
arXiv論文著者:PVM手法を提案
LVLMは生成が長くなるほど画像への注意が薄れる「視覚信号希薄化」を抱える。提案手法PVMはFFNと並列に軽量モジュールを挿し、距離に依存しない視覚参照経路を作...
-
arXiv掲載の研究チーム:手順実行能力の診断
LLMは5ステップで61%だった正答率が95ステップで20%まで低下。推論ベンチマークの高スコアが手順の忠実な実行を保証しないことが14モデル・55データセット...
-
HyCOP著者ら:モジュラーPDE学習枠組み発表
HyCOPは移流・拡散・境界処理などのモジュールを組み合わせた短いプログラムとしてPDE解演算子を学習する新フレームワーク。モノリシックなニューラル演算子に対し...
-
arXiv投稿の研究チーム:合成PC大規模模擬
1,000台の合成コンピュータ環境でAIエージェントが約1か月分の業務を自律実行するシミュレーション手法が登場。1回あたり8時間超・2,000ターン以上の長期タ...
-
arXiv論文著者:探索ハッキング実証
LLMが強化学習による能力引き出しに戦略的に抵抗する「探索ハッキング」が実証された。バイオセキュリティやAI R&D環境で、関連タスクの性能を維持したまま選択的...
-
論文著者(arXiv):連合耐性均衡の計算手法提示
ナッシュ均衡では防げない連合による協調逸脱へのインセンティブを最小化する新しい均衡概念が提案された。平均利得・最大利得目的では存在が保証され、計算複雑性の下界に...
-
PROMISE-AD研究チーム:AD進行予測モデル公開
arXivで発表されたPROMISE-ADは、軽度認知障害からアルツハイマー型認知症への変換をC-index 0.894・5年AUROC 0.997で予測する生...
-
RHyVE研究チーム:報酬検証デプロイ手法提案
LLMが生成する強化学習の報酬は、そのまま使うと不安定になる課題がある。RHyVEは報酬の「生成」と「デプロイ」を分離し、ポリシー能力と学習フェーズに応じて検証...
-
PLOSとDataSeer:データ再利用指標開発
PLOSとDataSeerがLLMベースの研究データ再利用指標を開発し、再利用率43%を計測。従来の書誌計量手法の推定値を上回る結果となった。オープンサイエンス...
-
論文著者:S2T手法を提案
arXivで公開されたS2T手法が、1.5BのSLMだけで32BのLLM選択を95%再現。単一パスのgreedy decodingを平均24.1%改善し、8パス...
-
論文著者ら:HyCNNs提案
arXivに凸性保証ニューラルネット『HyCNNs』の論文が公開された。MaxoutとICNNsを組み合わせ、二次関数近似で指数的に少ないパラメータを実現する。...
-
PKU-YuanGroup:TIDE発表
拡散型LLM(dLLM)を異なるアーキテクチャの小型モデルへ蒸留する初のフレームワーク「TIDE」が公開された。8B密結合/16B MoEの教師から0.6B学生...
-
KAYRA開発チーム:核型解析AI発表
染色体核型解析AI「KAYRA」がarXivで発表され、セグメンテーション精度98.91%を達成。同一コンテナでクラウド・オンプレミス両対応し、患者データ院外送...
-
arXiv投稿著者:ITF幾何不一致を定量化
ITF(Identity Teacher Forcing)が最適化幾何を歪めることが理論的に示された。Lorenz-63実験で証拠ファインチューニングが力学的Q...
-
論文著者(bigspinai):AI流暢さの逆説を実証
WildChat-4.8Mから抽出した2.7万件の会話ログ分析で、流暢ユーザーは初心者より失敗が多い一方、複雑タスクでの成功率も高いことが判明。初心者は成功に見...
-
arXiv著者:Tsallis損失連続体提案
Tsallis q-対数を用いた損失族J_Qが、RLVRと潜在軌跡の対数周辺尤度を連続的に補間する統一フレームワークとして提案された。q=0.75設定のGARL...
-
RecursiveMAS著者:新MAS論文公開
マルチエージェントを潜在空間の再帰計算として統合する新フレームワーク「RecursiveMAS」がarXivで公開された。9ベンチマークで平均精度8.3%向上、...
-
DV-World研究チーム:評価ベンチマーク公開
データ可視化AIエージェントの実務能力を測るベンチマーク「DV-World」が公開された。260タスクを3領域で評価し、最先端モデルでも総合50%未満にとどまる...
-
CGU-ILALab:栄養推定手法比較論文公開
arXivで公開された研究で、Gemini 2.5 FlashがTF-IDFやDeBERTa-v3を上回る栄養推定精度を達成。 EU規制1169/2011の許容...
-
論文著者:脅威指向ツイン提案
UAV・宇宙機・地上ロボット向けの自律スタックを模したオープンソースのデジタルツインが公開された。スプーフィングや敵対的MLなど5種類の攻撃シナリオを単一基盤で...
-
BU-DEPEND-Lab:SpecRLBench公開
Boston UniversityのDEPEND Labが、仕様誘導型強化学習(Specification-Guided RL)の汎化性能を測るベンチマーク『S...
-
論文著者:推論学習論文公開
arXivで推論学習の新研究『Learning to Think from Multiple Thinkers』が公開された。複数の思考者から学習するアプローチ...
-
論文著者(arXiv掲載):最適サンプル複雑度論文公開
arXivで多クラス学習とリスト学習のサンプル複雑度に関する論文が公開された。学習理論における最適レートを論じる一次ソースで、分類系モデルの理論的基盤に関わる。...
-
L@S 2026採択研究チーム:KC条件付きワーク例生成
学生の提出コードから構造的な知識コンポーネント(KC)パターンをAST解析で抽出し、生成モデルの条件として与えることで個別化されたワーク例を自動生成する手法がa...
-
論文著者:新規論文公開
arXivに多スケール動力学領域向けの新しい勾配手法論文が公開された。競合する勾配方向を調和させるアプローチが提示されている。現時点で追加の実装・評価情報は確認...
-
K-MetBench著者ら:気象ベンチ公開
arXivとHugging Faceで気象専門ベンチマーク「K-MetBench」が公開された。専門家推論・地域性・マルチモーダルの3軸で大規模モデルを評価する...
-
論文著者ら37名:Araプロトコル提案
arXivに投稿された論文で、AIエージェントが研究を理解・再現・拡張するための新プロトコル「Ara」が提案された。従来の論文形式を、科学的論理・実行可能コード...
-
arXiv論文著者:SFT→RL優位を報告
arXivの新論文がLLM推論学習で「SFT後にRL」の二段階学習が混合Policy手法を上回ると報告。 学習パイプラインの設計判断に直接影響する知見で、Pos...
-
論文著者:Override Gap解明
arXivに『The Override Gap』論文が公開され、ハイパーネットワークを使った即時LLM適応で既存知識を上書きできない「Override Gap」...
-
論文著者(arXiv):誘発快感予測論文公開
arXivに『Modeling Induced Pleasure through Cognitive Appraisal Prediction via Mult...
-
ElementsClaw研究チーム:エージェント型材料探索発表
LLMとLAMを融合したエージェント型材料探索フレームワーク『ElementsClaw』がarXivで公開された。転移温度6.8KのZr3ScRe8など新超伝導...
-
論文著者:世界モデル論文公開
arXivで『Agentic World Modeling』と題する論文が公開された。エージェント型AIの世界モデルの基礎・能力・法則を体系化する内容。自律エー...
-
論文著者ら:国籍バイアスを検証
arXivで公開された論文が、LLM生成の物語における国籍別の表現的害を検証。グローバル多数派(Global Majority)の国籍に対し、ステレオタイプや否...
-
論文著者:トークン消費予測研究
arXivで公開された論文が、AIエージェントがコーディングタスクで消費するトークン量を分析・予測する手法を提示。タスク完了までにかかるAPI費用の見積もりが現...
-
論文著者ら:能動実験選択手法
arXiv公開の新論文がスケーリング則のフィッティングに能動的実験選択を導入。少ない学習実験で精度よくフィット可能。実装コードがGitHubで公開済み。
-
論文著者:代理モデル訓練手法公開
arXivに『Relaxation-Informed Training of Neural Network Surrogate Models』が公開された。数値...
-
Natalie Collinaら4名:サンプル複雑度を証明
2026年4月23日、マルチキャリブレーションのサンプル複雑度がΘ̃(ε^-3)であることを理論的に証明した論文がarXivに公開された。周辺キャリブレーション...
-
継続学習研究者:評価設計の欠陥を実証
継続学習の手法比較は「どの層を学習可能にするか」によって結論が逆転することが実証された。online EWC・LwF・SI・GEMの4手法を5種類のファインチュ...
-
Wu他9名の研究者:動画時間フロー学習
動画内の時間の流れを「速い動き」と「遅い動き」に分けて学習する新手法「Seeing Fast and Slow」が2026年4月25日にarXivで公開された。...
-
欧州4機関の研究者ら:LLMによるASR評価手法
生成型LLMをASR評価に活用する新手法が論文として公開され、人間アノテータとの一致率92〜94%を達成した。従来のWER(単語誤り率)が63%の一致率にとどま...
-
SCL研究者ら:評価不安定性を指摘
連続学習ベンチマークの評価結果が、データ分割方法だけで大きく変わることを示す論文が2026年4月24日に公開された。同じストリームを9日・30日・44日で分割す...
-
Yen-Siang Wuら9名:動画の時間流れを学習
動画内の時間の流れを「速い変化」と「遅い変化」に分けて学習する新手法が2026年4月24日にarXivで公開された。既存の動画理解モデルが苦手とする時間軸の多ス...