純粋・応用数学・数学隣接分野(含むガロア理論)18 (372レス)
1-

300: 04/26(金)23:15 ID:A7Cl6sKK(1/2) AAS
これ面白い
外部リンク:wired.jp
wired
STEPHEN ORNES

SCIENCE2024.04.26
AIの「創発性」は幻影に過ぎない ── 大規模言語モデルの新たな測定で判明

2年前、BIGベンチこと「Beyond the Imitation Game benchmark」というプロジェクトで、450名の研究者がChatGPTなどのチャットボットに用いられている大規模言語モデル(LLM)の性能を検証するためにデザインされた204のタスクをリストアップした。そのほとんどのタスクで、モデルが拡大するにともない、パフォーマンスも予測可能なかたちで徐々に向上していた。つまり、モデルが大きくなるにしたがい、性能も同様に少しずつ上がるということだ。しかし、一部のタスクでは、こうした性能のスムーズな向上が見られなかった。ずっとほぼゼロだったパフォーマンスが、突然飛躍的に向上するのだ。ほかの研究でも、同じような飛躍が確認された。

同研究論文の執筆陣は、この飛躍を「ブレイクスルー」挙動と呼び、ほかの研究者は水が氷に変わるようなものとして、物理学で言うところの「相転移」になぞらえた。研究者は2022年8月に発表された論文において、こうした行動は驚きであるばかりでなく予測も不可能であり、人工知能(AI)の安全性、可能性、リスクなどに関する議論で考慮されるべきだと指摘した。そしてこの能力を「創発性」と名付けた。特定のシステムの複雑さが高いレベルに達したときにのみ生じる集団的な挙動を意味する用語だ。

しかし、実際にはそれほど単純な話ではないのかもしれない。スタンフォード大学の3名の研究者が新たに論文を発表し、そうした能力が突然生じるように見えるのは、LLMのパフォーマンスを測定する方法の問題だと指摘したのだ。そのような能力は、予測が不可能でもなければ、突然でもないと、彼らは主張した。「この変化は人々が考えるよりもはるかに予測しやすいものだ」と、スタンフォード大学のコンピューターサイエンティストで、同論文の筆頭著者であるサンミ・コイエジョは語る。「創発的な能力が存在するという強力な主張は、モデルが何をするかという点と同じぐらい、それを測定する方法の選択とも関係しています」

創発的ではなく、漸次的
1-
あと 72 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.040s