[過去ログ]
純粋・応用数学・数学隣接分野(含むガロア理論)19 (1002レス)
純粋・応用数学・数学隣接分野(含むガロア理論)19 http://rio2016.5ch.net/test/read.cgi/math/1725190538/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
リロード規制
です。10分ほどで解除するので、
他のブラウザ
へ避難してください。
380: 132人目の素数さん [] 2025/01/04(土) 09:25:29.48 ID:JiQXGw+V これいいね gigazine.net/news/20241225-ai-frontiermath/ gigazine 2024年12月25日 OpenAIのo3モデルが数学の超難問データセット「FrontierMath」で25.2%のスコアを獲得した衝撃を数学者が語る インペリアル・カレッジ・ロンドンで純粋数学の教授を務める数学者のケビン・バザード氏が、OpenAIのo3モデルがFrontierMath問題データセットで25.2%のスコアを獲得したことについて解説するブログ記事を投稿しました。 Can AI do maths yet? Thoughts from a mathematician. | Xena xenaproject.wordpress.com/2024/12/22/can-ai-do-maths-yet-thoughts-from-a-mathematician/ 2024年12月20日に、OpenAIは新たな推論モデル「o3」シリーズを発表しました。OpenAIはo3モデルについて「これまで開発した中で最も高度な推論能力を持つ」と述べ、2025年の公開に向けて準備を進めています。 o3モデルはFrontierMathという問題データセットで25.2%のスコアを獲得したことが明らかになっています。FrontierMathは数百個の難しい数学の問題のデータセットで、問題そのものだけでなくデータセット全体の問題数なども秘密であり、AIが事前に問題をトレーニングしないよう注意深く設計されています。 FrontierMathの全ての問題は計算問題で、「証明せよ」などの形式の問題は含まれていないとのこと。公開されている5つのサンプル問題では答えが全て正の整数となっており、その他の問題についても「自動的に検証できる明確で計算可能な答えがある」とされています。問題の難易度はかなり高く、数学者のバザード氏でもサンプル問題のうち解けたのは2問だけで、別の1問については「取り組めば解けるかも」と思えたものの、残りの2問は「解けない」と思ったそうです。 FrontierMathの論文にはフィールズ賞受賞者などの著名な数学者による問題の難易度評価が記載されていますが、「極めて難しい」とコメントした上で、それぞれの問題の分野の専門家でなくては解答できないことを示唆しています。実際、バザード氏が解けた2問はバザード氏の専門分野の問題でした。 なお、実際の数学者は計算ではなく証明や証明のためのアイデアを考え出すことにほとんどの時間を使用するため、「計算で数値的な答えを出すことは独自の証明を思いつくことと完全に異なる」として数学力の計測に不適だとする数学者も存在します。しかし証明を採点するのはコストがかかるため、モデルが提出した答えが正答と一致するかどうかを確認するだけで採点できる計算問題が採用されているとのこと。 そうしたFrontierMathのテストに対し、OpenAIのo3モデルが25.2%ものスコアを獲得したことについてバザード氏は「衝撃を受けた」と述べました つづく http://rio2016.5ch.net/test/read.cgi/math/1725190538/380
382: 132人目の素数さん [] 2025/01/04(土) 09:55:55.92 ID:6lrI3oEN >>380 > 実際の数学者は計算ではなく証明や証明のためのアイデアを考え出すことにほとんどの時間を使用するため、 > 「計算で数値的な答えを出すことは独自の証明を思いつくことと完全に異なる」 > として数学力の計測に不適だとする数学者も存在します。 計算苦手なポアンカレならそういうだろうな 計算得意なガウスがどういうかは知らない > しかし証明を採点するのはコストがかかるため、 > モデルが提出した答えが正答と一致するかどうかを > 確認するだけで採点できる計算問題が採用されているとのこと。 コスト以前にそもそも証明の採点法が分かってなさそう AI屋は数学者じゃないから http://rio2016.5ch.net/test/read.cgi/math/1725190538/382
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.031s