技術的特異点/シンギュラリティ261 (954レス)
1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

856: 09/15(日)01:02 ID:MWCCIrIe(1/80) AAS
そもそもだけど、人間は経験した事がないと対応できないからね。
人が生まれてから成人するまでに、40歳くらいまでに、60歳くらいまでに優秀な人含めてどれだけ経験して、情報量で言えばどのくらいなのかという話。

優秀な人と言っても大企業の経営者、有名大学の研究者、官僚、スポーツ選手、みんな質の異なる経験を積んでるだろうし。
857: 09/15(日)01:06 ID:MWCCIrIe(2/80) AAS
同じような優秀な人といっても1930年代生まれと1990年代生まれでは世代が違いすぎるから違うだろうし、性別と生まれた国、日本なのかカメルーンなのかでも異なるだろうし。
858: 09/15(日)01:10 ID:MWCCIrIe(3/80) AAS
人間に入力されたデータってそのくらい多種多様なんだよな。
859: 09/15(日)01:13 ID:MWCCIrIe(4/80) AAS
ただこれからはその人間に入力されたデータだけに頼らなくても良くなるんだよね

>OpenAI o1のように,事前学習によって作られたモデル本体の性能だけでなく,推論時の工夫によって性能をスケーリングさせたAIが登場すると何が起きるかというと,かつて囲碁チャンピオンを倒したAlphaGo~Alpha
Zeroのように「自分で生成したデータで強くなり続ける」ループが完成するんですよね。
860: 09/15(日)01:17 ID:MWCCIrIe(5/80) AAS
ダラダラとテレビ見たり、何十年も同じメンツで飲み会したり、ギャンブルやったり、スマホゲー、ネトゲとかやった経験は無駄なデータになるのかな。

特にゲームは作る側の想定通りの事しか起きないし。
861: 09/15(日)01:21 ID:MWCCIrIe(6/80) AAS
o1とりあえずバカでも分かるくらいに分かりやすく説明してくれてるんでまず勉強しろ
862: 09/15(日)01:24 ID:MWCCIrIe(7/80) AAS
o1、数学だけではなく各分野のエキスパート領域に入った模様

今回、o1はMMMUで78.1%を達成。これは大学レベルの芸術、デザイン、ビジネス、 自然科学、社会科学、人文科学、健康、医学、技術の問題(計30テーマ)を画像 & テキストから解くベンチマーク。テーマ毎に専門とする3人
の大学4年生が解き、各テーマ毎の最低成績の平均が76.2%、中間が82.6%、最高が88.6%
863: 09/15(日)01:28 ID:MWCCIrIe(8/80) AAS
o1使ってみたけどまだファイルのアップロードに対応してないっぽい?
864: 09/15(日)01:31 ID:MWCCIrIe(9/80) AAS
こんなの過去問のカンニングだー!
       ↓
機械が本気でカンニングしたなら全部100点取るだろバカww
865: 09/15(日)01:35 ID:MWCCIrIe(10/80) AAS
難関資格やTOEIC900の市場価値がどんどん下がる未来予測
866: 09/15(日)01:38 ID:MWCCIrIe(11/80) AAS
これさえ間違ってなければ説得力あったんだけどな
悪いけどこれ見る限りほんの少しの推論力も持ち合わせているとは思えない
867: 09/15(日)01:42 ID:MWCCIrIe(12/80) AAS
これ
868: 09/15(日)01:46 ID:MWCCIrIe(13/80) AAS
このレベルの点数ってことはもう各種専門分野でもかなり使い物になるレベルに到達しちまったってことだよな
うろ覚えだけど4oはこのテストのスコアかなり低くなかったか?

AIは当然ミスもするが、それをスクショして騒ぐ奴の出現もOpenAIの社員は事前に予測してたんよね 読んでおけ


また、OpenAl o1-previewは完璧ではありません。三目並べでも、時々間違えることがあります。人々は失敗例をツイー トするでしょう。しかし、人々が「LLM は推論できない」ことを示すために使用してきた多くの一般
的な例では、01 previewははるかに優れたパフォーマンスを発揮し、o1はほぼ常に正答し、さら にスケールアップする方法もわかっています。
869: 09/15(日)01:49 ID:MWCCIrIe(14/80) AAS
だめだだめだ言う前に頼むから勉強してくれよ
バカでも分かるように分かりやすくて詳しい動画も貼ってんだから
870: 09/15(日)01:53 ID:MWCCIrIe(15/80) AAS
見たけど結構分かりやすいね 見て思うのが「OpenAIやっぱすげえ」ということ
o1使って次のより強いモデル作れるだろってアイデアも既にオリオンの制作に使ってるようだし先が楽しみでしかない
てかo1無印とプレビューとミニでそれぞれ別のモデルだったんだな
871: 09/15(日)01:56 ID:MWCCIrIe(16/80) AAS
「普通の人がわかる性能発展としてはGPT-4o」がほぼ限界ラインで、
OpenAI o1レベルになると、日常使用レベルではオーバーキルになり、o1のありがたみを感じられる推論が必要な場面はほぼないという気もします

>一方で、研究者や開発者、金融などの高度な推論が必要な場面で、
>単なる生産性向上を超えて新しい発見につながるツールとしての生成AIの発展は、まさにo1の方向が今日開かれた
872: 09/15(日)02:00 ID:MWCCIrIe(17/80) AAS
大躍進かどうかは知らないが
時々間違えることはあっても、
明らかにGPT-4oの推論力は超えてるだろ?

慎重派の俺でもo1の進歩は過小評価してないぞ
873: 09/15(日)02:03 ID:MWCCIrIe(18/80) AAS
GPT-4o→トークンベースで次の単語を予想、過去のプロンプトを元に確率論で事前学習よりアウトプットを出す

OpenAI-o1→人間の思考過程を参考に答える前に考えてアウトプットを出す
プロセス中に誤りを認識し修正可能
思考過程を明示
874: 09/15(日)02:07 ID:MWCCIrIe(19/80) AAS
実はGPT-4oでも、「ゆっくり段階的に考えろ」というプロンプトを添えて
論理問題を与えると、意外と解ける問題が増えていた

今回はその工程自体を、LLM内部に組み込んだ形か
875: 09/15(日)02:10 ID:MWCCIrIe(20/80) AAS
東大の数強の人がOpenAI o1の回答(京大の伝説の入試問題)を検証してみて、通常回答とは別解の大学レベルのテクニックを利用しているのを確認しているので、OpenAI o1の推論能力はガチっぽいです。
1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 1.787s*