AIコーディング・システム設計・運用★6 (256レス)
上下前次1-新
193: 06/03(水)19:54 ID:OV9GIiUK(19/37) AAS
さっきまでやってた、Microsoft Build 2026をチェックしてるけど
ついにOpenAIと決別して独自モデル出してきたな
でもパラメータがたった35Bで、コンテキストも128K・・・
これは相当厳しそう、実際Opusとは戦えてないことを認めているし、Sonnetとどこまでやれるかってくらいかなぁ
やっぱAIは周回遅れになると追いつくのが大変でコモディティ化せんね
ただ音声認識に関しては、かなり自信があるみたいで具体的なベンチを公開しまくってて、OpenAIの製品にも勝ってるって主張しているな
ビジネス会話の収集がzoomとMS Teamsの独占状態だから、ここは他が追いつけないって感じなのかぁ
194(1): 06/03(水)19:56 ID:YxzekrxL(4/4) AAS
比較対象が違うw
195: 06/03(水)19:58 ID:W1vwGs0G(4/4) AAS
>>182
やっぱりトークンは減りやすいのか
そもそもobsidianのフォルダをAI作業フォルダに当てたほうが早かったな
複数のことをやらせてるからどう使い分けて読み込ませるか考えないとな
196: 06/03(水)20:05 ID:qzs8zLnC(3/4) AAS
散々ノイジーな長文書き散らしといて結論は個人の当て推量
197: 06/03(水)20:07 ID:OV9GIiUK(20/37) AAS
昨日あったIntelのCOMPUTEX 2026もチェックしてるけど、こっちは目ぼしい情報はなさそうだなぁ
198: 06/03(水)20:12 ID:OV9GIiUK(21/37) AAS
>>194
そう比較対象が違うのは正解
で、比較対象に対して厳しいって言ったんじゃなくて
比較対象の領域で戦えないから、戦える領域を探して、そこに向けたAIにせざるを得なかったことが
厳しってこと
199: 06/03(水)20:18 ID:OV9GIiUK(22/37) AAS
だから「このモデル」がSonnetとどこまでやれるか、って意味じゃないからね
将来的にMicrosoftのフルスペックのAI開発能力が、そことギリギリ戦えるか、戦える製品が将来的にでてくるか?ってくらいの選択肢がないんjないか?ってこと
200: 06/03(水)20:20 ID:ige3yBlB(2/2) AAS
chatGPTからgithubのブランチ見に行ってくれなくなった
前はブランチ名言わなくても見てくれたのにわいだけなんかな
201: 06/03(水)20:28 ID:OV9GIiUK(23/37) AAS
今回のアップデートでOpusとGPT系はStrictを大幅に高めてきたから
これまで言わなくてもやってくれたことを言わないとやらなくなったよ
勝手に推定して補完しないで欲しいっていうマーケットのニーズに応えた
202: 06/03(水)20:38 ID:OV9GIiUK(24/37) AAS
このStrictの大幅上昇で
これってユーザに聞いたほうがいいんじゃない?ってのも勝手に推定しないようになった
だけど「推定できない情報を都度確認して」とか「推定できていない情報を明示して」って書くのはもう良くない
今は、価値や目的を形成するのが正解、価値が形成されていれば、githubのブランチも見に行かないといけないことが自明になる、だから確認してくるようになる
203: 06/03(水)20:43 ID:OV9GIiUK(25/37) AAS
これは人間側の手法を変える必要があるんじゃなくて、認知を変える必要がある、
こんなことをモデルは大幅アップデートしてくるんで、
AI論の基本を知って実践していないと、モデルの変更に無限に人間側が対応し続けなきゃいけなくなる
204: 06/03(水)20:56 ID:OV9GIiUK(26/37) AAS
さらに重要なのは、理論に則った設計(ここではAI論)は後方互換で、前方互換だってこと
つまりこれは、古いモデルに対しても同じ有効性をもつ、これが大事
理論に則っていない設計は、今この瞬間だけ有効
205: 06/03(水)21:09 ID:OV9GIiUK(27/37) AAS
さっきのわいの発言をちょっと補足するけど
AIが推定できていないことを明確にすることが本質じゃなくて
そもそもAIはなぜ推定できないのか?を考える必要があって
情報の推定には価値と目的が必要ってことが重要なんよね
そしてそれは下位認知なので、推論コストが極めて低く、コンテキスト汚染度が極めて低く、自由度が極めて高い
これが重要
206: 06/03(水)21:14 ID:OV9GIiUK(28/37) AAS
んで、こんなことは一般人は知らなくてもいいけど←わいの価値観による主観的推定
プロのエンジニアはこれが仕事なんで、知ってなきゃいけないよね?ってことが重要←わいの価値観による主観的推定
そしてあなたたちはプロのエンジニアですよね?←客観的事実
207: 06/03(水)21:20 ID:Weqxc/jZ(2/4) AAS
わいはハネおじみたいな大規模開発してないから大丈夫
208: 06/03(水)22:03 ID:qzs8zLnC(4/4) AAS
ハネおじは開発エアプでLLMからのにわかAIバイブコ勢
209: 06/03(水)22:05 ID:t1EzIhT1(2/2) AAS
2ヶ月くらい前にClaude Desktop使ってバグだらけですぐにやめちゃったけどリリース直後だったんだってね
今は十分安定して使えるようになった?
210: 06/03(水)22:15 ID:OV9GIiUK(29/37) AAS
今回のStrictの大幅上昇が意味することは
これまで設計がバグってた(理論に則っていない)AIシステムも、バグったまま実行(当然タスクも成果物もバグってる)できたけど
Strictの上昇によって、実行時にエラーを吐いて続行不可能になったことで
それを検出できるようになったことが、大きな価値なんよね
だから、次は設計時にコンパイルエラーがでるようにStrictの再上昇を図ると思うで
だからますます、意味がわかって理論に則って設計していないとどうにもならなくなる
211: 06/03(水)22:17 ID:OV9GIiUK(30/37) AAS
Claudeに何かやらせても、上手くやらない、成果物が間違っている
これの正体が見えてきたやろ?
212: 06/03(水)22:20 ID:ZtKPk+XD(1) AAS
バグって単語だけ拾ってすごい方向に突き進んでるな
10年前のチャットボットだろこれ
上下前次1-新書関写板覧索設栞歴
あと 44 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.501s*