AIコーディング・システム設計・運用★6

AIコーディング・システム設計・運用★6 (256ﾚｽ)
上下前次 1-新

81: 06/01(月)17:38 ID:h6XHe4wV(1) AAS
ふとしたきっかけでアプリを作り出してもうちょっとで1ヶ月。途中でMacBook Airも買ったり、当然200ドルの課金が必要だったりと思った以上にお金かかった。もう直ぐ完成予定。楽しいから良し

82(1): 06/01(月)17:40 ID:lPJMtC9K(1/3) AAS
coderのgpt aiのモデルって5.3-codexと5.5どっちがいいの？リリースされた時期結構違うよね

83: 06/01(月)17:47 ID:lPJMtC9K(2/3) AAS
>>60
5系のマイナーバージョン更新だとそこまで劇的に変わってないどころか収束しそうなグラフだったけどどうなんだろうね

84: 06/01(月)17:54 ID:lPJMtC9K(3/3) AAS
gptで複数エージェント使うときにどうしてもprevious response id渡しくなるけど、あいつらは要らないという
もっと和気あいあいとやれよ

85: 06/01(月)18:53 ID:1+KnuZ/g(1/2) AAS
CursorでSonnet high thinkingを1日だけちょーっと使っただけで半分以上残ってたゲージがカンストして終わった
あと半月もあるのに…

86: 06/01(月)21:06 ID:/gShh1Bz(2/2) AAS
>>80
カスタムは長期メモリにアクセスできんからわいはプロジェクトにした。カスタムで十分ならそれでええやん
>>82
5.5のほうが頭いいけど消費トークンえぐいから5.3のほうがよかった。けど選べなくなるってアナウンスあったはず

87: 06/01(月)22:54 ID:3015XZ4h(1/7) AAS
最近Hermes Agentの伸びがエグイ
去年までのエージェントのトレンドだった
「エージェントを正しく設計して、正しくタスクを実行させる」から
「エージェントが正しいタスクを経験して、正しさとは何かを学習する」に変化してきた
Anthropicもかなり焦ってて似たような機能リリースしようとしているな

88: 06/01(月)23:03 ID:3015XZ4h(2/7) AAS
たぶんこのままいくと来年頃には
「エージェントが自律的に、このタスクにおいて正しさとは何かを人間にヒヤリングして、正しさを学習する」に変化するんだろうな
そして再来年には
「エージェントがこのタスクにおける正しさを発見するためには、何を確認して、何を試さないといけないのか？を自律的に推論して実行する」になりそう

89: 06/01(月)23:10 ID:3015XZ4h(3/7) AAS
現在のAI論でも、憲法であるCONTEXT.md、法律であるrules.mdの自律的改正は、AIエージェントが主権者ではないので禁止されているけど。
Hermes Agentが改正しているのは、skills.mdなので合法なんだよな。

90: 06/01(月)23:17 ID:3015XZ4h(4/7) AAS
３つ目の例はギリギリ人間が主権者だからグレーだけど、４つ目はそうじゃないんで、AI論自体を再定義しないと社会実装は不可能なんだろうな。

91: 06/01(月)23:23 ID:3015XZ4h(5/7) AAS
結局は、評価関数を評価する評価関数が必要で、それを評価する評価関数が必要で・・・
と無限後退するので、それを何で止めるかが全てで。
評価関数の無限後退が止まれば、評価関数が定まるから、強化学習が可能になる。
その止めるものが現在の社会許容度において合法か違法かが全てになる。
Hermes Agentは、このあたりの模索の第一弾なんだろうね。

92: 06/01(月)23:33 ID:p/4ZM5S5(1) AAS
本当にコード生成AIの生産性は高いのか？！
ひたすらスクラッチする場合だと、コードの具体に触れながらテスト実行で成果物を確認しながら作業できるが、
プロンプトで痒い所を靴の上からかくように作り込む場合だと、コードという具体に触れられないから、モチベが続かない
スクラッチの方が早くね？

93: 06/01(月)23:45 ID:1+KnuZ/g(2/2) AAS
うん俺もそう思う

94: 06/01(月)23:52 ID:3015XZ4h(6/7) AAS
LLMは基本的に圧縮機なのでコードをどこまで圧縮（抽象化）して人間が読むかってのが論点やからね
究極に圧縮（抽象化）されたものが、「目的」っていう概念で、これでシステムが正しく動けば究極のシステムだよ。
これまでだって、０１の羅列や、機械語を人間が読める抽象度まで圧縮したのがプログラミング言語だったんだから、それの上層レイヤの抽象言語をどこまで受け入れるかやね。

95: 06/01(月)23:57 ID:3015XZ4h(7/7) AAS
その抽象言語を採用するかどうかの指標に生産性を持ち出すのはある意味正解
それで短絡的に生産性が落ちるから不採用というのも合理的なこと

96: 06/02(火)00:01 ID:EWULcwRB(1/17) AAS
つまり「日々の売上をスプレッドにまとめる」とかは圧縮率（抽象度）が高すぎるので
システムの記述言語として無理がある、これをどこまで圧縮率を下げるつまり具象化するかが
AIエンジニアの仕事の１つやね

97: 06/02(火)00:09 ID:EWULcwRB(2/17) AAS
そしてそれをどこまで下げるかを決めるものが「あるもの」なんだけど、これをこのスレで持ち出すとなぜが全員キレ散らかすので、さすがにもうそれには言及しないことにした。

98: 06/02(火)00:11 ID:EWULcwRB(3/17) AAS
Hermes Agentに話しを戻すと
こいつのやべーところはskillsのスキーマローディングをコンパイルしたことなんだよな
これでいくらskillsがあってもコンテキストウィンドウを汚すことはなくなった
それとセッションをアセットに昇格してこっちもコンパイルしたこと
アルゴリズムに著作権はないから、せっかく頑張って作ったこのあたりも全部Claudeにパクられるんやろな
可哀想に

99: 06/02(火)00:12 ID:O6ST+M4d(1/3) AAS
そら「売れるソフト作って」なんて発注かける企業はおらんやろ

100: 06/02(火)00:21 ID:EWULcwRB(4/17) AAS
結局このあたりは発想さえパクれば実装コストがほぼゼロになったんだから
再現できるものに商業的価値はないってシグナルなんよね
これ肝に銘じて置かないと他人事じゃないとおもうで

上下前次 1-新書関写板覧索設栞歴

あと 156 ﾚｽあります
ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 0.009s