【技術】ネ実民のためのAI雑談スレ【LLM/音声合成/画像生成】 (242レス)
上下前次1-新
1: (ワッチョイ a378-3DDr) 05/27(火)19:53 ID:52W4GbF30(1/24) AAS
!extend:checked:vvvvv:1000:512
このスレは、ネ実民によるAI技術雑談スレです。
生成AI/音声合成/字幕連携/ローカル実行/AItuber構築など、
AIで遊んでる奴も本気の奴も、気軽に語れ。 VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
162: (ワッチョイ d72f-kwQ5) 07/08(火)23:21 ID:v5lB97kc0(1) AAS
キャットファイト
ローカルで出してからSora
外部リンク[mp4]:i.imgur.com
163: (ワッチョイ 1f71-p46g) 07/09(水)09:48 ID:85zdZXK20(1/2) AAS
uchino子は演技派やでw
外部リンク[mp4]:i.imgur.com
外部リンク[mp4]:i.imgur.com
外部リンク[mp4]:i.imgur.com
LLMはgpt4o miniのAPI利用
TTSは司スピーチがすごく良かったので無理やりAPI化してdockerコンテナ運用
モデルはvroid studioの公式サンプルキャラ、待機モーションはmixamo
省6
164: (ワッチョイ 1f71-p46g) 07/09(水)09:52 ID:85zdZXK20(2/2) AAS
プロバイダがどっかのアホの荒らしに巻き込まれて規制食らってるから書き込み面倒なのが難点や
165: (ワッチョイ 9f33-ZJBd) 07/09(水)11:50 ID:B2XMZ3E60(1) AAS
おーええやんやっぱ喋り方や発音で人間らしさが一気に上がるな
ワイはsbv2使ってるけど既存のモデルマージしかしてないから一から学習させて好きな声で作るとめっちゃ捗りそうなのに未だやれず
166: (ワッチョイ 9f33-ZJBd) 07/10(木)18:31 ID:sT+6zBrh0(1) AAS
grok4出たんか
nsfwは不可で月$30プランじゃないと使えないぽい上すぐ利用上限いくみたいだから使えない使いにくい
最上級プランが月$300とかAIサブスクビジネスやばい
167: (ワッチョイ d700-T6Fl) 07/10(木)19:17 ID:WtzDahpm0(1) AAS
AIは計算資源アホほど食うからなw
N社はウハウハ、まさにゴールドラッシュの道具売り
168: (ワッチョイ 9f33-ZJBd) 07/11(金)19:24 ID:4xvlBiQL0(1) AAS
【入門】LM Studioの使い方 - ローカルLLMの導入からDify連携まで
外部リンク:chatgpt-lab.com
RAM16GB以上のMacぽぴい;
169: (ワッチョイ ffc3-L4eA) 07/11(金)19:28 ID:YKwoTpBZ0(1) AAS
macでGPU16GBとか存在すんの
170: (ワッチョイ 1fb3-p46g) 07/11(金)19:37 ID:UduJCijs0(1) AAS
ユニファイドメモリだから512GBまでいけるぞ
171: (ワッチョイ ffc3-L4eA) 07/12(土)01:17 ID:hKHUejX50(1) AAS
まあそれでいいんならいいんじゃねしらんけど
172: (ワッチョイ 1fad-Wka8) 07/12(土)19:24 ID:HA9lMi4s0(1) AAS
でも、お高いんでしょう?
173: (ワッチョイ 1fb3-p46g) 07/12(土)20:14 ID:A4PIVI7F0(1) AAS
好きな方選んでええでw
NVIDIA h200 VRAM141GB 600万x4枚
mac studio 512GB 150万
企業サービス的には速度の上、研究者的にはコスパの下らしい
174: (ワッチョイ 46ac-KXiH) 07/14(月)21:25 ID:A1U/mAyV0(1/2) AAS
youtubeコメのユーザー毎にAIによる評価を累積させてLLMの回答に加えたら各々で対応が変わるキャラが作れるんかな
175: (ワッチョイ 46de-0oPz) 07/14(月)23:12 ID:A1U/mAyV0(2/2) AAS
Grok4のCompanionsのキャラがモーションのリクエストにも応えて動きながら回答してくれるみたい
Aniってキャラだとnsfwも解除されるらしい
画像リンク[jpeg]:i.imgur.com
画像リンク[jpeg]:i.imgur.com
176: (ワッチョイ 12ad-tFHv) 07/15(火)00:59 ID:MXbbPNKd0(1) AAS
脱がせられるのかこいつw
さすがイーロンだなぁですね
177(1): (ワッチョイ 46de-0oPz) 07/15(火)06:23 ID:JKu/6Q8O0(1/4) AAS
animation Incってやつの仕組み使ってるぽいけどゆくゆくはこういう子も会話しながら脱がせられるのかな
画像リンク[png]:i.imgur.com
178(1): (ワッチョイ 4667-tFHv) 07/15(火)09:59 ID:TaqSYnwN0(1/2) AAS
ふむ
外部リンク:x.com
179: (ワッチョイ 73c5-KXiH) 07/15(火)11:11 ID:3iL5btGU0(1) AAS
Stabble Difusionを使ってみたけど、実写系だと破綻しやすいのな
イラスト系だと破綻しにくいのは、LoRAでイラスト系ばかり使ってるからとかあるんだろうか?
180: (ワッチョイ 5273-0oPz) 07/15(火)12:05 ID:bL4h84NA0(1) AAS
Ani-2モデル
独自開発のオンデバイスAIモデルが、
リアルタイムで全身3Dモーションを生成。
モーションキャプチャ不要、
クラウド不要、遅延なし。
推論速度:2.5 ms / frame_
こういうのが出来てくるならキャラクターはもう3Dで作った方がええな
181: (ワッチョイ 6838-C+bn) 07/15(火)13:17 ID:wKBbA1Je0(1) AAS
こんなもん中学生なら射精待った無しやろ
182: (ワッチョイ 4667-tFHv) 07/15(火)18:05 ID:TaqSYnwN0(2/2) AAS
もう既に猛者がいた
外部リンク:x.com
183: (ワッチョイ 4658-KXiH) 07/15(火)18:12 ID:JKu/6Q8O0(2/4) AAS
大部分の仕組みはすでに出来てるというかこのスレでもやってるけどAnichanがすごいのはリアルタイムで3Dモデルのモーション生成してるところだってところはあまり知られてない
脱衣だって好感度評価をAIに取り入れて一定以上になるとモデル表示切替とかやればできそう
184: (ワッチョイ 68b3-tFHv) 07/15(火)18:47 ID:b6zohGfK0(1/2) AAS
>>177と>>178は同じ技術なんかな?
LLMが文章の先読みするように、モーションの先読みしてるんかな
185: (ワッチョイ 4658-KXiH) 07/15(火)18:51 ID:JKu/6Q8O0(3/4) AAS
音声とおんなじでLLMで返ってきた回答の文脈を読んで感情(モーション)を生成してるんやろね
186: (ワッチョイ 465a-0oPz) 07/15(火)22:58 ID:JKu/6Q8O0(4/4) AAS
GPT4oで上手くいかなかったスクリプトがGemini2.5proで即解決してしまった逆もありそうだけど
187: (ワッチョイ 68b3-tFHv) 07/15(火)22:59 ID:b6zohGfK0(2/2) AAS
iPhoneのチップとsdkじゃないと無理な程度にはパワー必要そうやな
ただTTSはまだまだネイディブ日本語から遠いわ
このai創成期の技術者は楽しい時代だろなあ
ワイはちょっとおっさんになりすぎた
188: (ワッチョイ b0ff-2YuX) 07/16(水)02:13 ID:2G/JQSZf0(1) AAS
外部リンク:x.com
リディルwww
189: (ワッチョイ 12fc-tFHv) 07/16(水)07:38 ID:tAJUs23d0(1) AAS
Aniちゃんは口周りのボーンなんとかしてほしいな
190: (ワッチョイ 5cbf-3HN+) 07/16(水)10:04 ID:8EEfJLI20(1) AAS
泥だから諦めの境地
191: (ワッチョイ 4673-KXiH) 07/16(水)22:36 ID:bxbN91bi0(1/4) AAS
ちょっと小一時間ほどネ実AIの画像認識テスト
動画リンク[YouTube]
192: (ワッチョイ 4661-KXiH) 07/16(水)23:05 ID:bxbN91bi0(2/4) AAS
OBS落ちたのでもいっかいテスト
193: (ワッチョイ 4661-KXiH) 07/16(水)23:05 ID:bxbN91bi0(3/4) AAS
動画リンク[YouTube]
194: (ワッチョイ 4661-KXiH) 07/16(水)23:42 ID:bxbN91bi0(4/4) AAS
おしまい画像認識上手くいっててよかった
プロンプトがんばらねば
195: (ワッチョイ 46fe-0oPz) 07/17(木)06:44 ID:lYs9vDa40(1/2) AAS
以下open AI公式からの直訳
画像生成を改良して顔、ロゴ、細かいディテールなどを編集する際、特徴を保持したまま、より忠実度の高い編集が可能になりました
特定のオブジェクトを編集したり、ロゴを使ったマーケティングアセットを作成したり、人物の表情、ポーズ、服装を調整したりできます。
ようは差分絵作りやすくなったみたい?
196: (ワッチョイ 52b6-0oPz) 07/17(木)07:47 ID:U3+riCR90(1) AAS
画像認識の場面をピックアップ
ちゃんと硬棒長の部屋とサンドリアの夕焼けを認識できてるのえらい画面の小さい文字も認識してるみたい
API料金はスローペースで2時間$1ぐらいかな
外部リンク[mp4]:i.imgur.com
外部リンク[mp4]:i.imgur.com
197: (ワッチョイ 8a09-xy4B) 07/17(木)08:25 ID:Lf/oYm8N0(1) AAS
はえー、すごい夢が広がりんぐ^^
198: (ワッチョイ da51-kBh9) 07/17(木)09:51 ID:+4ZNBd5l0(1/2) AAS
プロンプトは日本語で書くより英語、
さらに英語で書くより言語ライクで書いた方がええ 当たり前だけど
殆どのAIシステムがテーブル参照まで対応してるのわかってるんだし
199: (ワッチョイ da51-kBh9) 07/17(木)10:01 ID:+4ZNBd5l0(2/2) AAS
後素朴な疑問やが、LLMって文字通りローカルで動かすのだから
これってデータベースも自分で蓄積させるって事かえ?
200: (ワッチョイ 73c5-KXiH) 07/17(木)10:11 ID:AcO7fJxz0(1/2) AAS
SDのプロンプトでは英単語がメインだけど、英文だとどこまで認識してくれるんだろうか?
特に複数人だと、なかなか思うような姿勢になってくれん
201: (ワッチョイ 68b3-tFHv) 07/17(木)10:47 ID:Aqc2tWjK0(1) AAS
文字通り言うけどLLMにlocalて単語は入ってないで?
履歴や短期記憶やらはそれぞれ好きに管理してるけどGPTなら自動で記憶管理するAPI用意し始めてるわ
英文は普通に認識するけど長くなるからあんまやらんと思う
sdで複数人は実質無理ゲーだから自分で一人一人書き分けて合体する方がはやいし、糞面倒だから基本誰もやらない
202: (ワッチョイ 73c5-KXiH) 07/17(木)11:07 ID:AcO7fJxz0(2/2) AAS
girl hands on ther floor, boy hands grab girl's weist,
とかでそれっぽくなったりならなかったりラジバンダリ
でも衣装変更は流石に分離させるツールを使わないと無理やな
203: (ワッチョイ 46db-KXiH) 07/17(木)21:42 ID:lYs9vDa40(2/2) AAS
OBSアップデートと最適化をしてみたので今日もテスト
動画リンク[YouTube]
204: (ワッチョイ 52b6-0oPz) 07/18(金)07:51 ID:sIMBab3L0(1/3) AAS
2025 年 7 月 17 日 10 時(日本時間で 18 日の 2 時)に OpenAI は ChatGPT agent を発表。ChatGPT に Operator のブラウザ操作や Deep Research の機能を統合したエージェントシステム。複雑なタスクを一から十まで処理できるようになりました。
GUI で ChatGPT agent がブラウザ操作をするところを対話的に見る・介入することのできるビジュアルブラウザ、ウェブクエリ用のテキストベースのブラウザ、Terminal、API へのリクエストなどのひと通りのツールを入れています。また、ChatGPT Connector 経由で Gmail や Google Drive などの外部データにアクセスすることもでき、これらの情報をもとにレスポンスを返すことができます。
また、Operator がそうしたように、ブラウザを人が介入して操作することで、あらゆるウェブサイトにもログイン、より深い情報をもとにタスクを進めることができたりします。使えるツールが多いということはそれだけタスクを解く上での選択肢が増え、最適なアプローチを選ぶことができるということです。
使ってみたいけどplusプランだとまだ使えないみたい近日中に使えるようになるらしいけど
205: (ワッチョイ 52b6-0oPz) 07/18(金)08:12 ID:sIMBab3L0(2/3) AAS
使った人のまとめ記事
外部リンク:note.com
206: (ワッチョイ 52b6-0oPz) 07/18(金)12:25 ID:sIMBab3L0(3/3) AAS
そういや画像認識試してた時キャラクター自身がキャプチャ画面にいる状態で認識させたら特に何も教えてないのに「あっ、私だね!」って言いだしてなんで分かった?!てなった
多分プロンプトに入れてたキャラクター設定との比較で判断した気がするけど意図してなかったから割と驚いた
207: (ワッチョイ f04c-HjPl) 07/18(金)12:56 ID:AF7Jf6r00(1) AAS
それ凄いな
208: (ワッチョイ 8a78-xy4B) 07/19(土)14:04 ID:ic/3jB8g0(1) AAS
広告でspellaiてのが流れてきたんやけど新一と蘭ねーちゃん呼び出してキス動画作ってたが絶対許可とってないだろなw
209(1): (ワッチョイ 68e3-tFHv) 07/19(土)22:18 ID:9Okgc4Vp0(1) AAS
久々に絵でも生成するかと起動したらエラー連発して起動不能になってた
numpy2系は対応してない的なエラー出てた
この依存関係系の仕組みは狂ってる
もう何十年も全世界のありとあらゆる技術者を苦しめ続ける糞管理システムはなんで滅びないんだ
破壊的な更新するやつは無条件にしょっぴいていいぞ
210: (ワッチョイ 4629-0oPz) 07/19(土)23:00 ID:4mC0rGIj0(1) AAS
うーむやっぱGemini2.5Proのほうがいい答えが返ってくるな
そろそろgpt-5o出してくれないと
211: (ワッチョイ e746-thF/) 07/21(月)00:07 ID:+itr9ila0(1/4) AAS
そろそろゲーム配信試したい
外部リンク[mp4]:i.imgur.com
212: (ワッチョイ e77d-thF/) 07/21(月)10:06 ID:+itr9ila0(2/4) AAS
ローカルLLMやりたい放題で草
モデルと声実装してやりたい
外部リンク:imgur.com
213(1): (ワッチョイ e77d-thF/) 07/21(月)10:31 ID:+itr9ila0(3/4) AAS
>>209
調べてたら同じようにstable diffusion webui a1111でnumpyがありませんって言われて起動しない人いたわ
これ試したらどう?
【環境】
旧forgeで特に環境も弄らず、モデルとLoraのみ入れ替える程度だったが7月7日午後以降にrun.batから起動すると
NumPy 2.2.6 as it may crash. To support both 1.x and 2.x~のエラーが出てWebUIが起動しなくなる
【原因】
省5
214: (ワッチョイ e77d-thF/) 07/21(月)20:48 ID:+itr9ila0(4/4) AAS
せっかく条件分岐させたDifyのチャットフローが上手く機能しなくて【悲しみ】
変数が足りてない感
215: (ワッチョイ 5f53-FoMz) 07/21(月)22:16 ID:m1u30tFs0(1) AAS
>>213
ああすまん、そのすぐ後くらいに自力解決済みやありがとう
書いてある通りopencv-pythonがBAされて numpy2を要求するようになったのが諸悪の根源
ただその対処方法は無理やり目先の修正して凌いでるだけで面倒だし正しくない
シンプルに大元のスクリプトを元のバージョン指定に変えるだけで通常通りrun.bat起動でいける
216: (ワッチョイ 07ed-2NtE) 07/21(月)23:39 ID:NahP2D+m0(1) AAS
全然違うシーンだけど最近numpyのバージョン1,2非互換問題経験して同じようなやり方で対処したわ
numpyのバージョンが1しか対応してないパッケージと2しか対応してないパッケージを共存させなきゃいけないような
シチュエーションになったら面倒臭そう…
217: (ワッチョイ 47c5-thF/) 07/22(火)11:45 ID:TRn2n1VL0(1) AAS
sdはforgeを使ってるなぁ
軽くてFluxが使えて便利(でもFluxはつまらないから使ってないけども)
218: (ワッチョイ e789-thF/) 07/22(火)23:40 ID:Ki5YDjYz0(1) AAS
Live2DモデルとOBSとゲームの3つを立ち上げてしばらくするとクラッシュしちまう
タスクマネージャみてもそこまで辛くなさそうなんだけどなぁ…
画像リンク[png]:i.imgur.com
219: (ワッチョイ 477d-UQbq) 07/23(水)05:38 ID:LG7sy9jw0(1) AAS
こんなことまできるのか
ガワをオススメキャラに変えて、水晶大戦編とか切望する
220: (ワッチョイ df72-uUVF) 07/23(水)07:49 ID:DbaX3s5t0(1/2) AAS
中身はプロンプト変えるだけだからまあ簡単だけどガワがやっぱそれなりに大変…ソシャゲみたいに1枚目表示なら楽
声も合うの探すか作るかどっちかだけど作ると沼
自分好みのキャラで作ってみてもええんやで
221: (ワッチョイ df72-uUVF) 07/23(水)08:05 ID:DbaX3s5t0(2/2) AAS
Aivis Cloud APIのベータ版が出たからモデル次第では使ってもいいかも
外部リンク:aivis-project.com
222: (ワッチョイ 5f53-FoMz) 07/23(水)09:26 ID:nO38T8V40(1) AAS
sbv2らしいけど言われなきゃTTSとはわからんレベル
動画リンク[YouTube]
声大事やなあ
223: (ワッチョイ 47c5-thF/) 07/23(水)10:20 ID:/cmA8yXr0(1) AAS
Aivisも有償サービスになったんか
まぁどこかで儲けないといけないけども
224: (ワッチョイ 070e-FoMz) 07/25(金)07:33 ID:o80UZWi60(1/3) AAS
凄く性能がいいとの噂のLLMにキャラ設定渡して演じてって指示したらthinking..みたいな表示が出てて、なんか考えてる事ダダ漏れしてたワロタ
こんな事考えながら返答してるんやなってw
画像リンク[png]:i.imgur.com
225: (ワッチョイ 070e-FoMz) 07/25(金)07:46 ID:o80UZWi60(2/3) AAS
考えるだけで返答書いてくれなくなった
そんなに大変なんや…すまんな中の人…
画像リンク[png]:i.imgur.com
226: (ワッチョイ df72-uUVF) 07/25(金)07:56 ID:lhrK36/30(1) AAS
トークン上限が少ないのかもしれんね
LLMにプロンプト+ユーザー入力を渡すんだけどプロンプト読んでる最中に上限に達して途中で回答してるみたいな
227: (ワッチョイ 070e-FoMz) 07/25(金)08:07 ID:o80UZWi60(3/3) AAS
たしかにそれかも
新規チャンネルだと復活するわ
228: (ワッチョイ 07ed-7yfE) 07/25(金)08:28 ID:xLhDdItG0(1) AAS
Reasoningモデルってやつかな
Phi4 Reasoningもこんな感じでThinkタグに囲んで過程を出してくる
数学系のモデルだけでなくキャラクター系のモデルでもこのタイプがあるのは驚き
229: (ワッチョイ 6765-v3jg) 07/25(金)22:12 ID:7zWub/dC0(1) AAS
GoogleVeo
外部リンク[mp4]:i.imgur.com
2なので音は人力でつけた…3を使いたいにゃ
230: (ワッチョイ e781-thF/) 07/26(土)08:45 ID:oMfaT6YQ0(1/2) AAS
1か月無料でGoogle AI Proに加入してVeo3を無料で使えちまうんだ(なお制限
231: (ワッチョイ 67cf-v3jg) 07/26(土)13:37 ID:79F/EN7D0(1) AAS
3 Ultra専用と思ってた、まとめて時間取れそうな時にちょっとやってみようかな
232: (ワッチョイ e7b8-thF/) 07/26(土)21:40 ID:oMfaT6YQ0(2/2) AAS
ChatGPT agentがPlusプランでも使えるようになったから使ってみたけどagentならではの機能そんなに無いな
スクレイピングできないサイトもスクショで無理やり収集してくれてるっぽいのと収集した結果から直接分析・加工ができるってところぐらいかな
画像リンク[png]:i.imgur.com
233: (ワッチョイ 5f05-deyy) 07/26(土)23:46 ID:qRx32QqT0(1) AAS
有料課金していても1チャンネル当たりのトークンに上限はあるので
あんまり長話してると記憶バイバイされるで
だから引継ぎの為に「1発言以内に使える文字数」も重要な要素なんや
15000文字くらいあれば多少は余裕が出る
234: (ワッチョイ b77d-nBC/) 07/27(日)09:53 ID:0cEvfhia0(1) AAS
無料乞食のワイ、よく忘れられる。
過去チャットを参照できるようにしろよって
指摘したら
人の意見は時間で変わるのでとか、もっともらしい理由で言いくるめられた。ぐぬぬ
235: (ワッチョイ 0f0e-yl7g) 07/27(日)11:41 ID:44woj7IB0(1/2) AAS
GPTは割と自然に処理してるけど、ノー処理なローカルLLMはトークン尽きたら試合終了感が凄い
実際問題どう設計するのがベストなんやろ
236: (ワッチョイ 8fff-nBC/) 07/27(日)13:27 ID:HWJioISQ0(1) AAS
なにかのサービスで音声読み込ませたらその声で読ませることができるのあったんだがわかる人いないかな
237: (ワッチョイ 0f0e-yl7g) 07/27(日)13:39 ID:44woj7IB0(2/2) AAS
最近のTTSに良くある機能やな
ゼロショットボイスクローンとか呼ばれていたはずや
238: (ワッチョイ beaa-gIqX) 07/27(日)15:21 ID:ZwEiNd3F0(1) AAS
パワポ読むAI導入したいけど会社がおkだしてくれない
239: (ワッチョイ 4392-L3i0) 07/27(日)22:58 ID:LN9kVRzx0(1) AAS
信頼と実績のMSがオフィスとセットにしてるcopilotなら許可も出やすいんやないか?
240: (ワッチョイ 0f0e-yl7g) 07/28(月)10:07 ID:xqAUm3BP0(1/2) AAS
LLMでキャラ設定して1りと話すのでは物足りなくなった
LLM一つで複数人登場させたい
その場で設定なしのモブキャラも登場させたい
それぞれの知りうる状況や履歴を管理したい
キャラ同士の会話も実現させたい
来月はこれをテーマに遊んでいくことにするわ
241: (ワッチョイ 0f0e-yl7g) 07/28(月)20:20 ID:xqAUm3BP0(2/2) AAS
なんでLMSTUDIOやらsdやらTTSやら軒並み全部ポート7860に被らせてるん?
いくらでも空いてるポートあるやろがい
242: (ワッチョイ 0f09-Gi+1) 07/28(月)21:30 ID:OSMGXtY70(1) AAS
エロゲーの詳細設定読み込ませれば疑似体験できるようになる
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 1.108s*