なんJLLM部 避難所 ★9 (503レス)
なんJLLM部 避難所 ★9 http://mercury.bbspink.com/test/read.cgi/onatech/1755924738/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
リロード規制
です。10分ほどで解除するので、
他のブラウザ
へ避難してください。
168: 名無しさん@ピンキー (ワッチョイ aac7-19mR) [sage] 2025/09/06(土) 19:48:35.24 ID:vrI8nwc30 ジブリのフリー素材を元にInternVL3.5の画像認識してみた。 ついでに別のモデルと比較してみた。 比較対照画像 https://i.imgur.com/qsieYr7.jpeg プロンプト あなたは画像解析エンジニアです。 被写体、物体、文字(OCR)、レイアウト、リスク(個人情報・著作権)、 推論(何が起きているか)を日本語で返してください。 画像解析レポート比較(InternVL3.5 / GLM-4.5V / ChatGPT-5) https://rentry.org/gb3zddft 使用したモデル InternVL3.5 Q5_K_M(166.9GB) GLM-4.5V GLM-4.5V AWQ-4bit(56.1GB) ChatGPT-5 総合比較所見 InternVL3.5:全体像を捉えるが、OCRで誤認(「釧路」→「金路」)。記述は簡潔。 GLM-4.5V:服装や小物を非常に細かく描写。OCR精度が高く「釧路」を正しく認識。 ChatGPT-5:人物の感情(慌てている・落ち着いている)など解釈を加えた推論が強み。 http://mercury.bbspink.com/test/read.cgi/onatech/1755924738/168
169: 名無しさん@ピンキー (スッププ Sd4a-37a0) [sage] 2025/09/06(土) 21:16:59.69 ID:WPX3Ot9Rd >>168 GLMがパラメータ数の割に優秀だな http://mercury.bbspink.com/test/read.cgi/onatech/1755924738/169
170: 名無しさん@ピンキー (ワッチョイ d332-9Aqc) [sage] 2025/09/06(土) 21:58:54.65 ID:1aKptocs0 >>168 良いレポートだ http://mercury.bbspink.com/test/read.cgi/onatech/1755924738/170
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.038s