Ember (758レス)
前次1-
抽出解除 レス栞

684
(1): 安倍晋三エクスプローラー 05/19(火)12:24 ID:jo4IEQmh0(3/3) AAS
BEアイコン:001.gif
RTX20シリーズ以降での生成速度とか、8B以上のモデルでの生成品質はどんな感じだろうか
高性能グラボを持ってないので試せない
687
(1): 05/20(水)07:45 ID:ER4HLsg70(1/2) AAS
>>684
RTX5070Ti(16GB)でGemma3-12B-ITが使えた
MoEの事は良く分からないけどGemma4-26B-A4B (MoE)はロードが出来ませんね

このスレの要約をやらせると
Gemma3-12B-ITはモデルロード込みで
7秒でイニシャルトークン出力
トータル15秒で完了(「続きを生成」ボタンが表示されるまで)

ロード後は、イニシャルトークン2~3秒でトータル9秒

Qwen3-14Bも同じくらいのスピードで動くのですが画像のようになって文字化けしてます
画像リンク[png]:i.imgur.com
省2
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.568s*