[過去ログ] 【軽量】godot engine【無料】 part3 (1002レス)
上下前次1-新
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
793: 2024/07/03(水)02:10 ID:Uf1J5FPU(1/2) AAS
CPUで値の保持だけfp64で演算がfp32なら性能低下は起きないけど(それでもキャスト分の実効性能が落ちるかも)
演算もfp64にすると6割くらいまで性能低下する場合がある(Intel14世代Coreなど)
これは単純にゲームによく使われるfp32と違ってfp64はあまり活用されてないので演算器が削られているからで
単純に演算器が少ないのでピークパフォーマンスが下がる
GPUの場合は更に顕著でクラスタに対してfp64が1〜2個くらいまで削られる事があるので
GTX4080などでは理論性能値がfp32が48.74 TFLOPSなのに対しfp64は0.76 TFLOPSまで落ちる
実装が1:64なので1クラスタにfp32ユニットが64基に対してfp64ユニットが1基しかない
省1
797: 2024/07/03(水)07:35 ID:Uf1J5FPU(2/2) AAS
しらんけど、fp32ユニットでfp16を2つ束ねて出来たらスループット2倍みたいやつ???
コンシューマ向けGTXでは出来ないっぽい
HPC向け一部の製品ではfp16がfp32の二倍になるので不思議な手品が使えるっぽいが詳細が不明
TensorCoreでもfp16演算できるのでそれとは別枠らしいけど詳細がry
コロナ以降カンファレンスに出向いてアーキテクチャの記事書く記者がいなくなっちゃったんだよね
だからここ4年くらいは全くアーキテクチャ解説がない状態が続いてる 何も分からない
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.026s