【軽量】godot engine【無料】 part3

[過去ﾛｸﾞ] 【軽量】godot engine【無料】 part3 (1002ﾚｽ)
上下前次1-新
抽出解除必死ﾁｪｯｶｰ(本家) (べ) 自ID ﾚｽ栞あぼーん

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

793: 2024/07/03(水)02:10 ID:Uf1J5FPU(1/2) AAS
CPUで値の保持だけfp64で演算がfp32なら性能低下は起きないけど（それでもキャスト分の実効性能が落ちるかも）
演算もfp64にすると6割くらいまで性能低下する場合がある（Intel14世代Coreなど）
これは単純にゲームによく使われるfp32と違ってfp64はあまり活用されてないので演算器が削られているからで
単純に演算器が少ないのでピークパフォーマンスが下がる

GPUの場合は更に顕著でクラスタに対してfp64が1〜2個くらいまで削られる事があるので
GTX4080などでは理論性能値がfp32が48.74 TFLOPSなのに対しfp64は0.76 TFLOPSまで落ちる
実装が1:64なので1クラスタにfp32ユニットが64基に対してfp64ユニットが1基しかない
省1

797: 2024/07/03(水)07:35 ID:Uf1J5FPU(2/2) AAS
しらんけど、fp32ユニットでfp16を2つ束ねて出来たらスループット2倍みたいやつ？？？
コンシューマ向けGTXでは出来ないっぽい
HPC向け一部の製品ではfp16がfp32の二倍になるので不思議な手品が使えるっぽいが詳細が不明
TensorCoreでもfp16演算できるのでそれとは別枠らしいけど詳細がｒｙ

コロナ以降カンファレンスに出向いてアーキテクチャの記事書く記者がいなくなっちゃったんだよね
だからここ4年くらいは全くアーキテクチャ解説がない状態が続いてる　何も分からない

上下前次1-新書関写板覧索設栞歴

ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 0.027s