[過去ログ]
【軽量】godot engine【無料】 part3 (1002レス)
【軽量】godot engine【無料】 part3 http://mevius.5ch.net/test/read.cgi/gamedev/1708131114/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
必死チェッカー(本家)
(べ)
自ID
レス栞
あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
793: 名前は開発中のものです。 [sage] 2024/07/03(水) 02:10:34.05 ID:Uf1J5FPU CPUで値の保持だけfp64で演算がfp32なら性能低下は起きないけど(それでもキャスト分の実効性能が落ちるかも) 演算もfp64にすると6割くらいまで性能低下する場合がある(Intel14世代Coreなど) これは単純にゲームによく使われるfp32と違ってfp64はあまり活用されてないので演算器が削られているからで 単純に演算器が少ないのでピークパフォーマンスが下がる GPUの場合は更に顕著でクラスタに対してfp64が1〜2個くらいまで削られる事があるので GTX4080などでは理論性能値がfp32が48.74 TFLOPSなのに対しfp64は0.76 TFLOPSまで落ちる 実装が1:64なので1クラスタにfp32ユニットが64基に対してfp64ユニットが1基しかない 昨今のハードウエア事情とはかなり異なる悪手だと思う http://mevius.5ch.net/test/read.cgi/gamedev/1708131114/793
797: 名前は開発中のものです。 [sage] 2024/07/03(水) 07:35:55.27 ID:Uf1J5FPU しらんけど、fp32ユニットでfp16を2つ束ねて出来たらスループット2倍みたいやつ??? コンシューマ向けGTXでは出来ないっぽい HPC向け一部の製品ではfp16がfp32の二倍になるので不思議な手品が使えるっぽいが詳細が不明 TensorCoreでもfp16演算できるのでそれとは別枠らしいけど詳細がry コロナ以降カンファレンスに出向いてアーキテクチャの記事書く記者がいなくなっちゃったんだよね だからここ4年くらいは全くアーキテクチャ解説がない状態が続いてる 何も分からない http://mevius.5ch.net/test/read.cgi/gamedev/1708131114/797
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.030s