// Topsy Retweet Button for Web Sites
ホーム > VGA > | カテゴリー別 | APU | AM1 | AM3+ | SB | SBE | Haswell | Ivy Bridge | Opteron | GPU | HDD | SSD | TS | その他 | リンク集 | TOPICS |

2005年12月31日

NVIDIAのG71は 32ps/16ROPs

NVIDIAのハイエンド用のグラフィックチップ G71は、32ps/16ROPs とのこと。

Nvidia's G71 has 32 pipes and 16 ROPs - INQ

INQの情報によると、NVIDIAのハイエンド用のグラフィックチップ G71は、「32ps/16ROPs(Rasterize Operation Units)」とのこと。発売は2月上旬といわれているみたいですが。

◎G71 :700?/1700MHz?、32ps/16ROPs/?vs、90nm
- 7800 GTX 512MB:550/1700MHz、24ps/16ROPs/8vs、130nm
- 7800 GTX 256MB:430/1200MHz、24ps/16ROPs/8vs、130nm
- 7800 GT 256MB:400/1000MHz、20ps/16ROPs/7vs、130nm

X1900シリーズ(R580)はG71とは逆のアプローチを取っており、「16ps/48レンダーバックエンド(NVIDIAのROP)」のようにも解釈できる。(ATI's R580, on the other hand, will still be able to push sixteen raw pixels per clock but will be able to render 48 pixel operations per clock. )
- X1900 XTX :650/1550MHz、
- X1900 XT :625/1450MHz、
- X1900 XT CF:625/1450MHz、

単純に考えると「複雑なピクセルシェーダプログラムを高速に動かしたいのか」か「ピクセルスループットを上げたいのか」の違いとなり、処理内容によってはそれぞれの場合でメリットとデメリットがあってベンチで差が出てくることも多そう。ただ、G71も7800GTX 512並みの高速メモリを搭載するでしょうから、16ROPsはもったいないかもしれません。

ここらへんの情報は西川善司さんの記事が参考になります。
→ ・ 【4Gamer.net】 - 西川善司の3Dゲームエクスタシー

1600×1200ドットや,フルハイビジョンの1920×1080ドットといった解像度で現実的なフレームレートを出せるROP処理ブロックが実現できていれば,現実問題として,それ以上のROP性能向上は確かに不要といえるかもしれないのだ。

【特集】Radeon X1000シリーズ徹底解説 - 新アーキテクチャで何が変わったのか - MYCOM PC WEB

両者共に、クロック当たりのピクセルスループットは16個だから、動作クロックの高いRadeon X1800 XTの方がパフォーマンスは上になる

【4Gamer.net】ATIとNVIDIAが語る 2005&2006年 NVIDIA編
【4Gamer.net】ATIとNVIDIAが語る 2005&2006年 ATI編



[BTO可能なカスタムPC] ツクモSYCOMクレバリードスパラTWOTOPFAITH
[SLIのカスタムPC] ドスパラSYCOMTSUKUMO(P180ケース使用)

Posted by nueda at 2005年12月31日 10:48 JST | トラックバック | ホームに戻る
コメント

なんだか誤解がありそうなので、一応突っ込ませていただきます。
ROPは、PixelShaderがアウトプットしてきたPixelに対し、
最終的な仕上げとしてAnti-AliasやZ圧縮などをかけ、フレームバッファへ出力する役割を担っており、
これはG70もR520も同数です。

R580で「48」といわれているのは、あくまでもPixelShaderのProcessor数であり、
TextureUnitはR520と変わらずおそらく16のままで、ROPの数も据え置きの16だからこそ、
「16PixelPipe」なんだと思いますよ。

で、対するG71は、32PixelShader/32TextureUnit/16ROPなのではないかと。

Posted by: 七死 at 2005年12月31日 16:59

> なんだか誤解がありそうなので、一応突っ込ませていただきます。

きっと誤解しています(^^; 何かあったら今後も突っ込んでください。
ROPが同じだとすると、メモリも共に1.7GHz前後でしょうから、
PixelShaderの数で勝るX1900のほうがベンチ的には有利かもしれませんね。

にしてもわずか3ヶ月ちょっとのVerUPでPixelShaderのProcessor数が16→48になるって
X1800のユーザーは可哀相かなー。
X1800って結局は今年のクリスマス商戦用にだけ準備されたものかも(^^;

Posted by: nueda at 2006年01月01日 02:00

>PixelShaderの数で勝るX1900のほうがベンチ的には
>有利かもしれませんね。
いえいえ、R580はTextureUnitは16がネックとなります。
32PixelShader/32TextureUnitとバランス良いG71の
方が全般的に性能は上でしょう。
(3Dmark05のTexture単体性能ベンチ以外は)

Posted by: 3Dex at 2006年01月01日 12:14

R520はパイプラインあたり2つのPixelShaderUnitが付いて、32個のPixelShaderUnitを搭載しています。
R520→R580での変更は、ほとんどトランジスタ数が増えていない所をみると、パイプラインあたりのShader数を単純に3個に増やしただけだと思われます。
ちなみにnv40以降のGeforceも2Shader/1Pipelineの構造をとっており
G70は48PixelShaderUnit/24TextureUnit/16ROP
G71は64PixelShaderUnit/32TextureUnit/16ROP
となります

Posted by: 774 at 2006年01月01日 17:19

うーん、774さんに異論というか、個人的に、R580は今までの単位でPixelShaderが48基では
ないかと推測してます。

R520は、QuadCore x 4で16PixelShaderとなっていますが、QuadCoreが内包する
PixelShader Processorの実装は、774さんがおっしゃるような、
ScalarALU2器 + VectorALU(SIMD)2基、そして分岐命令実行ユニットのセットという構成です。

ただし、2基ずつ存在しているScalar/VectorALUは同等ではなく、ALU1は加算のみ可能で、
ALU2で可能な乗算(MUL)・積和算(MADD)ができないという制限があります。

ALUは演算器であってShaderではありませんし、nuedaさんの「X1900シリーズ(R580)のクロック」と
いうエントリで取り上げているVR-Zoneの記事に、

ATi R580 has 16 pipelines but features 48 shader processors now instead of 16 previously
on the R520 therefore we can expect some performance boost here.

とあることから、PixelShader Processer自体が48基になっていると考える方が妥当ではないかと。

R520も、最初はPixelShader48基と言われてましたし、その後一連のゴタゴタが発生した際に、
R520は16になるけど、R580は48になるとか言われてたので、48という数字に不自然さは無いような
気がします。
ただ、R520とのトランジスタ数の差を考えると、この推論にそれほど自信はないんですけどね。

ちなみに、R580はTextureUnitがShaderから分離されているため、TextureUnitとPixelShaderの数が
違うという形態を取れますが、G70/71はPixelShader自体にTextureUnitが入っているので、
PixelShaderの数を増やすと自動的にTextureUnitの数も増えるというわけです。

#駄レスすみません…。

Posted by: 七死 at 2006年01月01日 18:08

すいません、
「R520も、最初はPixelShader48基と言われてましたし」
とか書きましたが、これって48じゃなくて32ですね。
訂正してお詫びします。

#改めて文章読んだら余計自信がなくなりました(苦笑。

Posted by: 七死 at 2006年01月01日 18:34

テクスチャユニットと足並みが揃わないと、
いくらピクセル処理が速く出来ても
テクスチャに対して適用できる・処理できるピクセルが
16ユニットなら16しかないので
たとえ100ピクセルシェーダがあったとしても
あまり効率が良くないでは。

Posted by: なななな at 2006年01月03日 16:29

R580もG71にしても16ROPで供給能力に変わりは無いよね。

Posted by: at 2006年01月05日 17:02

レンダバックエンドはいずれも16ですから、バランスが悪いって意味では同じですやね。

Posted by: ぶり at 2006年01月05日 17:31
コメントする
(書込時に「、」か「。」が必要です。内容によっては削除しますので、ご了承ください)









名前、アドレスを登録しますか?