// Topsy Retweet Button for Web Sites
ホーム > VGA > | カテゴリー別 | APU | AM1 | AM3+ | SB | SBE | Haswell | Ivy Bridge | Opteron | GPU | HDD | SSD | TS | その他 | リンク集 | TOPICS |

2007年09月23日

Radeon HD 2950 Pro (RV670)の写真

Radeon HD 2950Pro(RV670)の写真がリークされています。

RV670 GDDR3 pictured?! - HARDSPELL.COM

10月上旬から発売されるというRadeon HD 2900 Proの後継機種として、年内か年初に出るといわれているHD 2950 Pro (RV670)の写真がリークされています。

カードのサイズはHD 2900 Pro並ですが、GPUが55nmに変更されるためにCPUクーラーが1スロット占有タイプに、外部電源コネクタが6ピン 1個に変更されているのが特長でしょうか。以前にリークされたHD 2950Pro(RV670)の仕様によると、RV670は2種類ありメモリクロックも上がっていることから、"Gladiator"については既存の2900 XTを越すパフォーマンスが期待できそう。

◎Gladiator :320sp、825/2400MHz(GDDR4)、512MB、256-bit、55nm
◎Revival :320sp、750/1800MHz(GDDR3)、256/512MB、256-bit、55nm
---------------------------------------------------------------------
- HD 2900 XT :320sp、740/1650MHz、512-bit、512MB、399米ドル
----------------------------------------------------------------------
- HD 2900 Pro:320sp、600/1600MHz、512-bit、512GB、150W以下、249米ドル
- HD 2900 GT :240sp、?MHz、256-bit、256MB? 150W以下
----------------------------------------------------------------------

Radeon HD 2900 Proのコストパフォーマンスは魅力かと思いますが、RV670のポテンシャルを感じさせる仕様も魅力的ですね。また2950Proとプロセス変更を意味する50番台があることからもRadeon X1950 Proの正統的な後継機種はこちらでしょうね。

2900 Proと2950Pro(RV670)の間には、G92(GeForece 8700 GTS?)が発売されるので、ここ数ヶ月間のアッパーミドルGPUはおもしろくなりそうです。

通販情報
[RADEON HD 2000]:SOFMAPクレバリードスパラFAITHTWOTOP
[GeForce 8800] :FAITHTSUKUMOクレバリーTWOTOPドスパラT-ZONE
[GeForce 7900] :TSUKUMOFAITHSOFMAPクレバリードスパラ
[Antec製Nine Hundred BTO PC]:SYCOM [Antec製P180のBTO PC]:TSUKUMO



Posted by nueda at 2007年09月23日 04:08 JST | トラックバック | ホームに戻る
コメント

1950proユーザとしては待ち遠しい限りですね。
スペックだけをみれば2900XTよりも良さそうですがはてさてどうなることやら。

Posted by: 19 at 2007年09月23日 11:45

予想スペックを見る限りでは、1950proから2950Proへの
アップグレードでも十分恩恵がありそう。
ワタシは手持ちの1950ProをP86GT-GEに変えましたが、
今回発売されるカードをどれか買う予定です。

Posted by: nueda at 2007年09月23日 13:35

256bitですし、DX10.1の対応もあるのにネーミングが2950XTではなく2950Proですから性能は2900XT以下でしょう。R600に近い性能はあると思いますが、もうちょっとクロックを上げて欲しいですね・・・。

ただ、消費電力が100Wを切りそうなのと、あと価格しだいではかなり期待できます。 G92もありますし選択が楽しくなってきたのは嬉しいですね。(299ドル程度? 249ドル?)

Posted by: aix at 2007年09月23日 15:38

やっぱり性能的には2900XT以下になってしまいますかね~。
でも2950XTならそれこそミドルじゃなくてハイエンド扱いになってしまいますしね。
先に発売される2900PROと比較して値段と性能がどれ位なのかが気になりますよね。

Posted by: 19 at 2007年09月23日 20:31

そうですね、クロック差が80MHz程度では256bitと512bitの差は埋められないと思いますよ。特異なケースで速い場合もあるかと思いますが、1600X1200以上の高解像度や高負荷設定ではやや厳しいと思います。
その代わりに、消費電力が1スロットクーラーからも伺えますが、100W以下らしいのでここが最大の魅力になると思います。
DX10.1対応は今のところ重要度が読めないですが、まあなんとなく安心感はありますしね。

2900Proとの比較では2950Proの名の通り値段・性能とも2950Proがやや上回ると思います。2900Proは512bitになったので高解像度・高負荷では差が縮まるとは思います。
絶対的な値段の安さでは、やや投売りの2900Proだと思いますがこちらは150W以下です・・・アッパーミドルとしての魅力は2950Proが上ですね。2900Proはパワーコネクタ2つで遊ぶ気があるのなら面白いかもしれません。

Posted by: aix at 2007年09月23日 23:35

皆さんメモリバス幅が512bit無い(256bit幅)なのを
気にされているようですが、2900XT程度の
コア/メモリクロックで320spならば実は512bitも
バス幅は要らないんじゃないでしょうか?
256bitでは足りないけど512bitでは余る、384bitくらいで
必要な帯域にぴったりくるのでは無いかと言う気がしています。
最近の2900Proがメモリバス幅256bitだ、512bitだと
伝わってくる仕様が揺れた事を考えると。
ただ384bitと言う半端なメモリバス構成は物理的に
取りにくいので仕方なく512bitバス幅になったと。
そう思うとRV670のRevivalはともかくGladiatorの方は
バス幅256bitながらメモリクロックを約1.5倍に高めてますので
(コアクロックもちょっと上がってますが)帯域的には十分なんだと
思います。(消費電力と発熱がちと心配ですが)
つまりGladiatorは2900XTのパフォーマンスを確実に
上回ってくるものと思えます。
せっかくコアをシュリンクして発熱を気にせずクロックを上げられるように
なったのにメモリバスが足を引っ張ってたんでは何にもならないですから。

Posted by: ケンジ at 2007年09月24日 01:12

512Bitって、パフェリアの再来かと思いました。w

Posted by: かず at 2007年09月24日 11:24

ちなみに記事の元であるHARDSPELL.COMによれば
RV670 Revivalの型番が2950 Proで
Gladiatorが2950XTになる予定のようですね。
写真とイラストが載っているのはRevival(2950Pro)の方のようです。
RevivalとGladiatorと言うのはコードネームなのか
はたまたニックネームかなんかなんですかね?

Posted by: ケンジ at 2007年09月24日 12:41

RevivalとGladiatorという名称は、コードネームのようです。
いろいろなハードウェアサイトでこの名称が使われています。
http://www.fudzilla.com/index.php?option=com_content&task=view&id=2620&Itemid=55
http://www.vr-zone.com/?i=5181

Gladiatorの方は勇ましい名前ですが、Revivalって「リバイバル」なんですね。
全然意識しなかったなぁ。

Gladiator
http://dic.yahoo.co.jp/dsearch?enc=UTF-8&p=gladiator&dtype=1&stype=1&dname=1ss
Revival
http://dic.yahoo.co.jp/dsearch?enc=UTF-8&p=revival&dtype=1&stype=1&dname=1ss

Posted by: nueda at 2007年09月24日 14:47

かずさん
Parhelia-512って、当時のAKIBA PC Hotline!でも大きく取り上げられていますね。
http://www.watch.impress.co.jp/akiba/hotline/20020629/etc_parhelia.html

でもMATROXのビデオチップで記事として取り上げられたのは
これが最後かも^^;

Posted by: nueda at 2007年09月24日 15:02

ビデオカードのメモリバス幅、帯域についてなんすが。
以前、nVidiaの技術者が、十倍にしてもホントはまだ足りないと言ってたのを記憶してる。
二、三年くらい前かな、あれから十倍に達したんだろうか。
コアの性能は更に上がってるから、恐らくメモリがボトルネックになってるのはAMDもnVidiaも一緒という気がする。
どういう状況でそれが顕著になるのか俺には分かんないけれど、両者が、特にハイエンドにおいてより高速なメモリを模索し続けてるのは確かだと思うよ。

Posted by: 旅人A at 2007年09月25日 00:10

あのー、メモリ帯域(正確にはバス幅)が太ければ太いほど良いのなら
G80のメモリバスが(512bitでなく)384bitや320bitと半端なのはなぜなんでしょう?
現実的な事を考えずに将来的な理想を言えばメモリ帯域は幾らでも欲しいのでしょうが、
現在のシェーダー(SP)構成で考えると使いきれる帯域には必然的に限界があるわけです。
それでもメモリクロックをいきなり、これまでの倍にしてデータ転送できれば
それなりに使い道がありそうですが、SPが使える以上に半端に(1.4倍とか)幅を広げても
多分役には立たないと思います。

Posted by: ケンジ at 2007年09月25日 01:12

ケンジさん
逆に考えてみると、メモリ帯域に合わせて
現在のGPUが設計されているのかもしれませんよ。
そう考えると、現在のGPU設計で使いきれないから帯域を
余していると言うのは早計ではないでしょうか。

Posted by: 通りすがり at 2007年09月25日 02:50

まあ簡単に言えばG80のメモリバスを半端にしたのはダイサイズ肥大の問題がひとつ。
もうひとつは、nVidiaがリングバスを採用してない事による、配線面積確保が困難な為だと思うよ。
要はコスト面と製造面の制約。
過去の事例で言えばSISが192bit幅のカード出してたけど、理由が256bitではコストが上がる、128bitでは大域が足りない、との事だった。
今のnVidiaもこれに近いんではないかな。

Posted by: 旅人A at 2007年09月25日 10:39

いや、別にどっちが先でも話は同じなんですけど、私に取って。
現在(その時点)でのGPUコアに取って太すぎる帯域が
使い切れないと言う事を正しいと認めてくれるのであれば。

R600(2900XT)が実は512bitもメモリバス幅
要らないんじゃないかと言うのは単なる推測に過ぎませんが。

Posted by: ケンジ at 2007年09月25日 12:52

なんか勘違いなさっているがR600がライバルとの差を埋めるためにメモリ帯域で性能を稼いでいるのはベンチの傾向からして明らかな訳で。
それが良い悪いは別の話題だけどね。
9600程度でも128bitと64bitの帯域差は歴然で、後者は地雷と言われた事をお忘れなのだろうか?

Posted by: 旅人A at 2007年09月25日 13:12

Radeon HD 2900 XT公称スペックはメモリ帯域105.6GB/secです。

一方フィルレートは118億4000万texel/secで、32bit/texel
で計算すると必要メモリ帯域は379GB/sで、512bitのXTでも
ピークフィルレート、すなわちシェーダーの有する演算能力に
メモリ帯域幅が追いついていない計算になります。

なお8800ULtraのメモリ帯域・フィルレートもほぼ横並びです。

足りない帯域は並列化・多段パイプライン化等で補っている
わけですが、少なくとも現状のハイエンドGPUにおいて、
メモリ帯域が演算能力に対して余剰であるとは言えないでしょう。

Posted by: 通りすがられ at 2007年09月25日 21:53

通りすがられさん
>>一方フィルレートは118億4000万texel/secで、32bit/texel
で計算すると必要メモリ帯域は379GB/sで

とのことですが、118億4000万texel/sec×32bit/texel=379ギガビット/s
なのでビットをバイトに直すと47.36GB/sではありませんか?これなら105.6GB/secで間に合うと思いますが。

Posted by: JM at 2007年09月26日 11:43

フィルレートも重要ですし、演算とかシェーダー処理の入出力も最終的にはメモリの帯域に依存しますよね。
FP64bitテクスチャーとかHDR、DX10ではますます重要になってくると思います。

2900XTは320spありますが、フル活用できていなくてもメモリ帯域が広いと効率面からいってもスピードアップに寄与すると思います。320spフルに動くと場合によっては、512bitは少なすぎるかもしれません(これは予測ですが^^;)

ただしケースによっては、256bitとほとんど差がない場合もありえると思います。
どの割合違うかは状況によって大きく変わるでしょうから、正直わかりませんが、最大ほぼ2倍もありえなくはない?

あとGDDR4はメモリ粒度の関係で同クロックのGDDR3より遅いらしいので単純計算は危険だと思います。
が、RV670 vs 2900Proでは、コアクロックが225MHzも違うのでRV670が速いと思います。

Posted by: aix at 2007年09月26日 11:44

JMさん>

> 118億4000万texel/sec×32bit/texel=379ギガビット/s
> なのでビットをバイトに直すと47.36GB/sではありませんか?
> これなら105.6GB/secで間に合うと思いますが。

ご指摘の通りです。単純な計算ミスです。お恥ずかしい。。。

ただ、2900XT発表時には演算能力の指標として475GFLOPS
という数値も公表されています。

こちらはGPGPUとして使用した場合のスペックということに
なるかと思いますが、16bit演算としても1000GB/s近い
帯域が必要になり、やはりメモリ帯域が演算能力に
追いついていないことになりますね。

Posted by: 通りすがられ at 2007年09月27日 07:32

http://pc.watch.impress.co.jp/docs/2007/0821/kaigai381.htm
この記事を読むと、「実装コストの問題が大きいために、ハイエンドGPUだけ(より帯域の広い)XDRを使用することはできない」というような書き方になっています。また、
http://www.ne.jp/asahi/comp/tarusan/main111.htm
このコラムのデータと比較すると、GPGPU時で約0.22Byte/FLOP
となりますから、DX処理時はともかく、汎用のベクトルプロセッサとしては帯域が狭いということは言えそうです。

Posted by: gbs at 2007年09月30日 14:30

gbsさん、ご紹介のコラム「CELLの相対性能と絶対性能」
楽しく読ませてもらいました。ただコラム筆者の方の
「現実的に必要なデータ転送量は1データ/FLOPSに漸近する」
と言う結論はどんなものでしょうか?

例えば科学技術計算で良くある行列演算を考えると10x10の行列を2個掛け合わせる場合、
1要素につき10回のかけ算と9回の加算で合計1900回の演算が行われます。
一方データ転送量は(計算の途中結果がレジスタやローカルストレージに収まれば)
200ワードのロードと100ワードのストアで合計300ワードのメモリ転送で済みます。
この場合転送量は1/6データ/FLOPS以下で納まる事になります。

信号処理で良く行われるコンボリューション(畳み込み演算)なども同様に
データ量に比べて計算量の比率が高いですね。

Posted by: ケンジ at 2007年10月01日 00:02

> 10x10の行列を2個掛け合わせる場合、
> 1要素につき10回のかけ算と9回の加算で合計1900回

このようにシンプルに演算を行えば、確かにメモリより
演算ユニットへの負担が大きくなることでしょう。

ただし、実際にこの演算を高速に行うためには、積和
各段階で分割して可能な限り並列演算する方が効率的です。
すると個々の演算は単純な代わりにメモリへの負担は
大きくなります。

このように演算をできるだけ単純なレベルに分割して
各演算を高速化・並列化する手法は現在のプロセッサの
高速・効率化の常套手段となっていますね。

その代わりにメモリ帯域への要求が強くなるということです。

Posted by: 通りすがられ at 2007年10月01日 09:04
コメントする
(書込時に「、」か「。」が必要です。内容によっては削除しますので、ご了承ください)









名前、アドレスを登録しますか?