2024-08-04 Broadcom ASIC まとめ

提供:hkatou_Lab
2024年9月10日 (火) 14:30時点におけるHkatou (トーク | 投稿記録)による版 (→‎リファレンス)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)

Broadcom の ASIC について、情報をまとめるページです。

使われている製品として、

  • Cisco Nexus 3000
  • Cisco NCS 5500 , 5700
  • Arista DCS
  • Juniper QFX5k
  • Extreme Networks VSP (旧 Avaya)

などがあります。

Broadcom ASIC の適用範囲

 
Broadcom asics

最初は Leaf の Trident , Spine の Tomahawk , ルータの Jericho と覚えとけば良いでしょう。

Trident

  • エンタープライズ

Tomahawk

  • ハイパースケール データセンター

Jericho / Qumran / Ramon

  • ルータ向き
  • サービス プロバイダー

参考 URL : Networking Chips Buyer’s Guide


ASIC 比較表

Broadcom ASIC 比較
コードネーム 用途 概要 パケット

バッファ

データベースの

仕組みとスケール

パイプラインの

深さ

テーブルの

大きさ

スイッチの

レイテンシ

ファン

アウト

帯域幅

パケット/秒

Trident 多用途向け クラウド エッジと

エンタープライズ用


高機能・プログラマブル

普通 普通 普通 普通 普通 普通 普通
Tomahawk 高帯域幅向け ハイパースケールの

ファブリック用


高帯域幅

普通 普通 普通 普通 最適 最適 最適
Jericho 拡張性向け キャリア グレード インフラ用

スケールアウト・プログラマブル・ディープバッファ

最適 最適 最適 最適 普通 普通 普通
 
Trident
 
Tomahawk vs Jericho
 
Broadcom ASICs Portfolio

スイッチング ASIC vs プログラマブル ASIC

スイッチング ASIC

以前主流だった形式です。イーサネット ヘッダーや IP ヘッダに対して高速に処理できる反面、フレーム・パケット処理がハードコード (=ハードウェアで決められている) されているため機能追加はできません。

柔軟性にかける + ASIC 開発のコストを捻出するため、複数世代にわたって使えるように、マーケティングや初期の設計が重要となります。

ハードウェアにエラーがあると長期間修正できないため、ハードウェアの開発コストが高いです。

2003 年にリリースされて現在でも使われている、Cisco Catalyst 3750 -> 2960 -> 1000 世代の Sasquatch / Strider 系が代表的です。

プログラマブル ASIC

新しいヘッダであってもプログラム次第で処理が可能となる ASIC です。

自由度が高い反面、パケット処理のパイプラインを書かないといけないため、以前よりもソフトウェア開発が高コストになってきているといえます。

  • 5nm 世代の ASIC は、開発コストが $542.2M (=146 円換算で 791 億円) とのこと。 [1]

例としては Cisco Catalyst 3850 に搭載の UADP ASIC が挙げられます。当初はスタンダードな機能を持つ ASIC でしたが、現在は MPLS ヘッダや VXLAN ヘッダを処理できるようになっています。

最新の Cisco Silicon One では小規模な変更でバリエーション モデルを作ることで、ルータ・スイッチに両対応してきています。

プログラマブル ASIC
ASIC P4 NPL 備考
Broadcom Trident4 対応
Cavium XP80 ディスコン
Barefoot Tofino 対応 ディスコン

顧客・アリスタでプロファイルを EOS / RPM で追加可能 Intel が開発をやめたため、今後の展開は望めない

Mellanox Spectrum-2 対応
Broadcom Jericho2 対応
Cisco UADP ASIC
Cisco Silicon One 対応 ルータ・スイッチ用
Juniper Trio ルータ用


ASIC 一覧表

スイッチ系
シリーズ名・

コードネーム

Ver 型式 帯域幅 (半二重) パケットバッファ Cisco Arista Juniper Extreme 備考
StrataXGS

Trident

2 BCM56850 1.28 Tbps 12 MB Nexus 3100 DCS-7050SX-64 QFX5100-48S

EX4600-40F

2+ BCM56860 1.28 Tbps 16 MB Nexus 3100-V DCS-7050QX2-32S QFX5110-48S

QFX5110-32Q

3-X5 BCM56770 2.0 Tbps 共有 32 MB [2] DCS-7050X3-48Y8C QFX5120-48Y

EX4650-48Y

SLX 9150

VSP7400-48Y-8C

3-X7 BCM56870 3.2 Tbps 共有 32 MB [3] Nexus 3100-Z

(N3K-C3132C-Z)

DCS-7050X3-32C QFX5120-32C SLX 9250

VSP7400-32C

4-X7 BCM56690 4.0 Tbps DCS-7050X4
4-X11C BCM56890 12.8 Tbps 132 MB DCS-7060X4 QFX5130-32CD
StrataXGS

Tomahawk

1 BCM56960 3.2 Tbps 24MB [4] Nexus 3200 DCS-7060X QFX5200-32C
1+ 22 MB QFX5200-48Y
2 BCM56970 6.4 Tbps 統合スマート

バッファ 42MB[5]

Nexus 3200-E

(N3K-C3264C-E)

DCS-7260X3 QFX5210-64C
3 BCM56980 12.8 Tbps 共有 64MB [6] DCS-7360X4 QFX5220-32CD

(128 MB [7])

4 BCM56990 25.6 Tbps 114MB [8] DCS-7060X5
5 BCM78900 51.2 Tbps ? DCS-7060X6 LPO 対応
ルータ系
シリーズ名・

コードネーム

Ver 型式 帯域幅 (半二重) パケット

バッファ

Cisco Arista Juniper 備考
StrataDNX

Qumran

UX BCM88270 120 Gbs NCS 540 スモール
MX BCM88370 800 Gbps ACX5448, ACX5448-D, and ACX5548-M
AX BCM88470 300Gbps
2u BCM88280 360 Gbps GDDR6 Deep packet buffering ACX7024
2a BCM88480 800 Gbps Deep

buffering

NCS 540 ラージ
2c BCM88820 2.4 Tbps HBM
3D BCM88870 25.6 Tbps HBM
StrataDNX

Jericho

1 BCM88670 720 Gbps VoQ Deep

buffering

DCS-7280R
1+ BCM88680 900 Gbps Nexus 3600

(N3K-C3636C-R)

DCS-7280R2
2 BCM88690 4.8 Tbps VoQ HBM

Deep Buffer

2 - 16 GB [9]

NCS-57B1-5DSE

NCS-57B1-6D24H

DCS-7280R3 ACX7100-32C

ACX7100-48L

2x BCM88830 3.2 Tbps Deep

Buffer 4GB [10]

2c BCM88800 4.8 Tbps NCS-57C3-MOD-SE

NCS-57C3-MOD

ACX7509
2c+ BCM88850 14.4 Tbps HBM
3 BCM88860 28.8 Tbps HBM LPO 対応
3AI BCM88890 28.8 Tbps 7700R4

7800R4

StrataDNX

FE3600

(fabric element)

BCM88770 3.6 Tbps Jericho1 用ファブリック
StrataDNX

FE9600 Ramon

(fabric element)

Ramon BCM88790 9.6 Tbps Jericho2 , 2+ と組み合わせる [11]
3 BCM88920 51.2 Tbps Jericho3 と組み合わせる [11]

ファブリック ASIC

ファブリック ASIC は Jericho 搭載シャーシ型のバックプレーンや、ホワイトボックス ルータで作る分散シャーシの Spine で使用する。

  • FE3600
  • Ramon

イーサネットの ECMP ベースではなく、セルベースで負荷分散を行うことで、1 つのノードであっても複数リンクを使用して負荷分散を行うことが可能。[12]

  • ECMP ベース : MAC / IP などをパラメータとして負荷分散
  • セルベース : パケットをセルに再構成し、パラメータに依存せずに負荷分散

DDBR (Distributed Disaggregated Backbone Router)

分散シャーシは KDDI + DRIVENETS が TIP (Telecom Infra Project) で推進・商用導入 [11] された。

Feature Rich な PE よりも、バックボーンに向くとのこと。

 
96T J2 Ramon 参考 : Merchant Silicon in Carrier Networks

Cell-ste Routers , vBNG , DDC (Distributed Disaggregated Chassis)

 
Merchant_Silicon_in_ISP 参考 : Jericho2 & Ramon Cell Based DDC

Cisco

 
Cisco Nexus3k Portfolio
 
Cisco NCS Portfolio

上記 Jericho 2C と 2C+ の bandwidth Gbps は、Broadcom のページにある記載と異なります。

Broadcom の表記が全二重に見えます。

  • Cisco 2,400 vs Broadcom 4,800
  • Cisco 7,200 vs Broadcom 14,400

Arista

 
Arista DCS Portfolio

Juniper

 
Juniper QFX5K –SWITCHING PORTFOLIO

リファレンス

Merchant Silicon in Carrier Networks

Domain-specific switch silicon in networking

Cisco SP Router Portfolio Update

Building the ACX7000 Series: the PFE

ACX7509 Deepdive

BRKDCN-3734 - Cisco Nexus 3000 Switch Architecture

The Arista Advantage Cloud Networking Trends

JUNIPER 400G PORTFOLIO

NPLによるデータプレーンプログラミング

更新履歴

2023-10-05 : 初版作成

2024-01-23 : ファブリック ASIC などを追記

2024-08-04 : スイッチング ASIC とプログラマブル ASIC を追記

引用

  1. ムーアの法則による高速インターフェース展開予測2025/2026 P.13 CPUチップの設計コストが高騰中
  2. Trident3-X5 / BCM56770 Series 32MB of on-chip fully shared packet buffer
  3. https://people.ucsc.edu/~warner/Bufs/7050X3-Datasheet.pdf
  4. https://www.edge-core.com/temp/edm/201502edm_fileEC/A3_BROCHURE_20150206_2_view.pdf
  5. https://www.arista.com/assets/data/pdf/Datasheets/7260X3_Datasheet.pdf
  6. https://www.arista.com/assets/data/pdf/Datasheets/7368X4-Datasheet.pdf
  7. QFX5220 SWITCH Data Sheet QFX5220-32CD Total packet buffer 128 MB
  8. 400/800G Leaf and Spine solutions for hyperscale cloud and I/O intensive environments 114MB of buffers
  9. https://www.arista.com/assets/data/pdf/Whitepapers/7280R3-Platform-Architecture-WP.pdf
  10. BCM88830 Preliminary Data Sheet Deep packet buffering, in-package HBM Gen2 for a total of 4 GB.
  11. 11.0 11.1 11.2 DDBR HW仕様
  12. AI ネットワーキング セルベースのファブリック:セルベースのファブリックは、すべてのパケットを均一な大きさのセルに分割してから、すべてのファブリック・モ ジュールに均等に「スプレー(分配)」します。このスプレー動作に多くの利点があり、各転送エンジンに均等なフロー・バランスをもたらす非 常に効率的な内部スイッチング・ファブリックを実現します。セルベースのファブリックは、トラフィック・パターンに関係なく 100%効率である と考えられています。