* 2021年8月19日に米国で発表された資料の抄訳です。
アーキテクチャーは、ハードウェアとソフトウェアにとって魔法のような存在です。アーキテクチャーに基づき、エンジンの用途に最適なトランジスターを組み合わせ、これを高度なパッケージング技術で実装し、広帯域幅かつ低消費電力のキャッシュと統合、そして大容量かつ広帯域幅のメモリーや拡張性のある低レイテンシーのインターコネクトとともに実装することにより、あらゆるソフトウェアをシームレスに迅速処理できるハイブリッド・コンピューティング・クラスターが単一のパッケージで実現します。今後まもなく登場する製品の開発に携わってきたアーキテクト達は毎年、「Intel Architecture Day」を心待ちにしていますが、3回目を迎える今年はこれまでで最も期待を抱くイベントになりました。
本日、インテルは、世代を超えたインテル・アーキテクチャーの最大の変化を公表しました。今回、2つの新世代のx86コアとインテリジェントなワークロード・スケジューラーであるインテル® スレッド・ディレクターを備えたインテル初のパフォーマンス・ハイブリッド・アーキテクチャー「Alder Lake(開発コード名)」、そして新しいPerformance-coreと多様なアクセラレーター・エンジンを実装し、インテルにとって新たな標準となるデータセンター向けアーキテクチャー「Sapphire Rapids(開発コード名)」の情報を公表しました。さらに、新しいディスクリート型ゲーミング用グラフィックス・プロセッシング・ユニット(GPU)アーキテクチャーや、新たなインフラストラクチャー・プロセッシング・ユニット(IPU)、そしてインテル史上最高のコンピューティング密度を実現し、傑出したデータセンター向けGPUアーキテクチャーとなる「Ponte Vecchio(開発コード名)」の情報も公開しました。
今回の発表された画期的なアーキテクチャーが、次の時代でも業界をリードする製品の実現を支え、その皮切りとなる、Alder Lake(開発コード名)がまもなく登場します。さらに、デスクトップ PCからデータセンターにわたりワークロードが一層、大規模化、複雑化、多様化し、コンピューティング性能に対する需要が急増する今、本日公開された画期的な進展を通じて、この需要の課題に応えるアーキテクチャーの在り方も示しています。
詳細情報: Intel Architecture Day 2021 (プレスキット) | Intel Unveils Biggest Architectural Shifts in a Generation for CPUs, GPUs and IPUs (Architecture Day ファクトシート) | Expanding Intel’s Foundry Partnerships: A Critical Piece of IDM 2.0 (Stuart Pann Editorial)
インテルのアーキテクトは熱心な取り組みを通じて、スカラー、ベクトル、マトリクス、スぺ―シャルのインテル独自の豊富なコンピューティング・エンジンを組み合わせ、顧客が求める要求度の高いワークロードで右肩上がりの効果をもたらすハイブリッド・コンピューティング・アーキテクチャーを実現します。
今回の発表のハイライトは次の通りです。発表の詳細は、プレスキット(英語)をご覧ください。
Efficient-core:低消費電力のモバイル・アプリケーションから、メニー・コアのマイクロサービスまで、顧客の全領域でのニーズに応えるコンピューティング要件を満たす、拡張性に優れたx86マイクロアーキテクチャーです。Efficient-coreは、広く普及しているインテルのCPU マイクロアーキテクチャー「Skylake(開発コード名)」 と比較して、同等の消費電力で40%高いシングルスレッド・パフォーマンスを、もしくは消費電力を40%抑えながら、同等のパフォーマンスを引き出すことができます*1。スループット性能については、4つのEfficient-coreが、4つのスレッドを実行する2つのSkylake(開発コード名)コアよりも消費電力を抑えながら80%高いパフォーマンスを、もしくは消費電力を80%抑えながら、同等のパフォーマンスを発揮します*1。
Performance-core:このx86コアは、インテルがこれまで開発してきた中で最高レベルのパフォーマンスを発揮するだけでなく、今後10年のコンピューティングをけん引するCPUアーキテクチャーとしてパフォーマンス水準を1段階引き上げます。より広く、深く、スマート化したアーキテクチャーとして設計され、並列処理の実装、実行並列処理の向上、レイテンシーの低減、汎用パフォーマンスの向上といった特長を有しています。また、大容量データと大規模コード・フットプリントのアプリケーションに対応します。このPerformance-coreは、動作周波数が同等の第11世代 インテル® Core™ プロセッサー・ファミリー・アーキテクチャー「Cypress Cove コア」と比較し、広範なワークロードを通じて幾何平均で約19%の性能向上を示しています*1。
Performance-coreは、データセンターのプロセッサーや進化する機械学習のトレンドを念頭に開発され、新しいインテル® Advanced Matrix Extensions(AMX)を含む専用ハードウェアを搭載し、行列乗算演算処理により、比類のパフォーマンスを実現し、AIのアクセラレーションを約8倍向上させます*1。Performance-coreは、x86のプログラミングモデルを利用して、ソフトウェアの使いやすさを追求しています。
インテル® スレッド・ディレクター:Efficient-coreとPerformance-coreをシームレスに連携させ、起動直後から動的かつインテリジェントにワークロードを割り当て、実環境でパフォーマンスと効率を最大化してシステムの最適化するスケジューリングに対するインテル独自のアプローチです。コアに直接、インテリジェンスを組み込みことにより、インテル® スレッド・ディレクターはOSとシームレスに連動し、適切なスレッドを、適切なコアへ、最適なタイミングで配置します。
Alder Lake(開発コード名):マルチコア・アーキテクチャーを再び創造するAlder Lake(開発コード名) は、新開発のインテル® スレッド・ディレクターを備えたインテル初の高性能ハイブリッド・アーキテクチャーです。インテルで最もインテリジェントなクライアント向けSoC(システム・オン・チップ)アーキテクチャーであり、Efficient-coreとPerformance-coreの組み合わせを特長とし、ウルトラモバイル PCからデスクトップ PCまで対応可する拡張性を備えています。また業界をリードするマルチI/Oとメモリーを実装し、業界の転換を導きます。Alder Lake(開発コード名) に基づく製品は年内の出荷開始が予定されています。
Xe HPGとAlchemist(開発コード名) SoC:ゲーミングやクリエイティブなワークロードといったエンスージアスト向けパフォーマンスにも対応できる拡張性を念頭に設計されたディスクリート・グラフィックスの新しいアーキテクチャーです。インテル® Xe HPG マイクロアーキテクチャーは、コンピューティングに焦点を当てたプログラマブルかつ拡張性の高い最新のインテル® Xeコアを中核とし、DirectX 12 Ultimateをフルサポートしています。インテル® Xe コアに内蔵される新しいマトリクスエンジン「Xe Matrix eXtensions(XMX)」が、高性能かつ高解像度のゲーミングを実現する画期的なアップスケーリング・テクノロジーXeSSなどをはじめとしたAIワークロードの処理を加速させます。インテル® Xe HPGベースのAlchemist(開発コード名、旧称:DG2)SoCは、新たなブランド名「インテル® Arc™」として2022年第1四半期に登場する予定です。
Sapphire Rapids(開発コード名):インテルのPerformance-coreと新しいアクセラレーター・エンジンコアを組み合わせたSapphire Rapids(開発コード名)は、次世代のデータセンター向けプロセッサーの基準となります。Sapphire Rapids(開発コード名)の中核は、タイルと呼ばれるモジュール型の SoCアーキテクチャーで、インテルのEMIB(エンベデッド・マルチダイ・インターコネクト・ブリッジ)パッケージング技術と最先端のメッシュ・アーキテクチャーによりモノリシック CPUインターフェイスのメリットを維持しながら、拡張性を大幅に向上しています。
インフラストラクチャー・プロセッシング・ユニット(IPU):インテル初となる専用ASICベースのIPU「Mount Evans(開発コード名)」を、FPGAベースの新しいIPUリファレンス・プラットフォーム「Oak Springs Canyon(開発コード名)」とともに発表しました。クラウド・サービス・プロバイダー(CSP)は、インテルのIPUベースのアーキテクチャーによりインフラストラクチャーにかかるタスクをCPUからIPU にオフロードし、データセンターの収益性を最大化できます。インフラストラクチャーのタスクをIPUへオフロードすることにより、CSPはサーバーCPUの能力のすべてを顧客のワークロードに割り当てることができます。
インテル® Xe HPCとPonte Vecchio(開発コード名): Ponte Vecchio(開発コード名) は、インテルがこれまで開発してきた中で最も複雑なSoCであり、最先端の半導体プロセッサー、革新的な EMIB技術、そしてFoveros 3Dパッケージングという優位性を最大限に活かした、インテルのIDM 2.0 戦略を象徴する製品です。インテルはこの製品で1,000億個のトランジスターを搭載したデバイスという、壮大かつ挑戦的なプロジェクトの実現を目指し、この製品は業界をリードするFLOPS性能とコンピューティング密度によりAI、HPC(ハイパフォーマンス・コンピューティング)、高度な分析などのワークロードの処理を加速させます。
インテルは、Architecture Dayで、初期のPonte Vecchioシリコンが、一般的なAIベンチマークの推論と学習の両方のスループットで業界記録を樹立し、すでに業界をリードするパフォーマンスを達成していることを明らかにしました*1。インテルのA0 シリコンはすでに45TFLOPSを上回るFP32 スループット、5TBps以上のメモリー・ファブリック帯域幅、2TBps超の接続帯域幅を実現しています。Ponte Vecchio(開発コードネーム)は、インテル® Xe アーキテクチャー同様、アーキテクチャーやベンダーを問わないオープンで標準ベースの統合型ソフトウェア・スタックであるoneAPIによる開発が可能です。
このコロナ禍の直近1年の振り返りだけでも、あらゆる人々がテクノロジーを基軸にコミュニケーションを取り合い、働き、そして楽しい体験を得てきました。 すなわち、強力なコンピューティングの重要性が証明されました。一方、今後に目を転じると、コンピューティングに対する膨大な需要が目前に控え、そのニーズは2025年までに1,000倍に達する可能性も秘めています。4年で1,000倍というスピードは、ムーアの法則の5乗に匹敵します。
アーキテクトでもあるインテル コーポレーション CEO(最高経営者)のパット・ゲルシンガー(Pat Gelsinger)は今回のArchitecture Dayで「私たちは今、革新的なアーキテクチャーやプラットフォームでしか解決できない、大きなコンピューティングの課題に直面しています。インテルの才能あるアーキテクトとエンジニアが、テクノロジーのマジックでこのすべての解決を図ります」と述べています。
世界中の人々が、困難なコンピューティングの課題の解決と豊かな生活の実現に向け、アーキテクトとエンジニアに期待を寄せています。この期待こそ、インテルの戦略と実行力を加速させる原動力です。
インテル コーポレーション 上席副社長 兼 アクセラレイテッド・コンピューティング・システム&グラフィックス(AXG)事業部 事業部長 ラジャ M. コドゥリ(Raja Koduri)