ビジネス課題
日産自動車では、自動車の設計および開発段階で欠かせない衝突解析や流体解析のシミュレーションなど、大規模なコンピューティングリソースを必要とするCAE/HPC環境は世界各地のエンジニアから利用されています。2050 年までにカーボン ニュートラルとゼロエミッション車を達成するという同社の中期経営計画に基づいて、巨大なコンピューティング パワーを生成するためのよりエネルギー効率の高い方法が必要であると判断しました。
日産自動車は12月26日に創立90周年を迎えます。同社では、これまでオンプレミスでシミュレーション計算用大規サーバシステムCAE(コンピュータ支援エンジニアリング)/HPC(ハイパフォーマンスコンピューティング)環境を支えており、「大量のサーバーを自社データセンター内に抱えて運用を続けるためには膨大な電力消費量とそれに伴うCO2排出量が課題となっていました。」(主担 松原 大 氏)
「CAE/ HPC環境には製品開発プロジェクトの推移に伴う大きな需要変動があるため、ピーク対応のためにインフラのリソースには常にある程度の余裕を持たせなければなりません。一方で閑散期にはリソースが大量に余ってしまうことなど、リソースの無駄を解消し、オンデマンドのニーズに対して柔軟かつ機敏に対応できる効率的な新しいCAE/HPC 環境を実現する必要がありました。」
日産自動車では、担当エンジニアやプロジェクト担当者がインフラのリソース需要の変化に迅速に対応できるように、開発とテスト環境をより柔軟にできるスケーラブルなクラウド コンピューティング環境に移行する方法を検討しました。
俊敏かつ変化に強い組織を構築する
当初移行を進めていたクラウドプロバイダーのプラットフォームは、IaaS上で提供されるリソースが仮想化ベースのインスタンスだったことに起因して、日産自動車の求める基準には十分に応えきれないケースがありました。仮想化ベースのインスタンスでは1000並列を超える大規模なシミュレーションでは求めるパフォーマンスが得られない事がありました。
検討を重ねた結果、日産の技術スタッフは、Oracle Cloud Infrastructure (OCI) 上のベアメタル インスタンスのPOC検証 をオラクルと取り組みました。物理サーバーを占有できるOCIのベアメタルのインスタンスであれば、オンプレミスと同様に自由度の高いカスタマイズも可能となり、使い方が多岐にわたるアプリケーションも実装することができます。
「OCI」は、RDMA(Remote Direct Memory Access)クラスター・ネットワークを備えたベアメタル・HPCコンピューティングをパブリック・クラウドで初めて提供し、OCIのベアメタルの料金体系は、それまで利用してきた仮想化ベースのインスタンスと比べても遜色のない価格設定だったことも大きな魅力となりました。
「自動スケーリング機能の適用に際しては、日産自動車とオラクルの Big Compute チームが要件のヒアリングから機能のカスタマイズ、運用時のサポートまで緊密に連携してプロジェクトを遂行することで、発生した課題を乗り越えて安定稼働に至ることができました。」(主担 松原 大 氏)「当社の社内プロジェクトチームは、オラクルのサポートチームや関係スタッフと良好な連携関係を確立することができました。 プロジェクトはわずか 2 か月程度で完了し、非常にスムーズに移行プロジェクトを遂行できました」
NVIDIAのGPUを搭載したベアメタルによるグラフィックス性能の向上
従来オンプレミス環境で構成していたCAE/HPC環境をOCIへ移行したことで、日産自動車の世界各地のエンジニアから利用され、カスタマイズされたCAEアプリケーション40種以上、計算ニーズに合わせてピーク時には数万単位のコアを利用するワークロードの大規模なシステムは安定稼働とともにコストの削減や数多くのメリットをもたらしています。NVIDIA A10のGPUを搭載したベアメタルをユーザー認証のサーバーやライセンスプロキシサーバーなどが運用されている共通基盤上の各CAEアプリケーションのVDI(仮想デスクトップインフラ)に採用したことで、プリ/ポスト処理におけるグラフィックス性能が飛躍的に向上しました。
OCIの自動スケーリング機能を活用し、基盤運用のコスト削減に関しては、必要なノードをオンデマンドで立ち上げ、不要になったらすぐに落とすという運用を自動実行することで、リソース利用を最適化しています。
また、OCIによって実現した高並列計算の大幅なパフォーマンス向上は、各種シミュレーションのスピードアップやエンジニアの生産性向上はもとより、アプリケーションのライセンスコスト削減にも貢献しています。日産自動車が利用しているCAEアプリケーションの中には実行時間で従量課金されるものや、割り当てたCPUコア数によってライセンス費が変わるものがあり、OCIによる性能向上が、これらのリソース消費の増加を抑えています。結果としてシミュレーションの実行数が増加しているにもかかわらず、ライセンス費についてはほぼ横ばいを保っています。従前のオンプレミスでCAE/HPC環境を運用していた当時との比較で約30%減に相当するコスト削減効果を実現しました。
日産自動車は、未来を見据えてIT活用のさらなる高度利用とコスト最適化のために、今後はAI/ML 向けの GPUの活用も計画しており、「CAE/HPC環境をさらに拡充して、革新的な商品・技術の開発を継続的に進めていきます。」(主担 松原 大 氏)