computing power ニュース一覧

見つけた情報をご紹介します 👀

# computing power

4/17/2025

OpenTelemetryによる可観測性の拡張：MSCIの実踐と技術的考察

Open Telemetry Observability Legacy Vendor Tooling Data Crunching CNCF

OpenTelemetryは、CNCF（Cloud Native Computing Foundation）が主導するオープンソースプロジェクトで、アプリケーションの可観測性を実現するための標準化された

4/17/2025

自己サービスの力：DevOpsエンジニアとインフラ開発者のためのプラットフォーム革新

self-service DevOps engineers infra developers platforms CNCF

CNCF（Cloud Native Computing Foundation）が推進するプラットフォーム戦略において、自己サービスは開発者を業務ロジックに集中させ、DevOpsチームを高価値タスクに転換

4/17/2025

カスタムOpenTelemetryコレクターの実裝：OCBの導入と実踐

CNCF

## はじめに OpenTelemetryは、CNCF（Cloud Native Computing Foundation）が主導する観測（Observability）のためのオープンソースプロジェクト

4/17/2025

I Choo 平臺の技術的アプローチと課題

slides ADHD 25 minutes CNCF

データプラットフォームでは、Azure DataBricksとPower BIが採用され、データ血縁性と品質の管理が重視されています。

4/17/2025

プラットフォームエンジニアリングの挑戦とコミュニティの役割

platform engineering platform day two-track cubecon community CNCF

CNCF（Cloud Native Computing Foundation）傘下の活動が中心となり、技術革新とコミュニティの成長が密接に関わっています。

4/17/2025

TofuLithのDevOps最適化：リードタイムの短縮とインフラ変更の効率化

DevOps Lead Times Infrastructure Changes Continuous Delivery Platform Engineering CNCF

本記事では、TofuLithが実施したDevOps最適化の戦略と成果を解説し、Platform EngineeringとCNCF（Cloud Native Computing Foundation）の枠組

4/15/2025

クラウドネイティブ技術とCNCFの進化：多産業での実踐と未來の展望

cloud native technologies Kubernetes biotech streaming financial services CNCF

特に、Kubernetesを核とするCNCF（Cloud Native Computing Foundation）は、金融サービス、バイオテクノロジー、ストリーミングサービスなど多様な産業で活用され、技術革新

4/15/2025

Ingressシステムの再設計：Dockerの次の世代Ingressアーキテクチャへの移行

envoy gateway ingress system haproxy engineext envoy proxy CNCF

Envoy GatewayやHAProxy、EngineXといった技術の選択理由や、CNCF（Cloud Native Computing Foundation）の枠組みにおける位置づけについても説明します

4/15/2025

Kubernetesにおける殭屍サーバー狩りとクラウドネイティブ最適化

Kubernetes Quarkus on-prem server bandwidth WordPress CNCF

特に、on-premサーバーやWordPressなどのアプリケーション環境における実踐的な対策を、QuarkusやCNCF（Cloud Native Computing Foundation）の技術を活用

4/15/2025

仮想KubeletsとHPCの統合アーキテクチャ解析

Virtual Kubelets Kubernetes supercomputer high performance computing cloud-native CNCF

## 引言近年、ハイパフォーマンスコンピューティング（HPC）とクラウドネイティブ技術の統合が注目されています。仮想KubeletsはKubernetesの拡張機能として、HPC環境とクラウドネイティブエコシステムを連攜させる重要な技術です。本記事では、仮想Kubeletsの技術的特徴、HPCとの統合アーキテクチャ、実裝上の課題と解決策を詳細に解説します。 ## 技術的特徴とアーキテクチャ ### 仮想Kubeletsの定義仮想Kubeletsは、Kubernetesクラスタ內で仮想的なノードを実現する技術です。HPC環境における物理的なノードを抽象化し、Kubernetesのポッド管理機能を活用することで、HPCリソースをクラウドネイティブの枠組みで運用可能にします。 ### キーテクノロジー - **MTLS暗號化gRPCトンネル**：HPCノードとKubernetesクラスタ間の安全な通信を実現 - **Flux CDなどのツール**：ポッド狀態やメタデータの同期を可能にする - **ネットワークポリシー**：HPC環境における多租戶隔離を強化 ### 統合アーキテクチャ 1. **コントローラー（Controller）**：Kubernetesクラスタ內でPodとして実行される 2. **エージェント（Agent）**：HPCノードに接続し、MTLS暗號化gRPCトンネルを構築 3. **Slurm排程器**：Kubernetesのポッドタスクを受信し、HPCノードに分散実行 ## 実裝と運用 ### ワークロードの実行フロー 1. エージェントがトンネルを通じてコントローラーと通信 2. コントローラーがHPCノードの検出を依頼 3. 虛擬Kubeletが無後端ノードとしてデプロイされる 4. ポッドタスクがSlurmに転送され、複數ノードに分散実行 5. KubernetesがFlux CDなどのツールでポッド狀態を同期 ### 現在の統合ソリューション - **Superetes**：HPC→KubernetesとKubernetes→HPCの雙方向同期を実現 - **Interlink/HPK**：KubernetesワークロードをHPCにデプロイ可能 - **K Foundry/Slinky Slurm Bridge**：開発中または未公開のソリューション ## 課題と解決策 ### 多租戶隔離の課題 - **問題**：HPC環境における名前空間隔離の欠如 - **解決策**：Kubernetesのネットワークポリシーとコンテナ化隔離の活用 ### 高可用性と停機コスト - **Lumi超級コンピュータの停機コスト**：年間€30M、1日あたり€82K - **解決策**：Kubernetesによるハードウェアリソース管理、マルチクラスタ統合技術の採用 ## 未來の展望 ### 階段的目標 1. **現狀（Base Case）**：HPCシステムがすべてのテナントにリソースを提供 2. **中間段階（Stopgap Station）**：Kubernetes內で隔離されたSlurmクラスタを実行 3. **最終目標（Final Station）**：Slurmを完全に廃止し、Kubernetesがハードウェアを直接制御 ### 今後の方向性 - HPCシステムの完全クラウドネイティブ化 - AIトレーニングとHPCリソースの統合 - 多テナントと高可用性を支える統一プラットフォームの構築 ## 結論仮想KubeletsはHPCとクラウドネイティブ技術の統合を可能にする革新的なアプローチです。MTLS暗號化、Flux CDの活用、ネットワークポリシーによるセキュリティ強化がその核心です。今後の課題として、Slurmとの雙方向同期の実現や、ハードウェアリソースの細かい制御能力の向上が求められます。