blog

Apache Spark用R言語フロントエンド:SparkR

SparkRは、R言語からApache Sparkを使用するための軽量なフロントエンドを提供するR言語パッケージです。SparkRは、RDDクラスを通してSpark APIを公開し、ユーザーがクラスタ...

Mar 25, 2025 · 1 min. read
シェア

SparkはHadoopに似たオープンソースのクラウドコンピューティングシステムですが、両者にはいくつかの違いがあります。SparkはHadoopに似たオープンソースのクラウドコンピューティングシステムですが、特定のワークロードに対してSparkを優位にする有用な違いがあります。

スパーク・アーキテクチャー

SparkはScala言語で実装されており、アプリケーションフレームワークとしてScalaを使用します。Hadoopとは異なり、SparkとScalaは緊密に統合することができ、Scalaは分散データセットをローカルのコレクションオブジェクトのように簡単に操作することができます。

Sparkは分散データセットの反復処理をサポートするために開発されましたが、実際にはHadooファイルシステム上で並列実行することでHadoopを補完しています。この動作は、Mesosと呼ばれるサードパーティのクラスタリングフレームワークによってサポートされています。SparkはUC BerkeleyのAMP Labによって開発され、大規模で低レイテンシのデータ分析アプリケーションを構築するために使用できます。

SparkRの実行

library(SparkR) sc <- sparkR.init(master="local") 

プロジェクトホームページ

Read next

アップルのマーベリックス・システムの魔法

Living Earthの開発者Moshen Chenは最近、Mavericksでコンピュータが環境光センサーを使って、ユーザーがコンピュータの前に座っているかどうかを検出できることを発見しました。

Mar 25, 2025 · 1 min read