Amazon Athenaって何?

Amazon Athenaは、S3に保存された膨大なデータを標準SQLにて簡単に分析することのできる、サーバーレスのサービスとなります。

サービスの特徴・メリット

  • サーバーレス
    サーバーの管理が不要で、必要な時に必要な分だけリソースが割り当てられます。サーバーの管理や運用をユーザーが行う必要がありません。
  • 標準SQLで利用可能
    使い慣れたSQLでクエリを実行できるため、学習コストが低く、比較的スムーズに導入することができます。
  • 高いスケーラビリティ
    ペタバイト級の大容量データでも高速に分析することができます。
  • 多様なデータ形式を分析
    CSV、JSON、Parquetなど、様々な形式のデータを分析できます。
  • コスト効率
    スキャンしたデータ量に応じて課金されるため、無駄なコストを回避することができます。

利用シーン

  • ログ分析
    Webサイトのアクセスログやアプリケーションのログから、ユーザー行動やシステムの状態を分析して把握したい。
  • ビッグデータ分析
    大量のデータを高速で分析し、データの傾向やパターンを発見したい。
  • IoTデータ分析
    IoTデバイスから収集されたデータを分析し、異常検知や事前対処をしたい。

Amazon Athenaのデメリット

  • SQL の知識が必要
    SQLを利用して、クエリを作成・実行するため、ある程度の SQL の知識が必要となります。
  • リアルタイム分析には不向き
    thena はインタラクティブクエリサービス(対話的なクエリ実行により即座に結果を表示するもの)とはなりますが、クエリ実行に時間がかかるため、リアルタイム分析には向いていません。
    Amazon Kinesis などのストリーミングデータ処理サービスと連携すれば、リアルタイムに近い形で運用は可能となります。 

まとめ

・サーバレスのサービス
・膨大なデータからクエリ実行により分析を実施する。
・標準SQLにて実行
・リアルタイム分析には不向き