Amazon Athenaって何?
Amazon Athenaは、S3に保存された膨大なデータを標準SQLにて簡単に分析することのできる、サーバーレスのサービスとなります。
サービスの特徴・メリット
- サーバーレス
サーバーの管理が不要で、必要な時に必要な分だけリソースが割り当てられます。サーバーの管理や運用をユーザーが行う必要がありません。 - 標準SQLで利用可能
使い慣れたSQLでクエリを実行できるため、学習コストが低く、比較的スムーズに導入することができます。 - 高いスケーラビリティ
ペタバイト級の大容量データでも高速に分析することができます。 - 多様なデータ形式を分析
CSV、JSON、Parquetなど、様々な形式のデータを分析できます。 - コスト効率
スキャンしたデータ量に応じて課金されるため、無駄なコストを回避することができます。
利用シーン
- ログ分析
Webサイトのアクセスログやアプリケーションのログから、ユーザー行動やシステムの状態を分析して把握したい。 - ビッグデータ分析
大量のデータを高速で分析し、データの傾向やパターンを発見したい。 - IoTデータ分析
IoTデバイスから収集されたデータを分析し、異常検知や事前対処をしたい。
Amazon Athenaのデメリット
- SQL の知識が必要
SQLを利用して、クエリを作成・実行するため、ある程度の SQL の知識が必要となります。 - リアルタイム分析には不向き
thena はインタラクティブクエリサービス(対話的なクエリ実行により即座に結果を表示するもの)とはなりますが、クエリ実行に時間がかかるため、リアルタイム分析には向いていません。
Amazon Kinesis などのストリーミングデータ処理サービスと連携すれば、リアルタイムに近い形で運用は可能となります。
まとめ
・サーバレスのサービス
・膨大なデータからクエリ実行により分析を実施する。
・標準SQLにて実行
・リアルタイム分析には不向き