「見える化」ではなく「分かる化」 ユニコーン企業グラファナ・ラボが実現するオブザーバビリティとは
夜中にアラートが鳴り、システム担当者が慌ててログを開くーー。それでも原因が分からず、復旧に丸一日。そんな“よくある地獄”を解決する鍵となるのが、「オブザーバビリティ(可観測性)」という考え方だ。これは単なる「見える化」を超え、システムの状態を「理解し」「対応する」ための情報をリアルタイムで把握することを意味する。Grafana Labs(グラファナ・ラボ、本社:米ニューヨーク)は、このオブザーバビリティを支えるオープンソースツールを提供するユニコーン企業。特に、見やすさと拡張性に優れたダッシュボード機能が、多くの開発者や運用担当者に重宝されている。東京で初の自社イベントを開催するために来日したCTOのTom Wilkie氏に、オブザーバビリティの最前線について話を聞いた。
<font size=5>目次
・エンジニアはなぜ「解放」されるべきなのか
・グラファナ・ラボをユニコーン企業に押し上げたもの
・日本初の月面着陸、グラファナが陰の功労者
・日本のITの現状は「レガシーだらけ」
エンジニアはなぜ「解放」されるべきなのか
―グラファナ・ラボはどのような課題を解決するスタートアップですか?
グラファナ・ラボはソフトウエアエンジニアの能力を最大限引き出すプラットフォームです。アメリカの著名投資家のマーク・アンドリーセン氏(アンドリーセン・ホロウィッツ共同創業者)がかつて述べたように、現代はありとあらゆる業界・業種の企業が「ソフトウエア会社化」しています。自社のソフトウエアエンジニアの生産性向上が、企業の競争力に直結する時代です。
―では、企業がソフトウエア会社化する中で、現場ではどのような課題が生じているのでしょうか。
言うまでもなく、ソフトウエアエンジニアはクラウドを用いてアプリを開発したり、自社のデータをクラウド上で一元管理することで効率的な分析をしたりするわけですが、こうした現場にはある問題があります。それは、クラウド上では外部APIやデータベース、マイクロサービス(※機能ごとに分割された小さなサービス群で構成されるシステム)など多種多様な要素が連携しながらリアルタイムで動いているため、どこで何が起きているか瞬時に把握できないのです。
例えば、「決済機能でエラーが出た」場合、それは外部API(StripeやPayPayなど)の応答遅延なのか、クエリの負荷なのか、内部サービス間の断続なのかなど、問題の根本がすぐには判明しません。その「原因探し」のために、ソフトウエアエンジニアは丸一日を費やすことも珍しくないのです。
―そうした複雑化するシステムの監視やトラブルシュートに対して、グラファナ・ラボはどのようなアプローチを取っているのですか?
そこで、当社はオープンソースの監視プラットフォームを開発しました。このプラットフォーム上で「ログ(記録情報)」「メトリクス(CPU使用率など)」「トレース(リクエストの流れ)」といったデータを統合的に、リアルタイムに把握する「オブザーバビリティ」という手法を導入し、ソフトウエアエンジニアの生産性を大きく引き上げたのです。
具体的に説明しましょう。グラファナ・ラボのプラットフォームは、Amazon CloudWatchやMySQLをはじめとする200種類以上のデータソースと接続できます。つまり、システム上で発生している情報を1カ所に集約し、ひと目で状況を把握できるのです。また、Datadogなどの他社製ツールとの連携も可能で、すでに導入済みの環境に無理なく統合できます。
さらに、視覚的に分かりやすいダッシュボードを自社のニーズに合わせて自由にカスタマイズできるのも特徴です。エンジニアはこのダッシュボードを通じて、ログやメトリクス、トレースといった複数のデータをリアルタイムで確認し、「いま何が起きているのか」「なぜそうなっているのか」を素早く把握できます。これが、まさにオブザーバビリティが生産性向上につながる理由なのです。
Tom WilkieGrafana LabsCTO英ケンブリッジ大学でコンピュータサイエンスの修士号を取得。同大で研究アシスタントを務めた後、英データ分析企業Acunu(2013年にAppleが買収)を創業、CTOに就任。Googleで複数のポジションを歴任した後、フィンランドで気候変動向けソフト会社Kausalを創業。2018年、同社をGrafana Labsに売却し、そのままVice Presidentに。2023年、現職のCTOに就任。
グラファナ・ラボをユニコーン企業に押し上げたもの
―グラファナ・ラボは、セコイア・キャピタルなどが主導した2021年8月のシリーズCラウンドの資金調達により評価額が30億ドルとなり、ユニコーン企業となりましたね。
ええ。私たちは投資家目線で、成長率がとても高い企業です。10年前には存在しなかったサービスですが、今や売上高2億5,000万ドル以上、50カ国で展開し、1,300人の従業員を抱える企業に成長したのですから。
―ここまで急成長を遂げた背景には、どのような要因があるとお考えですか?
Wells FargoやDell、J.P. Morganといった名だたるグローバル企業が「グラファナ」を利用しているのは、オブザーバビリティ向けのツールが必要不可欠なものだからです。例えば、営業支援のためにSalesforceが不可欠なように、ソフトウエアエンジニアにとって、すべてのデータをひとつのダッシュボード上に並べ、リアルタイムで観測できるオープンソースのツールは他にないと自負しています。
さらに、グラファナは低コストで実行できる点が魅力だと考えています。私たちはリソース管理や制限、ワークフローの最適化など、細部のテクノロジーを磨き上げ、費用をかなり低減させています。クラウドにかける予算を抑えられることもグラファナの強みでしょう。
加えて、開発者にとっての使いやすさも強みです。他社製ツールと異なり、私たちはオープンソースソフトウエア(ソースコードが公開されていて、誰でも利用できる)にこだわっています。これは5,000社以上の顧客を私たちが抱えている大きな理由の1つですが、オープンソースにすることで、世界中のエンジニアが自由に試し、改良し、フィードバックするエコシステムが成立します。開発者にとって真に使いやすいプラットフォームであるためには、オープンソースが適しているのです。
image : Grafana Labs Logs
日本初の月面着陸、グラファナが陰の功労者
―グラファナを活用したユースケースには、どのようなものがありますか。
例えば、SpaceXのロケット打ち上げなどの際には、グラファナが利用されています。他にも、パリの街中のコンテナでイチゴを栽培するスタートアップは、IoTのセンサーからデータをとって、それをリアルタイムにグラファナに表示させることで、効率的な栽培を目指しています。
私自身、グラファナのユーザーです。(取材時の)今は私は東京におり、家族はロンドンにいるので、グラファナを通じて自宅のIoTセンサーをつけた暖房をモニタリングしたりしていますよ。
―日本企業との提携も進んでいますね。
日本ではJAXA(宇宙航空研究開発機構)も当社の顧客で、JAXAの一部である宇宙科学研究所(ISAS)は小型月着陸実証機(SLIM)プロジェクトという、月惑星探査機システムの100メートル精度の着陸を目指すプロジェクトにおいてグラファナを活用しています。日本初の月面着陸が成功した際、グラファナのダッシュボードを用いて着陸操作などが監視されていました(参考:グラファナ・ラボのブログ記事)。宇宙探査にグラファナが使われていると思うと、とても誇らしい気持ちになりますね。
また、GREE(グリー)は2015年のAWS移行をきっかけに、グラファナを利用しています。
image : Grafana Labs AWS dashboard
―Wilkieさんは2018年にグラファナ・ラボに参画されました。その経緯とグラファナ・ラボ創業者との接点について教えてください。
元々、私はテックスタートアップの業界を渡り歩いてきた人間です。大学卒業後、最初に参加したのは、大学の教授に誘われた「Xen」という仮想化ソフトのプロジェクトです。その後、自分で作った会社を運営した後、Appleに売却。それからGoogleで勤務しました。今でもGoogle時代に学んだ、超大規模なインフラ運用と可観測性の実戦は私の資産になっています。
その後、Kausalという、オープンソースを軸にした開発者向けツール、それもVC資金なしで自力成長させる「ブーストラップ型」のスタートアップを作りました。その頃からグラファナ・ラボを知っていましたが、当時テキサス州オースティンを訪れた時、創業者のRaj Duttに会ったのです。彼と話した時、Kausalとグラファナ・ラボの共通点の多さに驚きました。例えば、サービスは開発者ファーストを貫くべきだという思想や、場所に縛られず、リモートで働くことなど、私たちが大事にしている価値観が一致していました。
2018年当時のグラファナ・ラボは従業員数が25人程度でしたが、売上高は数十万ドルありました。Kausalはまだ私ともうひとりだけだったことから、Kausalを売却し、グラファナ・ラボに入社したという経緯です。
日本のITの現状は「レガシーだらけ」
―東京開催のイベントにはたくさんの日本企業が集まりました。日本市場を率直にどのように見ていますか。
日本はまだまだレガシー技術が強い国ですね。一方で、クラウドネイティブなインフラへの移行は急務だと思いますから、今後当社にとってはチャンスも大きい市場だと考えています。レガシーから一足飛びにクラウドに移行すると、かならず先ほどお話した「どこでどんなデータ・サービスが動いているか分からない」という問題が起きますから。
―今後、さらに日本企業との連携を深めていく考えはありますか。
もちろんです。関心があるのは、ハイテク産業と金融業界でしょうか。すでに世界ではJ.P. MorganやWells Fargo、Goldman Sachs、Bank of Americaなどと提携しています。
金融業界はまだレガシー・インフラを利用している企業も多く、クラウドへの移行が遅れています。先に挙げた大企業ほどクラウドに近年急速に移行していますが、問題はクラウドインフラを運用する人材やツールの展開が遅れていることです。専門性がない中では、グラファナの可観測性が非常に役立ちますし、当社の専門チームを金融機関に派遣することで、クラウドへのスムーズな移行と日常業務のスムーズな展開を実現しています。
ハイテク産業と金融業界以外にも、小売業や航空会社などもグラファナの利用率が非常に高い業界です。こうした装置産業もクラウド移行が遅れている業界であり、それだけグラファナが求められる余地も大きいということでしょう。
image : Grafana Labs Cloud Provider Observability
―日本でのパートナーシップを考えた時、理想とする形態はありますか。
基本的には、日本市場に展開する際に必要な代理店が望ましいでしょう。今のところはR&Dや共同研究は求めていません。本格的なローカライゼーションは、向こう1年間をめどに、実現させます。
―最後に、今後の目標を教えてください。
現在、最も優先度が高いのは、当社のプロダクトにLLM(大規模言語モデル)を搭載させることです。すでに5年前から実装を始めていましたが、現在、ブレイクスル―とも呼べる局面に入っています。
具体的には、グラファナのインターフェイス上でユーザーと会話できる仕組みを実装することです。例えば、ユーザーが過剰にデータを収集している箇所を自動的に検出し、「このログは不要」「このメトリクスは意味がない」という風にユーザーにフィードバックします。この機能があることで、クラウドの利用コストも削減できますし、業務の生産性も向上します。すでにPoCではユーザーのクラウド利用コストを最大50%削減できたという結果も得られています。
LLMの実装の例から分かるように、中長期的にはグラファナは「観測ダッシュボードから、観測を基に適切な文脈に組み込むことで、開発者に『最適な行動』を促す意思決定エンジン」にしていきたいですね。
従業員数なし