Y Combinatorの2018年夏季から巣立ったActiveloopは、メディアに特化した人工知能アプリケーションのために特別に設計されたデータベースを開発している。米国時間11月2日、同社は 468 CapitalとCM Venturesがリードする500万ドル(約5億7000万円)のシード投資を発表した。これにはTribe CapitalとShasta Ventures、およびテクノロジー業界のさまざまなエンジェルたちが参加した。
同社の創業者でCEOのDavit Buniatyan(ダビット・ブニアティヤン)氏によると、同社は彼がプリンストン大学で行っていた研究から生まれた。そのとき彼は、AIのユースケースのために特別に設計された、画像や動画など非定型データのストリーミングデータベースが必要だと感じていた。同社はこの度、商用プロダクトのアルファバージョンを立ち上げている。
「私たちのAIのためのデータベースは、具体的には、データを極めて効率的に保存し、これを機械学習のアプリケーションや、コンピュータービジョン、音声処理、NLP(自然言語処理)などのモデルの訓練へストリーミングするレイターです」とブニアティヤン氏は説明している。
実用面では、ビデオやオーディオなどのデータをマシンが理解できる数学的表現に変換するためのオープンソースのAPIだ。さらにそのAPIでデータの異なるバージョンを追跡でき、そして最終的にはそれを、Amazon S3のようなにリポジトリに保存できる。
データがストリーミングで入手できれが、データサイエンティストやデベロッパーはこれまでのようにすべてのデータを手元のノートパソコンにダウンロードする必要もなく、それをモデルが使うために送ることもできる。Netflixでムービーを自分のところへストリーミングするのと同じで、自分のローカルマシンには何もダウンロードしない。
彼によると、このオープンソースプロジェクトには55名のコントリビューターがいて、コミュニティのメンバーはおよそ700名いる。そのプログラムはこれまでに30万回ダウンロードされた。
彼がデータをストリーミングしようと思いついたのは、プリンストンの神経科学研究所で大量のデータを扱っていたときだ。彼は、ファイルでは大きすぎると悟った。それをダウンロードするのは非実用的であり、むしろストリーミングするやり方を思いついて、それがActiveloopのベースになった。
現在、社員は15名だが、5〜6名の高度な技術者を求めている。彼が同社を創るときには、人材のダイバーシティをできるかぎり心がけた。たとえばエンジニアリング担当の副社長は女性だ。最近ではエチオピア出身のエンジニアを雇用しようとしたが、彼は結局断った。ブニアティヤン氏によれば、有能な人材であれば性別や人種や国籍などはまったく関係ないし、気にもしないという。
「人の出自や生まれつきなどはどうでもいい。重要なのは、我が社のミッションに貢献してくれるかだけです。私はこの会社をインパクトのある企業に育てたいので、そのための人材が欲しいのです」。
APIはオープンソースだが、この度アルファをリリースした商用プロダクトは、ストリーミングデータへのSQLクエリなど、いろいろな機能が加わっている。それらはオープンソースプロダクトにはない。同社はまだ売上を計上していないが、2022年の第1四半期には商用バージョンをリリースしたい意向だ。
画像クレジット:Activeloop
[原文へ]
(文:Ron Miller、翻訳:Hiroshi Iwatani)