社内活動ブログ

MySQL Heatwave Meet in Tokyo 参加レポ

こんにちは。弊社代表の鈴木です。

先月(11月)の話になりますが、オラクルさん主催のイベント、Oracle HeatWave Meet in Tokyo に参加してきました。
MySQL HeatWave(以下 HeatWave)に関する技術系イベントですが、昨今のIT業界は技術もセールスもマーケも渾然一体というか、ある程度フルスタックでないとやっていけない側面があります。
そんなわけで、開発現場から離れて久しい私ですが、技術動向のキャッチアップ目的で行ってきました。

まず。この記事を見ているかたで、MySQLを知らないという人はいないと思いますが、HeatWave?という人はいるかもしれません。
かなり乱暴に単純化しますと、
元々のMySQLのトランザクション(OLTP)に加えて、分析(OLAP)が同じDB上でリアルタイム実行できる製品です。
トラン系と分析系が1つのDBで済むので、ETLプロセスが省ける。これだけで構築・連携・移送コストが抑制できます。

最近ではHeatWaveに機械学習(AutoML)や生成AI(GenAI)機能がネイティブで統合され、モデルの構築・トレーニング・推論回答まで可能になっています。ベクトルストアもDB内に統合されていますので、RAGのナレッジベースとして機能するわけですね。これはすごいです。

さて。当イベントではいくつもセッションやLTがありましたが、個人的にベクターサーチやRAGに関心がありますので、以下は「統計数理研究所様」のセッションについても触れさせていただきます。

同研究所様では既にHeatWaveを利用されていて、今回はHeatWaveのベクトルストアやRAG評価をされたとのこと。SQLで柔軟に拡張検索ができる点や、ベクトルストアの秀でた点などお話しされていました。
浅学な私には専門用語についていけない部分もありましたが、大変興味深いセッションでした。特に昨今、機械学習界隈で盛り上がっているという「最適輸送」について。

そもそもベクトルストアは、特徴ベクトルの点の集まりです。そのベクトルの集合同士の距離を測るのに「最適輸送」が使える、点の集まり同士の似ている度合いを測れる、ということだと理解しました。(違っていたらすみません)
一般的には、各ベクトル間の平均距離やコサイン類似度の和を使って意味距離を測っていますが、集合同士の距離を測れる「最適輸送」を用いることでRAGの改善が想像できます。

現在のHeatWaveには(ドキュメントベースでは記述がないので)最適輸送ベースの機能は実装されていないようですが、今後に期待ですね。
※距離関数は、COSIN/DOT/EUCLIDEANが用意されています。

以上、簡単かつ地味ですが、イベント参加レポでした。
(写真を撮らなかったので、ちょっと後悔してます)

私の日常業務では深く技術に入ることがないのでとても刺激になりましたし、HeatWaveがデータAIプラットフォームとして進化してゆくのが楽しみです。

関連記事

TOP