Method of Complex Event Processing over XML Streams

Full text

(1)XML ストリームのための複合イベント処理方式 Method of Complex Event Processing over XML Streams 内田友樹 Yuki Utida 法政大学大学院情報科学研究科情報科学専攻 E-mail: [email protected]. Abstract This paper describes a query processing engine for multiple XML streams, in which series of correlated data continuously come. First, this paper formulates stream processing in algebra expressions, in which stream filtering, union, activation, decomposition and partition are formally modeled. Second, this paper designs a query language, called QLMXS, over XML streams for CEP. The QLMXS supports all functions of the algebra expressions in a SQL-like form. Finally, QLMXS queries are converted into a visibly pushdown automaton, called VPA, which analyzes complex event data from the XML streams. The VPA engine is required to concurrently process multiple XML data in multiple levels, so that it is very important to tune the performance of the engine up. Therefore, this paper proposes four optimization methods to improve the performance, utilizing VPA and XML features. They are VPA-state reduction, VPA unification, delayed evaluation and elimination of superfluous XML processing. Experimental results showed that the VPA unification makes the processing speed of VPA engine 1.6 times faster and the total performance reaches that speed 2.6 times faster.. 1. はじめに近年，高速ネットワーク技術の発達により時々刻々と変化する大規模な情報をリアルタイムに取得し，活用できるようになった．次々と流れてくるデータはストリームデータと呼ばれ，リアルタイムに高速処理・分析して価値を見出す CEP(Complex Event Processing)技術に注目が集まっている．一方，Web サービスの普及に伴い，インターネット上でのデータ交換フォーマットとして XML が用いられるようになってきた．XML とは，タグを用いた文書データの構造化のための汎用フォーマットであり，個々のデータの属性や論理構造をタグの中に容易に表現できる．現在，株価情報，気象情報，センサ等のデータが XML ストリームとして扱われており，これを高速に処理するための CEP エンジンが求められている． XML ストリームを扱うシステムとして，複雑な要求に応えられる VPA(Visibly Pushdown Automaton)[2]ベースの XSeq[1]が提案され，時系列を組み込んだ検索の効率的な Supervisor: Prof. Satoru Fujita. 実行が報告されている．しかし，単一のストリームしか扱うことができず，複数のストリームにまたがる複雑な検索を行うことができない．現在のインターネットは様々なデータソースが存在し，それらを組み合わせた情報抽出が必要になってくる．そこで本稿では，このような複数の XML ストリームデータに対して検索を行うために QLMXS(Query Language for Multiple XML Streams)と呼ばれる問い合わせ言語を設計した[4,6]．そして，VPA をベースに，QLMXS の検索エンジンを開発した[5,7]．一つの検索要求から複数の VPA が生成されることがあり，検索エンジンは，このような VPA の組み合わせを高速に実行することが求められる．そこで VPA の特性を生かしたエンジンの最適化や高速な処理アルゴリズムについて検討を行った．第 2 章では関連する基盤技術について説明し，第 3 章では想定するマルチストリーム処理について説明する．第 4 章では QLMXS 言語の仕様を述べ，第 5 章では QLMXS の VPA 変換手法を説明する．第 6 章では QLMXS エンジンの構成と実装について説明し，第 7 章では検証実験によるシステムの性能評価を行う．そして，第 8 章で考察を述べ，最後にまとめを述べる．. 2. 関連する基盤技術 2.1. CEP CEP とは，連続して発生するストリームデーダを高速に処理・分析して新たな情報を見出すための複合イベント処理技術である．ストリームデータはデータ容量や発生タイミングの予測が難しい，蓄積しようとすると大容量になる，様々なデータ構造を持つという特徴を持つ．発生したデータを即時に解析することが求められるため， CEP では予めデータ形式に合う分析エンジンを作成し．流れてくるストリームデータに対して特定の条件を満たした時にイベントを発生させたり，データを抽出する必要がある．従来のデータベースが蓄積したデータに対してクエリを適用する方式であるのと違い，逐次発生するストリームデータに対して，登録したクエリを事前にコンパイルして作成したエンジン上で継続的なクエリ適用が行われるため，低遅延で処理結果を取得することが可能となる．さらに，近年ではネットワーク技術の発展とコンピュータの性能向上により，複数のストリームデータを同時に処理することが可能になり，単純な処理だけでなくリアルタイムに複雑な組み合わせの分析が可能となってきている．.

(2) 2.2. Cayuga Cayuga[3]は，複数のストリームデータのイベントをまとめて単一イベントのように扱える CEP を意識した SQL ライクな言語である．Cayuga には，単純なパターンのクエリを組み合わせて複雑なパターンのクエリを構成するためのオペレータが備わっている．代表的なオペレータとして NEXT と FOLD があり，検索例は以下の通りである． Example2.1．SELECT Name FROM (SELECT Price FROM Stock) NEXT {$1.Price = $2.Price} (Stock2) Example2.1 は，Stock と直後の Stock2 の売値が等しい時にそれぞれの銘柄を組み合わせて出力するクエリであり，複数のストリームに跨るイベント処理を実現している． Example2.2．SELECT * FROM FILTER {cnt > 10} {SELECT *, 1 AS cnt FROM FILTER {Volume > 10000} (Stock)) FOLD {$2.Name = $.Name, $2.Price > $.Price, $.cnt+1 AS cnt } Stock) Example2.2 は，特定の銘柄の株価が 10 回連続で上がった時の株情報を出力するクエリであり，シーケンシャルなイベント処理を実現している．. 2.3. XSeq XSeq は XML ストリーム向けの CEP であり，時系列イベントの処理が可能である． XML 向け検索言語では XPath や，XQuery が有名であるが，複雑なパターンを伴う CEP アプリケーションには適さない．そこで XSeq では XPath を拡張し，クリーネ*と兄弟関係を明示的に表す \ オペレータを追加し，シーケンシャルな検索を容易に行えるようにした．Xseq の検索例は以下の通りである． Example2.3．return last($Y)@price from /stocks /$Z (\$X)* (\$Y)* where tag($Z) = ‘transaction’ and tag($X) = ‘transaction’ and tag($Y) = ‘transaction’ and $X@price < prev($X)@price and $Y@price > prev($Y)@price partition by /stocks/transaction@company Example2.3 は，特定の銘柄の売値が V 字回復した時の売値を出力するクエリであり，兄弟間での条件の変更や連続する兄弟に対する条件を実現している． XSeq では，エンジンのベースとして 2.4 節で説明する VPA を利用している．VPA は Xseq における複雑なクエリを表現することができ，最適化を施しやすい．Xseq クエリを VPA に変換して検索エンジンを生成する際に，クエリからの推論できる接頭辞のカット，VPA の非決定性の除去，状態数の削減を行うことで高い処理性能を実現. している．しかし，マルチソースから来るデータを組み合わせて検索するような複数のストリームに跨る検索はできない．. 2.4. VPA VPA はプッシュダウンオートマトンの制約を強めたものであり，スタック操作がプッシュ，ポップ，インターナルの 3 種類に分かれていることが特徴である．スタック操作が明確化されたことにより，VPA は，和集合，積集合，補集合，連結，クリーネ*に対して閉じた性質を持っている．このため，有限状態オートマトンと同等の最適化を行うことが可能である．また，スタックの特性を活かし，XML，JSON ファイルのような入れ子構造のデータ解釈を容易にモデル化することができるため XML を効率的に処理することができる．. 3. マルチストリーム処理 XML ストリームとして流れてくるデータの内容，構造，流れてくるストリームの件数．送り元，出力先は様々であることが想定される．本稿では，マルチ XML ストリームに必要となる基本処理モデルを代数表現として表わすことを提案する． (1) Filtering 流れてきたストリームデータに対して特定の条件でフィルタリングし，新たなストリームとして出力するという最も基本となるモデルである．ストリーム:s に対してフィルタ:f をかけて s’ として出力する処理は，以下のように記述する. s | f >> s’ (1) (2) Union 2 つのストリームの中のデータを別のストリームにまとめて出力するモデルであり，2 ストリームを合流・結合させる. この処理は結合演算子「+」を用いて以下のように記述する. s1 + s2 >> s3 (2) 結合演算では交換法則と結合法則が成り立つ． (3) Activation あるストリームのイベントが別のストリームのイベント処理を呼び起こし，結果を合流させるモデルである．この処理は合成演算子:「*」を用いて以下のように記述できる. s1 * s2 >> s3 (3) 合成演算では, ストリームデータの到着順序は s1 が先, s2 が後という意味が含まれているため, 交換法則や結合法則は成り立たない．複合イベント処理における重要な処理モデルである． (4) Decomposition 大量の件数の XML を 1 件ずつに分割して出力するモデルである．ストリーム中のデータを, 指定されたキー単位で分割し, 新たなストリームに出力する. キーは XML においてはタグに相当するものである. 例えば, ストリームデータを，‘key‘をキーとして分割し出力する処理は分割演算子:「/」を用いて以下のように記述する. s / key >> s’ (4).

(3) Example4.1．return select from where. 図 1 QLMXS の処理フロー (5) Partition ストリームを特定のキーの値を持つレコード毎に分割し，ストリーム配列として出力するモデルである． ‘key‘をキーとして処理する場合は以下のように記述する． s[key] >> s’[] (5) 特定の値を持つストリームを抽出する場合は，以下のようにキーの値を指定してシングルストリームを生成する． s’[key=’value’] >> s’’ (6). 4. QLMXS 4.1. QLMXS 概要 3 章の代数的表現に基づき，マルチ XML ストリーム向けの問い合わせ言語 QLMXS を設計した．提案する QLMXS の処理フローを図 1 に示す．次々と流れてくる XML ストリームデータは QLMXS エンジンで処理され，処理・分析結果を下流に渡す．QLMXS エンジンは検索エンジンのベースとして VPA を用いている．処理の流れとしては，まず，マルチ XML ストリームに対応した問い合わせ言語 QLMXS クエリを解釈して VPA を生成し，生成した VPA を用いてエンジンを作成する．次に作成したエンジンを用いて，XML ストリームをフィルタリング，整形し，解析結果を出力する．図 1 のように，単一だけでなく，複数の入力ストリームを融合して出力を得ることも可能である．内部では，複数の VPA エンジンが動いており，それぞれの VPA の結果を，別の VPA の入力として処理するという動作が可能である．. 4.2. QLMXS の言語仕様提案する問い合わせ言語である QLMXS は SQL や XPath，XSeq，Cayuga を参考にしており，SQL ライクに検索要求が記述できるように設計されている．また， XML ストリームデータから単純なデータの検索と抽出を行うだけでなく，複数の XML に跨って解析を行うための複雑な条件記述が行える． QLMXS のクエリは基本的に, ストリームの出力先を指定する return 節, 細かい出力形式を指定する select 節，検索対象・条件や入力ストリームを指定する from 節 , 検索対象・条件を指定する where 節の 3 節から成り立つ. 詳しい記述方法に関しては, 具体的な例を挙げながら説明する．例として, 株式売買システムより各時刻における各企業の株情報が XML ストリームデータとして流れてくるような状況を想定する.. MyStock2 stocks/stock/price MyStock stocks/stock[price/text()>=100 and @name=’A’]. Example4.1 は，流れてきた株情報から売値が 100 以上で且つ銘柄が A であるようなデータを新たなストリームとして出力するクエリである．1 行目の return 節の中では，前述した通りストリームの出力先を MyStock2 として指定している．select の後の stocks/stock/price は出力形式を XPath 形式で指定している． 3 行目の from 節では， MyStock を入力ストリームとして指定している．4 行目の where 節では，そのストリーム中のデータに対するフィルタ条件を XPath 形式で指定している．即ち， Example4.1 は MyStock ストリームの中から stocks タグの子タグである stock タグのさらに子タグに price タグが存在し且つそのストリームの price タグの値が 100 以上且つ stock タグの属性 name が’A’である時，price タグ内のデータを抽出し，MyStock2 ストリームとして出力する． Example4.2．return MyStock2 select stocks/stock from ( select stocks/stock from MyStock where stocks/stock[@name=’A’] ) where stocks/stock[price/text()>=100] Example4.2 は，MyStock ストリームから銘柄が A であるものを抽出したストリームから，売値が 100 以上のものを抽出し, MyStock2 ストリームとして出力するクエリである．4 行目から 6 行目までが内包された QLMXS クエリであり，このクエリによる出力ストリームを入力ストリームとして 1,2,3,7 行目のクエリが処理している．記述方法に関しては，上記のように括弧の中に記述する．この記述は，Example4.1 に比べて冗長であるが，記述の簡便性のために，仕様として採用した．複数の XML にわたって処理を行うためのストリーム処理として，3 章の(3)で述べた Activation 処理を実現する場合，chaining 節を利用する．使用例を Example4.3 に示す． Example4.3．return MyStock2 select mystock[$1/stock, $2/stock] chaining Stock1, Stock2 where [$1/stock/price/text() = $2/stock/price/text()] Exmaple4.3 は，2 つの株情報ストリームである Stock1 と Stock2 から，売値が等しいものを１つのデータにまとめて新たなストリームとして出力するためのクエリである． chaining 節では 2 つの入力ストリームを指定しており，先に書かれている Stock1 が後に書かれている Stock2 のストリーム処理を呼び起こす形になっている．また，select 節では MyStock2 に出力する XML の形式を指定しており，.

(4) Exmaple4.3 の場合は mystock がルート要素，その下に Stock1 と Stock2 の stock 以下の要素に格納されている XML 構造が出力形式になっている． 1 入力目である Stock1 に対するパスを記述する際は$1 を，2 入力目である Stock2 の場合は$2 をそれぞれパスの先頭に加える必要がある．where 節に書かれている$2 の売値は時系列的に見ると$1 の直後に流れてきたストリームデータである．すなわちこのクエリでは，Stock1 ストリームで売値が流れてきた直後に一度だけ Stock2 ストリームの売値を参照し，一致していれば出力形式にそって出力する．さらに，QLMXS では，while 節や processing 節を用いて，指定した時間の間繰り返すような処理を記述できる．例を Example4.4 に示す． Example4.4．return MyStock3 select mystock[$1/stock, @ave = $sum div $cnt] chaining Stock1, Stock2 setting $sum = 0, $cnt = 0 processing $sum = $sum + $1/stock/price/text(), $cnt = $cnt + 1 where [$1/stock/volume/text() >= $2/stock/volume/text()] while 10min Example4.4 は Stock1 の取引量が Stock2 の取引量よりも高くなっている間の Stock1 の平均売値と，低くなった直後の株データを抽出するクエリである．setting 節では変数宣言を行うことができ，processing 節では where 節の条件が満たされたときに実行される処理を記述できる． while 節では最大処理継続時間を記述することができ，処理が開始されてから指定された最大処理継続時間を超えた場合は処理を終了する．以上，QLMXS を用いたストリーム処理例を挙げたが， 3 章にも述べた(4)Decomposition，(5)Partition や QLMXS で可能な再帰処理を合わせて用いることで，さらに複雑な処理を行えると共に，多様な構造である XML ストリームデータに対して対応が可能となる．. 5. QLMXS の VPA 変換 5.1. XML 処理と VPA 2.4 節で述べた通り，VPA はスタック操作がプッシュ，ポップ，インターナルの 3 種類に明確に分かれており， XML のような入れ子構造のデータをモデル化することができる．よって，XML のタグを辿りながらリアルタイムに分析するストリーム処理に最適である． XPath 表現のクエリからの VPA への変換は比較的少ない状態数におさまり，VPA を状態遷移図として視覚化することで処理の流れを容易に確認することができる． VPA はスタックを一つ持ち，遷移時にスタックトップを参照しながら遷移先を決定する．そのため, VPA を生成するためには, 状態の集合や遷移するためのシンボル集合, 遷移時にスタックに格納されるシンボルの集合, そして遷移関数が分かれば良い．基本的にはクエリ中のパス指定の箇所を解釈し, どのタグが親子関係であるかを判別することで，VPA 生成に必要な情報を構築していく．. 図 2 QLMXS の VPA 変換例 VPA で XML を処理するには，プッシュ遷移関数にオープンタグ，ポップ遷移関数にクローズタグ，インターナル遷移関数に属性とキャラクターの処理を対応付ける．そして，オープンタグが来た時にスタックに積み，そのクローズタグが来た時にスタックから取り出す処理を行うことで XML の階層レベルに沿った正確な処理を実行できる． /articles/article[initPage/text() = 100]を例として VPA の生成手順を図 2 に示す．これは，articles タグの下の article タグの下の initPage タグの値が 100 である時，article 要素を XML ストリームとして出力する単純なクエリである． /articles を 1 ステップとすると，1 ステップ毎に状態が 1 つ生成される．この例は 3 ステップであるため，初期状態と合わせて 4 状態が生成される．article の一つ下の initPage タグの中の text 値を取得し，initPage タグを含む article のクローズタグが来た時，このクエリの条件が成り立っているかを判別する．図 2 の状態 q1 の自己ループ else は，目的以外の article タグで次の状態に遷移しないようにスタック操作を行うことで階層レベルを合わせる．この else 操作においてもオープンタグ，クローズタグ，属性，キャラクターをそれぞれ入力として処理しており， *を任意なタグだとすると，実際には<*>, S / XS，<*>, X /XX， </*>, X /ε等の遷移関数が存在する．クエリである 4.2 節の Example4.3 にある Activation 処理を行う場合，Stock1 用 VPA と Stock2 用 VPA を生成する．これをそれぞれ$1.VPA，$2.VPA とする．このクエリでは， Stock1 ストリーム stock/price が来た直後の Stock2 ストリーム stock/price と比較して，等しいならばデータをまとめて出力処理を行う．このため，Stock1 ストリームの stock/price が来るまで，$2.VPA を動作させる必要はない．よって，Stock1 で price を持つ stock を見つけた時初めて，$2.VPA を起動するとともに，蓄積した XML キャッシュと price 値を送り，そのデータを基に $2.VPA で where [$1/stock/price/text() = $2/stock/price/text()] の判定を行う．そして，条件を満たしているならば，送られてきた XML キャッシュと$2.VPA の方で蓄積したキャッシュをまとめて最終的な出力とする．その後，VPA を再び停止することで，Activation 処理を実現する．. 6. QLMXS 検索エンジンの実装 6.1. QLMXS 検索エンジン QLMXS 検索エンジンでは，リアルタイムに高速な解析を行うために，事前に問い合わせ言語 QLMXS を基に VPA ベースの解析エンジンを生成する．さらに高速化の.

(5) 図 3 QLMXS エンジンの実装ための最適化を施し，各 VPA エンジンを組み合わせてマルチ XML ストリームデータに対して複雑な解析を行う． QLMXS 検索エンジンの実装とストリーム処理の流れは図 3 の通りである．このエンジンでは，一つのストリームの処理が終わり次第，次のストリームの処理を開始する．マルチストリーム処理を実現するため，ストリームの時刻管理が重要になる．そのため，入力される XML ストリームは，大きなシングルキューで管理することで，次々と送られてくるストリームを容易に正確な時刻順に並び替える．そして，キューから出てくるストリームをディスパッチャにより，適切な VPA エンジンに振り分ける．各 VPA エンジンでは，受け取った XML ストリームをフィルタリングして出力するが，出力結果を XML ストリームとすることで，その結果を再び VPA の入力とすることが可能となる．その際に，ストリームはキューの一番後ろに挿入されるが，自動的にキュー内部で正確な時刻順に並び替える．この QLMXS 検索エンジンを構成するモジュールについて以下にまとめる． (1) XML ストリーム解析対象となる XML ストリームで，タイムスタンプ，ストリーム名，XML の実態を格納している．タイムスタンプはエンジンにストリームが到着時の時刻を記憶しており，時刻管理のために利用する．また VPA から出力されるストリームには解析対象のストリームのタイムスタンプをそのまま付与する． (2) キューストリームがインキューしたタイミングで，ストリームに含まれるタイムスタンプを利用し逐次並び替える．再帰的な処理を行う場合には VPA から出力されるストリームをそのまま次の VPA に流すのではなく，一旦キューに入れ直すことで，時系列が保証される．この時には，処理順を保証するためにキューの先頭に挿入する． (3) ディスパッチャキューから送られるストリームを VPA に振り分けるために利用される．ディスパッチャの生成はエンジン生成時に行い，各 QLMXS クエリの from 節に従い生成される． (4) StAX パーサ XML ストリームを上から順にノード毎に分割するためのパーサである．QLMXS エンジンには StAX パーサがただ一つ存在し，解析したノードをディスパッチに従い，順番に VPA エンジンに送る．. (5) VPA エンジン事前に QLMXS クエリを解釈して VPA に変換し，高速化のための最適化を施して，VPA エンジンを作成する． StAX パーサより送られてきたノードに対して逐次操作を行い，検索要求通りの順番に流れてきて，かつ，条件を満たした時に処理結果を XML ストリームとして出力する．各 VPA エンジンは他の VPA エンジンに干渉することができ，データのやり取りやアクティベート操作が行える． VPA での解析にはスタックを一つ持つトークンを利用する．オペレータを持った遷移関数を見ながら状態遷移を繰り返し、スタック操作や XML のキャッシュ、そして条件判定等の操作を行うことで XML を解析する。そのため，トークンはスタックだけでなく，レジスタ， XML キャッシュレジスタの機能を持つ．基本的に、ノードの数だけトークン操作は行われ，トークン操作数がエンジンの処理速度に大きく影響を与える．. 6.2. エンジンの最適化 QLMXS エンジンでは大量に送られてくるデータをリアルタイムに処理しなければならない．そのためエンジンの最適化をいくつか実装する． 6.2.1. VPA の状態数の削減 XML スキーマが利用可能な場合，条件や操作等で参照されていなく，加えて，下位の状態から常に予測できる上位のパス表現から生成された状態を VPA から削除する．これにより削除した部分でのトークン操作を行う必要がなくなるため大幅な高速化を図ることができる． 6.2.2. VPA の合流 1 つのストリームに対して複数の問い合わせを同時に処理したい時に，解析エンジンでは複数の類似した VPA を並行して処理する必要がある．各 VPA の処理には共通状態・遷移が存在し，この共通状態を合成した新たな VPA を作成することで最適化できる．これにより，トークンの無駄な重複操作が減り，VPA のスケーラビリティが向上する． 6.2.3. 遅延評価 QLMXS から生成される VPA では，条件評価対象の要素が見つからない時は，検索条件が満たされることはない．そこで，順次トークン操作を行わずに，ノードを一旦キューにためておき，対象の要素の入力が確認できたとき，はじめて，キューのノードを利用し、トークン操作を開始することができる．それ以外の場合，トークン操作は行わない．この処理は，XML の構造が規則的でない場合に有効である． 6.2.4. 不要ノード処理の簡略化クエリのパス表現に含まれないノードは通常は操作，条件等にも使わない不要ノードである．そこで， QLMXS エンジンでは通常一つ一つのノードに対して操作を行うが，連続する不要ノード処理については文字列のまま読み飛ばし，トークン操作を簡略化する．.

(6) 7. 実験 6.2.2 で述べた複数 VPA の合流を行うことによる効果を実験により検証する．実験環境を表 1 に示す．表 2 の問合せ Q1 と Q2 を VPA に変換し，解析エンジンにより並行に処理した時と，Q1 と Q2 の VPA の共通状態を一つに合成したもの(問い合わせ式では Q3)を処理した時，そして 6.2.1 および 6.2.4 で述べた最適化をした時の速度比較を行う．図 4 の実験結果より，データ容量 467KB 時では，共通状態を合成した Q3 は，Q1+Q2 より 38%の処理時間が減少した．これは Q1 と Q2 が/articles/article を共通部分として持ち，通常各 VPA にそれぞれノードを作り逐次トークン処理する所を，VPA の合流によりトークン操作数を半分にし，処理時間が大幅に短くなったためである．次に 6.2.1 の状態数削減を行った Q3(6.2.1)では，9%の処理時間が減少した．最後に 6.2.4 の不要ノード処理の簡略化を行った Q3(6.2.4)では，37%の処理時間が減少した．検索クエリが局所的なものであればあるほど操作不要ノードは増え，トークン操作数は減り高速になる．このことは表 3 の各トークン操作回数の差に顕著に表れており，図 4 と合わせてみることでトークン操作数が速度に影響を与えていることが分かる．また，XML のデータ容量が大きくなればなるほど最適化前との処理時間の差は大きくなることが示された．. CPU メモリ XML. 問合せ Q1 Q2 Q3. 表 1 実験環境 Intel(R) Core(TM) i5-2500K 3.3GHz x 4 8GB SIGMOD Record. 表 2 問合せセット問合せ式 /articles/article[initPage/text() > 50] /articles/article[endPage/text() < 100] /articles/article[initPage/text() > 50 or endPage/text() < 100]. 表 3 データ容量 467KB 時のトークン操作回数 Q1+Q2 Q3 Q1+Q2 Q3 Q1+Q2 Q3 (6.2.1) (6.2.1) (6.2.4) (6.2.4) 69652 34826 69384 34692 24332 15174. 8. 考察本稿は QLMXS 及びその処理エンジンについて述べてきた．QLMXS は Activation 処理モデルを利用することで， Cayuga の NEXT オペレータを利用したマルチストリーム処理と同等の記述ができる．そして，VPA を対応させることで自動的にエンジンをできる．また，汎用クエリモデル設計の Cayuga に比べ，XML に特化した QLMXS は， XML ストリーム解析に適している．そして， QLMXS 検索エンジンは遷移関数に優先度を付与することで，エンジンレベルで VPA の決定性を実現しており，クエリからの VPA 生成で非決定性が生じる XSeq に比べ，基本処理速度が高い．また，複数の VPA を連携する処理モデルを確立することで，XSeq では行えないマルチ XML ストリームに対する分析が可能となり，QLMXS は XML 向け CEP に非常に適している言語と言える．しかしながら， XSeq の持つクリーネ*や兄弟を表すオペレータがないため，単調増加・減少は検出できるが，V 字回復等を検出できないため，シーケンシャルな解析に制限がある. 9. まとめ本稿では，QLMXS 検索エンジンの実装と VPA の最適化について述べた．そして XML を扱う上での QLMXS と VPA の特性に合わせた効果的な最適化を実現した．そして実験により大幅な速度向上を確認した．今後の課題として，本稿では触れていない VPA の特性を生かした最適化を進めることによるエンジンの高速化と，実験で扱ったような単純な検索だけではなく， QLMXS で要求されるストリーム分割や複数の VPA を連. 図 4 速度比較実験結果携させる等のエンジン全体で見た時の高速化を進めたい．. 文献 [1] Mozafari B., Zeng K., Zaniolo C., "High-performance complex event processing over xml streams", Proceedings of the 2012 ACM SIGMOD International Conference on Management of Data, pp.253-264 (2012). [2] Alur R., Madhusudan P., "Visibly pushdown languages", Proceedings of the thirty-sixth annual ACM symposium on Theory of computing, pp.202-211 (2004). [3] Demers A., Gehrke J., Panda B., Riedewald M., Sharma V., White W., "Cayuga: A General Purpose Event Monitoring System", CIDR, Vol.7, pp.412-422 (2007). [4] 松田達希, 内田友樹, 藤田悟, “XMLStream 向け検索言語からの VPA の生成”, 第 13 回情報科学技術フォーラム, pp.147-148 (2014) [5] 内田友樹 , 松田達希 , 藤田悟 , “ VPA を用いた XMLStream 向け CEP エンジン”, 第 13 回情報科学技術フォーラム, pp.149-150 (2014) [6] 松田達希, 内田友樹, 藤田悟, “XMLStream 処理のモデル化と検索言語の設計”, 情報処理学会第 77 回全国大会, 5M-05 (2015) [7] 内田友樹, 松田達希, 藤田悟, “XMLStream の時系列イベント処理の性能評価”, 情報処理学会第 77 回全国大会, 5M-06 (2015).

(7)

No results found