アルファマイナー。プロセスマイニングのモデル構築の分析





アルファアルゴリズムは、プロセスログからいわゆるワークフローネットを見つけることを可能にした最初のプロセス分析テクノロジーです。このアルゴリズムは、プロセスマイニング手法の創設者であるWill MP van derAalst教授によって2013年に開発されました。



ワークフローネット(以下WF)とは、ペトリネットをベースに構築されたネットワークです。重要なのは、ペトリネットワークに基づくWFを使用すると、ワークフローを提示してさらに分析できることです。



WFの特徴的な機能は次のとおりです。



  1. 明確なスタート。(すべての一連のアクションのみをトリガーする独自のアクション)
  2. クリアエンド(すべてのアクションチェーンのみを終了する一意のアクション)
  3. 個々のアクションは項目1の間にあります。および項目2。


いくつかの例を見てみましょう。











これらのスキーマはWFではありません。どうして?最初のケースでは、チェーンの開始と終了がありません(これらは円で示されています)。 2番目のケースでは、アクションdに終わりはありません。



以下に、正しいWFネットワークの例を示しました。開始と終了があり、すべてのアクションはそれらの間にあり、完了しています。







WFとは何かを少し明確にしたので、アルファアルゴリズムに移り



ましょう。アルファアルゴリズムを使用してWFを取得するには、ログに整理する必要があります。これを行うために、イベントログの遷移間に次の関係を定義します(後でモデルを構築するために必要になります)



。1。直接シーケンス。

イベントA>イベントB。

実際のイベントログでは、次のようになります。







2.因果関係。

イベントA→イベントB。

イベントログにそのような遷移があることを意味します







が、そのような遷移はありません:







したがって、図に記号を付けます







  1. 並列イベント。

    ログには、イベントA→イベントBとイベントB→イベントAの両方の遷移が含まれます。
  2. 一貫性の欠如。

    イベントA#イベントBおよびその逆。これらのイベントはログに表示されません。


すべての遷移に共通のデータセットはLセットと呼ばれます。



小さな例を見てみましょう。以下は3つのケースのログです。







アルファアルゴリズムで使用されるログからのリンクを書いてみましょう。



  1. > ,

    > ,

    > ,

    > ,

    > ,

    > ,

    >
  2. → ,

    → ,

    → ,

    → ,

    → ,

  3. ||


得られた関係に基づいて、WFを描画します。







結果のモデルはログのすべてのアクションをカバーし、分析が簡単です。



アルファアルゴリズムの制限。



ログにシングルループまたはダブルループ(アクションの繰り返し)が含まれている場合、アルゴリズムは誤って解釈し、予想とは異なるモデルを生成する可能性があります。以前のログに戻って、繰り返しを追加しましょう







。予想されるモデルは次のようになります。







ただし、アルファアルゴリズムでは、まったく異なる図が得られます。







理由は何ですか? 「アプリケーションの処理」アクションには、開始も終了もありません。モデルを生成するプロセスでは、セットA(すべての開始点)とセットB(プロセスの終了点)が作成されます。複数回繰り返すと、データセットが表示されなくなるため、アルゴリズムはそれらを見つけることができません。したがって、このアクションは一般的なモデルから外れます。



同じ状況は、2つのアクションが連続して繰り返される場合にも発生します。 Alphaアルゴリズムは、そのうちの1つだけを残し、2つ目はドロップアウトして、モデルを解釈できなくなります。



この問題はどのように解決できますか?分析しているシステムの機能を可能な限り考慮する必要があります。システムが要点だけでなく、自動的に生成されるアクションもログに書き込む場合(たとえば、手書きの場合、システムは5秒ごとに自動保存してログに書き込むことができます)、これらのアクションを1つの要素に組み合わせるのが理にかなっています。



All Articles