こんにちは。

私たちはAdvancedAnalytics GlowByteチームであり、クレジットリスク管理のモデリングに関する一連の記事を発表しています。このサイクルの目的は、この分野について簡単に話し、専門用語の語彙を増やし、有用な記事や本へのリンクを提供することです。紹介記事では、主題分野を深く掘り下げることなく、信用リスクの分野でのMLとDSの適用の特徴を示します。

次に、クレジットリスクのコンポーネントを使用したモデリング手法の問題と、銀行でのモデルの運用の詳細を考慮したキャリブレーションと検証のアプローチについて説明します。

出版物の基礎は、銀行部門における分析モデルの開発と実装における私たちのプロジェクトの経験です。

そして今、猫の下に。

リスクは何ですか？

簡単に言えば、信用リスクとは、顧客がローン契約に基づく資金の支払い条件に違反するリスクです。

信用リスク管理の枠組みの中で生じる3つの課題に焦点を当てます。

評価モデリング;
クレジットオファリング;
予想損失のレベルの計算。

なぜ正確にそれらに？

これらのタスクは常に金融機関に関連しています。
それらは他の産業（テレコム、産業、保険）に移すことができます。
MLおよびDSメソッド用に十分なスペースがあります。

金融機関のリスクの一般的な分類と状況については、レビュー[1]を参照してください。

みんなのパイプ（パイプライン）またはクレジットプロセスのスキーム

概略的には、クレジットプロセスは次のようになります。

申請から発行までのこのプロセスの一部は、クレジットコンベヤーと呼ばれます。このスキームには単純化があります。たとえば、1つのローン商品のフレームワーク内のプロセスを検討します。マーケティングの問題（マーケティングの最適化、製品の共食い、顧客離れなど）は括弧の外にあります。事前スコアリング、専門家による評価の調整、およびアンダーライターによるストップファクターの適用のプロセスは、パイプラインから除外されます。ストップファクターとは制限を意味し、その性質はまず第一に、銀行がクライアントに提供する製品の構造にあります。例としては、破産者のリストへのクライアントの入力や、他の銀行での滞納ローンの存在があります。

評価モデリング

評価モデリング（RM）のタスクは、後続のランク付けのために顧客評価モデルを構築することです。格付けは、信用力の低下、破産など、さまざまなネガティブな出来事に関連して行われます。

コンテキストに応じて、このタスクはさまざまな方法で分類できます。顧客のライフサイクルの段階ごと

：

アプリケーション（適用）スコアリングは、新規クライアントまたは金融会社内の小さな（または長年の無関係な）履歴を持つクライアントに使用されます。このような格付けモデルの構築では、クライアントのプロファイルとプロファイル、他の金融機関での支払い行動に関するデータ（信用履歴局で入手可能）、およびさまざまなリストの入力に関するデータ、たとえば、法人向け中央銀行のネガティブリストが重要です。アプリケーションスコアリングは、申請者にローンを付与するかどうかを決定するために使用されます。
. — -. , .

«» : ( ) , .
«» : . , , , .

«» . . .
«» . ( ) . — Z-score [2].

Stand-alone — , . — . , .
«Supply chain finance» — . , , , ( ) . , — , [3].

: , , . — , ( , ).
, .. . , .. .

最初の近似でこの問題を解決することの特徴は、[1]、[4]、[5]、[6]にあります。サイクルの次の記事で、開発方法論に特化した設計機能について説明する予定です。

関連するタスクの中で、クレジット提供のタスク（以下を参照）と、スコアリングスコアに基づいてカットオフしきい値を選択するタスク（承認しきい値を決定する）について言及する価値があります。後者の問題はこの記事では取り上げていませんが、最先端のMLアプローチのためのスペースが含まれています。たとえば、RL [7]を使用する試みがあります。

また、開発された評価モデリングモデルの品質を向上させるための現在の傾向についても簡単に説明する必要があります。

/ (, - [8], . [9], )
( XGBoost );
( ) (text-mining);
( pipeline ---) , .. ModelOps [10].

レーティングモデリングは、独立したタスクとして、また他のタスクと連携して、ますます遭遇することが少なくなり、より一般的な問題を解決するための応用アプリケーションの一部となっています。これらの1つはクレジットオファリングです。私たちはそれに行きます。

クレジットオファリングまたは拒否できないオファーの作成方法

評価モデルの結果（デフォルトの確率の推定値の絶対値-PD）を使用して、クレジット提供の問題を解決できます。クレジットオファリングとは、まず第一に、クライアントの初期制限を設定するタスクを意味します。

もちろん、PD値（デフォルトの確率の予測）だけでは、最適な制限を決定するのに十分ではありません。顧客に提供するのに合理的な制限値の許容範囲を理解する必要があります。これは、金額がクライアントのニーズと債務を処理する能力を少なくとも間接的に反映するために必要です。

この場合のベンチマークは、たとえば、クレジット以外の製品に対するクライアント自身の資金の売上高である可能性があります。

他に何を知る必要がありますか？問題をよりよく理解するために、あなたはローンの費用の構造のアイデアを持っている必要があります。これは、次の図（[11]でのぞき見）に概略的に表されています。

「リソース」-貸付が実行される費用の金額（たとえば、預金者のお金を引き付け、必要な資金供給を提供する預金のレート）。「マージン」-ローンからの期待利益。「リスク」-ローンのデフォルトの場合の控除。「費用」-魅力とメンテナンスの費用。

このフレームワークでは、評価モデリングを使用して、リスクブロックのサイズと構造を決定できます。「リソース」は、主に中央銀行のキーレートによって決定されます。「コスト」と「マージン」は製品コンポーネントであり、多くの場合、製品パスポートに示されています。

言い換えれば、「リスク」は、取引の最終的な収益性に影響を与える要素の1つにすぎません。

他の人はどうですか？最適化の問題が発生しているようです。それを形式化してみましょう。多くのオプションがあり得ることを強調する必要があり、まず第一に、ビジネスタスクと開発プロセスのコンテキストに依存する価値があります。

簡単なオプションから始めて、ソリューションの潜在的な開発ポイントを示しましょう。取引の収益性を最適化する最も簡単な方法

金額L（限度額）のローン契約を発行させてください。この契約には、デフォルトPDの予測確率があります。最初の概算として、デフォルト時のクライアントの負債がLに等しいと仮定します。

その場合、最適化の問題は次のようになります。

PDは固定されており、Lへの依存性は線形であることがわかります。最適化するものは何もないように思われます。

ただし、実際には、PDは次の理由でLに依存します。制限が大きいほど、債務の返済が難しくなり、したがって、デフォルトの可能性が高くなります。この場合、私たちのタスクは実際に最適化タスクに変わります。ただし、ここにはニュアンスもあります。サンプルには収入の異なるクライアントがいるため、絶対値では不十分です。制限ではなく、債務負担のレベルに依存関係を構築するのが最善です。パラメータ

\frac{L}{Д о х о д к л и е н т а (Д_{к})}

：

中毒

P D (\frac{L}{Д_{к}})

履歴データまたはパイロットデータに復元できます。

また、製品の停止は最適化タスクに影響を与える可能性があります。たとえば、製品パスポートには、リスクレベルの許容限度（デフォルトの確率）が示されている場合があります。その後、最適化は指定された制限までのみ実行されます。

さらに複雑な、興味のある人、そして猫の下：

, (, ) (-, EAD — Exposure at default — ) . , , ( EAD, , LGD – Loss Given Default).

EAD . LGD , (, ..) ( LGD ). 0.9-1.

, PD

\frac{L}{Д_{к}}

. :

, (, ), , :

«» — , «» — . Marketing Optimization.

— . , , , ..

. -.

他に何をググる？キーワードリスクベースの制限、クレジット制限管理の利益ベースのアプローチ。

そのため、お金はクライアントに提供され、与えられます。しかし、それらのいくつかは延滞し始めています。状況を管理する方法は？~~はんだ鉄を取ります。~~エアバッグは予備金の形で回収します。今すぐこれを行う方法を説明します。

リザーブとその計算におけるDSの役割

リスクの大きさを判断することは、銀行の活動において重要です。リスクの欲求に応じて、銀行は、どのクライアントと協力する準備ができているかを判断します。しかし、いずれにせよ、起こりうる損失を最小限に抑えるために、現金準備金は現金または流動性のある証券の形で形成されます。最悪の場合、銀行はポートフォリオ全体を失いますが、これは起こりそうにないため、完全な準備金を持つことはあまり効率的ではありません。ある程度のバランスが必要です。

これを行うには、予約する必要のある金額を正確に決定する必要があります。これは、予想される損失に対する自己資本の十分性（必要な資本）を確保するタスクがどのように表示されるかです。（予想損失-EL）。自己資本比率の要件は、規制当局（中央銀行）によって決定および監視されます。

歴史的参照：

, . . .

, DS ML .

1974 , .

Basel I 1988 . Basel I , 8% , (, – Risk-weighted Assets (RWA)).

, the Basel I Capital Accord RWA, .

	, %
	0
	50
	100

, 100 (-, ):

.. 4.

. : ~~XGBoost~~ , , .

Basel I Basel II. -, Basel II ( ) , , , . Xgboost ML DS.

Basel III . . . [6].

? , , RWA:

1. – . — 590-.

( [12]):

« , 590-, . , , ( ) . .»

.

, 5 , . , (, ), ( ) .

2. (, 483-) PD, LGD EAD.

:

, , , . , , , , data scientist’.

(Expected Loss – EL) (Unexpected Loss – UL).

ルーブルの損失は、次の3つの要素の結果です。

デフォルトの確率（PD-デフォルトの確率）
デフォルト時の支払人の債務額（EAD-デフォルト時のエクスポージャー）、
未払いのままになるこの金額の一部（LGD-デフォルトの損失）。

一般に、この式は次のとおりです。

一連の記事で何度も出くわします。これは、クレジットリスクのプロビジョニングの問題を控えています。

この種のEL（ECL）の分解後、（DSおよびML、こんにちは！））PD（バイナリ分類モデル）、LGD（回帰モデル）、EAD（回帰モデル）の上記の各値をシミュレートすることが可能になります。ここで、コントローラーによって指定された制限内モデリングのさまざまな段階（開発、校正、検証）での要件により、統計的手法と機械学習アルゴリズムを使用できるようになります。

もっと強く愛する人のために：

EL UL (Value at Risk – VaR) – , ( 99%) .

PD, LGD, EAD , .

3. 9. .

9 :

( );
( «Lifetime-» «Lt») PD, LGD, EAD, ; ECL — Expected Credit Losses;
( ).

9 :

9 DS ML-.

?

29.12.2012 N 192- « »
6 2015 . № 483- « »
15 2015 . N 3624- « »
6 2015 . № 3752- « , »
[13].

規則と指示が関係していて、本は読まれました、しかしDSはどこにありますか？約束通り-DSはコンポーネントの~~詳細にあり~~ます。しかし、それはまったく別の話です。サイクルの次の記事では、PD、LGD、およびEADのコンポーネントのモデリングの機能をより詳細に分析します。導入記事の最後に、各タスクのコンテキストでのリスクモデリングの分野への統計的手法と機械学習アルゴリズムの適用オプションを示す表を示します。

	評価モデリング	クレジットオファリング	予想損失のレベルの計算
DS / MLで解決される問題	- 評価アルゴリズムの決定 ; - 承認のしきい値の決定。 -キャリブレーション。	- オプティマイザの開発。 - ローン提案を選択するために使用されるモデルの開発。	-PD、LGD、EADコンポーネントのモデリング。 -キャリブレーション。

結論

私たちのために紹介記事を書いた後の主な結論（abv_gbc、 alisaalisa、 artysav、エイエンコトワル）は次のとおりです。信用リスクの計算で発生する3つの問題でさえ簡単に説明することは非常に困難です。どうして？

これらのタスクのために詳細な方法論が開発されており、MLおよびDSの考え方に適しています。これらの考察は、ますます複雑化する市場の課題に対応するためのアプローチを開発します。このようなアプローチに基づくツールは、補完的なものから、徐々に意思決定の主要なものになりつつあります。これらすべてを組み合わせることで、リスクモデリングのベストプラクティスと直感を他の業界（テレコム、保険、業界）に移転できます。どれ？サイクルの次の記事でお知らせします。

使用用語のリスト

デフォルト-ローン契約に基づく義務の履行の失敗。通常、デフォルトは、90日以内の契約に基づく不払いと見なされます。
PD-デフォルトの確率-デフォルトの確率。
EAD – exposure at default – . , , = + .
LGD – loss given default – EAD, .
EL – expected loss – .
EL – expected credit loss – .
– , .
- – .
SCF – supply chain finance – — - .
RWA – risk-weighted assets – , ; .
(IRB) – , , , .
9 (IFRS9) – , , , .
VaR – , .

[1] Leo Martin、Suneel Sharma、およびKoilakuntlaMaddulety。「銀行のリスク管理における機械学習：文献レビュー。」リスク7.1（2019）：29。

[2] en.wikipedia.org/wiki/Altman_Z-score

[3] www.youtube.com/watch?v=rfCamyEURyw&list=PLLQmSdmAWzkKeiOC1b-nxpoACqgfTc0G5&index=7。[4

] Breeden Joseph 「信用リスクにおける機械学習の調査」。（2020）。

[5]ソロキンアレクサンダー。「ロジスティック回帰モデルを使用してスコアカードを作成する。」科学の科学のオンラインジャーナル2（21）（2014）。

[6] Baesens Bart、Daniel Roesch、HaraldScheule。クレジットリスク分析：SASの測定手法、アプリケーション、および例。 John Wiley＆Sons、2016年。

[7] github.com/MykolaHerasymovych/Optimizing-Acceptance-Threshold-in-Credit-Scoring-using-Reinforcement-Learning

[8] Riskconference.ru/wp-content/uploads/2019/10/%D0%A1%D1%83%D1 ％80％D0％B6％D0％BA％D0％BE_％D0％92％D0％A2％D0％91.pdf

[9] MasyutinAlexey。「ソーシャルネットワークデータに基づくクレジットスコアリング。」Business Informatics 3（33）（2015）。

[10] habr.com/ru/company/vtb/blog/508012

[11] vc.ru/finance/83771-kak-formiruetsya-procentnaya-stavka-po-kreditam

[12] Farrakhov Igor 「IFRS9：予想される信用損失を見積もるための規定。」バンキングレビュー。アプリケーション「BESTPRACTICE2（2018）」。

[13]ベリーニティツィアーノ。IFRS 9およびCECLクレジットリスクのモデリングと検証：RおよびSASで機能する例を含む実用ガイド。アカデミックプレス、2019年。

信用リスク管理のMLおよびDSシェード