みなさん、こんにちは!私の名前はアンドレイです。最近VSRoboticsチームに加わり、ロボットとオペレーターの対話用のスクリプトの自動ビルダーのプロジェクトに携わっています。この投稿では、私の雇用の話とLGD予測問題の解決策を共有したいと思います。これは、これに大いに役立ちました。初心者のDSスペシャリストがスタートポジションを獲得するために深刻な困難を克服しなければならないことは周知の事実です。コンテストに参加し、厳しい面接や自分の能力に対する疑念の苦痛を回避することで、オファーを得ることができて幸運でした。私の話がお役に立てば、積極的に仕事を探すための優れたツールとして、ハッカソンや会議に新参者の注目を集めることを願っています。
はじめに-データサイエンスの過去の人生と最初のステップ
, , . , . , , - , - . , , data scientist — . , , , , .
, Python. « Python». 2020 , . Data Science .
, , — . , . https://ict2go.ru/companies/19/, , ScoringDay 2021 dsbattle.com LGD Prediction. (-3) «». , !
, !
0. , « ?», baseline- . . . , . , , CatBoost. , , Kaggle, .
, LGD (Loss Given Default), , , . MAE — mean absolute error, .
1400 — 691, — , , . , , . .
1. 35 2 : — 24 — (, , ..), — 11 — ( , , ).
— LGD — , .
U- , , — , .
. , 38% , 60% , . .
, ( ) ().
2. , , . , , , - . , . .
art ! , , . , — , . .
Kaggle — , , .
, 2 «/ ». , , .
, LGD , .
— « ». , «», « », « », «...», « » « ». — . — , , . . , . :
.
«» « ». . , 50 . ( — «corporation») 100 . . ( — «big»).
, LGD .
pairplot , — « », « », .
:
« » ;
« » « » , ( — , , « »);
, « » – LGD 0 ( ). .
, 70 « » LGD , , . 4 . — « ».
100 .
3. . ( , ), . , .
, , , . (debt_equity) (debt_op_profit).
9 : 4 5 . «» (ar_revenue), .
4. . , . CatBoost , . « » - 9 .
, , 0.086. 0.066.
« LGD — » .
, , LGD = 1, , 0, .
, , 0.087: , CatBoost , — 0.086. , , « », , « ».
.
« », , , lgd. — . (ar_revenue) . , .
, , , , , , , . : ! , - . , , .
0.086 . . . ( ), . , , .
, - — . , — !
, — . DS- , , , , .
( ), VS Robotics . , , , ! , , , . , , VS Robotics!
, .
, — , — 45 baseline. , , - , .
, , . . data scientist’, , , - , .
! — , . — , , .
, .
— - , , , .
- , , , - - .
, ! !