最高のデータ製品が現場で生まれる

オンライン注文のほとんどは倉庫からではなく、倉庫から収集されます。これは、サイトに表示されているものと実際にオンライン注文でまとめることができるものとの間のエラーにつながり  ます

起因する店舗における商品の高い回転率と在庫管理システムの複雑さ、エラーは、それが自動的に検出することができる起こります。システムに関する知識とソーシャルエンジニアリングの使用に基づいて、問題のある製品を自動的に検出し、サイトに公開する前に在庫を調整するソリューションを提案しました。





画像



,    « ».    2011 . (  ,   13, 107),       ,   Data- .



«»



   ,   ,   «».       ,  .



  •  —  .
  •  — ,     .
  •  — .
  •  — .
  •  — 5   .




,   ,      « »,  98%         .



8 000 .  , 40 000   .   , ?   ,   , ,   ,  ,  .   ,      - , , - « ».   ,   ,     -  .



-    ,  —   .



  ,     ,     Data Accelerator.  — data-,   data-driven.  Data Accelerator 126 ,   5      — « »,     .



 ,    ,   ,   . ,    .



  : Data Scientist, Data Engineer, Data Analyst, Product Owner  Scrum-.



:



  • ,     (  );
  •  eCom,    .


 , .





,    ,  ,  :   . ,   ,   3 , ,    ,   6 . , , ,    …



      ,       . . « » ,   ,   .



,  —    . ,    ,        .   ,     ,   1. , , ,    .   .  .



画像

 — .  ,   . , , .   2500 ,   43,    .        «».



画像



,   excel-,  ,     excel-  :   ,   .   ,  , ,   , , .



,   ,  60%   , .      ,    81%, ,  -, .



MVP.



 6 ,   proof of concept   , ,   ,  .    ,   ,   .

, , ,   ,   ,    — ,   , .    ,     , , .



«-1».



  ,   ,   : « ,   , , , ».     , , « » ,    .     4  , .



   ,   . -,   ,   , - , , .     ,       . -, ,        . ,  ,      .



ML-.



,   ML-,     6 .   ML-?



  •    Catboost,   ,     .
  •     ,        .
  •     ,     ,  ,  ,   ,  ,    .
  •   70 .
  •     ,   Permutation Importance  ,   Catboost.
  •   ,       80/20.
  •   ,     .
  • ,    ,     ,    train/valid-.
  •     DVC,    S3.


  :



  • ROC-AUC: 0.68
  • Recall: 0.77




 —    .   ,   DataLake   GreenPlum.   ,  MongoDB,  .   GreenPlum  MongoDB   opensource- Apache- Apache AirFlow  Apache NiFi.



Python-,  Kubernetes.     ,   -   Apache Kafka,   ,         Apache Kafka.



画像



  6    ,   15%    12%,   E-com   . ,   ,   .



  ,    ,    .   ,    — ,   ,     .           .



p.s. Avito.Tech, .






All Articles