類似製品の自動選択をどのように行ったか

画像



では、前の 記事、特性、画像、説明-私たちはさまざまなソースから製品を比較して、製品のカードを記入することを学んだかについて話しました。そして、サプライヤーの価格、競合他社の価格、および商品の特性がわかっている場合、それらの特性が単純に類似している類似品または商品に関する情報の検索は論理的な継続となりました。



これはさまざまな方法で使用できます。たとえば、製品カードにあるいくつかの類似したアイテムを顧客に表示します。おそらく、もう1つ好きになるでしょう。在庫がない場合は、同様の在庫商品のリストも役立ちます。2番目のオプションは、この情報をコールセンターの従業員に提供して、要求された製品が利用できない場合、またはアナログがクライアントの希望により適している場合に、アナログを迅速に(または原則として)提供できるようにすることです。



製品が類似しているかどうかをどのように判断できますか?特性を比較することができます、より一致するほど、製品はより類似しています。残念ながら、それは簡単には機能しません。実際には、原則として、すべての特性が満たされている製品はほとんどありません。80%は良い結果です。第二に、いくつかの特性は他よりも重要です。たとえば、65インチのテレビは22インチのテレビとはまったく異なりますが、どちらにも2つのUSBポートがあります。または、別の例として、金属ケースとアルミニウムケースは、3つの異なる意味ですが、プラスチックよりもはるかに接近しています。



したがって、同様の製品を選択するには、次のタスクを解決する必要があります。



  1. 重量特性を割り当てます。対角線のサイズは重要ですが、USBポートの数はそれほど重要ではありません。
  2. 各特性の値の範囲を決定し、その上で値間の距離の関数を設定します。
  3. ある製品の特性はわかっているが、別の製品の特性はわかっていない場合に対処するための戦略を決定します。
  4. すべての特性の値の間の距離を持って、商品間の距離を計算します。
  5. パフォーマンスについて考えてください。すべての距離ペアの計算には複雑さがあります

    O((N2

    そして、1万の商品に対して5000万の距離を計算することが大きな問題ではないように思われる場合、30万に対して500億の距離はすでに多くなっています。


これらの問題を解決しましょう。ある程度、これは研究作業になります。



フィーチャの重みを決定する方法



重み付きの2つの基本的なアイデアを使用しました。



  • 価格に影響を与える特性は重要です。逆は必ずしも真実ではありません。たとえば、携帯電話の色は十分に重要ですが、価格にはほとんど影響しません。
  • 価格に影響を与えない重要な特性を特定するために、平均して、それらがより適切に満たされていると仮定します。


さらに、カテゴリごとに、すべての特性に重みを割り当てます。これを行うには、次のようにします。



  1. 特性が数値の場合、ピアソン価格との相関を考慮します。
  2. 列挙に相互に排他的な選択肢がある場合(数値ではない)、その要素をこの値の商品の平均価格で並べ替え、スピアマン価格との相関を計算します。
  3. 複数の選択肢が提供されている場合は、それを相互に排他的なセット(yes / no)に減らし、それぞれとSpearmanの価格との相関関係を計算します。オプションの数に応じて、結果の係数を減らします。
  4. 特性ごとに塗りつぶされた値の割合を計算し、以前に取得した重みを増減します。
  5. 得られた値は重みとして使用できますが、実際には、順序を維持しながら再び非線形に変換すると、最良の結果が得られます。


各ステップには独自のニュアンスがあります。たとえば、ある場合は小売価格のみがわかっている場合、他の場合は卸売価格のみがわかっている場合、3番目の場合はそれらとその他の両方の場合の価格の計算方法です。または、ある店が価格を間違えて、同じシリーズのキャビネットの価格でベッドサイドテーブルを販売しています。



商品間の距離を計算するにはどうすればよいですか



特性の値間の距離を計算するアルゴリズムを選択するときは、個々の特性間の距離とその重量を使用して、商品間の距離をどのように計算するかを覚えておく必要があります。私の直感では、n次元空間の距離から始めるように指示されています。特性間の距離の二乗の合計の二乗根。



さらに、直感によれば、この場合、値間の距離の関数は分布的であり、三角形の不等式が満たされている場合はさらに優れているはずです。そのような要件の正しさを証明することはできませんが、私たちはこれらの条件を順守します。



次に、次の関数を距離の関数として使用できます。



  • — , . , 35 , — 75 , 40 . .
  • — (, ?), . .
  • , .


さて、パフォーマンスについて。実際には、妥当な時間(最大5分)で、3万個の商品間のペアワイズ距離を計算できることがわかりました。しかし同時に、商品のカテゴリによっては、カタログに10万枚のマットレスが含まれている場合など、さらに多くの場合があります。この場合、費やす時間を10倍に増やすことについて話します。



この場合の最適化は次のようになります。すべての製品を、最も重みのある特性の値で注文します。

O((Nlog((N

これはより速い

O((N2

次に、すべての製品を重複するグループ(たとえば、20%重複する)に分割し、各グループ内のペアワイズ距離を計算します。したがって、カテゴリ内の最大3万の製品では、処理時間が次のように増加します。

O((N2

そして3万から始まる-どのように

O((Nlog((N





結果



このアルゴリズムを使用した類似製品の自動検索結果の例をいくつか示します(表の最初は、類似製品を探していた製品になります)。













ボッシュWLT24540OE

ボッシュWLN24240OE

サムスンWW80K6210RW

ボッシュWLT24460OE

シーメンスWS12T440OE

シーメンスWS12T540OE

タイプ 自動

自動

自動

自動

自動

自動

実行 自立型

自立型

自立型

自立型

自立型

自立型

洗濯物を入れる 正面

正面

正面

正面

正面

正面

最大負荷 7

7

8

7

7

7

白い

白い

白い

白い

白い

白い

エネルギークラス +++

+++

+++

+++

+++

+++

スピンクラス B

B

B

B

B

B

プログラムの数 14

15

14

15



14

ハッチカラー

白い

黒い







最大スピン速度 1200

1200

1200

1200

1200

1200

Ind。プログラム終了までの時間 +



+

+

+



消費電力 2300,00





2300,00

2300,00



不均衡制御 +

+

+

+

+

+

ボディ素材 プラスチック

プラスチック

プラスチック

プラスチック

プラスチック

プラスチック

電源コードの長さ 1.75

1.75









埋め込み









カウンターの下

ドラムの数

1







1

スピン速度の選択 +

+

+

+

+

+

スピンをキャンセル +

+

+

+

+

+

バブルジェネレーター



+







すべてのプログラム 合成

追加のすすぎ

追加のすすぎ

追加のすすぎ

追加のすすぎ

エコウォッシュ

市場投入日 2016年

2016年

2016年

2015年





サイクルあたりの電力消費量 0,91

0,91



0,96

0,91

0,91

38,00

38,00



38,00

38,00

38,00





8100,00





8550,00

A

A

A

A

A

A

+

+

+

+

+

+



56

56

56

56



56

77

78

75

78

76

77











165°

32,00





32,00

32,00

32,00



+



46,00



46,00

46,00

46,00

























+

+

+

+

+

+









+









+

+





+

+

+







+

+

+

+







+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+







+























84,80

84,80

85,00

84,80

84,80

84,80

59,80

59,80

60,00

59,80

59,80

60,00

44,50

44,60

45,60

44,40

44,60

44,60

48,60

48,60



48,60

47,40



65,00

63,00

67,00

64,00

65,00

63,00

-























Hotpoint-Ariston WMTF 701 H CIS

Hotpoint-Ariston WMTL 601 L CIS

Gorenje WT62093 468938

Whirlpool AWE 7515/1

Zanussi ZWY51004WA































7

6

6

5.5

5.5











A+

A+

A+

A+

A+

C

C

C

C

C

18

18

18

11













1000

1000

900

1000

1000

2100,00

2100,00



2100,00





+

+

+

+

















1





+

+

+

+



+

+

+

+











1,18



1,02

0,93



50,00



48,00

48,00









8674,00



A

A

A

A

A



59

59

59

59

58

75

76

76

76

75





























42,00























+



+

+

+



A

A









+



+









+



+

+

+

+

+

+

+

+

+













90,00

90,00

85,00

90,00

89,00

40,00

40,00

40,00

40,00

40,00

60,00

60,00

60,00

60,00

60,00



58,00

58,00

58,00

58,00

-











これらの例は、原則として、アルゴリズムがうまく機能し、最初のケースでは、水平荷重が同じ深さでほぼ同じ最大荷重の自立型自動洗浄機を選択したことを示しています(私は洗濯機の専門家ではありませんが、これらの特性が重要だと思われます)。 2番目のケースでは、自立型の自動洗浄機ですが、トップローディング式です。提案されたオプションの幅と深さは同じです。どちらの場合も、カタログにはありますが、アクティベーターまたは組み込みのマシン、およびコンパクトな壁掛け式のマシンは提供されていません。



大規模なアプライアンスのスペシャリストがより良い仕事をした可能性があります(さまざまなカテゴリの結果について営業担当者と話し合い、ほとんどのオプションを承認しましたが、結果に含めなかったオプションも提案しました)。購入者として自分自身で結果を試してみると、そのような推奨事項は有用であることがわかりました。期待に大きなミスは見つかりませんでした。



したがって、このアルゴリズムの実装後、入力として製品の名前のみを使用して、サプライヤや競合他社から製品を自動的に検索し、その特性を入力し、画像を選択し、アナログを提供することもできます。これにより、コンテンツマネージャーとセールスマネージャーの作業が大幅に簡素化されます。



All Articles