デシジョンツリーとは何ですか?どこで使用されますか?

みんな、こんにちは!本日、ProductStarチームは、運用の一般原則と意思決定ツリーの適用分野を検討した記事を作成しました。

デシジョンツリーは、大規模なデータセットを自動分析するための方法です。この記事では、操作の一般原則と適用分野について検討します。

デシジョンツリーは、強力なデータマイニングおよび予測分析ツールです。分類と回帰の問題に役立ちます。

, « …, ...». .

, , : , « 1000 , ».

( ), . , — .

, — , . :

  • — ;

  • — .

1950- . .

. ( ID3 4.5 5.0) , CART .

. — , — (node) (leaf). .

: , :

  • — , ;

  • — , .

, . , . , , .

. — , , — . , , , .

, . . , , .

, , .

?

, , . :

  • . . .

  • ( ). .

  • . . , , .

— . ? , .

:

  • — ;

  • — , .

«» , - ( ), . , , . , , .

, , « ». S, :

  • n , Ci(i = 1..k);

  • m Aj(j = 1..m), .

:

  1. S Ci, , . , , «» . , Ci. , .

  2. S — . , . , .

  3. S Ck. . Aj S, : a1, a2, …, ap), p — . S p (S1, S2, …, Sp), . , . , .

, . , .

: ID3, CART, C4.5, C5.0, NewId, ITrule, CHAID, CN2 . :

  • ID3 (Iterative Dichotomizer 3). . , ID3, . . .

  • C4.5. «» ID3, . 2008 Spring Science , C4.5 — Data Mining.

  • CART (Classification and Regression Tree). , . CART , .

4 :

  1. .

  2. .

  3. .

  4. .

.

, . , . — .

, - .

-

:

n — , Ni — i- , N — .

. , , . , .

Aj , .

. — . , :

Info(S) — , S , Info(Sa) — , , A.

Gain(A), . - « .

. , . — .

, . .

:

Q — , n — , pi — i- ( ).

0 1. 0, , . 1, , . , .

«» . , . - . . , .

. , . — .

, «».

:

  • . (, ). — . — . - .

  • . . .

  • . (, 7). .

, . , - . - , .

«» , . , 2-3 , .

— , , . — .

: NP- , , , . , 3 :

  1. , .

  2. : ( ) ( ).

  3. , .

, , .

« » — . , .

, . , .

. , .

( ), .

:

  • . , « < 40 , ». .

  • , .

  • , «» , ( ).

  • .

  • .

  • , .

:

  • . , .

  • , - .

  • , - « », .

  • : , 100- .

  • , , .

?

. , .

:

  • . .

  • . ( ), (, ) ..

  • . .

  • . .

  • . .

. , - .

, . ProductStar vc -.

. , , .




All Articles