スマートデータの正規化:カテゴリデータと通常データ、「ペア」機能

この記事はその場限りのものです。前回、私は別のデータの正規化法のニュアンスと課題を見ました。そして、出版後初めて、私はいくつかの重要な詳細について言及していないことに気づきました。一部の人には明白に見えるかもしれませんが、私の意見では、それについて明示的に言う方が良いでしょう。



カテゴリデータの正規化



基本的なことでテキストを乱雑にしないために、私はあなたがカテゴリーと順序のデータが何であるか、そしてそれらが他のものとどのように異なるかを知っていると仮定します。



明らかに、正規化は数値データに対してのみ実行できます。したがって、数値のみがアルゴリズム/プログラムに適している場合は、他のすべてのタイプをそれらに変換する必要があります。



カテゴリデータは単純です。目標が値をいくつかの数値でエンコード(暗号化)することだけではない場合、利用可能な唯一のオプションは、可能な各カテゴリの値「1」-「0」(はい-いいえ)としてそれらを表すことです。これは、いわゆるワンホットエンコーディングです。1つのカテゴリ機能の代わりに、可能なカテゴリと同じ数の新しい「ブール」機能が表示される場合。





そしてそれがすべてです。



, .



, , .



, /”” , — . . .



, , , , “” “”. “ ”, , “” . , , — .



, - , « , 0 1». , . , .





. “” ( ) . , . .



1. . ( ). ( ) , , , . , , .





2. ( ). , “” .



, , . — , , , .



— ..





“”



, , . , .



. “” , . “” .



. , , , . — , , , ( ). .



“” , “”. .





. . , , 100 , 100 . 100 .



,





. “” , , . - , .



“” ( ) “” .





, , “”. .





“” “” .



. /, . “-” ( ), “-” ( ). , - , “-” , “-”.





. . “” .



, , (- ), “-”, , “-”, . .. “”.



, “”, .



, — - , . - .



P.S. — , - AdjustedScaler, “” .




All Articles