(正規分布を想定)
等分散の条件下で平均の同等性を決定する問題は、数理統計学の古典的な問題であり、専門学校や大学で解決されています。ただし、科学としてのMSは沼地に非常に似ています。古典的に解決された問題のバンプから横にジャンプしようとすると、行き詰まったり、完全に溺れたりする可能性があります。
検討中の問題はこれらの1つです。実際、思いやりのある数学者は、この種の問題を解決するための約20の異なる統計的検定をすでに開発しており、「どちらを使用するか」というカテゴリから疑問が生じます。
予備調査(調査のテキストはGitHubで入手可能)は、平均値、分散、および問題ステートメントの詳細の特定の組み合わせに応じて、記事「Cavus、M。 、Yazici、B。doexパッケージによる不均等な分散の下での正規分布グループと独立グループの平均の同等性のテスト/ TheRJournal。2020.No。2 (12)。P。134-155 "。
この問題を解決するために、特定のケースごとに最適な統計的検定を決定できる手順が開発されました。経済成長に関するデータを含むGrowthDJデータベースの例を使用して説明します。国での高品質データの可用性に応じて、経済成長の平均値(可変gdpgrowth)が等しいという仮定をテストしましょう(可変inter)
研究の最初の段階は、分布の正規性をチェックし、記述統計を見つけることです。
library("tibble")
library("AER")
library("WRS2")
library("doex")
data("GrowthDJ")
XX<-na.omit(GrowthDJ)
library("psych")
describeBy(XX$gdpgrowth, XX$inter)
shapiro.test(XX[XX$inter=='yes',6])
shapiro.test(XX[XX$inter=='no',6])
データが正規分布していることがわかります。つまり、テストを適用できます。
検証方法
2つの平均値と2つの分散値を設定します(グループごとの利用可能なデータに基づく)
( 70 ). – № 1 № 1, – № 1 № 2, – № 2 № 2.
0.01. p- 0.01, , 0.01 – . . p- 0.01, , 0.01 – . 100 , .
( , ):
accuracy ( );
selectivity ( , );
precision ( );
recall ( , );
FOR ( );
F- ( precision recall, ).
( .R )
, :
, AF FA- ( , F-score
- (.. ), RGF-
- (.. ), 8 (AF,BA,CF,FA,JF,MBF,SS,WA)
, 8
, RGF-
- AF- (Approximate F-test)
0.0003 -