仮説を検証するには統計分析が必要です。統計的有意性は p 値を使用して計算されます。p 値は、特定の命題、つまり帰無仮説が真である場合に予測された結果が得られる確率を示します。 [1] p 値が有意水準値(通常は 0.05)より小さい場合、実験者は帰無仮説が誤りであると結論付け、対立仮説を受け入れることができます。単純な t 検定を使用して p 値を計算し、データセット内の 2 つの異なるグループ間の差の有意性を判断できます。
ステップ パート1 パート 1/3:実験の設計 {"smallurl": "https:\/\/www.wikihow.com \/images_en \/thumb \/4 \/45 \/assess-statistical-significance-step-1-version-3.jpg \/vv4-460px-assess-statististististicance-step-step-step-1-bursion:" \ /www.wikihow.com \/images \/thumb \/4 \/45 \/assess-statistical-significance-step-1-version-3.jpg \/vv4-728px-assess-statistical-sificance-step-1-vursion-3.jpg "、" Smallwidth ":460" "345 :728、 "Bigheight":546、 "ライセンス": "<div class = \" mw-parser-output \ "> <\/div>"} 1定义假设。 統計的有意性を評価する最初のステップは、回答したい質問を特定し、仮説を立てることです。この仮定には、実験データと母集団における可能性のある差異が含まれます。どのような実験でも、帰無仮説と対立仮説の両方が存在する必要があります。 [2] 一般的には、2 つのグループを比較して、それらが同じかどうかを確認します。帰無仮説 H 0 は 通常、2 つのデータ セット間に違いがないことを示します。たとえば、授業前に教材を予習する学生は、最終成績が良くなりません。 対立仮説 H a は 帰無仮説の反対であり、実験データで裏付けようとしている命題です。たとえば、授業前にコースの教材を準備した学生は、コース終了時により良い成績を取ることができます。 : : : : : : : : : : : : : : : 有意水準はアルファとも呼ばれ、有意性を判断するために設定するしきい値です。 p 値が設定された有意水準以下の場合、データは統計的に有意であると見なされます。 [3] 一般的に、有意水準 α は 0.05 に設定されることが多く、これは偶然にデータに違いが見られる可能性がわずか 5% であることを意味します。 信頼度レベルが高くなると、p 値は小さくなり、結果はより有意になります。 データの信頼度を高めたい場合は、p 値を 0.01 未満に設定できます。製造業では、製品の欠陥を検出するために、より小さな p 値がよく使用されます。すべてのコンポーネントが期待どおりに機能するという高いレベルの信頼性を満たす必要があるためです。 仮説に基づく実験の場合、有意水準 0.05 が許容されます。 : : : : : : : : : : : : : : : t 検定を適用するための条件の 1 つは、データが正規分布していることです。正規分布したデータはベル型の曲線を形成し、ほとんどのサンプルが中央に位置します。 [4] t 検定は、データが曲線の「末尾」の正規分布の外側、つまり曲線の上または下に位置するかどうかを判定する数学的検定です。片側検定は、コントロール グループの上など、一方向の関係の可能性をテストするのに対し、両側検定は、コントロール グループの上または下など、二方向の関係の可能性をテストするため、両側検定よりも強力です。 [5] データがコントロール グループより上か下か不明な場合は、両側検定を使用します。この方法では、どちらの方向でも有意性をテストできます。 データがどの方向に進むかがわかっている場合は、片側検定を使用します。先ほどの例では、生徒の成績が向上すると予想したため、片側テストを使用できました。 {"smallurl": "https:\/\/www.wikihow.com \/images_en \/thumb \/2 \/28 \/assess-statistics-significance-step-4-version-3.jpg \ /v4-460px-assess-statistististicatististical-step-step-4- /\/www.wikihow.com \/images\/thumb\/2\/28\/assess-statistical-significance-step-4-version-3.jpg\/v4-728px-statistical-significance-setist-4-version-3.jpg"、po th ":728、" bigheight ":546、"ライセンス ":" <div class = \ "mw-parser-output \"> <\/div> "} 4使用功效分析来确定样本量。 テストの検出力とは、特定のサンプル サイズを与えられた場合に、期待される結果を観察する確率を指します。パワーまたはベータの一般的なしきい値は 80% です。各グループ間の平均値と標準偏差に関する情報が必要になるため、予備データがない場合には検出力分析が少し難しくなる可能性があります。オンラインで利用できる検出力分析計算機を使用して、データに最適なサンプル サイズを決定できます。 [6] 大規模で包括的な研究を実施する場合、研究者は検出力分析に必要な情報を取得し、そのサンプル サイズを決定するために、小規模なパイロット スタディを実施することがよくあります。 複雑なパイロットスタディを実施できない場合は、文献や他の研究者が行った研究を読んで、可能な平均値を推定することができます。これは、サンプル サイズを決定するときに開始するのに適した場所です。 広告する パート2 パート 2/3:標準偏差を計算する {"smallurl": "https:\/\/www.wikihow.com \/images_en \/thumb \/c \/ca \/assess-statistics-significance-step-5-version-3.jpg \/vv4-460px-assess-statistististicatististical-step-step-step-5- /\/www.wikihow.com \/images\/thumb\/c\/ca\/assess-statistical-significance-step-5-version-3.jpg\/v4-728px-statistical-significance-setist-5-version-3.jpg"、po th ":728、" bigheight ":546、"ライセンス ":" <div class = \ "mw-parser-output \"> <\/div> "} 1确定标准方差公式。 標準偏差はデータの分布の尺度です。サンプル内のデータ ポイントの類似性に関する情報を提供し、データが重要であるかどうかを判断するのに役立ちます。一見すると、この式は少し複雑に思えるかもしれませんが、次の手順で計算プロセスを説明します。その式は s = √∑(( xi – µ) 2 /(N – 1)) です。 sは標準偏差です。 ∑は収集されたすべてのサンプル値の合計を指します。 xi は データの個々の値を表します。 µ は各データ グループの平均値です。 N はサンプルの総数です。 {"smallurl": "https:\/\/www.wikihow.com \/images_en \/thumb \/3 \/31 \/assess-statistical-significance-step-6-version-3.jpg \/vv4-460px-assess-statistististicatistical-step-step-step-vorsion:" /\/www.wikihow.com \/images\/thumb\/3\/31\/assess-statistical-significance-step-6-version-3.jpg\/v4-728px-statistical-significance-setist-6-version-3.jpg"、po th ":728、" bigheight ":546、"ライセンス ":" <div class = \ "mw-parser-output \"> <\/div> "} 2计算每组样本的平均值。 標準偏差を計算するには、まず各サンプル グループの平均を計算する必要があります。平均はギリシャ文字のµで表されます。各値を合計し、サンプルの総数で割るだけで計算されます。 [7] たとえば、授業前に教材を予習した学生グループの平均成績を計算するには、いくつかのデータを見てみましょう。簡単にするために、90、91、85、83、94 の 5 つの値を含むデータ セットを使用します。 すべてのサンプルを合計します: 90 + 91 + 85 + 83 + 94 = 443。 合計をサンプル数 N = 5 で割ります: 443/5 = 88.6。 このグループの学生の平均スコアは 88.6 でした。 {"smallurl": "https:\/\/www.wikihow.com \/images_en \/thumb \/d \/d0 \/assess-statistic-significance-step-7-version-3.jpg \/vv4-460px-assess-statististististicatistististicatististicatististical-steption" "' \/\/www.wikihow.com \/images \/thumb \/d \/d0 \/assess-statistical-significance-step-7-version-3.jpg \/vv4-728px-assess-statistical-significance-step-7-version-3.jpg ": ':smallwidth" ":" 45dth "" width ":728、" bigheight ":546、"ライセンス ":" <div class = \ "mw-parser-output \"> <\/div> "} 3用每个样本减去平均值。 計算の次のステップでは、式の ( xi – µ) の部分が扱われます。各サンプルから先ほど計算した平均値を減算する必要があります。この例では、5 回の引き算を行う必要があります。 (90 – 88.6)、(91- 88.6)、(85 – 88.6)、(83 – 88.6)、(94 – 88.6)。 計算結果は1.4、2.4、-3.6、-5.6、5.4です。 {"smallurl": "https:\/\/www.wikihow.com \/images_en \/thumb \/b \/b5 \/assess-statistic-significance-step-8-version-3.jpg \/vv4-460px-assess-statististicatististicatististicatististicatististical-steption" "' \/\/www.wikihow.com \/images \/thumb \/b \/b5 \/assess-statistical-significance-step-8-version-3.jpg \/vv4-728px-assess-statistical-significance-step-8-version-3.Jpg width ":728、" bigheight ":546、"ライセンス ":" <div class = \ "mw-parser-output \"> <\/div> "} 4将这些数字平方后再相加。 この時点で、導き出した各数字の二乗を計算する必要があります。このステップでは、否定的な兆候にも対処します。この手順の後または計算の最後にマイナス記号がある場合は、この手順の計算を忘れた可能性があります。この例では、5 つの数字の平方は 1.96、5.76、12.96、31.36、29.16 です。 これらの二乗値を合計すると、1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2 になります。 {"smallurl": "https:\/\/www.wikihow.com \/images_en \/thumb \/3 \/34 \/assess-statistic-significance-step-9-version-3.jpg \/vv4-460px-assess-statistististicatististicatististicatististicatistististic steption" "" \/\/www.wikihow.com \/images \/thumb \/3 \/34 \/assess-statistical-significance-step-9-version-3.jpg \/vv4-728px-assess-statistical-significance-step-9-version-3.jpg ":smallwidth" ":" 45 "" width ":728、" bigheight ":546、"ライセンス ":" <div class = \ "mw-parser-output \"> <\/div> "} 5除以样本总数减一。 式を N-1 で割るのは、全員の成績を計算しておらず、修正するために全生徒からサンプルを取って推定値を出したためです。 [8] 引き算: N – 1 = 5 – 1 = 4 割り算をします: 81.2/4 = 20.3 {"smallUrl":"https:\/\/www.wikihow.com\/images_en\/thumb\/a\/a6\/Assess-Statistical-Significance-Step-10.jpg\/v4-460px-Assess-Statistical-Significance-Step-10.jpg","bigUrl":"https:\/\/www.wikihow.com\/images\/thumb\/a\/a6\/Assess-Statistical-Significance-Step-10.jpg\/v4-728px-Assess-Statistical-Significance-Step-10.jpg","smallWidth":460,"smallHeight":345,"bigWidth":728,"bigHeight":546,"licensing":"<div class=\"mw-parser-output\"><\/div>"} 6平方根を取ります。 サンプル数から 1 を引いた数で割った後、最終的な数値の平方根をとります。これは標準偏差を計算する最後のステップです。生データを入力した後で標準偏差を計算できる統計アプリケーションがいくつかあります。この例では、授業前に準備した学生の最終成績の標準偏差は、s =√20.3 = 4.51 でした。 広告する パート 3パート 3/3:重要性の判断 {"smallUrl":"https:\/\/www.wikihow.com\/images_en\/thumb\/d\/d3\/Assess-Statistical-Significance-Step-11.jpg\/v4-460px-Assess-Statistical-Significance-Step-11.jpg","bigUrl":"https:\/\/www.wikihow.com\/images\/thumb\/d\/d3\/Assess-Statistical-Significance-Step-11.jpg\/v4-728px-Assess-Statistical-Significance-Step-11.jpg","smallWidth":460,"smallHeight":345,"bigWidth":728,"bigHeight":546,"licensing":"<div class=\"mw-parser-output\"><\/div>"} 1 2 つのサンプル グループ間の差を計算します。 これまでの例では、1 つのサンプル グループのみを扱ってきました。 2 つのサンプル グループを比較する場合、当然、両方のグループのデータが必要になります。 2 番目のサンプル セットの標準偏差を計算し、この値を使用して 2 つの実験グループ間の差を計算します。差分式は s d = √((s 1 /N 1 ) + (s 2 /N 2 )) です。 [9] s d は 2 つのグループ間の差です。 s1 はグループ 1 の標準偏差、 N1 はグループ 1 のサンプル サイズです。 s 2 はグループ 2 の標準偏差、N 2 は グループ 2 のサンプル サイズです。 たとえば、2 番目のデータ グループ (授業前に準備をしなかった学生のデータ) のサンプル サイズが 5 で、標準偏差が 5.81 であるとします。違いは次のとおりです。 s d = √((s 1 ) 2 /N 1 ) + ((s 2 ) 2 /N 2 )) s d = √(((4.51) 2 /5) + ((5.81) 2 /5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29. 2 データのtスコアを計算します 。 t スコアは、データを他のデータと比較できる形式に変換します。 t スコアを使用して t 検定を実行し、2 つのグループ間に有意差がある可能性を計算することができます。 tスコアの計算式はt = (µ 1 – µ 2 )/s d です。 [10] µ 1 は最初のグループの平均です。 µ 2 は 2 番目のグループの平均値です。 s d は サンプル間の差です。 t値が負にならないようにするには、µ 1 の平均値を大きくする必要があります。 たとえば、準備をしなかったグループ 2 の学生のサンプル平均が 80 であるとします。 tスコアは次のようになります: t = (µ 1 – µ 2 )/s d = (88.6 – 80)/3.29 = 2.61。 {"smallUrl":"https:\/\/www.wikihow.com\/images_en\/thumb\/3\/3b\/Assess-Statistical-Significance-Step-13.jpg\/v4-460px-Assess-Statistical-Significance-Step-13.jpg","bigUrl":"https:\/\/www.wikihow.com\/images\/thumb\/3\/3b\/Assess-Statistical-Significance-Step-13.jpg\/v4-828px-Assess-Statistical-Significance-Step-13.jpg","smallWidth":460,"smallHeight":345,"bigWidth":728,"bigHeight":546,"licensing":"<div class=\"mw-parser-output\"><\/div>"} 3サンプルの自由度を決定します。 t スコアを使用する場合、自由度の数はサンプル サイズによって決まります。両グループのサンプルサイズを合計し、2 を引きます。この例では、グループ 1 に 5 つのサンプルがあり、グループ 2 に 5 つのサンプルがあるため、自由度 (df) は 8 です (5 + 5) - 2 = 8。 [11] {"smallUrl":"https:\/\/www.wikihow.com\/images_en\/thumb\/c\/c6\/Assess-Statistical-Significance-Step-14.jpg\/v4-460px-Assess-Statistical-Significance-Step-14.jpg","bigUrl":"https:\/\/www.wikihow.com\/images\/thumb\/c\/c6\/Assess-Statistical-Significance-Step-14.jpg\/v4-728px-Assess-Statistical-Significance-Step-14.jpg","smallWidth":460,"smallHeight":345,"bigWidth":728,"bigHeight":546,"licensing":"<div class=\"mw-parser-output\"><\/div>"} 4 t 表を使用して有意性を評価します。 tスコアは標準的な統計書やオンラインで見つけることができます。[12] および自由度テーブル。データの自由度を含む行を見つけて、t スコアに対応する p 値を見つけます。自由度が 8 で t 値が 2.61 の場合、片側検定の p 値は 0.01 ~ 0.025 になります。有意水準を 0.05 以下に設定したので、値は統計的に有意です。このデータを得た後、帰無仮説を棄却し対立仮説を受け入れることができる: [13] 授業前に授業の準備をしておく学生は、より良い最終成績が得られます。 {"smallUrl":"https:\/\/www.wikihow.com\/images_en\/thumb\/1\/1b\/Assess-Statistical-Significance-Step-15.jpg\/v4-460px-Assess-Statistical-Significance-Step-15.jpg","bigUrl":"https:\/\/www.wikihow.com\/images\/thumb\/1\/1b\/Assess-Statistical-Significance-Step-15.jpg\/v4-728px-Assess-Statistical-Significance-Step-15.jpg","smallWidth":460,"smallHeight":345,"bigWidth":728,"bigHeight":546,"licensing":"<div class=\"mw-parser-output\"><\/div>"} 5フォローアップ調査を検討します。 多くの研究者は、より大規模な研究をどのように設計するかを理解するために、少量のデータを使用して小規模なパイロット研究を実施します。より多くのデータを使用して別の調査を行うことで、結論に対する信頼性を高めることができます。フォローアップ調査は、結論にタイプ I エラーが含まれているのか、タイプ II エラーが含まれているのかを判断するのに役立ちます。前者は、違いがないのに違いを観察すること、または帰無仮説を誤って棄却することを指し、後者は、違いがあるのに違いを観察しないこと、または帰無仮説を誤って受け入れることを指します。 [14] 広告するヒント 統計学は広範囲かつ複雑な主題です。統計的有意性を理解するために、高校、大学、またはそれ以上のレベルで統計的推論コースを受講することができます。 広告する警告する この分析は、正規分布する 2 つの母集団間の差を検定する t 検定との比較です。データ セットの複雑さに応じて、異なる統計テストを使用する必要がある場合があります。 広告する