外れ値とは、他のサンプルデータと大きく異なる値です。この用語は統計学でよく使用され、データの異常や測定エラーを意味する場合があります。外れ値を計算する方法を知ることは、データを正しく理解するのに非常に役立ち、より正確な結論につながります。以下では、外れ値を計算するための非常に簡単なプロセスと方法を紹介します。 ステップ- {"smallUrl":"https:\/\/www.wikihow.com\/images_en\/thumb\/3\/33\/Calculate-Outliers-Step-1-Version-2.jpg\/v4-460px-Calculate-Outliers-Step-1-Version-2.jpg","bigUrl":"https:\/\/www.wikihow.com\/images\/thumb\/3\/33\/Calculate-Outliers-Step-1-Version-2.jpg\/v4-728px-Calculate-Outliers-Step-1-Version-2.jpg","smallWidth":460,"smallHeight":345,"bigWidth":728,"bigHeight":546,"licensing":"<div class=\"mw-parser-output\"><\/div>"} 1潜在的な外れ値を識別する方法を学びます。計算を実行する前に、データ内の潜在的な外れ値を特定します。たとえば、データの列は部屋にある 12 個の物体の温度を表します。そのうち 11 個が 70 代で、12 個目が 300 代であれば、大まかに外れ値であることがわかります。
- {"smallUrl":"https:\/\/www.wikihow.com\/images_en\/thumb\/0\/0a\/Calculate-Outliers-Step-2-Version-2.jpg\/v4-460px-Calculate-Outliers-Step-2-Version-2.jpg","bigUrl":"https:\/\/www.wikihow.com\/images\/thumb\/0\/0a\/Calculate-Outliers-Step-2-Version-2.jpg\/v4-728px-Calculate-Outliers-Step-2-Version-2.jpg","smallWidth":460,"smallHeight":345,"bigWidth":828,"bigHeight":546,"licensing":"<div class=\"mw-parser-output\"><\/div>"} 2データを小さいものから大きいものの順に並べます。上記のデータを例に、部屋の中の物体の温度を考えてみましょう:{71、70、73、70、70、69、70、72、71、300、71、69}、変化の順序は:{69、69、70、70、70、70、70、71、71、71、72、73、300}です。
- 中央値を計算します。中央値は、データの文字列の中央にあるデータ ポイントです。データの合計数が偶数の場合、中央の 2 桁の平均が中央値になります。上記のデータでは、中央の2つの項目は70と71なので、中央値は((70 + 71) / 2)または70.5です。
- {"Smallurl": "https:\/\/www.wikihow.com \/Images_en \/Thumb \/2 \/2f \/Calculate-Outliers-step- 4-version-2.jpg .wikihow.com \/images \/thumb \/2 \/2f \/calculate-outliers-step-4-version-2.jpg \ /v4-728px-calculate-outliers-step-4-version-2.jpg "、" smallwidth ":460、" 460:460:460 、「ライセンス」: "<div class = \" mw-parser-output \ "> <\/div>"} 4下部四分位を計算します。ここでは、総データの最小25%がこのポイントを下回っていることを示します。上記の例では、均等に分割するデータがさらに2つあります。つまり、((70 + 70) / 2)または70です。
- {"Smallurl": "https:\/\/www.wikihow.com \/Images_en \/Thumb \/4 \/48 \/Calculate-Outliers-Step- -Jpg .wikihow.com \/images \/thumb \/4 \/48 \/calculate-outliers-step-5-version-2.jpg \ /v4-728px-calculate-outliers-step-5-version-2.jpg "、" smallwidth ":460、" 460:460:460 、「ライセンス」: "<div class = \" mw-parser-output \ "> <\/div>"} 5上部四分位を計算してQ3に設定し、データの最大25%がこのポイントを超えていることを示します。この例では、Q3は71と72の平均で、71.5です。
- {"smallUrl":"https:\/\/www.wikihow.com\/images_en\/thumb\/8\/85\/Calculate-Outliers-Step-6-Version-2.jpg\/v4-460px-Calculate-Outliers-Step-6-Version-2.jpg","bigUrl":"https:\/\/www.wikihow.com\/images\/thumb\/8\/85\/Calculate-Outliers-Step-6-Version-2.jpg\/v4-728px-Calculate-Outliers-Step-6-Version-2.jpg","smallWidth":460,"smallHeight":345,"bigWidth":828,"bigHeight":546,"licensing":"<div class=\"mw-parser-output\"><\/div>"} 6データの「内側の円」を見つけます。最初のステップは、Q1 と Q3 の差 (四分位範囲) に 1.5 を掛けることです。上記の例では、四分位範囲は (71.5 - 70) で、1.5 になります。これに 1.5 を掛けて 2.25 を得て、それを Q3 に加算し、この合計を Q1 から引いて内側の円を求めます。この場合、内側の範囲は 67.75 と 73.75 です。
- この範囲外の数値はすべて「定常外れ値」となります。この例では、華氏 300 度のみが範囲外であり、これをプラトー外れ値と呼びます。
- {"smallUrl":"https:\/\/www.wikihow.com\/images_en\/thumb\/7\/72\/Calculate-Outliers-Step-7-Version-2.jpg\/v4-460px-Calculate-Outliers-Step-7-Version-2.jpg","bigUrl":"https:\/\/www.wikihow.com\/images\/thumb\/7\/72\/Calculate-Outliers-Step-7-Version-2.jpg\/v4-728px-Calculate-Outliers-Step-7-Version-2.jpg","smallWidth":460,"smallHeight":345,"bigWidth":728,"bigHeight":546,"licensing":"<div class=\"mw-parser-output\"><\/div>"} 7データの外れ値を検索します。内部範囲法に似ていますが、ここでは四分位範囲に 1.5 ではなく 3 を掛けます。 3 を掛けると (1.5 * 3)、4.5 になります。周囲は65.5と76
- この範囲外の数値はすべて「極端な外れ値」とみなされます。300 度もこの範囲外であるため、「極端な外れ値」とみなされます。
広告する
ヒント- 外れ値を見つけたら、それを排除する前に、なぜ外れ値が発生したのかを説明します。外れ値は、実験のエラーまたは分布の異常を示している可能性があります。
広告する準備が必要です |