対応 の ない t 検定。 F検定(等分散かどうかの検定)

t検定(対応のないt検定)

対応 の ない t 検定

t検定の数式 統計学は数学によって成り立っています。 検定というのは、データの規則性や確率により立てた数式から、目的の情報を判断します。 今回の t検定は2つの集団の間の差の情報を目的とします。 t検定は必ず2つの集団間でないといけません。 二つのテストの点数の差でも、2クラス間の得点の差などとにかく2つの標本間の差を見ます。 ・t値 t値とはt検定をした際に出てきて、どれだけ差があるのかを示す値です。 t値の絶対値が(つまり+にも-にも)大きければ大きいほど差が確かなことを示します。 ・期待値 期待値とは、データの加重平均値のことです。 加重とは「重みづけをする」ってことです。 例えば、 1,5,1,4,9,7,5,7,7,2 のような10個の得点のデータがあったとします。 加重平均値とは、これらの得点にそれぞれの出現する確立をかけて、全て足し合わせてできた平均値のことなのです。 8という平均値を算出するものだと思います。 1という平均値を算出するものです。 この平均値を「期待値」というわけです。 出現する確率で「重みづけ」されていることが分かると思います。 標準偏差とはデータのばらつき具合を表すものです。 まあ、分散自体がデータのばらつき具合を表すものなので、当然ってかんじですね。 で、サンプル数nのルートで標準偏差を表しているのは、「標準偏差にサンプル数の大きさを反映させるため」です。 例えば、5人のみが受けたテストでは、めっちゃできる人ばっかり集まったり、逆に全然できない人ばっかり集まったり、はたまた、天才とおバカがまざっちゃってばらつきが異常に大きくなったりする確率が高くなります。 というよりも 異常値が出る確率が高くなります。 でも言った通り、サンプル数を大きくすることでこういった異常値を回避できるわけです。 まとめると 標準誤差は誤差を表す指標です。 標準誤差は、標準偏差にサンプル数を反映させたもの。 標準偏差(バラツキ)が小さければ標準誤差は小さくなり、またサンプル数が大きければ標準誤差は小さくなる。 逆も同様に、 標準偏差(バラツキ)が大きければ標準誤差は大きくなり、またサンプル数が小さければ標準誤差が大きくなる。 といった風な理解で完璧です。 t検定とは具体的に何をするものなのか t検定とは「2標本の差のたまたま具合」を見る、という風に、知能指数と数学のテストの点数の関係という例を使って以前にでお話ししたことがありますが、今回は具体的にどのように差のたまたま具合を見るのか検定を行っていきたいと思います。 では、以下の例を使って実践していきましょう! T学校には、AクラスとBクラスがあります。 T学校は、新たに開発した数学の指導法の効果を調べるためにAクラスにはその指導法を、Bクラスには従来の指導法を適用しました。 そして、数学のテストを行い、両クラスの得点を比較しようとしました。 得点の結果は以下の通りです。 両クラスの数学の点数と平均点 出席番号 Aクラス Bクラス 1 86 75 2 86 67 3 81 63 4 95 40 5 95 57 6 93 37 7 76 40 8 92 73 9 66 89 10 72 75 11 96 41 12 69 71 13 92 53 14 92 42 15 86 90 16 88 84 17 94 90 18 90 30 19 82 65 20 60 48 21 70 89 22 65 66 23 93 59 24 85 57 25 100 33 26 70 73 27 86 34 28 98 60 29 62 82 30 63 53 31 61 34 32 82 59 33 79 82 34 68 80 35 64 41 36 61 42 37 76 48 38 78 65 39 96 42 40 52 71 平均点 80 60 表から、Aクラスでは、平均80点です。 そしてBクラスでは平均60点となりました。 確かにこの時点んで点数に差は出ていますが、これが本当の差かどうかは検定してみないと何とも言えません。 たまたま差が20点出てしまっただけかもしれないからです。 そして、この問題を解決するために、t検定を行っていきましょう。 t検定の方法 Excelでt検定を行っていきます。 もちろん、検定のための数式は既述した通りにありますが、 研究や調査で手計算することはありません。 では早速やっていきましょう。 まず、Excelでt検定をするにはツールバーの「データ」へ行きます。 そののち、「データ分析」をクリックします。 ここから、t検定の項目を探していくのですが、困ったことにt検定の項目は三つあります。 抽出した標本別に使うt検定が違ってきますので、以下の説明を見てどのt検定を使うかを確認しましょう。 t検定の種類。 どのt検定を行うべきか ・t検定:一対の標本による平均の検定 「一対の標本による」とはつまり「同じ被験者による」ということです。 つまり、同じ集団が2つのテストを行ったときなどに使うものです。 ・t検定:等分散を仮定した2標本によるt検定 2標本によるっていうのはつまり、2グループの集団がいますよってことです。 そして、 「等分散を仮定する」とか「等分散を仮定しない」とかの重要性は、「分散(標本のデータのばらつき具合)によって平均値の差の信用度が違ってくる」という認識によります。 さきほどの数式を思い出してみましょう。 どう変わるかというと、「 標準誤差が大きければt値が小さくなる。 t値が小さくなれば差の確かさが無くなっていく。 」という感じです。 2標本ということは、2つの標本があるわけですよ。 2つの標本とも同じ分散だったら、誤差は標本間で少ないでしょう。 一方、2つの標本が異なる分散を持つなら誤差はかなり大きくなるため、修正が必要なことが分かると思います。 そのため、「2標本の分散が等しいかどうか」というのは非常に大事な要素なのです。 そして、もちろん、その修正された式がこのt検定と次のt検定では用意されています。 今回はt検定の意味と流れを理解してもらうだけでいいので、そこまでは書きません。 ・t検定:分散が等しくないと仮定した2標本によるt検定 さて、上の説明でほぼこの意味は捉えられたと思いますが、「分散が等しくないと仮定した2標本によるt検定」というのは。 「2標本の分散が等しくないため、修正した数式で行うt検定」という意味です。 さて、ここまでの説明で、今回のデータはどのt検定を行うべきか分かったでしょうか?? 答えは 「分散が等しいと仮定した2標本によるt検定」か、「分散が等しくないと仮定した2標本によるt検定」のどちらかでしょう。 AクラスとBクラスという違う被験者間でのデータの検定ですからね。 さて、しかしここでまたまた問題が出てくるわけです。 すなわち 「どうすれば、分散が等しいかどうかが分かるんだ…」 ということですね。 その答えは F検定にあります。。。 検定一つするためにどんだけ前置きが必要なんだ、、といった声が聞こえてきそうですが、とりあえずF検定は次のページからにしましょう。 次ページで詳しく見ますが、t値の絶対値がt境界値を超えていれば二つのデータに差があると判断します。 固定ページ: 1•

次の

Student

対応 の ない t 検定

対応のないt検定 R コマンダーで2条件間の平均値の差の検定をやってみましょう。 R Console で以下のデータを分析してみます。 R コマンダーへのデータの読み込みは実行しましょう。 groups score 1 2. 5 1 3. 0 1 4. 2 1 5. 4 1 2. 8 1 3. 3 1 4. 0 1 2. 5 2 2. 5 2 2. 2 2 2. 0 2 1. 8 2 3. 3 2 3. 以下のダイアログが表示され,[オプション]で両側検定か片側検定か,2条件間の等分散性が保障されているかどうか,有意水準の指定などができます。 デフォルトでは,等分散が仮定できない検定(ウェルチ法)が選択されています。 等分散性が満たされているなら,「Yes」に変更しましょう。 因みに「分散比の検定」を実施してみると,以下のようになり,有意ではありませんので,等分散を仮定したt 検定を実施します。 sided', conf. 2491 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0. 4330602 15. 6854974 sample estimates: ratio of variances 2. 967795 t 検定の結果は,R Console で分析したときと当然同じになります。 sided', conf. 05271 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0. 01366192 2. 00532858 sample estimates: mean in group 1 mean in group 2 3. 462500 2. 466667.

次の

【Python】2群間での統計検定手法まとめ

対応 の ない t 検定

ある2郡間の平均値において、統計的に有意な差があるかどうか検定したいです。 ちなみに、対応のない2郡間での検定です。 T検定を行うには、ある程度のサンプル数(20以上程度?)があった方が良く、サンプル数が少ない場合には、Mann-WhitneyのU検定を行うのが良いと聞いたのですが、それは正しいのでしょうか? また、それが正しい場合には実際にどの程度のサンプル数しかない時にはMann-WhitneyのU検定を行った方がよろしいのでしょうか? 例えば、サンプル数が10未満の場合はどうしたらよろしいのでしょうか? また、T検定を使用するためには、正規分布に従っている必要があるとのことですが、毎回正規分布に従っているか検定する必要があるということでしょうか?その場合には、コルモゴルフ・スミノルフ検定というものでよろしいのでしょうか? それから、ノンパラメトリックな方法として、Wilcoxonの符号化順位検定というものもあると思いますが、これも使う候補に入るのでしょうか。 統計についてかなり無知です、よろしくお願いします。 結局ですね、適切な検定というのは適切なp値が得られるということなんですよ。 適切なp値というのは第1種の過誤と第2種の過誤をなるべく低くするようにする方法を選ぶということなのですね。 従来どおりの教科書には「事前検定をし、正規性と等分散性を仮定できたら、、、」と書いていありますが、そもそも事前検定をする必要はないというのが例のページの話なのです。 どちらが正しいかというと、どちらも正しいのです。 だから、ある研究者はマンホイットニーのU検定を行うべきだというかもしれませんし、私のようにいかなる場合においてもウェルチの検定を行う方がよいという者もいるということです。 ややこしく感じるかもしれませんが、もっと参考書を色々と読んで分析をしていくうちにこういった内容もしっくり来るようになると思います。 あくまでも「仮定」できればよいのであって、その仮定が妥当なものであれば問題ないのです。 要するにいかなる場合においても「等分散性を仮定しないt検定」を行うと良いということです。 事前検定を行うことが、すでに検定の多重性にひっかかると考える人もいます(私もその立場にいます)。 それは「歪みのある分布」と「一様な分布」のシミュレーショングラフを見れば分かりますね。 ご回答ありがとうございます。 サンプル数ではなく、サンプルサイズなのですね。 参考記事を読ませていただきました。 これによると、2群のサンプルサイズがたとえ異なっていても、 またサンプルサイズが小さくても、それから等分散に関わらず、 基本的に等分散を仮定しない t 検定を採用するのが望ましいという ことになるのでしょうか? つまり、正規分布に従っている場合、サンプルサイズが小さくても基本的に等分散を仮定しない t 検定を採用し、正規分布に従わない場合に、ノンパラメトリックな方法であるマン・ホイットニーの U 検定などを採用すればよろしいということでしょうか? また、マン・ホイットニーの U 検定は等分散である場合にしか使えないということだと理解したのですが、もし正規分布に従わず、等分散でもない場合には、どのような検定方法を採用することになるのでしょうか? いろいろご質問してしまい申し訳ございませんが、 何卒よろしくお願いします。 理想は、全てのサンプルのデータを得ること。 これは、必ず差がでます。 1mmでも、1mgで大きいほうが、誰がやっても大きいのです。 t検定は、「例数が少なくても」というのが特長です。 有意差は、有れば「有意差が有る」と書け、説得力が少しは増すだけです。 信頼性については、「いつくのサンプルなら絶対」というのは、ありません。 経験的なもので、特にヒトの場合はいろいろな人がいるので、サンプル数が十分に大きくないと、なんぞが書かれていますが、どれだけなら十分かは客観的に、というのはありません。 あくまでも確率です。 実際、食品とガンとの関係で、味噌汁は、ガンになりにくい、なりやすい、なりにくい、と二転三転しています。 実際には、無作為抽出を無限解すれば、正規分布をする、というのが統計学の基礎です 教科書だと、はじめの部分に記述してある。 そうでないと、t検定根拠を失います。 例外的に、無作為抽出をしても、「人の平均貯蓄額は、正規分布をしない」というのは有名です。 私は動物実験をして、各群3匹、計6匹で有意差有との論文にクレームがついたことはありません。 動物の場合は、無作為抽出と想定されますが、ヒトの場合は困難です。 正規分布の判定は、正規確率紙の方法は見たことがありますが、知りません。 10と1でも、2. 3と1でも、順位はいずれも1番と2番です。 10と1の方が差が大きいという情報は利用されていません。 ですから、t検定よりも有意差はでにくいでしょう。 しかしサンプル数が大きければt検定と同程度の検出力がある、と読んだことがあります。 正規分布していることが主張できないのなら、U検定は有力な方法です。 有意差が出やすい方法を選ぶのは、研究者の能力です。 ただ、正規分布していないのにt検定は、ルール違反です。 6 7. 225 4. 9 2. 6+7. 225+4. 9+2. 025=49. 25 計算過程をさらりと書いていますが,早い話が観測値と理論値のズレの大きさはいくらになるのか,を求めることになります.最終的には「49. 25」というズレ値が算出されました. さて,この「49. A ベストアンサー pは確率 probability のpです。 全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。 統計・確率には100%言い切れることはまずありません。 例えばサイコロを5回振って全て同じ目が出る確率は0. そんな時、そのサイコロを不良品 イカサマ? と結論つけるとわずかに間違っている可能性が残っています。 05でそのサイコロは正常ではないと結論付けます。 それが危険率です。 05で相関がない 相関がないと結論。 エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。 5 ここでnは組みデータの数です。 ( x1,y1 , x2,y2 ,・・・ xn,yn ) 最後に関数TDISTで確率に変換します。 両側です。 (アドインの分析ツールを使う以外は pは確率 probability のpです。 全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。 統計・確率には100%言い切れることはまずありません。 例えばサイコロを5回振って全て同じ目が出る確率は0. そんな時、そのサイコロを不良品 イカサマ? と結論つけるとわずかに間違っている可能性が残っています。 05でそのサイコロは正常ではないと結論付けます。 それが危険率です。 この場... 05以下 であれば、正規分布ではないと結論づけてお終いでいいのではないですか。 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い 区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。 ヒストグラム作成の処理に関しては、上記を参考にしてください。 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。 もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。 サンプリング手法の再検討 データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等 をして、再度データを得る必要があります。 また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える 少なくとも20~30個 必要もあります。 05以下 であれば、正規分布ではないと結論づけてお終いでいいのではないですか。 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。 ヒストグラムを作成する場合、区... 平均ではないように見えても、検定の計算式の中に、2群の平均値を用いています。 ただ、前提時要件があって、2群が正規分布していることが必要です。 サンプルを選んだときに、無作為抽出していたり、サンプル数が1000ほどあれば、正規分布を想定できます。 検定法は、どの方法を選ぶかは、研究者の自由です。 わたしがt検定を多用するのは、正規分布を想定でき、計算式が分かりやすく、サンプル数が2群で異なっても良い、その数も少なくて良い 大差があるので、1群3例でも有意差をだしています 、そして有意差が出やすいからです。 この場合は、正規分布しているという条件を満たしているとはいえないだろうと判断します。 その場合は、F検定をしてください。 これは、2群の平均値ではなく、バラツキによって検定する方法です。 正規分布している必要は無いとされています。 F検定で有意差があれば、問題ありません。 t検定では有、F検定ではなし、になると方針が定まりませんが 現在このデータで悩んでいます。 その人に訊くのが一番です。 身近にいないのなら、いないと返答があれば、書き込みますが。 というのも、大学などの研究テーマだと、指導教員をさしおいて、はマズイノデ。 もしも、このテーマに興味を持てば、私が実施して先に発表します。 こんな研究内容がハッキリ分かる書き込みを4年生がやったら、研究室は追放ですね。 長男、次男だけではなく、三男、四男となると多重比較という方法になります。 この場合、H検定 エクセルだけでは無理でしょう を使います。 平均ではないように見えても、検定の計算式の中に、2群の平均値を用いています。 ただ、前提時要件があって、2群が正規分布していることが必要です。 サンプルを選んだときに、無作為抽出していたり、サンプル数が1000ほどあれば、正規分布を想定できます。 検定法は、どの方法を選ぶかは、研究者の自由です。 わたしがt検定を多用するのは、正規分布を想... Q エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。 両者の違いが良くわかりません。 宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。 (例) セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3. 89444、STDEVPでは3. 741657となります。 また、平均値7と各数字の差を取り、それを2乗し、総和を取る 182 、これをデータの個数13で割る 14 、この平方根を取ると3. 741657となります。 では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。 A ベストアンサー データが母集団そのものからとったか、標本データかで違います。 また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。 で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。 公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。 まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。 AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。 また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要なサンプル数は、比べる検定手法により計算できるものもあります。 最低限必要なサンプル数ということでは、例えば、ある集団から、ある条件で抽出したサンプルと、条件付けをしないで抽出したサンプル 比べるための基準となるサンプル を比較するときに、そのサンプルの分布が正規分布 正規分布解説:身長を5cmきざみでグループ分けし、低いグループから順に並べたときに、日本人男子の身長なら170cm前後のグループの人数が最も多く、それよりも高い人のグループと低い人のグループの人数は、170cmのグループから離れるほど人数が減ってくるような集団の分布様式 でない分布形態で、しかし分布の形は双方とも同じような場合「Wilcoxon符号順位検定」という検定手法で検定することができますが、この検定手法は、サンプルデータに同じ値を含まずに最低6つのサンプル数が必要になります。 それ以下では、いくらデータに差があるように見えても検定で差を検出できません。 また、統計上差を出すのに必要なサンプル数の例では、A国とB国のそれぞれの成人男子の身長サンプルがともに正規分布、または正規分布と仮定した場合に「t検定」という検定手法で検定することができますが、このときにはその分布を差がないのにあると間違える確率と、差があるのにないと間違える確率の許容値を自分で決めた上で、そのサンプルの分布の値のばらつき具合から、計算して求めることができます。 ただし、その計算は、現実に集めたそれぞれのサンプル間で生じた平均値の差や分布のばらつき具合 分散値 、どのくらいの程度で判定を間違える可能性がどこまで許されるかなどの条件から、サンプル間で差があると認められるために必要なサンプル数ですから、まったく同じデータを集めた場合でない限り、計算上算出された 差を出すために 必要なサンプル数だけサンプルデータを集めれば、差があると判定されます すなわち、サンプルを無制限に集めることができれば、だいたい差が出るという判定となる。 よって、集めるサンプルの種類により、計算上出された 差を出すために 必要なサンプル数が現実的に妥当なものか、そうでないのかを、最終的には人間が判断することになります。 具体的に例示してみましょう。 ある集団からランダムに集めたデータが15,12,18,12,22,13,21,12,17,15,19、もう一方のデータが22,21,25,24,24,18,18,26,21,27,25としましょう。 一見すると後者のほうが値が大きく、前者と差があるように見えます。 そこで、差を検定するために、t検定を行います。 常識的に考えても、これだけのサンプル数で差があると計算されたのだから、差があると判断しても差し支えないだろうと判断できます。 ちなみにこの場合の差が出るための必要サンプル数は、有意確率5%、検出力0. 8とした場合に5. 7299、つまりそれぞれの集団で6つ以上サンプルを集めれば、差を出せるのです。 一方、サンプルが、15,12,18,12,21,20,21,25,24,19の集団と、22,21125,24,24,15,12,18,12,22の集団ではどうでしょう。 この場合に、このサンプルの分布様式で拾い出して差を出すために必要なサンプル数は551. 33となり、552個もサンプルを抽出しないと差が出ないことになります。 この計算上の必要サンプル数がこのくらい調査しないといけないものならば、必要サンプル数以上のサンプルを集めて調べなければなりませんし、これだけの数を集める必要がない、もしくは集めることが困難な場合は差があるとはいえないという判断をすることになるかと思います。 一方、支持率調査や視聴率調査などの場合、比べるべき基準の対象がありません。 その場合は、サンプル数が少ないレベルで予備調査を行い、さらにもう少しサンプル数を増やして予備調査を行いを何回か繰り返し、それぞれの調査でサンプルの分布形やその他検討するべき指数を計算し、これ以上集計をとってもデータのばらつきや変化が許容範囲 小数点何桁レベルの誤差 に納まるようなサンプル数を算出していると考えます。 テレビ視聴率調査は関東では300件のサンプル数程度と聞いていますが、調査会社ではサンプルのとり方がなるべく関東在住の家庭構成と年齢層、性別などの割合が同じになるように、また、サンプルをとる地域の人口分布が同じ割合になるようにサンプル抽出条件を整えた上で、ランダムに抽出しているため、数千万人いる関東の本当の視聴率を割合反映して出しているそうです。 これはすでに必要サンプル数の割り出し方がノウハウとして知られていますが、未知の調査項目では必要サンプル数を導き出すためには試行錯誤で適切と判断できる数をひたすら調査するしかないかと思います。 多少の大きさのばらつきが生じてしまいます。 1mm違っても規格外品となります。 工場では企画外品をなるべく出さないように、統計を取って、ネジの直径のばらつき具合を調べ、製造工程をチェックして、不良品の出る確率を下げようとします。 しかし、製品をすべて調べるわけにはいきません。 そこで、調べるのに最低限必要なサンプル数を調査と計算を重ねてチェックしていきます。 一方、農場で生産されたネギの直径は、1mmくらいの差ならほぼ同じロットとして扱われます。 また、農産物は年や品種の違いにより生育に差が出やすく、そもそも規格はネジに比べて相当ばらつき具合の許容範囲が広くなっています。 ネジに対してネギのような検査を行っていたのでは信頼性が損なわれます。 そもそも、統計学的検定は客観的判断基準の一指針ではあっても絶対的な評価になりません。 あくまでも最終的に判断するのは人間であって、それも、サンプルの質や検証する精度によって、必要サンプルは変わるのです。 あと、お礼の欄にあった専門家:統計学者とありましたが、統計学者が指摘できるのはあくまでもそのサンプルに対して適切な検定を使って正しい計算を行ったかだけで、たとえ適切な検定手法で導き出された結果であっても、それが妥当か否か判断することは難しいと思います。 そのサンプルが、何を示し、何を解き明かし、何に利用されるかで信頼度は変化するからです。 ただ、経験則上指標的なものはあります。 正規分布を示すサンプルなら、20~30のサンプル数があれば検定上差し支えない それ以下でも問題ない場合もある とか、正規分布でないサンプルは最低6~8のサンプル数が必要とか、厳密さを要求される調査であれば50くらいのサンプル数が必要であろうとかです。 でも、あくまでも指標です。 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。 また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要な... Q 統計についてはまったくの初心者で意味がわかりません。 こちらで回答されているのを見ていたのですが、よくわからないので質問させていただきました。 論文を提出するのに、Mann-Whitneyの検定を用いるのは上司より指導いただき わかったのですが、ソフトで出た語句について説明できません。 000 論文提出の期限が迫っており大変困ってます。 すみませんが、回答宜しくお願いします。 Q ご覧頂きありがとうございます。 有意差検定についての質問です。 正規分布していない二つの群について有意差検定を行う必要がありMann-Whitney検定を使っています。 way-nifty. html というご意見を頂いています。 分散を比較すべきでしょうか。 比較すべきであればどういった方法で行い、等しくない場合にはどの検定が使えるのでしょうか。 また、もうひとつ、今回2群のサンプル数が8倍くらい違います。 90と700というような状況です。 これについてはMann-Whitney検定を行うことに問題はないのでしょうか。 統計は今までほとんど使ってこなかったため付け焼刃の知識で解析しており間違った検定をしていないか心配です。 ご回答よろしくお願いします。 A ベストアンサー たびたび申し訳ありません。 Ansari-Bradely検定の記述をもう一度確認してみましたが,今回の場合では不適切ですね。 Ansari-Bradely検定は,代表値が(ほぼ)等しい時に,散布度(分散)に違いがあるかどうかを調べる検定法です。 今回のように,代表値に違いがあるかどうかを調べる場合には,この方法は不適切ですね。 A ベストアンサー 分析ツールが有効になっていないためです。 次の方法でアドインを読み込みましょう。 読み込みが完了しExcelを再起動すると「データ」タブ内に「分析」の項目ができて「データ分析ボタン」が表示され使用可となります。 Excel ヘルプで検索。 [データ分析] コマンドが表示されない場合は、分析ツール アドイン プログラムを読み込む必要があります。 [ファイル] タブをクリックし、[オプション] をクリックして、[アドイン] カテゴリをクリックします。 [管理] ボックスの一覧の [Excel アドイン] をクリックし、[設定] をクリックします。 [有効なアドイン] の一覧の [分析ツール] チェック ボックスをオンにし、[OK] をクリックします。 ヒント [有効なアドイン] の一覧に [分析ツール] が表示されない場合は、[参照] をクリックしてアドイン ファイルを検索します。 分析ツールが現在コンピューターにインストールされていないというメッセージが表示されたら、[はい] をクリックして分析ツールをインストールします。 分析ツールが有効になっていないためです。 次の方法でアドインを読み込みましょう。 読み込みが完了しExcelを再起動すると「データ」タブ内に「分析」の項目ができて「データ分析ボタン」が表示され使用可となります。 Excel ヘルプで検索。 [データ分析] コマンドが表示されない場合は、分析ツール アドイン プログラムを読み込む必要があります。 [ファイル] タブをクリックし、[オプション] をクリックして、[アドイン] カテゴリをクリックします。 [管理] ボックスの一覧の [Excel アドイン] をクリッ...

次の