引用元:https://hayabusa.open2ch.net/test/read.cgi/livejupiter/1658463649

1: 名無しさん@おーぷん 22/07/22(金) 13:20:49 ID:HqhH
統計とか統計学の話がしたい
知らないことの方が多いかもだけど頑張る


2: 名無しさん@おーぷん 22/07/22(金) 13:22:06 ID:buJj
回帰分析って何?


3: 名無しさん@おーぷん 22/07/22(金) 13:22:58 ID:HqhH
>>2
あるデータであるデータを説明しようとすること
回帰分析自体は単に相関関係を見る作業や


4: 名無しさん@おーぷん 22/07/22(金) 13:24:54 ID:4i9k
正規分布って何?


5: 名無しさん@おーぷん 22/07/22(金) 13:25:45 ID:HqhH
>>4
よくある分布
身長とかそうやし、なにかの平均を取ったものそれ自体も数増やしていったらそうなるっていう分布
登場頻度が高い


6: 名無しさん@おーぷん 22/07/22(金) 13:27:23 ID:HqhH
一問一答スレかな?


7: 名無しさん@おーぷん 22/07/22(金) 13:29:39 ID:EgNp
なんかないんか?
なんでもええんやけど


9: 名無しさん@おーぷん 22/07/22(金) 13:30:12 ID:HqhH
>>7
ワイか?ワイも何でもええけど


8: 名無しさん@おーぷん 22/07/22(金) 13:30:11 ID:RFES
ボルツマンマクスウェル分布とカノニカル分布の違いって何


10: 名無しさん@おーぷん 22/07/22(金) 13:37:59 ID:HqhH
>>8
知らなかったから調べた
前者は分子の質量と絶対温度の比と定数で定まる分布関数なんやな
それに対して、後者は逆温度と微視的状態というもので定まる確率分布を総和が1になるようにした分布関数なのか
いずれも物理的な条件をもとにして定められる分布関数やけど、興味の対象がちゃうんやね


12: 名無しさん@おーぷん 22/07/22(金) 13:43:08 ID:HqhH
答えた後全員無言で去るやん
なんか話そうや


13: 名無しさん@おーぷん 22/07/22(金) 13:47:37 ID:9OGb
主成分分析と因子分析の使い分けについて教えて


14: 名無しさん@おーぷん 22/07/22(金) 13:53:03 ID:HqhH
>>13
これまた馴染みのない言葉だったので調べたら、なるほど因果推論をするための方法なんやな
Observableな情報を用いて、その変数に共通する原因を想定して推定するのが因子分析で、その変数による結果を推定するのが主成分分析なのか
モデル的には観測された値を従属変数とするのか独立変数とするのかっていう違いがあるんやね


67: 名無しさん@おーぷん 22/07/22(金) 14:40:40 ID:9OGb
>>14
せやな
因果の因の方を検討するとかに使うのが因子分析、因があること前提で結果にどのように効くのかを推定するのが主成分


16: 名無しさん@おーぷん 22/07/22(金) 13:55:27 ID:ElIq
PCA知らんのはガチ素人やんけ


17: 名無しさん@おーぷん 22/07/22(金) 13:56:53 ID:HqhH
>>16
どちらかというとエコノメの話の方が詳しいかな
GMMのモーメント条件がどうこうとかGLSとか、ハザード関数がどうのこうのとかそういうの


18: 名無しさん@おーぷん 22/07/22(金) 13:58:17 ID:HqhH
なんでみんなワイの回答に対して無言で去っていくんやろ


19: 名無しさん@おーぷん 22/07/22(金) 14:01:55 ID:SPhq
>>18
ここはラインとちゃうんやぞ


20: 名無しさん@おーぷん 22/07/22(金) 14:03:36 ID:HqhH
>>19
会話する場所ではあるやん

「〇〇って何?」

「▲▲っていうことやな」

「ほーん、□□っていう感じなんやな。サンガツ」

みたいな流れがあるやん普通に


21: 名無しさん@おーぷん 22/07/22(金) 14:04:25 ID:SPhq
>>20
ここにはない


22: 名無しさん@おーぷん 22/07/22(金) 14:04:43 ID:HqhH
>>21
でも今ワイとお前は会話しとるやん


23: 名無しさん@おーぷん 22/07/22(金) 14:05:53 ID:SPhq
>>22
現に他のやつは返さないやろ?
そういうことや


34: 名無しさん@おーぷん 22/07/22(金) 14:17:54 ID:PqQW
>>22
統計スレなんだからまともに会話するやつとしない奴の統計とれよ


24: 名無しさん@おーぷん 22/07/22(金) 14:06:30 ID:HqhH
ワイは統計の話がしたいだけなんや


25: 名無しさん@おーぷん 22/07/22(金) 14:07:47 ID:Fwes
ほぉ〜
統計のワイに初歩を教えてくれや
偏差値を求めるところまででええから


27: 名無しさん@おーぷん 22/07/22(金) 14:13:20 ID:HqhH
>>25
(点数とか学力の)偏差値っていうのはまず正規分布を仮定するところから始まるねんな
全員の点数の分布は平均点にたくさん集まって、そこから離れただけ対称に少なくなっていくとするんや
で、それを仮定したら、平均点との差を分散の平方根で割ってやることで、標準正規分布ってやつに従う確率変数(の実現値)になるねん
その確率変数の平均はゼロ、分散は1や
それに10かけると分散が100になる
で、最後に50を足してやれば平均は50になるな
そうしてできた基準に当てはめて行けばそれぞれの点数の偏差値が求まるってわけなんや


29: 名無しさん@おーぷん 22/07/22(金) 14:14:06 ID:Fwes
>>27
そんなに一気に書かれても理解が追い付かんがな


30: 名無しさん@おーぷん 22/07/22(金) 14:14:35 ID:HqhH
>>29
偏差値を求めるところまでっていうから


32: 名無しさん@おーぷん 22/07/22(金) 14:15:58 ID:Fwes
>>30
そっかすまんね
一レス毎に理解していくのを期待したわ


26: 名無しさん@おーぷん 22/07/22(金) 14:11:01 ID:Fwes
あれ
一分後にレスいれても
見てくれてないのか・・・


28: 名無しさん@おーぷん 22/07/22(金) 14:13:33 ID:HqhH
>>26
遅くなった
すまん


31: 名無しさん@おーぷん 22/07/22(金) 14:15:10 ID:Fwes
まずは
"平均点との差を分散の平方根で割ってやることで"
ここからや
平均点はわかるけど
分散ってなんや


33: 名無しさん@おーぷん 22/07/22(金) 14:17:45 ID:HqhH
>>31
分散というのは高校の数学でやった通り、平均からの差の2乗の平均やで
x1,...,x100っていう100人分の点数があったら、(x1-平均),^2...,(x100-平均)^2って具合に求めていって、足して100で割るんや


35: 名無しさん@おーぷん 22/07/22(金) 14:19:24 ID:Fwes
>>33
なんで差の2乗を取らなきゃいけないんや


37: 名無しさん@おーぷん 22/07/22(金) 14:22:30 ID:HqhH
>>35
分散という統計量を取るモチベーションは「データがどれくらいバラついてるか」を比べたいってところから来とるで
同じ平均50のデータでも、50,50,51,50,49っていうデータと50,100,0,100,0ってデータを同じやとは思わないやろ?


40: 名無しさん@おーぷん 22/07/22(金) 14:23:25 ID:Fwes
>>37
それはええねん
なんで二乗せなあかんのかや


43: 名無しさん@おーぷん 22/07/22(金) 14:26:36 ID:4i9k
>>40
2乗せずに平均したらどうなるかを考えれば良いんやないか?


84: 名無しさん@おーぷん 22/07/22(金) 14:52:56 ID:Fwes
>>43と>>63のことか?
どちらも答えじゃないからだな


85: 名無しさん@おーぷん 22/07/22(金) 14:53:08 ID:e1ix
>>84
ほっ統計


86: 名無しさん@おーぷん 22/07/22(金) 14:54:46 ID:4i9k
>>85
つまんね


46: 名無しさん@おーぷん 22/07/22(金) 14:27:22 ID:HqhH
>>40
じゃあ他にどんな方法で「バラつき具合」を表せるのか考えてみようか
パッと思いつくのは平均からの差の絶対値を取る方法
48なら平均50から2離れてるし、53なら3離れてる
これを全部足してもバラつきを表現できそうやね

せやけど、これからまとめて割ったり掛けたりすることを考えると絶対値よりは2乗のほうが便利なんや
そもそも|x1-xの平均|と(x1-xの平均)^2って似てるやろ?


49: 名無しさん@おーぷん 22/07/22(金) 14:29:00 ID:Fwes
>>46
そこの便利を理由にしてほしくないのよね

理屈に合うなら複雑でもええやん
今はコンピュータの時代や


52: 名無しさん@おーぷん 22/07/22(金) 14:31:48 ID:HqhH
>>49
実際PC使えば絶対値でも計算できるからそれでやってもええんやで
バラつきを比べることが目的なんやから、それが達成できるならなんでもええんや
実際、正規分布は分散ではなく偏差の絶対値の平均からでも作れるからな


55: 名無しさん@おーぷん 22/07/22(金) 14:34:15 ID:Fwes
>>52
なんとそうなんか


58: 名無しさん@おーぷん 22/07/22(金) 14:36:05 ID:HqhH
>>55
だって平均を取る理由も別に明確ではないやろ?
代表値としては中央値や最頻値をもちいてもええわけやし
せやけど基本的に便利やから使われとる
分散も同じやで


61: 名無しさん@おーぷん 22/07/22(金) 14:38:02 ID:Fwes
>>58
最初の仮定が間違えてたら
求めた結果は信頼できないよね

偏差値とか正規分布してるという仮定なんやろ?


65: 名無しさん@おーぷん 22/07/22(金) 14:39:43 ID:HqhH
>>61
せやで
そこの仮定が正しいかどうかを検定するために「分布自体を推定する」っていうアプローチもあるねん


66: 名無しさん@おーぷん 22/07/22(金) 14:39:50 ID:ElIq
>>61
それは正しい
偏った分布だとあんま意味がなくなる


90: 名無しさん@おーぷん 22/07/22(金) 14:56:55 ID:9OGb
>>61
基本的にnが多くなると正規分布に近似できるので、そこは問題ない


92: 名無しさん@おーぷん 22/07/22(金) 14:57:42 ID:HqhH
>>90
不偏分散の話に中心極限定理は関係ないで


95: 名無しさん@おーぷん 22/07/22(金) 15:00:39 ID:ElIq
>>90
複雑系から反感買いそうな主張やな
テスト得点とかはそうやろけども


97: 名無しさん@おーぷん 22/07/22(金) 15:03:06 ID:HqhH
>>95
中心極限定理を拡大解釈してるんだと思う


101: 名無しさん@おーぷん 22/07/22(金) 15:11:59 ID:9OGb
>>97
あれ、俺の認識がおかしいのか?
中心極限定理はnが大ならば近似的に正規分布に従ったものになるってことやろ?
現在よく偏差値が利用されるのは、多くの観測データはさまざまな誤差をふくんだものであって、この定理を当てはめることが出来る状況にあるから正規分布としてるんじゃなかったか?


102: 名無しさん@おーぷん 22/07/22(金) 15:13:27 ID:HqhH
>>101
せやな、それはおかしいで


104: 名無しさん@おーぷん 22/07/22(金) 15:14:12 ID:ElIq
>>101
標本平均の「誤差」が正規分布に従うだけや


107: 名無しさん@おーぷん 22/07/22(金) 15:19:38 ID:HqhH
>>104
母平均と標本平均の差にルートnを掛けたものが(0,σ^2)の正規分布に従うって定理やから、標本平均自体も正規分布には従うで


117: 名無しさん@おーぷん 22/07/22(金) 15:32:15 ID:9OGb
>>104
>>116
なるほどなぁ


116: 名無しさん@おーぷん 22/07/22(金) 15:29:41 ID:5JDr
>>101
中心極限定理は関係なくて自然現象、例えば身長とか工業生産品の実力とかは、そうべつさえしとけば正規分布になりやすいってだけや
そもそも偏差値やら平均やら分散やら出す前にグラフを書くことが統計では大事やで

統計検定2級やから自信はないが


63: 名無しさん@おーぷん 22/07/22(金) 14:38:18 ID:4i9k
>>40
2乗せずに平均すると0になるから、2乗するって聞いたんやが


87: 名無しさん@おーぷん 22/07/22(金) 14:55:11 ID:HqhH
>>63
偏差の2乗を使わずにバラつきを表現する方法はいくらでもあるで
例えば偏差の絶対値を使うこと
例えば四分位範囲を使うこと
例えば最小値と最大値を使うこと
せやけど数学的な性質の便利さから分散が使われることが多いということや


38: 名無しさん@おーぷん 22/07/22(金) 14:22:38 ID:Fwes
正規分布というのも難問やね


41: 名無しさん@おーぷん 22/07/22(金) 14:24:08 ID:HqhH
>>38
正規分布というのは「よくある分布」や
身長もこの分布に従うとされている
分布っていうのは、データの散らばり方やね
どの値を取りやすいか、どの値を取りにくいかをまとめた概念や


47: 名無しさん@おーぷん 22/07/22(金) 14:27:33 ID:jCqR
統計学って結果の正しさから過程を検証したものなん?
それとも過程の正しさを元に結果にも因果関係があるはず、と見做すの?
OPSは前者で高打率=好打者とする旧来の考え方は後者って感覚なんやが、統計学はどっち?


50: 名無しさん@おーぷん 22/07/22(金) 14:29:47 ID:HqhH
>>47
仮定かな?
統計学っていう括りなら、「得られたデータは、裏にある真の値が確率的にバラつきがある形で表出したもの」っていう仮定をおいて、データからその真の値や分布を推定する方法論やで
因果推論はまた違うレイヤーの話やな


51: 名無しさん@おーぷん 22/07/22(金) 14:31:17 ID:jCqR
>>48
>>50
なるホモ三月


39: 名無しさん@おーぷん 22/07/22(金) 14:22:57 ID:GzXJ
統計ってワイの人生にどんな影響があるんや
わいの知らない統計の中でワイが少数派だったとして、実際にワイが多数派か少数派かなんて統計にはわからんし、ワイが多数派にならなきゃいけないわけでもないやろ?


45: 名無しさん@おーぷん 22/07/22(金) 14:26:49 ID:ElIq
>>39
少数派であることが分かれば広告もマニア向けのを配信することで売上が上がる可能性が高まるやん


53: 名無しさん@おーぷん 22/07/22(金) 14:32:47 ID:GzXJ
>>45
ワイが少数派かどうかなんて統計にはわからんやろ
少数派の量はわかるやろうけど


56: 名無しさん@おーぷん 22/07/22(金) 14:35:04 ID:HqhH
>>53
横レスやけど、例えば「Googleで毎日『おんJ』って検索して一つのサイトにアクセスしてる」っていう情報があれば、他と比較して少数派かどうかわかるかもしれんよな?
収集された自分の情報を元にいろいろ推測はできるねんな


64: 名無しさん@おーぷん 22/07/22(金) 14:38:59 ID:GzXJ
>>56
それってビッグデータみたいな話やろ?人間の活動記録が完全に取れるならそりゃワイが少数派か多数派かは明らかや。
わいが聞きたいのは従来のサンプルを用いた統計の場合や
無作為に集められた一元的なサンプルから作られた統計はわいの人生に影響あるんか?


68: 名無しさん@おーぷん 22/07/22(金) 14:41:47 ID:ElIq
>>64
データマイニングも統計学の一部とされてるから切り分けは微妙やな
まぁ国勢調査とかなら政策決定に使われるし意味はあるんちゃう知らんけど


70: 名無しさん@おーぷん 22/07/22(金) 14:43:07 ID:HqhH
>>64
お前がどんなライフスタイルなのかにもよるな
例えばアイスクリーム屋さんをやってるなら、天気と曜日から売上を説明することで明日開店するかどうかを決めることができるかもしれない


93: 名無しさん@おーぷん 22/07/22(金) 14:58:51 ID:GzXJ
>>70
それやと売り上げとか来客数に統計はどんな影響があるのかって話になて、明日が一回しか来ない以上比較できないからやはり統計に基づいた判断が正しいのかどうかわからんってことになるやん。

まあその辺は同じような条件のデータと比較してそれこそ統計に基づいでこれなら信憑性があるだろうって感じなんかな

わいが納得できないのは統計で未来がわかる!みたいな風潮なんかな?
明日とかワイとか再現性がないものに対して統計が使える!っちゅーのが納得できん


99: 名無しさん@おーぷん 22/07/22(金) 15:07:49 ID:HqhH
>>93
統計を活用したときの収益としなかったときの収益は比較できないというのは中心的な懸念で的を射てるで
そこを改善するために因果推論って分野が生まれたんや
例えば、「施策を打った人たち」と「施策を打たなかった人たち」が施策前からいろいろな変数が同じような動きをしていることが確認できた場合、打ったことによるそのトレンドの変化は因果関係と言える、とかな


72: 名無しさん@おーぷん 22/07/22(金) 14:44:33 ID:9OGb
ワイが今だに納得いってないことをわかりやすく説明してほしい
なぜ分散を求める際に平方和をnではなく、n-1で割るのか?


77: 名無しさん@おーぷん 22/07/22(金) 14:46:48 ID:HqhH
>>72
nを増やしていったときに、漸近的に母集団の分散に近づくようにするためやで
lim n→∞ (1/n)(xi-平均)で極限を計算すると母集団の分散に一致しないんや


81: 名無しさん@おーぷん 22/07/22(金) 14:49:54 ID:9OGb
>>77
確かにそんな感じでn-1の方が利点があるとして習ったんやが、まずそこが納得できんのよ
分散って要はnが増加すると平方和も増加するから平方和の平均で議論しようという考え方やろ?
それがなんで1/nやと母集団の分散に一致しなくなるんや?


83: 名無しさん@おーぷん 22/07/22(金) 14:52:30 ID:HqhH
>>81
すまん>>77は違うな、間違いや
nで割った標本分散は、nを増やしていくと真の値σ^2に一致する(一致性は満たされる)
問題はそこではなくて、nが多くないときに期待値が(n−1)σ^2になってしまうことなんや(不偏性が満たされない)


88: 名無しさん@おーぷん 22/07/22(金) 14:55:44 ID:9OGb
>>83
nが十分大きくないと成り立たなくなるってことなのか?


91: 名無しさん@おーぷん 22/07/22(金) 14:57:10 ID:HqhH
>>88
十分大きいときも無限大でなければ誤差はあるんよ
n-1で割れば補正できるねん


94: 名無しさん@おーぷん 22/07/22(金) 14:59:38 ID:GzXJ
統計って全体に対する量じゃないんか?


98: 名無しさん@おーぷん 22/07/22(金) 15:04:36 ID:HqhH
>>94
統計ってもの自体はデータを取ってきてそれを解釈したり要約したりすることやで


103: 名無しさん@おーぷん 22/07/22(金) 15:14:04 ID:GzXJ
>>98
比率を解釈して統計にしてるって感じなんかな?データ自体は全体に対する部分の量やろ?
ある部分が多数派が少数派かを正規分布やらで表現してるわけで、そこに新たに部分のデータが一つ加わるとして、それが多数派か少数派かは実際に計算しないとわからないわけや。

判断基準として一定の信憑性があるだけで、未来がわかるわけちゃうやろ?


106: 名無しさん@おーぷん 22/07/22(金) 15:16:54 ID:HqhH
>>103
未来がわかるかどうかは因子に対して得られる情報量次第やな
例えば病院の無菌室の中でなら結果を予測するのは簡単
実験室のビーカーの中でも結果を予測するのは簡単
未来が予測できるかどうかは因子に対する情報量次第やで


109: 名無しさん@おーぷん 22/07/22(金) 15:22:14 ID:GzXJ
>>106
自然界で予測するのは難しいから因子に対する情報量が多いビッグデータや!ってことになるんかな?因子に対する情報量が無限だった場合、それは未来になるんかな?あくまでも判断基準か?


111: 名無しさん@おーぷん 22/07/22(金) 15:24:36 ID:HqhH
>>109
ビッグデータってデジタル化の普及で観測してストックできる情報が多くなってきましたねって話でしかないし、そんな革命的なものではないで
未来とか判断基準とかは応用次第
推測統計は一貫して「推測」


114: 名無しさん@おーぷん 22/07/22(金) 15:26:59 ID:GzXJ
>>111
因子に対する情報量が増えてるってことやんな?

やっぱ推測よな。未来がわかる!みたいな風潮ないか?納得いかんくない?


115: 名無しさん@おーぷん 22/07/22(金) 15:28:10 ID:HqhH
>>114
お前は「未来がわかる」って決定論的に捉えとるんか?
推測やからある意味では「未来がわかる」ではあるけども


118: 名無しさん@おーぷん 22/07/22(金) 15:32:46 ID:GzXJ
>>115
決定論なのかそうじゃないのかが知りたいねん。決定論じゃないならそれでスッキリするわ
でもやってることとしては決定論に近いやろ?統計ってこういう条件の場合こういう結果になるって話なわけやから


119: 名無しさん@おーぷん 22/07/22(金) 15:34:14 ID:HqhH
>>118
それは因果推論
相関関係と因果関係をごっちゃにして見当違いに憤ってるように思う


123: 名無しさん@おーぷん 22/07/22(金) 15:39:58 ID:GzXJ
>>119
相関と因果って違いわからんわ
>>122
そこまで分かっててなんで補償されないんや?


124: 名無しさん@おーぷん 22/07/22(金) 15:42:02 ID:HqhH
>>123
暑い日にアイスがよく売れる(因果関係)
暑い日に水遊びが増えて水難事故が増える(因果関係)

水難事故が多いとアイスもよく売れる(相関関係)

特にこういう因果関係のない相関関係については擬似相関って言ったりするで


125: 名無しさん@おーぷん 22/07/22(金) 15:43:19 ID:GzXJ
>>124
因果関係のある相関関係もあるんか?


126: 名無しさん@おーぷん 22/07/22(金) 15:44:02 ID:HqhH
>>125
因果関係があれば相関関係もあるで
暑い日にアイスが売れるなら、気温とアイスの売上に相関関係があるはずやろ?


127: 名無しさん@おーぷん 22/07/22(金) 15:44:40 ID:5JDr
>>123
わかりやすいシンプルな例でいうと50m走りのタイムと年収には負の相関がある
つまり足が遅いほど年収が低いということや
ただそこに因果関係があるかと言うとない
実際には年功序列社会なので、年を取るほど足は遅くなる年収が上がると言うだけ
つまり年齢と年収には因果関係があるが足の速さと年収にはない


130: 名無しさん@おーぷん 22/07/22(金) 15:59:07 ID:GzXJ
>>127
歳をとる=年収下がる(因果)
歳をとる=足が遅くなる(因果)
足が遅い😉年収下がる(負の相関)
ってことなんか?
>>129
一つの原因から得られる二つの異なる結果が相関関係になるんか?


133: 名無しさん@おーぷん 22/07/22(金) 16:02:03 ID:HqhH
>>130
相関関係は次のどの場合でも観測される
「Bを変えた影響でCが変わった」
「Cを変えた影響でBが変わった」
「Aの影響で、BとCが同時に変わった」
「BとCはたまたま同じように動いている」

この中で、つまり一番上だけがB→Cという因果関係って言えるわけ


153: 名無しさん@おーぷん 22/07/22(金) 16:26:21 ID:GzXJ
>>133
「BとCはたまたま同じように動いている」
原因が明らかじゃなくてもいいってなると、関係があるように見えればええんやな


155: 名無しさん@おーぷん 22/07/22(金) 16:29:39 ID:HqhH
>>153
相関関係って数値上の定義でしかないからな
そういう数値上の関係があるっていう以外には意味とかは特にない


122: 名無しさん@おーぷん 22/07/22(金) 15:36:39 ID:5JDr
>>118
決定論ではない
例えば相関があったとしても因果関係があることにはならないし、どの因子が効くかわかってもそれは結果を保障するものじゃない


96: 名無しさん@おーぷん 22/07/22(金) 15:00:39 ID:k85V
競馬に統計学って使えるんか
有利な枠とか調子のええ騎手とか


100: 名無しさん@おーぷん 22/07/22(金) 15:09:39 ID:HqhH
>>96
うーん、レース結果を説明するのに有効な変数をどれくらい取ってこれるかにかかってると思うで
天気とかしかわからないなら難しいけど、馬に近い人ならもっと生物学的な変数を取ってこれるかもしれないし


108: 名無しさん@おーぷん 22/07/22(金) 15:21:49 ID:HqhH
>>107
従うというか、漸近的に従うようになる、か


110: 名無しさん@おーぷん 22/07/22(金) 15:23:43 ID:GzXJ
現状統計って未来じゃなくて判断基準やろ?


112: 名無しさん@おーぷん 22/07/22(金) 15:24:41 ID:HqhH
>>110
推測やな


120: 名無しさん@おーぷん 22/07/22(金) 15:35:29 ID:HqhH
「統計」っていう大きすぎるものを批判しているせいでよくわからないことになってる
統計は方法論であって、批判されるべきはそれを用いたここの分析やで


121: 名無しさん@おーぷん 22/07/22(金) 15:35:44 ID:HqhH
>>120
ミス
ここの→個々の


128: 名無しさん@おーぷん 22/07/22(金) 15:50:19 ID:GzXJ
A=B
B=C
A=Cってことか?
ここまで直接的に関わってるのが明らかだと因果関係になるんかな?
相関関係のうちで直接的な関わりがあるものが因果関係になるんか?


129: 名無しさん@おーぷん 22/07/22(金) 15:54:51 ID:HqhH
>>128
イコールだと因果(原因と結果)の関係が分かりづらいから「原因→結果」にしよう
A→B、A→Cだとすると、B→Cではないのにそう見えてしまう
直接的にというか、原因と結果の関係になっていれば因果関係やで
「Aを変えればBが動く」なら因果関係
「Aが変わったときBも変わっている」なら相関関係
原因と結果やなくて、単なる現れた事実でしかない


131: 名無しさん@おーぷん 22/07/22(金) 15:59:22 ID:HDxM
すごい細かくいうと、すべての関係は相関関係で
因果関係ってものはないけどな


134: 名無しさん@おーぷん 22/07/22(金) 16:02:30 ID:HqhH
>>131
無いというのはどういうことや?


142: 名無しさん@おーぷん 22/07/22(金) 16:10:03 ID:HDxM
>>134
経験的な観測から因果関係を導く、
帰納というプロセスが実は自明ではないってことや。

まあ実務上ではええんやけどね。


144: 名無しさん@おーぷん 22/07/22(金) 16:13:12 ID:HqhH
>>142
確かにモデルについては(線形なのか、どの独立変数を取るのか、非線形ならprobitにするのか、とか)仮定してるわけやから、そこは整合してないと何言っても無駄ではあるけどなあ
モデルの元での因果関係は正しく推定できるやんか


146: 名無しさん@おーぷん 22/07/22(金) 16:15:46 ID:5JDr
>>144
例えばその線形モデルで扱ってる変数が本当に因果関係があるのか?の根拠的な話しちゃうか


147: 名無しさん@おーぷん 22/07/22(金) 16:17:08 ID:HqhH
>>146
モデルの下で因果関係があるのかないのかに関しては、操作変数法やFixed effect推定量を用いれば識別できるで


152: 名無しさん@おーぷん 22/07/22(金) 16:25:31 ID:HDxM
>>144
「因果」を見出してるのは、
あくまでも人間の側の主観にすぎんからね


154: 名無しさん@おーぷん 22/07/22(金) 16:28:38 ID:HqhH
>>152
それって自然科学も同じやんか
仮に気温以外のあらゆる変数が一定で気温だけが変化したときにアイスの売上が伸びるなら、試験管の中の反応で因果関係を捉えることと何が違うんや


156: 名無しさん@おーぷん 22/07/22(金) 16:32:53 ID:HDxM
>>154
そのどっちも”経験則”でしかない。
そのから法則は(厳密には)導けない。


157: 名無しさん@おーぷん 22/07/22(金) 16:35:45 ID:HqhH
>>156
まあ自然科学の統計的手法もそうだっていうならまあそうやけど
それを95%信頼区間や99%信頼区間とかのファジーな結論で許すのが統計学やんそもそも


135: 名無しさん@おーぷん 22/07/22(金) 16:03:49 ID:Lors
割とお固い感じのお勧めの教科書教えて
統計以外の解析とか代数は大体できる


136: 名無しさん@おーぷん 22/07/22(金) 16:05:17 ID:HqhH
>>135
ならWooldridgeのエコノメかな


139: 名無しさん@おーぷん 22/07/22(金) 16:08:37 ID:Lors
>>136
英語めんどくさい


138: 名無しさん@おーぷん 22/07/22(金) 16:07:07 ID:J7K1
統計は数量比較を行う学問で必然的に諸事象を互換的同質的な単位に還元するけど、現実には互換するもののない完全に一回的な事象(自分自身の生存など)があって、それに対して統計的事実を適用させることの妥当性は何なのか?っていうのが上の人の当初の疑問だったように解釈した


143: 名無しさん@おーぷん 22/07/22(金) 16:10:38 ID:HqhH
>>138
外的妥当性のことね
その検定については、individualが同時に持つ他の変数との整合性で見るしかないわな
つまり、適用するにあたって同一の母集団を持つと言えるのかってとこよね


145: 名無しさん@おーぷん 22/07/22(金) 16:15:37 ID:J7K1
>>143
「一度は数のうちに入らない」っていうドイツの諺があるって話を小説で読んで、たしかにそう言われてみればそうやなって思ったわ


148: 名無しさん@おーぷん 22/07/22(金) 16:17:19 ID:GzXJ
>>138
半分くらいしか理解できんけど多分そういうことが言いたいんや
>>143
同じような性質を持った人からとった統計は同じような人に対しては有効ってことか?全く別の性質を持った人に対しては統計上はわからないってことになるんか?


150: 名無しさん@おーぷん 22/07/22(金) 16:18:30 ID:HqhH
>>148
わからないで
もともと推定してる母集団が違うなら何も言えへん


149: 名無しさん@おーぷん 22/07/22(金) 16:18:06 ID:6xDX
今時代ってAI使った深層学習も統計分野に含まれるん?


151: 名無しさん@おーぷん 22/07/22(金) 16:19:43 ID:HqhH
>>149
機械学習のモデル作ったりするおしごともデータサイエンティストっていうし、まあ言うやろな


引用元:https://hayabusa.open2ch.net/test/read.cgi/livejupiter/1658463649