統計学の勉強するよ

1 : 2022/03/18(金) 16:36:58.539 ID:Q4GMqQaV0
使用する教科書は「基礎統計学Ⅰ 統計学入門」
統計学に詳しい人がいたら付き合ってね
2 : 2022/03/18(金) 16:37:29.262 ID:bO9pbxgTM
どうぞ。
5 : 2022/03/18(金) 16:38:12.647 ID:Q4GMqQaV0
>>2
ようこそ
早速はじめるね

>>3
しないよ

3 : 2022/03/18(金) 16:37:42.865 ID:6Fu/N8gB0
パートスレにするなよ
4 : 2022/03/18(金) 16:38:05.758 ID:Le+MsUEWa
えー
7 : 2022/03/18(金) 16:40:45.911 ID:Q4GMqQaV0
1章 統計学の基礎
 内容が概説的なため省略

2章 1次元のデータ
 平均、分散、標準偏差が軽く触れられる程度
 ここも省略

分散S^2=1/n{(観測値-平均値)^2 これをn個}
標準偏差d=√S

10 : 2022/03/18(金) 16:44:00.897 ID:+MirshIUr
まずは標準偏差のべんきょーから
14 : 2022/03/18(金) 16:48:31.477 ID:Q4GMqQaV0
>>10
分散も標準偏差も、意味としては各データのばらつきの度合いを指す
d=√{(観測値-平均値)^2 の平均値}

標準偏差は分散と違って、観測値の単位をそのまま使えるのが便利だよね
標準偏差2つぶん(±2σ)なら全体の95%のデータがある、みたいにある程度便利に考えられるし

11 : 2022/03/18(金) 16:44:36.558 ID:Irj5emdv0
名著じゃん
マジでいい本だよな
16 : 2022/03/18(金) 16:50:57.626 ID:Q4GMqQaV0
>>11
一応続編の「人文・社会科学の統計学」「自然科学の統計学」も持ってはいる
前者は通読したけれどあまり実用性を見いだせなかった
後者は線形代数の知識がないと読めなさそうだから挫折中

名著なのかな?正直この本かなりとっつきにくいんだよね
最終的には簡潔かつ網羅的で有用だけど、初学には向かない本ってイメージ

12 : 2022/03/18(金) 16:45:32.081 ID:Q4GMqQaV0
練習問題が付属しているんだけど、これどうやって解けばいいの
手計算?面倒だなぁ

n=10のデータ(各値は0~10程度の整数値)について、ジニ係数を計算しろという課題がある
これのプログラムを組めるほど知識ないんだよね

13 : 2022/03/18(金) 16:47:20.110 ID:6Fu/N8gB0
10個ぐらいなら手計算しよう
頭の体操だよ
17 : 2022/03/18(金) 16:51:36.329 ID:Q4GMqQaV0
>>13
面倒なのでジニ係数は省略します
他の課題やるわ
15 : 2022/03/18(金) 16:48:33.436 ID:4kopgZDr0
これ有名なのかな 俺も買わされたわ
18 : 2022/03/18(金) 16:58:14.567 ID:Q4GMqQaV0
3章 2次元のデータ
この時点では相関(correlation)と回帰(regression)の定義と、これの例示に留まる。
回帰分析については13章で取り上げる。遠いので多分今日中にはたどりつけない

相関係数(product-moment correlation coefficient)
ここでは、2変数の相関の強さを示す指標。-1だと負の完全相関、+1だと正の完全相関
Rx,y=(x,yの共分散) / SxSy
 共分散=(x観測値-x平均)(y観測値-y平均) の平均値 →偏差積の平均値

19 : 2022/03/18(金) 17:07:17.943 ID:Q4GMqQaV0
偏相関係数(partial CC)
x,y,zの3変数があるとき、zの影響を除いたx,yの相関係数をr(xy・z)と表記する。
計算方法はたぶんその都度読めばよさそうなので省略。

順位相関係数(rank CC)
スピアマンの順位相関係数は、上記の相関係数の定義式にあてはめたものを整理したもの
ケンドールの順位相関係数は、片方を順位順にソートした後に、もう片方の順位との単純な差を数値化したもの

20 : 2022/03/18(金) 17:12:39.066 ID:Q4GMqQaV0
最小二乗法(method of least squares)
一時回帰式 y=bx+a と観測値のx,yを比べて誤差項を計算し、誤差項の2乗和が最小になるようにa,bを定義する手法

この証明課程に正規方程式が出てくるのだけれど、ここが本当に難しい
線形代数や微積分学未履修なんだよな

21 : 2022/03/18(金) 17:19:07.991 ID:launjYv50
>>20
最悪2次関数の極値問題として高校知識で証明することもできるけど、そっちで手動かしてみたら?
23 : 2022/03/18(金) 17:23:59.977 ID:Q4GMqQaV0
>>21
確かにそうだな
先にそっちでやってみる
22 : 2022/03/18(金) 17:22:51.378 ID:Q4GMqQaV0
回帰方程式 y=ax+b
観測値 (x,y)=(xi,yi) i=1,2,・・・,n

L=Σ{yi-(b・xi +a)}^2 ・・・2乗和の定義式

ここから頑張って解釈する

24 : 2022/03/18(金) 17:33:33.427 ID:Q4GMqQaV0
全然解けない
26 : 2022/03/18(金) 17:43:22.272 ID:Q4GMqQaV0
文字の煩雑化を避けるため、xi,yi をそれぞれ x,y として記載する。

L={y-(bx+a)}^2
=a^2+2(xb-y)a+(xb)^2-2xyb+y^2 ・・・①

bを定数として見たとき、①が最小となるときを考える。
①はaの二次関数であり、下に凸の二次関数は頂点で最小値を取ることが知られている。
従って、Lをaで微分した値(Lの傾き)が0となるaの値を考えると
dL/da=2a+2(xb-y)=0
a=-xb+y ・・・②

②を①に代入してbの値を求めようとすると、L=0となって計算不能となって終わった

27 : 2022/03/18(金) 17:45:23.238 ID:launjYv50
まずお前はシグマの微分を忘れてる
31 : 2022/03/18(金) 18:03:06.672 ID:Q4GMqQaV0
>>27
①をきちんとΣを使って表記すると
L=Σa^2+Σ2(xb-y)a+Σ{(xb)^2-2xyb+y^2} ・・・①'
dL/da=Σ2a+Σ2(xb-y) ・・・②'
また Σ2a=2na ・・・③'
②'=0 のときに①'は最小となるので、③'を用いてこれを解くと
a=(Σy/n) – (Σx/n)b ・・・④

これで解いてみるか

28 : 2022/03/18(金) 17:46:08.407 ID:launjYv50
あと未知変数はaとbの2個あるから、b微分=0のケースと連立するんだぞ
29 : 2022/03/18(金) 17:53:05.502 ID:Q4GMqQaV0
>>28
教科書を見るといきなりa,bで偏微分したものを0と置いてるんだよね
ここあまり理解できてない

偏微分の考え方ってこれであってる?
例:S=a^2+2a+b+1 ・・・(a+1)^2+b^2
として、Sの最小値を求めるとする。
aの二次関数として見れば、dS/da=0 のときに最小となり ・・・(a)
bの二次関数として見れば、dS/db=0 のときに最小となる ・・・(b)
従って(a)(b)を連立し、 b=0, 2a+2=0 として上記解を求められる。

30 : 2022/03/18(金) 18:00:35.392 ID:launjYv50
(a)(b)は同時に満たさなきゃダメ
片方の微分だけがゼロのケースなんて無限にあるからね?断面の2次曲線じゃなくて曲面で想像してくれ
あとシグマの展開を飛ばしてるっつってんじゃん
そしたらnμの項も出てくるよ

コメント

タイトルとURLをコピーしました