1月20日後半


※上記の広告は60日以上更新のないWIKIに表示されています。更新することで広告が下部へ移動します。

1/20 後半45分

あとPo(k= λ=)というのはポアソン分布のkとλに数字を代入したものです。
普通はPo(λ)となっていますが、ここでは上のようにさせてもらいました。


[7ページ~10ページ]
ここでは基本的なこと(大学1年生程度レベルのこと)は
わかっているものとして書かせてもらいます。
例えば基礎統計シケプリがわかりやすい。
http://image02.wiki.livedoor.jp/u/7/ut2010s2317/f23e8ec8daaa7cb5.pdf
上からどうぞ。
簡単には統計の基礎の基礎から入り
標準偏差、分散、回帰分析、検定などがかかれています。
検定も4つか5つぐらいはのっています。そちらからどうぞ。

ここは 回帰分析 の話が中心です。
回帰分析・重回帰分析・推定量・ダミー変数 についてです。
あと金融勉強してる人もたくさんいるので金融用語が出てきます。


基本的な公式は省略。先ほど上げた基礎統計のプリントでもみてください。
さてモデルとしてy,xの間にy=α+βxという関係があるとする。
βは金融での理論CAPMで出てくる
分散と平均リターンの関係で出てくるヒストリカルβとも関係しています。
(僕は知識ないので、先輩が言っていたことをそのままかきました)

では一番簡単な回帰分析である一変数の場合から。
単回帰 とかいわれるやつです。
あるα、βに大してモデルの当てはまり度合いを考える。
Q=Σ(y-α-βx)^2
このずれQを最小とするα,βをみつけるよう。
偏微分して0になるようなα,βを求めれば良い
(まあ数学の世界的にお決まり)

7~8ページ参照。
そうするとあの公式になる。
α,β=標準偏差と共分散であらわせるの公式

また 正規方程式 を満たす。
p7の一番下に書いてあることである。
覚える方法としてあげられていたのが
1行目はY=α+βxを想像すればよい。
2行目は上のY=α+βxにxをかけたということを
やるつもりにする。実際にやるのではなくやるつもり
実際は平均の2乗と2乗の平均は違う。
ということでそこを修正すればよい。
あくまでやるつもり、と覚えれば簡単に修正しなければ
ならないことも忘れないだろう。
さらに転置してもかわらない行列と覚えておくのも良い。

8ページ7行目をみると
yの標準化=相関係数×xの標準化とある。
これは言葉のまま覚えておいてもいいし、式で覚えても良い。
内挿値という言葉がある。残差という言葉もある。これについては8ページ参照。

以下再生性の議論をしたいが時間がないので省く。
多次元の正規分布公式の話もちょっと出たが僕はまだわからないので略。

では回帰分析は実際のモデルと比べてどのぐらい正しいのだろうか?
理想的ならば内挿値からの二乗と計算の差の二乗が一致するべきだろう。
ここでR^2を決定係数という。詳しくはP8参照。
これは誤差を考える話である。モデルと現実の差を考えるのが
残差変動。誤差の二乗をシグマしたものが残差変動である。
全変動=回帰変動+残差変動。これについては少し考えればわかります。
決定係数の範囲などは定義から考えればわかるので省略。
エクセルとかでも決定係数はつかわれますね。
計量社会科学などの分野でもよく使われます。
1に近いほど正しいモデルです。

今まではたかだか1変数の単回帰分析でしたが
次にやるのが 重回帰 。これは変数が2この場合です。
これもまた正規方程式がなりたちます。
覚え方は単回帰の場合と同様で1行目は当たり前。
2行目はx1をかけるつもり3行目はx2をかけるつもりです
転置しても同じです。

ちなみに転置しても行列が同じであることを対称行列とよび
全ての成分が実数なら実対称行列とよぶそうです。(先輩話)

非線形回帰については今のところは語ることはあまり有りません。

それで推定量の話にいくわけですが、これについては楽なので
省略。基礎統計レポートでもみればのってます。

次にダミー変数。簡単なことしか扱わなかったのですが
twitter上で聞いた話では今年の数学のアクチュアリー試験でダミー変数
がでたらしいですね。ということでこれについても少し書きます。
相関社会科学とかにもつかわれてます。

簡単にいうと事故とかがおこりグラフが突然かわる場合があります。
例えば1ヶ月の事故死者数が
4月100人 5月113人 6月121人 7月112人
であったとします。これは普通の記録でありここでの死亡者数は
あまり大きなものではありません。
ここで大規模災害(飛行機が墜落とか電車が脱線とか)がおき
事故死者数 8月1400人 となったとしましょう。
その後9月114人 10月111人 11月102人
となりこのままではこのデータは使えません。
数学のグラフの使い方の一つに総合人数でいくという方法があります。
上の例であれば4月まで100人 5月まで223人 6月まで344人
といった感じです。これを直線でつなげていくとほぼ直線のグラフになりますね。
で、事故が起こった8月部分も含めてグラフを書くと8月部分が急に角度が変わった
グラフになりその後4月から7月のようにもどります。
これを利用したい。で、2つにわけて回帰分析すればいいじゃないかと思うかも
しれません。その方法もないこともないのですがここで重要なものは傾きです。
傾きが得られれば大丈夫です。このようなときにダミー変数というものを使います。

ここで使うのは定数項ダミーの議論です。
詳しい使い方は知らないので略しますが、
このように突然大きくなったときに使う数学的手法です。
傾きだけを知ればいい。
でも事故などによって激変化している時にデータを利用する為の手法です。 

また係数ダミーというものもあり、これは途中から変数が増えるという
場合に用いる手法です。

推定量
基礎的なことは基礎統計プリントを参照。
変数変換してY=α+βxの形に直します。このときどうなるかを考えます。
10~11ページに議論が書いてあります。
さて式をみてもらうことにしてαβのずれの原因はεを含む項によるズレです。
あとの証明は時間がなかったので省略。誤差項の期待値が0であることに
注意していけばちゃんと証明ができます。

分散と共分散
誤差項の線形和や分散・共分散行列を考えます
シグマの二乗で立てられますので詳しくは下からどうぞ
http://www43.atwiki.jp/actuary-seminar?cmd=upload&act=open&pageid=13&file=actyuary-seminar4th.pdf
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。