夕暮れのままに


記事の内容

前へ | 次へ

回帰直線(線形回帰トレンド)・・・
2010/04/12 19:02

◆ 前置き ◆
株価チャートを線形回帰トレンドで分析する際に、
 回帰直線 y=ax+b
傾きa切片 b、及び回帰直線の廻りに点在する実値(実際の株価)の”ばらつき度”を示す 標準誤差 Se が必要となる。

改めて説明するならば、回帰直線とは、
その直線と実値(観測値)の残差(誤差)の平方和が最小となるように、係数 a、b を決定する直線であり、その一般化された解法は最小2乗法(つまり、誤差の平方和が最小となる値である)にて行なえる。
尚、最小2乗法の詳細は、線形代数(行列計算)の解説に譲る。

また、標準誤差 Se とは、(端的に言えば)誤差の 標準偏差σ と言えるが、
データ個数がN個である時、一般の 標準偏差σ は、自由度がNであるのに対して、回帰直線の 標準誤差 Se は、自由度が(N−2)である。つまり、誤差の平方和を(N−2)で割った平方根となる。

 標準誤差 Se = SQRT [ Σ(y−y’)^2 ÷ (N−2) ]  y’:推定値、N:個数
 (※ 推定値y’とは、回帰直線上のyの値である)

尚、Excel(エクセル)の関数を用いれば、
 傾きa     ⇒ SLOPE 関数、もしくは、LINEST 関数の第1解
 切片b     ⇒ INTERCEPT 関数、もしくは、LINEST 関数の第2解
 標準誤差Se ⇒ STEYX 関数
で計算ができる。(詳細は省略)

p.s
標準誤差Se は、データ系列が2つ(2次元)、標準偏差σ は、データ系列が1つ(1次元) と考えれば、上記式の推定値y’ は、標準偏差σの計算式 σ^2 = Σ(y−y”)^2 ÷N における 平均値y” に、(機能的に)等価である、と言えるかもしれない。


◆ 回帰直線の計算 ◆

≪言葉で表現すると≫
  N個のデータがある時、
    ◇ 傾きa     = (xy偏差の積和) ÷ (xの偏差平方和)
        あるいは、 「= x、y の共分散 ÷ x の分散」 と結果的に同じ。
    ◇ 切片b     = (yの平均値) − (傾きa) * (xの平均値)
    ◇ 標準誤差Se = SQRT{ (推定値yの残差の平方和) ÷(N−2) }
  但し、y は株価の値を使用し、x は(x=1,2,3,・・・N)とする。

≪計算式の詳細≫
 計算式は、その目的・用途に応じて、式を変形する事ができ、例を示すと、

 1)傾き a
  ◇ 傾きa = Sxy ÷ Sxx
         = Σ(x−x”)(y−y”)÷ Σ(x−x”)^2
        { = Vxy ÷ σ^2 }  ・・・ Vxy:共分散、σ^2:xの分散
    もしくは、
  ◇ 傾きa = n*Sxy ÷ n*Sxx
        =[ nΣxy−(Σx)(Σy)] ÷ [ nΣx^2 −(Σx)^2 ]
 2)切片 b
  ◇ 切片b = y” − (傾きa) * x”
         = (Σy)÷n −(傾きa) * (Σx)÷n

 3)標準誤差 Se
  ◇(標準誤差Se)^2 = Σ(y−y’)^2 ÷ (n−2)  
     但し、 y’:推定値 n:個数
    注意)  Σ(y−y’)^2 は、偏差平方和ではない。
         なぜなら、y’ は回帰直線上の 値y である。
    もしくは、
  ◇ (標準誤差Se)^2 =[ Syy−(Sxy)^2 ÷ Sxx ]÷(n−2)

    備考) 表記上の簡略化の為、
         標準誤差Seの2乗値で記述している。
         標準誤差Seを求めるには、上式の結果に
         Sqrt値(平方根)、つまり、数式記号√を施すこと。
         敢えて言えば、標準偏差σになぞると、分散σ^2 で表記している。

 4)傾きa と 相関係数R の関係
  ◇ 傾きa = 相関係数R × (Yの標準偏差) ÷ (Xの標準偏差)
     もしくは、
  ◇ 傾きa = 相関係数R × √(Syy) ÷ √(Sxx)

    備考) 相関係数R の定義式:
         相関係数R = (x y共分散) ÷ (x 標準偏差 * y 標準偏差)
         と、1項の 傾きa の式から導くことが出来る。
-------------
  但し、
  x”、y” は、xの平均値、yの平均値
  y’ は、回帰直線上の値y(推定値)
  Sxx は、xの偏差平方和 Σ(x−x”)^2
  Syy は、yの偏差平方和 Σ(y−y”)^2
  Sxy は、xyの偏差積和 Σ(x−x”)(y−y”)
  Vxy は、x、y の共分散 Vxy = Sxy ÷ n
  σ は、xの標準偏差(分散 = σ^2 ) σ = √(Sxx ÷ n)
-------------


【補足:偏差平方和について】
 N個のデータ列 Zi(i=1,2,・・・N) がある時、偏差平方和Sz
   Sz = Σ(z−z”)^2   但し、 z”:平均値 (即ち、Σz÷N )
 と定義すると
   N*Sz = NΣ(z^2)−(Σz)^2 ・・・ 式(1)
 のように、式の変形をすることができる。

 また同様に、データ列X とデータ列Y の偏差の積和Sxy は、
  N*Sxy = NΣxy−(Σx)(Σy) { = N*Σ(x−x”)(y−y”)}
 となる。

※ 証明 ※

偏差平方和Szの1/N を展開すると
  = Sz÷N  = (1/N)*Σ(z−z”)^2
  = (1/N)*Σ{ z^2−2zz”+z”^2 }    ・・・平方の展開
  = (1/N) *( Σz^2−2Σzz”+Σz”^2 ) ・・・Σの展開
  但し、z” はデータ列 z の平均値

ここで、z”は定数であり、(Σz)÷N = z” であるので、上式は、
  = (1/N)*Σz^2 −2z”z” +(1/N)*Σz”^2  ・・・(1/N)*2Σzz”の置換え
また、定数を合計してNで割っても元の定数に同じなので
  = (1/N)*Σz^2 −2*z”^2 +z”^2       ・・・(1/N)*Σ(定数)の置換え
  = (1/N)*Σz^2 −z”^2
となる。したがって、

  N*Sz = N*N*(1/N)*Sz
       = N^2 * { (1/N)*Σz^2 −z”^2 }
       = N*Σ(z^2) − N^2 *(Σz÷N)^2
       = N*Σ(z^2) −(Σz)^2
       = (N×二乗和) − (和の二乗)

となり、式(1)に等しくなる。同様に、Sxyも展開をすることで、式の変形ができる。

カテゴリ:テクニカル指標・計算

前へ | 次へ

コメントを見る(0)
コメントを書く
トラックバック(0)
BlogTOP
このユーザーのホーム

ログイン

i-mobile


Powered by FC2 Blog