統計学の入門書は数多くある.しかし,医学,工学,化学,心理学,経済学,ファイナンス,社会学等々に応用される統計学は,初等統計学の水準よりもかなり高い水準と,より高度な内容が要求される.
ところが中級以上の統計学のテキストは急にレベルが高くなり,理解できない,という声をよく聞く.統計学におけるこのような初級と中級の間の大きな間隙は,丁寧な説明と具体例を挙げて詳説することによって埋めることができるのではないかと考えたのが本書執筆の動機である.
本書の内容を大きく分ければ,観測データの記述(1章),確率,確率変数およびモーメント(2〜5章),確率分布と標本分布(6〜10章),収束,大数の法則,中心極限定理(11章),パラメータ推定(12〜13章),仮説検定(14〜16章),回帰分析(17〜19章),そして最後に,パラメータ推定と関連している推定関数(20章)から成る.各章の「はじめに」で,その章では何をあつかっているかを要約しているので,ここでは本書の特徴を以下列挙しておこう.
(1)すべての章にわたって,初等的な微分・積分と基礎的な行列の予備知識のみで十分理解できるよう,可能な限り具体例も入れ,丁寧な説明を心掛けた.
(2)確率の公理,定理,基本法則のみが展開されていると退屈になるので,確率論における有名な問題,誕生日の問題,一致の問題(邂逅の問題),賭博者の破産問題,占有(場所占め)の問題,ポリアのつぼを紹介している.楽しんで頂きたい(2章).
(3)統計学における重要な不等式,ジェンセンの不等式から導かれる情報不等式,カルバック・ライブラー情報量,リヤプノフの不等式,マルコフの不等式,チェビシェフの不等式,この不等式を改善したベルンシュタインの不等式,ヘルダーの不等式とこの不等式から得られるコーシー・シュワルツの不等式,これらほとんどすべての不等式について,証明も省略せず説明している(5章).
(4)重要な確率分布はほとんどとりあげ,積率母関数(mgf)を導出し(コーシー分布は特性関数),このmgfにもとづいて期待値,分散,歪度,尖度を求めている.とくに,応用範囲が広いにもかかわらず,統計学で依然として重要視されていない(テキストによってはまったくふれられてさえいない)逆ガウス分布について類書よりもくわしく説明し,推定,検定においても逆ガウス分布をあつかっている(7章,12〜14章).
(5)正規分布より両すその厚い分布として取り上げられることの多い多変量
t分布についてもくわしく述べている(9章).
(6)区間推定では2項分布の
p,ポアッソン分布のλ,指数分布のβ,正規分布のσ
2に関する複数の信頼区間設定法を,モンテ・カルロ実験によってどの方法が良いかを比較,検討している(13章).
(7)仮説検定はネイマン・ピアソンの補題にもとづき,尤度比検定から棄却域を求めている.また,代表的ないくつかの仮説検定において検定力を計算し,検定力曲線を図表化している(14章).
(8)回帰モデルで仮定した誤差項の確率分布が真の確率分布と異なっているとき,仮定した分布のもとで得られる最尤推定量は擬似最尤推定量(QMLE)である.このQMLEが,しかし,一致性をもつ場合がある.どのような確率分布のもとでQMLEは一致性をもつかを説明した(17章).
(9)回帰モデルの誤差項は正規分布に従うという仮定のもとで導出される回帰係数=0の
t検定は,非正規分布のもとでも,第I種の過誤の名目サイズからの歪みは小さい.さらに,非正規分布のもとでも,
t値が5〜6ぐらいあれば検定力も高く,
t検定の非正規分布のもとでの頑健性という意外な結果がモンテ・カルロ実験から得られている(18章).
(10)最後に,推定関数の理論は読者になじみが薄いと思われるので,20章に示されている主要な点を挙げておこう.
最小2乗法(LS)の正規方程式,最尤法(ML)のスコア関数,一般化モーメント法(GMM)のモーメント条件,これらはすべて観測値とパラメータの関数であり,この関数からパラメータ推定量が得られる.この関数が推定関数(EF)である.
(i)Wedderburnは擬似尤度関数(QL)を指数型分布族から導いたが,EFからの接近はQLの導出に指数型分布族を仮定する必要はない(20.4,20.12節).
(ii)推定量の特性という視点から最尤推定量(MLE)は漸近的特性が良い(BAN推定量)と評価されているが,EFからの接近は,スコア関数はいかなる標本の大きさのもとでも,一意的に最適のEFを与える.すなわちMLは有限標本においても最適である(20.6,20.7節).
(iii)最適EFを与える式から,正規分布(μ,σ
2)の不偏推定量(
X,
S2)が得られる(20.8節).
(iv)MLのスコア関数とEFの擬似スコア関数は類似の概念である(20.13,20.14節).
(v)ガウス・マルコフの定理が成立しないLS,あるいはスコア関数の期待値が0にならないMLの場合にも,EFは少なくとも一致性をもつ推定量を与える(20.14節).
(vi)擬似スコア関数は最適のEFを与える(20.15節).
(vii)回帰モデルにおいて,
E(
y|
X)=
Xβ,var(
y|
X)=
Vの定式化が正しく,かつ
Vは
βと独立のとき,確率分布の仮定なしで得られる
βの最適EFは,誤差項に正規分布を仮定したときの必要条件に等しい.いいかえれば,正規分布の仮定が正しくなかったとしても,正規分布の仮定のもとで得られる擬似最尤推定量(QMLE)はBANではないがCANである(20.15節).
(viii)漸近的有効推定量を与えるGMMの必要条件と最適EFは同じである(20.18節).
(ix)不偏EFを観測データの情報にもとづいてウエイトづけするのが経験的尤度の方法である(20.19節).
EFからのパラメータ推定への接近は,確率分布を仮定しないで,期待値ベクトルと共分散行列のみを特定化するセミ・パラメトリックな方法である.推定量(赤ちゃん)は推定関数(乳母車)のなかで眠っている.推定量ではなく推定関数を重視するのは「赤ちゃんより乳母車を重視するようなものだ」(Crowder)という批判もあるが,新たな観点から推定法を見直すことになった推定関数の理論と応用は,今後の一層の展開が楽しみな分野である.
最後になりましたが,予定より多くなり過ぎた原稿,また,たびたびの原稿の変更・追加にも快く応じてくださり,膨大なゲラを念入りにチェックしてくださったみみずく舎編集部に感謝致します.
2009年11月
蓑谷千凰彦