犀角(Diceros Horn)

とくながの「書き散らかし」です

ここは研究・調査・開発などの記録がメインのページです。 日常の雑事、読書記録は はてなダイアリー の方に書いています。よろしければそちらもどうぞ。

Mon, 16 Oct 2006

多角形の三角形分割(その2)

平面上の凸n角形と言う制限をなくして考えてみる。 つまり、三角形分割したときの面の張り方がメビウスの輪みたいになっていることを許すことにするとどうなるか。 n=5の場合は、平面の場合以外に、

  • [0,2,3]
  • [1,3,4]
  • [2,4,0]
  • [3,0,1]
  • [4,1,2]
の5つの三角形で分割する方法がある。普通の平面上だと当然自己交差が起こってしまうけれども、ここではそれは考えないことにする。

力技でnが小さいときに数えてみる

n角形 3 4 5 6 7 8
n-2個の三角形による分割 1 2 5 14 42 132
n個の三角形による分割 0 0 1 14 141 1056
n+2個の三角形による分割 0 0 0 2 210 4968
n+4個の三角形による分割 0 0 0 0 49 10184
n+6個の三角形による分割 0 0 0 0 0 7012
n+8個の三角形による分割 0 0 0 0 0 272
三角形による分割合計 1 2 6 30 442 23624

まだ規則性が見えていません。

posted at 00:59 | category: /Math/Discrete | 固定リンク(多角形の三角形分割(その2))

Sun, 06 Aug 2006

多角形の三角形分割

凸n角形を三角形に分割する方法が何通りあるかを考えてみた。 n=4の時は、対角線の引き方だから2通り。 n=5の時は、頂点を順に0,1,2,3,4とすると、

  • [0,2][0,3]
  • [1,3][1,4]
  • [2,4][2,0]
  • [3,0][3,1]
  • [4,1][4,2]
の辺を追加する5通り。n=6の時は14通りである。

一般にはn角形(n≧3) の時

Π_{k=2}^{n-1} (4k-6)/k
通りになる。小さいところを計算すると
  • n=3のとき1
  • n=4のとき1*(6/3)=2
  • n=5のとき1*(6/3)*(10/4)=5
  • n=6のとき1*(6/3)*(10/4)*(14/5)=14
  • n=7のとき1*(6/3)*(10/4)*(14/5)*(18/6)=42
のようになる。

上の式の (4k-6)/k の部分は

  • 4k-6 = 2(2k-3) = 2*(k角形の三角形分割が与えられた時の辺と対角線の本数)
  • k = k角形の頂点の回転による同一視
をあらわす。すなわち、n角形の三角形分割と、三角形分割を与える頂点の順序つきの組が与えられた時に、(n+1)角形の三角形分割が与えられることをいう。さらにそれが、頂点の番号付けに対して対称であることを言えばよい。
  1. 頂点の組[p,q]が辺の場合は、1点rを外部に追加して[p,r,q]を新たな三角形として、(n+1)角形の三角形分割を得る。ここで、[p,q]が順方向なら頂点の番号は r = q として、新たな q は r+1 とする。逆方向なら r = q+1 として、新たな p = r+1 とする。
  2. 頂点の組[p,q]が対角線の場合は、[p,q,r=q+1] を新たな三角形として追加する。p>q の場合は p もひとつ増やす。
n=4 の時の例として計算してみると、[0,1,2][0,2,3] を4角形の三角形分割として、
  • [0,1]を追加した場合[0,1,2][0,2,3][0,3,4]という5角形の三角形分割を得る
  • [1,0]を追加した場合[0,1,2][0,2,3][0,3,4]という5角形の三角形分割を得る
  • [1,2]を追加した場合[0,1,3][1,2,3][0,3,4]という5角形の三角形分割を得る
  • [2,1]を追加した場合[0,1,3][1,2,3][0,3,4]という5角形の三角形分割を得る
  • [2,3]を追加した場合[0,1,2][0,2,4][2,3,4]という5角形の三角形分割を得る
  • [3,2]を追加した場合[0,1,2][0,2,4][2,3,4]という5角形の三角形分割を得る
  • [3,0]を追加した場合[0,1,4][1,2,3][1,3,4]という5角形の三角形分割を得る
  • [0,3]を追加した場合[0,1,2][0,2,3][0,3,4]という5角形の三角形分割を得る
  • [0,2]を追加した場合[0,1,2][0,2,3][0,3,4]という5角形の三角形分割を得る
  • [2,0]を追加した場合[0,1,3][1,2,3][0,3,4]という5角形の三角形分割を得る
が得られ、[0,1,3][1,2,3]からも同様に得られて、頂点の回転対象性から、同じ三角形分割が 4つずつ得られるので、2*10/4=5通りの三角形分割が得られる。

追加情報

The On-Line Encyclopedia of Integer Sequences によると、この数列は Catalan numbers として知られているみたいです。

posted at 23:37 | category: /Math/Discrete | 固定リンク(多角形の三角形分割 )

Thu, 27 Apr 2006

Graphical Modeling

グラフィカルモデリングの可視化ツールを作ってみました。

グラフィカルモデリング計算機(Java Web Start)

テキストエリアにcsvで1行目に項目を、2行目以降にデータをコピー&ペーストで 貼り付けて GraphGenerate ボタンを押してください。JUNG を使って グラフを生成します。ただし、関連があるかどうかは、偏相関係数の絶対値が Threshold の値よりも大きいときとします。 初期状態では、2005年のプロ野球パリーグの打撃成績をサンプルとして表示してあります。 そのまま GraphGenerate ボタンを押せば様子がわかると思います。Threshold の値を0.35 ぐらいにするといいかな。 (JWSじゃなければ、ファイルも読めるんだけど・・・・)

履歴

2006/4/26
JTextArea にサンプルを初期表示。スクロールバーも出るようにする。辺には偏相関係数を表示するようにした。見にくいかな?
2006/4/25
グラフィカルモデリングの勉強を兼ねてプロトタイプ作成。可視化はJUNGを使う。

posted at 02:14 | category: /Math/Statistics | 固定リンク(Graphical Modeling )

Mon, 17 Apr 2006

数量化理論

統計の分野で数量化理論として知られているのは、質的データを統計で扱うための手法。

数量化1類
説明変数が質的変数のときの回帰分析の方法
数量化2類
説明変数が質的変数のときの判別分析の方法
数量化3類
説明変数が質的変数のときに主成分分析のように変数の値が似たものをまとめる方法

などがある。下手に使うと簡単に逆説的なことが言えてしまうので、そのような変な例などを探してみることにする。

posted at 01:57 | category: /Math/Statistics | 固定リンク(数量化理論 )

統計を勉強しなおす

理数系のスタンダードなカリキュラムだと、確率論といっしょに簡単な推定と検定を勉強し、 その後抽象的な確率論(測度論)を勉強して、後は個別の解析対象に応じて勉強していく。 なので、実は社会科学における統計の使い方というのはあまり詳しくない。 というわけで少しずつ勉強していくことにする。

  • 面白い例を考える
  • 簡単な実験プログラムを作る

参考文献

  • 『人文・社会科学の統計学』東京大学教養学部統計学教室(東京大学出版会)
  • 『社会を読み解く数理トレーニング』松原望(東京大学出版会)

posted at 01:48 | category: /Math/Statistics | 固定リンク(統計を勉強しなおす )

Fri, 24 Mar 2006

チャーノフの顔グラフ

多変数データを人間の顔の輪郭や鼻、口、目などであらわしたもの。18個までのパラメータを 表現できるとのこと(つまり18次元空間)。人間が顔の表情については微妙な違いも認識 しやすいことから、統計データの観測値の性質などを表情に対応させて比較する。

こういうちょっとした面白プログラムはきっと誰かが作って公開しているはず。 と思ったら、やっぱりありました。

自分のポートフォリオを登録しておいて、市場の値動きをチャーノフグラフで可視化して メールで送ってくれたり、アイコンにしてブログに貼り付けたりできると面白いかもしれない。

posted at 02:10 | category: /Math/Statistics | 固定リンク(チャーノフの顔グラフ )

Thu, 23 Mar 2006

標本誤差の話

大きさNの母集団でAが成り立つ比率をπとするとき、 無作為抽出でn個のサンプルを取った時のAが成り立つ標本比率をpとする。 このとき、pの分散は、

V(p) = (N-n)/(N-1)・π(1-π)/n

で与えられる(この計算をエレガントにやるには??)。 nが十分大きい時は、中心極限定理でpが正規分布に従うと考えてよく、 信頼度95%で母集団比率を推定すると、ε=1.96√V(p) が絶対精度となる。 つまり、πがp±εの間にある確率が95%以上ということ。

有名な話で、ビデオリサーチ社はn=600世帯のサンプルで視聴率を推定しているが、 この場合の信頼度を計算してみると、N を十分大きいとして、(N-n)/(N-1)〜1 で近似して、πは10%=0.1としてみると、

V(p) 〜 0.1 * 0.9 / 600 = 0.00015
1.96√V(p) ≒ 0.024

となるので、信頼度95%の絶対精度は約2.4%。少なくとも小数点以下の数字は ほとんど意味がないと言ってもいいだろう。

posted at 02:00 | category: /Math/Statistics | 固定リンク(標本誤差の話 )

Mon, 06 Mar 2006

80:20の法則

上位20%がリソースの80%を持つ。 さらにその上位20%だけの集合を考えても 同じ性質が成り立つ。そのような性質がべき法則 を満たす場合の特徴的な性質だといわれるが、 その場合の確率分布のべき指数γがいくら位になるかを計算してみよう。

べき法則を満たす確率変数(0<c≦x<∞)の確率密度関数をP(x)とした時、 yより大きな値を持つ確率 = P(>y) = 0.2 つまり、

y P(x) dx = 0.2

となるような yに対して、全体のリソースの80%を占めるということは、

y xP(x) dx = 0.8 ∫c xP(x) dx

を満たすので、これを解けばよい。結果は約 γ = 2.16 となる。 インターネットのノードの次数分布が大体これに当てはまる。

posted at 00:53 | category: /Math/PowerLaw | 固定リンク(80:20の法則 )

ベキ分布を平行移動する

べき分布の確率密度関数を平行移動したものを考える。 ある確率変数(c≦x<∞)の確率密度関数が

P(x) ∝ (x+α)

のようなベキ関数に比例する場合を考える。 当然 c+α > 0 は成り立つ必要がある。

簡単な計算からすぐわかることは、

  • γ>1のとき規格化するための係数は最小値cと平行移動の因子αを用いて、(γ-1)(c+α)γ-1と表され、γが1以下の場合は分布の積分は発散してしまう。
  • γ>2のとき、平均値は収束して、(c+α)(γ-1)/(γ-2)-α である。
  • γ>3のとき、分散は収束して、(c+α)2(γ-1)/(γ-2)2(γ-3) である。

となる。

ちなみにc=0のときに80:20の法則を満たすようなγを求めると、約γ = 2.41 になる。

posted at 00:51 | category: /Math/PowerLaw | 固定リンク(ベキ分布を平行移動する )

Mon, 20 Feb 2006

ベキ則について

調べたことなどを少しずつメモを残そう。

ある確率変数(0<c≦x<∞)の確率密度関数が

P(x) ∝ x
のようなベキ関数に比例するときに、ベキ法則に従う、などという。

簡単な計算からすぐわかることは、

  • γ>1のとき規格化するための係数は最小値cを用いて、(γ-1)cγ-1と表され、γが1以下の場合は分布の積分は発散してしまう。
  • γ>2のとき、平均値は収束して、c(γ-1)/(γ-2) である。
  • γ>3のとき、分散は収束して、c2(γ-1)/(γ-2)2(γ-3) である。
ネットワークのノードの次数分布でべき法則に従うものとして知られているものの、 理論値および観測値は、以下の通り。

ネットワークの種類 ガンマの値
WWW 1.9〜2.7
インターネット 2.1〜2.5
映画俳優の共演ネットワーク 2.3〜3.1
バラバシ・アルバートモデル 3

実世界のモデルでは確率変数の区間は無限大まで広がっておらず、 有限のところで切れているので、平均値や分散も計算することができるが、 理論上(区間の上限を無限大にした時の極限)を考えると、 散らばり具合の指標として、分散に替わるものが必要になってくる。

posted at 00:10 | category: /Math/PowerLaw | 固定リンク(ベキ則について )