Annotation of OpenXM/doc/genkou19991125.tex, Revision 1.40
1.1 tam 1: \documentclass{jarticle}
2:
1.30 ohara 3: \title{タイトル未定}
1.1 tam 4: \author{
1.34 tam 5: 前川 将秀\thanks{神戸大学理学部数学科},
6: 野呂 正行\thanks{富士通研究所},
1.40 ! tam 7: 小原 功任\thanks{金沢大学理学部計算科学教室}, \\
1.35 tam 8: 奥谷 幸夫
9: %\thanks{神戸大学大学院自然科学研究科博士課程前期課程数学専攻},
10: \thanks{神戸大学大学院自然科学研究科数学専攻},
1.34 tam 11: 高山 信毅\thanks{神戸大学理学部数学教室},
1.35 tam 12: 田村 恭士
13: %\thanks{神戸大学大学院自然科学研究科博士課程後期課程情報メディア科学専攻計算システム講座}
14: \thanks{神戸大学大学院自然科学研究科情報メディア科学専攻}
1.1 tam 15: }
1.30 ohara 16: \date{1999年11月25日}
1.2 tam 17: %\pagestyle{empty}
1.1 tam 18:
19: \begin{document}
20: \maketitle
21:
1.30 ohara 22: \section{OpenXMとは}
23:
24: OpenXM は数学プロセス間でメッセージを交換するための規約である。数学プロ
25: セス間でメッセージをやりとりさせることにより、ある数学プロセスから他の数
26: 学プロセスを呼び出して計算を行なったり、他のマシンで計算を行なわせたりす
27: ることが目的である。なお、 OpenXM とは Open message eXchange protocol
28: for Mathematics の略である。
29: OpenXM の開発の発端は野呂正行と高山信毅により、 asir と kan/sm1 を
30: 相互に呼び出す機能を実装したことである。
1.31 tam 31: %\footnote{この段落必要?}
32:
1.40 ! tam 33: %発端となった asir と kan/sm1 での実装時には、
! 34: 初期の実装では、相手側のローカル言語の文法に従った文字列を送っていた。
1.30 ohara 35: この方法は現在の OpenXM 規約でも形を変えて可能ではあるが、
36: 使いやすい反面、効率的であるとはいい難い。
37: さらに、この方法では相手側のソフトが asir なのか kan/sm1 なのかを
1.40 ! tam 38: 判別して、相手側のローカル言語の文法に合わせて文字列を作成する必要がある。
1.30 ohara 39:
40: これ以外の方法として、
41: OpenXM 規約では共通表現形式によるメッセージも用意している。
42: OpenXM 規約独自のデータ形式である CMO 形式(Common Mathematical Object format)
43: 以外にも、 MP や OpenMath の XML, binary 表現形式といった他の形式をも
44: 扱えるようにしてある。
45: なお、現在の OpenXM 規約では、
46: 前述のコマンド文字列も CMO 形式などの何らかのデータ形式の中の
47: 文字列として表現して送る必要がある。
48:
49: \section{OpenXM の計算モデル}
50:
1.36 tam 51: {\Huge この節では計算モデルの話をしなければいけません}
1.30 ohara 52:
1.34 tam 53: OpenXM 規約での計算とはメッセージを交換することである。
54: そして、そのメッセージの交換はサーバとクライアントの間で行なわれる。
1.31 tam 55: クライアントからサーバへメッセージを送り、
1.35 tam 56: サーバからクライアントがメッセージを受け取ることによって
1.34 tam 57: 計算の結果が得られる。
1.32 tam 58:
59: サーバはスタックマシンであると仮定されており、
60: サーバがクライアントから受け取ったメッセージはすべてスタックに積まれる。
1.35 tam 61: ただし、OpenXM のメッセージの中にはサーバに行なわせたい動作に
62: 対応するデータがあり、
1.32 tam 63: このメッセージを受け取ったサーバはそれに対応する動作を
64: 行なうことが期待されている。
1.35 tam 65: しかし、サーバは命令されない限り何も動作を行なおうとはしない。
1.36 tam 66: このため、クライアントはサーバの状態を気にせずにメッセージを送り、
1.39 tam 67: 一旦メッセージを送付し終えた後、
68: サーバへ送ったメッセージの結果を
1.36 tam 69: サーバから待つことなしに次の動作に移ることができる。
1.32 tam 70:
1.39 tam 71: なお、サーバに対する動作に対応したデータは SM 形式として定義されている。
72: SM 形式以外のデータでは、サーバは受け取ったデータをスタックに積む
73: 以外の動作をしないことになっている。
74: つまり、 SM 形式のデータがサーバにデータを受け取る以外の動作を
75: 行なわせる唯一のデータ形式である。
76:
1.30 ohara 77:
1.36 tam 78: \section{OpenXM のメッセージの構造}
1.30 ohara 79:
1.38 tam 80: %{\Huge この節では構造の話をしなければいけません}
1.30 ohara 81:
1.36 tam 82: OpenXM で規定されているメッセージはバイトストリームであり、
83: 次のような構造になっている。
1.30 ohara 84:
1.36 tam 85: \begin{tabular}{|c|c|} \hline
86: ヘッダ & \hspace{10mm} ボディ \hspace{10mm} \\ \hline
87: \end{tabular}
88:
89: ヘッダの長さは 8 バイトであると定められている。
90: ボディの長さはメッセージごとに異なっているが、
1.40 ! tam 91: 長さは $0$ でもよい。
1.38 tam 92: %なお、すべてのメッセージに ボディが必要というわけではなく、
93: %ボディのないメッセージも OpenXM 規約には存在することに
94: %注意しなければならない。
95:
1.36 tam 96: ヘッダは次の二つの情報を持っている。
1.30 ohara 97: \begin{enumerate}
1.36 tam 98: \item 前半の 4 バイトにある、メッセージの種類を表わす識別子。
99: タグと呼ばれる。
100: \item 後半の 4 バイトにある、メッセージにつけられた通し番号。
1.30 ohara 101: \end{enumerate}
1.36 tam 102: それぞれの 4 バイトは 32 ビット整数とみなされて扱われる。
103: この場合に用いられる整数の表現方法の説明については後述するが、
104: 基本的に表現方法はいくつかの選択肢から選ぶことが可能となっており、
105: またその選択は通信路の確立時に一度だけなされることに注意しなければならない。
1.30 ohara 106:
1.38 tam 107: %{\Huge 以下、書き直し}
108:
109: ボディの中身は各データ形式によって
1.37 tam 110: それぞれ独立に決められるようになっている。
111: もし、 OpenXM 規約でまだ定義されていないデータ形式を使いたい場合は、
1.38 tam 112: メッセージのヘッダのタグをまだ使われてない整数値に設定し、
1.40 ! tam 113: ボディの部分にデータを埋め込めばよい。
1.38 tam 114: なお、このような用途にも使えるように、
115: タグにはシステム固有の表現用に推奨されている整数の範囲がある。
1.30 ohara 116:
117:
118: \section{OpenXM の計算の進行方法}
119:
1.39 tam 120: OpenXM における計算とはメッセージの交換のことである。
121: 既に計算モデルの節で説明したが、
122: OpenXM はサーバ・クライアントモデルを採用していて、
123: サーバはスタックマシンの構造を持つ。
124: サーバが行うのは基本的に次の事柄に限られる。
125: クライアントからメッセージを受け取るとサーバは、
126: まずメッセージの識別子を調べ、 SM 形式のデータでなければスタックに積む。
127: SM 形式のデータであればメッセージのボディから
128: スタックマシンのオペコードを取りだし、
129: あらかじめ規約で定められた動作を行なう。
130:
131: %上の説明でわかるように、
132: サーバはクライアントからの指示なしに、
133: 自らメッセージを送らないことに注意しなければならない。
134: %(例外? ox\_asir の mathcap)。
1.30 ohara 135:
136: サーバがクライアントから受け取ったメッセージはすべてスタックに積まれる。
1.39 tam 137: 次いでサーバに SM 形式のデータを送ると、
138: 初めてサーバはデータをスタックに積む以外のなんらかの動作を行なう。
1.30 ohara 139: このとき、必要があればサーバはスタックから必要なだけデータを取り出す。
140: ここで、クライアントからの命令による動作中にたとえエラーが発生したとしても
141: サーバはエラーオブジェクトをスタックに積むだけで、
142: 明示されない限りエラーを返さないことに注意しなければならない。
143:
144: 結果が生じる動作をサーバが行なった場合、
145: サーバは動作の結果をスタックに積んでいる。
146: サーバに行なわせた動作の結果をクライアントが知りたい場合、
147: スタックからデータを取り出し送信を行なう命令に対応した SM 形式のデータを
148: サーバ側へ送ればよい。
1.39 tam 149:
150: {\Huge 以下、書き直し}
1.3 tam 151:
1.30 ohara 152: クライアントがサーバへ計算を行なわせ、結果を得るという手順を追っていくと、
153: 次のようになる。
1.3 tam 154:
155: \begin{enumerate}
1.30 ohara 156: \item まず、クライアントがサーバへ計算させたいデータを送る。
157: サーバは送られてきたデータをスタックに積む。
158: \item クライアントがサーバに「計算を行なう動作に対応したデータ」を
159: 送ると、サーバは必要なだけスタックからデータを取り出し、
160: 実行した計算の結果をスタックに積む。
161: \item 最後に「データを取り出し送信を行なう命令に対応したデータ」を
162: サーバへ送ると、サーバはスタックから計算結果の入っている
163: データを取り出し、クライアントへ送出する。
1.4 tam 164: \end{enumerate}
1.2 tam 165:
1.1 tam 166:
1.30 ohara 167: \section{CMO のデータ構造}
1.4 tam 168:
1.30 ohara 169: OpenXM 間でやりとりされるメッセージを実際に作成する場合、
170: CMO 形式で定義されている多倍長整数を理解しておくと、
171: CMO 形式の他のデータ構造だけでなく、 OX 形式、 SM 形式のデータを
172: 理解する助けになると思えるので、 CMO 形式の多倍長整数の
173: データ構造について説明する。
174:
175: CMO 形式で定義されているデータは多倍長整数以外にも
176: 文字列やリスト構造などがある。どのようなデータであるかは
177: データの先頭にあるタグを見れば判別できるようになっている。
178: これはメッセージのデータの判別の仕方とおなじである。
179: なお、タグは各データ毎に 32 bit の整数で表されており、
180: 多倍長整数は 20 となっている。
181: ここで 32 bit の整数の表現方法について説明する必要がある。
182: OpenXM ではバイト列で 32 bit の整数 20 を
183: {\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。
184: この表現方法の違いはクライアントとサーバの最初の接続時に
185: 双方の合意で決定することになっている。
186: なお、合意がない場合には
187: 前者の表現方法(以後、この表現方法を network byte order と呼ぶ)を
188: 使うことになっている。
189: また、負の数を表現する必要があるときには、
190: 2 の補数表現を使うことになっている。
191:
192: 表現したい多倍長整数の絶対値を 2 進数で表した場合の桁数を $n$ と
193: したとき、次にくるデータは $[(n+31)/32]$ を 32 bit の整数となる。
194: これは多倍長整数の絶対値を $2^{32}$ 進数で表した場合の桁数ととってもよい。
195: ただし、表現したい数が負の場合は $[(n+31)/32]$ を 32 bit の整数で表した値を
196: 2 の補数表現で負にして、正の場合と区別する。
197:
198: 表現したい多倍長整数の絶対値が $2^{32}$ 進数で $(b_0 b_1 ... b_k)_{2^{32}}$
199: と表せるとき、次にくるデータは $b_0$, $b_1$, $\cdots$, $b_k$ を
200: それぞれ 32 bit の整数で表現した値となる。
201: %以下は書き直しの必要があるかも...
202: なお、 GNU MP LIBRARY を用いると、
203: C 言語から多倍長整数や任意精度浮動小数を扱うことができる。
204: $b_0$, $b_1$, $\cdots$, $b_k$ をそれぞれ 32 bit 整数で表現した値は
205: この GNU MP LIBRARY で用いられている多倍長整数で使われている形式を
206: 参考にして合わせてある。
207:
208: ここで具体例をだそう。
209: $4294967298 = 1 \times 2^{32} + 2$ を network byte order の多倍長整数で
210: 表現すると、
1.6 tam 211: \begin{center}
212: {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01}
213: \end{center}
1.30 ohara 214: となる。また、同じ表現方法で $-1$ を表現すると、
1.6 tam 215: \begin{center}
216: {\tt 00 00 00 14 ff ff ff ff 00 00 00 01}
217: \end{center}
1.30 ohara 218: となる。
1.4 tam 219:
1.1 tam 220:
1.30 ohara 221: \section{MathCap について}
1.6 tam 222:
1.30 ohara 223: サーバおよびクライアント双方ともに OpenXM で規定されている
224: メッセージの中のデータ形式をすべて受け取れるわけではない。
225: しかも、 OpenXM 規約で規定されているデータ形式だけが
226: 受渡しに使われるというわけではない。
227: そこで、 OpenXM では相手側が受け取ることができるデータ形式を
228: 収得する方法を用意している。
229:
230: CMO 形式で定義されている MathCap データは
231: %理解可能なメッセージの
232: 受け取ることができるデータ形式を表すデータであり、
233: 要求されればサーバはサーバ自身の MathCap データをスタックに積む。
234: また、クライアントから MathCap データをサーバへ送ることもでき、
235: MathCap データをサーバとクライアントの間で交換することによって、
236: お互いに相手側が受け取ることができないデータ形式で
237: メッセージを送ってしまうのを防ぐことができる。
238: なお、 MathCap データの中では CMO 形式で定義されている
239: 32 bit 整数、文字列、リスト構造が使われており、
240: MathCap データに含まれている内容を理解できるためには
241: 必然的にこれらも理解できる必要がある。
242:
243: OpenXM 対応版の asir サーバである ox\_asir が返す MathCap を以下に示す。
244:
245: %なお、 $a_1$, $a_2$, $\cdots$, $a_n$ を要素に
246: %持つリスト構造を {\tt [$a_1$, $a_2$, $\cdots$, $a_n$]} 、
247: %文字列 ``string'' を {\tt "string"} 、 32 bit 整数を
248: %それに対応する 10 進数の整数で示す。
1.7 tam 249:
1.30 ohara 250: %↓手で作ったので間違えている可能性あり。
251: %%古いバージョン。差し替えの必要あり。
1.7 tam 252: \begin{verbatim}
253: [ [199901160,"ox_asir"],
254: [276,275,258,262,263,266,267,268,274
255: ,269,272,265,264,273,300,270,271],
1.8 tam 256: [ [514,[1,2,3,4,5,2130706433,2130706434
257: ,17,19,20,21,22,24,25,26,31,27,33,60]],
258: [2144202544,[0,1]]
1.7 tam 259: ]
260: ]
261: \end{verbatim}
262:
1.31 tam 263: この MathCap データのリスト構造は大きく分けて 3 つの部分に分かれる。
264: 最初の {\tt [199901160,"ox\_asir"]} の部分にはサーバの情報が入っている。
265: %この最初の要素がまたリスト構造となっており、
266: 最初の要素はバージョンナンバーを、次の要素はサーバの名前を表している。
267:
268: 次の {\tt [276,275,$\cdots$,271]} の部分は
269: サーバに対する動作に対応した理解可能なデータの種類を表している。
270: サーバの動作に対するデータはすべて 32 bit の整数で表しており、
271: このリストは理解可能なデータに対応する 32 bit 整数のリストとなっている。
272:
273: 最後の {\tt [ [514,[1,2,3,$\cdots$,60]],[2144202544,[0,1]] ]} の部分は
274: 理解可能なデータの形式を表している。
275: この部分はさらに {\tt [514,[1,2,3,$\cdots$,60]]} と
276: {\tt [2144202544,[0,1]]} にの部分に分けることができ、
277: それぞれが一つのデータ形式についての情報となっている。
278: どのデータ形式についての情報かは最初の要素にある整数値をみれば
279: 分かるようになっている。
280: この整数値は CMO 形式では 514 となっている。
281: 最初のデータ形式を区別する整数値以後の要素は
282: 各データ形式によってどのように使われるか定まっている。
1.40 ! tam 283: CMO 形式では理解可能なデータのタグがリストの中に収まっている。
! 284: 前節で CMO 形式では多倍長整数を表すタグが 20 であることを述べたが、
1.31 tam 285: このリストに 20 が含まれているので、
286: ox\_asir は CMO 形式の多倍長整数を受け取れることがわかる。
287:
288: %%このリストの要素はまたリストとなっており、
289: %この最後の部分もまたリストとなっており、
290: %あるデータ形式で理解可能なものを表現したリストを要素としている。
291: %{\tt [514,[1, 2, $\cdots$]]} の最初の 514 はこのリストが CMO 形式
292: %での理解可能なデータを表していることを示しており、
293: %その後のリストでは CMO 層で定義されているデータのうち、
1.40 ! tam 294: %理解可能なデータのタグが並んでいる。
1.31 tam 295:
296: なお、データが受け取れることと、
297: データの論理構造が理解できることとはまったく別物であるので
298: 注意する必要がある。
299:
300:
301: \section{セキュリティ対策}
302:
303: OpenXM では幾らかのセキュリティ対策を考えている。
304: OpenXM に対応したソフトウェアをクラックしても
305: 大した利点はないと思えるが、それは設計上の話であって、
306: 予期せぬ手段で攻撃を受けた場合にどのような事態を
307: 招くかは想像し難い。
308:
309: そこで、 OpenXM では侵入者に攻撃の機会を
310: できるだけ与えないようにしている。
311: 具体的には、接続が必要になった時のみ接続を待つようにし、
312: 常に接続に関与するといったことは避けている。
313:
314: しかし、これだけでは侵入者が接続を行なう一瞬のすきを
315: 狙ってくる可能性もある。
316: そこで接続を行なう時に、
1.40 ! tam 317: 接続を待つポート番号をランダムに決めている。
! 318: こうすることで、特定のポート番号を狙って接続を行なう
1.31 tam 319: 瞬間を待つ手口を幾らか防ぐことができる。
320:
321: さらにもう一段安全性を高めるために、
322: 接続時に 1 回だけ使用可能なパスワードを作成し、
323: そのパスワードを使って認証を行なう。
324: このパスワードは一旦使用されれば無効にするので、
325: もし仮になんらかの手段でパスワードが洩れたとしても安全である。
326:
1.40 ! tam 327: なお、上記のポート番号とパスワードは安全な手段で送られて
1.31 tam 328: いると仮定している。
329: また、同一のコンピュータ上に悪意のあるユーザはいないと仮定している
330: ことに注意しなければならない。
331: なぜなら、現在の実装ではサーバ、およびクライアントの動作している
1.40 ! tam 332: コンピュータ上ではこのポート番号とパスワードがわかってしまうためである。
1.31 tam 333:
334: なお、接続が確立した後のメッセージの送受信に関しては、
335: 特に暗号化などの処置が行なわれているわけではない。
336: もし必要があれば、通信路の暗号化を行なう機能がある
337: ソフトウェアを使うことを考えている。
338:
339:
340: \section{他のプロジェクト}
341:
342: 他のプロジェクトについても触れておこう。
343:
344: OpenMath プロジェクトは数学的なオブジェクトを
345: コンピュータ上で表現する方法を決定している。
346: 各ソフトウェア間でオブジェクトを交換する際の
347: オブジェクトの変換手順についても述べられている。
348: 表現方法は一つだけでなく、 XML 表現や binary 表現などが
349: 用意されている。
350: 詳細は
351:
352: http://www.openmath.org/omsoc/index.html A.M.Cohen
353:
354:
355: 以下は書いてる途中。
356:
357: NetSolve
358:
359: http://www.cs.utk.edu/netsolve/
360:
361:
362: MP
363:
364: http://symbolicNet.mcs.kent.edu/SN/areas/protocols/mp.html
365:
366:
367: MCP
368:
369: http://horse.mcs.kent.edu/~pwang/
370:
371:
372: \section{現在提供されているソフトウェア}
373:
374: 現在 OpenXM 規格に対応しているクライアントには
375: asir, sm1, Mathematica がある。
376: これらのクライアントから
377: OpenXM 規格に対応したサーバを呼び出すことができる。
378: 現在 OpenXM 規約に対応しているサーバソフトウェアには、
379: asir, sm1, gnuplot, Mathematica などがあり、
380: それぞれ ox\_asir, ox\_sm1, ox\_math という名前で提供されている。
381: また、 OpenMath 規格の XML 表現で表現されたデータと CMO 形式の
382: データを変換するソフトウェアが JAVA によって実装されており、
383: OMproxy という名前で提供されている。
1.33 tam 384:
1.1 tam 385:
386: \end{document}
FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>