Annotation of OpenXM/doc/genkou19991125.tex, Revision 1.33
1.1 tam 1: \documentclass{jarticle}
2:
1.30 ohara 3: \title{タイトル未定}
1.1 tam 4: \author{
1.31 tam 5: 前川 将秀,
1.30 ohara 6: 野呂 正行,
7: 小原 功任, \\
8: 奥谷 幸夫,
9: 高山 信毅,
10: 田村 恭士
1.1 tam 11: }
1.30 ohara 12: \date{1999年11月25日}
1.2 tam 13: %\pagestyle{empty}
1.1 tam 14:
15: \begin{document}
16: \maketitle
17:
1.30 ohara 18: \section{OpenXMとは}
19:
20: OpenXM は数学プロセス間でメッセージを交換するための規約である。数学プロ
21: セス間でメッセージをやりとりさせることにより、ある数学プロセスから他の数
22: 学プロセスを呼び出して計算を行なったり、他のマシンで計算を行なわせたりす
23: ることが目的である。なお、 OpenXM とは Open message eXchange protocol
24: for Mathematics の略である。
25: OpenXM の開発の発端は野呂正行と高山信毅により、 asir と kan/sm1 を
26: 相互に呼び出す機能を実装したことである。
1.31 tam 27: %\footnote{この段落必要?}
28:
1.30 ohara 29: 発端となった asir と kan/sm1 での実装時には、
30: お互いに相手側のコマンド文字列を送っていた。
31: この方法は現在の OpenXM 規約でも形を変えて可能ではあるが、
32: 使いやすい反面、効率的であるとはいい難い。
33: さらに、この方法では相手側のソフトが asir なのか kan/sm1 なのかを
34: 判別して、相手側に合わせてコマンド文字列を作成する必要がある。
35:
36: これ以外の方法として、
37: OpenXM 規約では共通表現形式によるメッセージも用意している。
38: OpenXM 規約独自のデータ形式である CMO 形式(Common Mathematical Object format)
39: 以外にも、 MP や OpenMath の XML, binary 表現形式といった他の形式をも
40: 扱えるようにしてある。
41: なお、現在の OpenXM 規約では、
42: 前述のコマンド文字列も CMO 形式などの何らかのデータ形式の中の
43: 文字列として表現して送る必要がある。
44:
45: \section{OpenXM の計算モデル}
46:
47: {\Huge この節では計算モデルの話をしなければいけませんよ、田村君}
48:
49: OpenXM 規約でのメッセージの交換はサーバとクライアントの間で行なわれる。
1.31 tam 50: クライアントからサーバへメッセージを送り、
1.32 tam 51: メッセージに対する返答を
52:
53: サーバはスタックマシンであると仮定されており、
54: サーバがクライアントから受け取ったメッセージはすべてスタックに積まれる。
55: OpenXM のメッセージの中にはサーバに行なわせたい動作に対応するデータがあり、
56: このメッセージを受け取ったサーバはそれに対応する動作を
57: 行なうことが期待されている。
58: ただし、サーバは命令されない限り何も動作を行なおうとはしない。
59: このため、クライアントはサーバへ送ったメッセージの結果を
60: サーバから
61:
62: これはクライアントがサーバへ一旦メッセージを送付し終えると、
63: あとはサーバ側の状態を気にせずにクライアントは
64: クライアント自身の仕事に戻れることを意味する。
1.30 ohara 65:
66:
67: \section{OpenXM のメッセージの構造}
68:
69: {\Huge この節では構造の話をしなければいけませんよ、田村君}
70:
71: OpenXM のメッセージはバイトストリームであり、次のような構造を持つ。
72: \begin{verbatim}
73: ヘッダ ボディ
74: \end{verbatim}
75: ヘッダの長さは8バイトであると定められている。ボディの長さはメッセージご
76: とに異なる($0$でもよい)。
77: ヘッダは次の二つの情報を持つ。
78: \begin{enumerate}
79: \item 前半の4バイト。タグと呼ばれ、メッセージの種類を表わす識別子である。
80: \item 後半の4バイト。メッセージにつけられた通し番号である。
81: \end{enumerate}
1.1 tam 82:
1.30 ohara 83: それぞれの4バイトは32ビット整数とみなされて処理される。
84: この場合に用いられる整数の表現方法については後述するが、基本的に
85: 表現方法はいくつかの選択肢から選ぶことが可能であり、
86: また選択は通信路の確立時に一度だけなされることに注意しておこう。
87:
88: {\Huge 以下、書き直してね。}
89:
90: ボディの中のデータがどのように格納されているかは
91: 各データ形式がそれぞれ独立に決められるようになっている。
92: もし、 OpenXM 規約でメッセージのやりとりを行ないたいが、
93: まだ規約で定義されていないデータ形式を使いたい場合は、
94: タグをまだ使われてなさそうな値
95: (システム固有の表現のために推奨されている値がある)
96: に設定し、 ボディの部分にデータを埋め込めばよい。
97: なお、すべてのメッセージに ボディが必要というわけではなく、
98: ボディのないメッセージも OpenXM 規約には存在することに
99: 注意しなければならない。
100:
101: サーバに対する動作に対応したデータは SM 形式として定義されている。
102: SM 形式以外のデータでは、サーバは受け取ったデータをスタックに積む
103: 以外の動作をしないことになっている。
104: つまり、 SM 形式のデータがデータを受け取る以外の動作を
105: サーバに行なわせる唯一のデータ形式である。
106: このデータを受け取る以外の動作の中には、
107: データになんらかの加工を施す動作も入っている。
108: このデータになんらかの加工を施す動作の中には
109: 数学的な演算を行なう動作も含まれている。
110: 以後、データになんらかの加工を施す動作のことを計算と呼ぶことにする。
111:
112: \section{OpenXM の計算の進行方法}
113:
114: OpenXM における計算とはメッセージの交換のことである。既に計算モデルの節
115: で説明したが(説明されているはずである)、OpenXM はサーバ・クライアントモ
116: デルを採用していて、サーバはスタックマシンの構造を持つ。サーバが行うのは
117: 基本的に次の事柄に限られる。クライアントからメッセージを送られるとサーバ
118: は、まずメッセージの識別子を調べ、OX\_COMMAND でなければスタックに積む。
119: OX\_COMMAND であればメッセージのボディからスタックマシンのオペコードを取
120: りだし、あらかじめ規約で定められたアクションを起こす。
121:
122: 上の説明でわかるように、サーバはクライアントからの指示なしに、自らメッセー
123: ジを送ることはない(例外? ox\_asir の mathcap)。
124:
125: {\Huge 以下、書き直してね、田村君}
126:
127:
128: % クライアントがサーバへなんらかの計算を行なわせる場合、
129: % クライアントからサーバへ計算させたいデータをメッセージとして送り、
130: % そしてその結果をサーバからメッセージで受け取ることによって計算は行なわれる。
131: % ただし、サーバは結果の送信すらも命令されなければ行なうことはなく、
132: % クライアントは結果を受け取らずにサーバに次々と
133: % 計算を行なわせることも可能である。
134:
135: サーバがクライアントから受け取ったメッセージはすべてスタックに積まれる。
136: ただし、このままでは受け取ったメッセージに含まれるデータを
137: スタックに積み上げていくだけで、サーバは計算を行なおうとはしない。
138: 次いでサーバに行なわせたい動作に対応したデータを送ると、
139: 初めてサーバは計算などの、なんらかの動作を行なう。
140: このとき、必要があればサーバはスタックから必要なだけデータを取り出す。
141: ここで、クライアントからの命令による動作中にたとえエラーが発生したとしても
142: サーバはエラーオブジェクトをスタックに積むだけで、
143: 明示されない限りエラーを返さないことに注意しなければならない。
144:
145: 結果が生じる動作をサーバが行なった場合、
146: サーバは動作の結果をスタックに積んでいる。
147: サーバに行なわせた動作の結果をクライアントが知りたい場合、
148: スタックからデータを取り出し送信を行なう命令に対応した SM 形式のデータを
149: サーバ側へ送ればよい。
1.3 tam 150:
1.30 ohara 151: クライアントがサーバへ計算を行なわせ、結果を得るという手順を追っていくと、
152: 次のようになる。
1.3 tam 153:
154: \begin{enumerate}
1.30 ohara 155: \item まず、クライアントがサーバへ計算させたいデータを送る。
156: サーバは送られてきたデータをスタックに積む。
157: \item クライアントがサーバに「計算を行なう動作に対応したデータ」を
158: 送ると、サーバは必要なだけスタックからデータを取り出し、
159: 実行した計算の結果をスタックに積む。
160: \item 最後に「データを取り出し送信を行なう命令に対応したデータ」を
161: サーバへ送ると、サーバはスタックから計算結果の入っている
162: データを取り出し、クライアントへ送出する。
1.4 tam 163: \end{enumerate}
1.2 tam 164:
1.1 tam 165:
1.30 ohara 166: \section{CMO のデータ構造}
1.4 tam 167:
1.30 ohara 168: OpenXM 間でやりとりされるメッセージを実際に作成する場合、
169: CMO 形式で定義されている多倍長整数を理解しておくと、
170: CMO 形式の他のデータ構造だけでなく、 OX 形式、 SM 形式のデータを
171: 理解する助けになると思えるので、 CMO 形式の多倍長整数の
172: データ構造について説明する。
173:
174: CMO 形式で定義されているデータは多倍長整数以外にも
175: 文字列やリスト構造などがある。どのようなデータであるかは
176: データの先頭にあるタグを見れば判別できるようになっている。
177: これはメッセージのデータの判別の仕方とおなじである。
178: なお、タグは各データ毎に 32 bit の整数で表されており、
179: 多倍長整数は 20 となっている。
180: ここで 32 bit の整数の表現方法について説明する必要がある。
181: OpenXM ではバイト列で 32 bit の整数 20 を
182: {\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。
183: この表現方法の違いはクライアントとサーバの最初の接続時に
184: 双方の合意で決定することになっている。
185: なお、合意がない場合には
186: 前者の表現方法(以後、この表現方法を network byte order と呼ぶ)を
187: 使うことになっている。
188: また、負の数を表現する必要があるときには、
189: 2 の補数表現を使うことになっている。
190:
191: 表現したい多倍長整数の絶対値を 2 進数で表した場合の桁数を $n$ と
192: したとき、次にくるデータは $[(n+31)/32]$ を 32 bit の整数となる。
193: これは多倍長整数の絶対値を $2^{32}$ 進数で表した場合の桁数ととってもよい。
194: ただし、表現したい数が負の場合は $[(n+31)/32]$ を 32 bit の整数で表した値を
195: 2 の補数表現で負にして、正の場合と区別する。
196:
197: 表現したい多倍長整数の絶対値が $2^{32}$ 進数で $(b_0 b_1 ... b_k)_{2^{32}}$
198: と表せるとき、次にくるデータは $b_0$, $b_1$, $\cdots$, $b_k$ を
199: それぞれ 32 bit の整数で表現した値となる。
200: %以下は書き直しの必要があるかも...
201: なお、 GNU MP LIBRARY を用いると、
202: C 言語から多倍長整数や任意精度浮動小数を扱うことができる。
203: $b_0$, $b_1$, $\cdots$, $b_k$ をそれぞれ 32 bit 整数で表現した値は
204: この GNU MP LIBRARY で用いられている多倍長整数で使われている形式を
205: 参考にして合わせてある。
206:
207: ここで具体例をだそう。
208: $4294967298 = 1 \times 2^{32} + 2$ を network byte order の多倍長整数で
209: 表現すると、
1.6 tam 210: \begin{center}
211: {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01}
212: \end{center}
1.30 ohara 213: となる。また、同じ表現方法で $-1$ を表現すると、
1.6 tam 214: \begin{center}
215: {\tt 00 00 00 14 ff ff ff ff 00 00 00 01}
216: \end{center}
1.30 ohara 217: となる。
1.4 tam 218:
1.1 tam 219:
1.30 ohara 220: \section{MathCap について}
1.6 tam 221:
1.30 ohara 222: サーバおよびクライアント双方ともに OpenXM で規定されている
223: メッセージの中のデータ形式をすべて受け取れるわけではない。
224: しかも、 OpenXM 規約で規定されているデータ形式だけが
225: 受渡しに使われるというわけではない。
226: そこで、 OpenXM では相手側が受け取ることができるデータ形式を
227: 収得する方法を用意している。
228:
229: CMO 形式で定義されている MathCap データは
230: %理解可能なメッセージの
231: 受け取ることができるデータ形式を表すデータであり、
232: 要求されればサーバはサーバ自身の MathCap データをスタックに積む。
233: また、クライアントから MathCap データをサーバへ送ることもでき、
234: MathCap データをサーバとクライアントの間で交換することによって、
235: お互いに相手側が受け取ることができないデータ形式で
236: メッセージを送ってしまうのを防ぐことができる。
237: なお、 MathCap データの中では CMO 形式で定義されている
238: 32 bit 整数、文字列、リスト構造が使われており、
239: MathCap データに含まれている内容を理解できるためには
240: 必然的にこれらも理解できる必要がある。
241:
242: OpenXM 対応版の asir サーバである ox\_asir が返す MathCap を以下に示す。
243:
244: %なお、 $a_1$, $a_2$, $\cdots$, $a_n$ を要素に
245: %持つリスト構造を {\tt [$a_1$, $a_2$, $\cdots$, $a_n$]} 、
246: %文字列 ``string'' を {\tt "string"} 、 32 bit 整数を
247: %それに対応する 10 進数の整数で示す。
1.7 tam 248:
1.30 ohara 249: %↓手で作ったので間違えている可能性あり。
250: %%古いバージョン。差し替えの必要あり。
1.7 tam 251: \begin{verbatim}
252: [ [199901160,"ox_asir"],
253: [276,275,258,262,263,266,267,268,274
254: ,269,272,265,264,273,300,270,271],
1.8 tam 255: [ [514,[1,2,3,4,5,2130706433,2130706434
256: ,17,19,20,21,22,24,25,26,31,27,33,60]],
257: [2144202544,[0,1]]
1.7 tam 258: ]
259: ]
260: \end{verbatim}
261:
1.31 tam 262: この MathCap データのリスト構造は大きく分けて 3 つの部分に分かれる。
263: 最初の {\tt [199901160,"ox\_asir"]} の部分にはサーバの情報が入っている。
264: %この最初の要素がまたリスト構造となっており、
265: 最初の要素はバージョンナンバーを、次の要素はサーバの名前を表している。
266:
267: 次の {\tt [276,275,$\cdots$,271]} の部分は
268: サーバに対する動作に対応した理解可能なデータの種類を表している。
269: サーバの動作に対するデータはすべて 32 bit の整数で表しており、
270: このリストは理解可能なデータに対応する 32 bit 整数のリストとなっている。
271:
272: 最後の {\tt [ [514,[1,2,3,$\cdots$,60]],[2144202544,[0,1]] ]} の部分は
273: 理解可能なデータの形式を表している。
274: この部分はさらに {\tt [514,[1,2,3,$\cdots$,60]]} と
275: {\tt [2144202544,[0,1]]} にの部分に分けることができ、
276: それぞれが一つのデータ形式についての情報となっている。
277: どのデータ形式についての情報かは最初の要素にある整数値をみれば
278: 分かるようになっている。
279: この整数値は CMO 形式では 514 となっている。
280: 最初のデータ形式を区別する整数値以後の要素は
281: 各データ形式によってどのように使われるか定まっている。
282: CMO 形式では理解可能なデータの tag がリストの中に収まっている。
283: 前節で CMO 形式では多倍長整数を表す tag が 20 であることを述べたが、
284: このリストに 20 が含まれているので、
285: ox\_asir は CMO 形式の多倍長整数を受け取れることがわかる。
286:
287: %%このリストの要素はまたリストとなっており、
288: %この最後の部分もまたリストとなっており、
289: %あるデータ形式で理解可能なものを表現したリストを要素としている。
290: %{\tt [514,[1, 2, $\cdots$]]} の最初の 514 はこのリストが CMO 形式
291: %での理解可能なデータを表していることを示しており、
292: %その後のリストでは CMO 層で定義されているデータのうち、
293: %理解可能なデータの tag が並んでいる。
294:
295: なお、データが受け取れることと、
296: データの論理構造が理解できることとはまったく別物であるので
297: 注意する必要がある。
298:
299:
300: \section{セキュリティ対策}
301:
302: OpenXM では幾らかのセキュリティ対策を考えている。
303: OpenXM に対応したソフトウェアをクラックしても
304: 大した利点はないと思えるが、それは設計上の話であって、
305: 予期せぬ手段で攻撃を受けた場合にどのような事態を
306: 招くかは想像し難い。
307:
308: そこで、 OpenXM では侵入者に攻撃の機会を
309: できるだけ与えないようにしている。
310: 具体的には、接続が必要になった時のみ接続を待つようにし、
311: 常に接続に関与するといったことは避けている。
312:
313: しかし、これだけでは侵入者が接続を行なう一瞬のすきを
314: 狙ってくる可能性もある。
315: そこで接続を行なう時に、
316: 接続を待つ port 番号をランダムに決めている。
317: こうすることで、特定の port 番号を狙って接続を行なう
318: 瞬間を待つ手口を幾らか防ぐことができる。
319:
320: さらにもう一段安全性を高めるために、
321: 接続時に 1 回だけ使用可能なパスワードを作成し、
322: そのパスワードを使って認証を行なう。
323: このパスワードは一旦使用されれば無効にするので、
324: もし仮になんらかの手段でパスワードが洩れたとしても安全である。
325:
326: なお、上記の port 番号とパスワードは安全な手段で送られて
327: いると仮定している。
328: また、同一のコンピュータ上に悪意のあるユーザはいないと仮定している
329: ことに注意しなければならない。
330: なぜなら、現在の実装ではサーバ、およびクライアントの動作している
331: コンピュータ上ではこの port 番号とパスワードがわかってしまうためである。
332:
333: なお、接続が確立した後のメッセージの送受信に関しては、
334: 特に暗号化などの処置が行なわれているわけではない。
335: もし必要があれば、通信路の暗号化を行なう機能がある
336: ソフトウェアを使うことを考えている。
337:
338:
339: \section{他のプロジェクト}
340:
341: 他のプロジェクトについても触れておこう。
342:
343: OpenMath プロジェクトは数学的なオブジェクトを
344: コンピュータ上で表現する方法を決定している。
345: 各ソフトウェア間でオブジェクトを交換する際の
346: オブジェクトの変換手順についても述べられている。
347: 表現方法は一つだけでなく、 XML 表現や binary 表現などが
348: 用意されている。
349: 詳細は
350:
351: http://www.openmath.org/omsoc/index.html A.M.Cohen
352:
353:
354: 以下は書いてる途中。
355:
356: NetSolve
357:
358: http://www.cs.utk.edu/netsolve/
359:
360:
361: MP
362:
363: http://symbolicNet.mcs.kent.edu/SN/areas/protocols/mp.html
364:
365:
366: MCP
367:
368: http://horse.mcs.kent.edu/~pwang/
369:
370:
371: \section{現在提供されているソフトウェア}
372:
373: 現在 OpenXM 規格に対応しているクライアントには
374: asir, sm1, Mathematica がある。
375: これらのクライアントから
376: OpenXM 規格に対応したサーバを呼び出すことができる。
377: 現在 OpenXM 規約に対応しているサーバソフトウェアには、
378: asir, sm1, gnuplot, Mathematica などがあり、
379: それぞれ ox\_asir, ox\_sm1, ox\_math という名前で提供されている。
380: また、 OpenMath 規格の XML 表現で表現されたデータと CMO 形式の
381: データを変換するソフトウェアが JAVA によって実装されており、
382: OMproxy という名前で提供されている。
1.33 ! tam 383:
1.30 ohara 384: この MathCap データのリスト構造は大きく分けて 3 つの部分に分かれる。
385: 最初の {\tt [199901160,"ox\_asir"]} の部分にはサーバの情報が入っている。
386: %この最初の要素がまたリスト構造となっており、
387: 最初の要素はバージョンナンバーを、次の要素はサーバの名前を表している。
388:
389: 次の {\tt [276,275,$\cdots$,271]} の部分は
390: サーバに対する動作に対応した理解可能なデータの種類を表している。
391: サーバの動作に対するデータはすべて 32 bit の整数で表しており、
392: このリストは理解可能なデータに対応する 32 bit 整数のリストとなっている。
393:
394: 最後の {\tt [ [514,[1,2,3,$\cdots$,60]],[2144202544,[0,1]] ]} の部分は
395: 理解可能なデータの形式を表している。
396: この部分はさらに {\tt [514,[1,2,3,$\cdots$,60]]} と
397: {\tt [2144202544,[0,1]]} にの部分に分けることができ、
398: それぞれが一つのデータ形式についての情報となっている。
399: どのデータ形式についての情報かは最初の要素にある整数値をみれば
400: 分かるようになっている。
401: この整数値は CMO 形式では 514 となっている。
402: 最初のデータ形式を区別する整数値以後の要素は
403: 各データ形式によってどのように使われるか定まっている。
404: CMO 形式では理解可能なデータのタグがリストの中に収まっている。
405: 前節で CMO 形式では多倍長整数を表すタグが 20 であることを述べたが、
406: このリストに 20 が含まれているので、
407: ox\_asir は CMO 形式の多倍長整数を受け取れることがわかる。
408:
409: なお、データが受け取れることと、
410: データの論理構造が理解できることとはまったく別物であるので
411: 注意する必要がある。
412:
413:
414: \section{セキュリティ対策}
415:
416: OpenXM では幾らかのセキュリティ対策を考えている。
417: OpenXM に対応したソフトウェアをクラックしても
418: 大した利点はないと思えるが、それは設計上の話であって、
419: 予期せぬ手段で攻撃を受けた場合にどのような事態を
420: 招くかは想像し難い。
421:
422: そこで、 OpenXM では侵入者に攻撃の機会を
423: できるだけ与えないようにしている。
424: 具体的には、接続が必要になった時のみ接続を待つようにし、
425: 常に接続に関与するといったことは避けている。
426:
427: しかし、これだけでは侵入者が接続を行なう一瞬のすきを
428: 狙ってくる可能性もある。
429: そこで接続を行なう時に、
430: 接続を待つ port 番号をランダムに決めている。
431: こうすることで、特定の port 番号を狙って接続を行なう
432: 瞬間を待つ手口を幾らか防ぐことができる。
433:
434: さらにもう一段安全性を高めるために、
435: 接続時に 1 回だけ使用可能なパスワードを作成し、
436: そのパスワードを使って認証を行なう。
437: このパスワードは一旦使用されれば無効にするので、
438: もし仮になんらかの手段でパスワードが洩れたとしても安全である。
439:
440: なお、上記の port 番号とパスワードは安全な手段で送られて
441: いると仮定している。
442: また、同一のコンピュータ上に悪意のあるユーザはいないと仮定している
443: ことに注意しなければならない。
444: なぜなら、現在の実装ではサーバ、およびクライアントの動作している
445: コンピュータ上ではこの port 番号とパスワードがわかってしまうためである。
446:
447: なお、接続が確立した後のメッセージの送受信に関しては、
448: 特に暗号化などの処置が行なわれているわけではない。
449: もし必要があれば、通信路の暗号化を行なう機能がある
450: ソフトウェアを使うことを考えている。
451:
452:
453: \section{他のプロジェクト}
454:
455: 他のプロジェクトについて幾つか紹介する。
456:
457: OpenMath プロジェクトは数学的なオブジェクトを
458: コンピュータ上で表現する方法を決定している。
459: 各ソフトウェア間でオブジェクトを交換する際の
460: オブジェクトの変換手順についても述べられている。
461: 表現方法は一つだけでなく、 XML 表現や binary 表現などが
462: 用意されている。
1.11 tam 463:
1.30 ohara 464: %以下、調べる必要あり。
1.11 tam 465: %NetSolve
466:
467: %MP
468:
469: %MCP
470:
1.30 ohara 471: \section{現在提供されているソフトウェア}
1.11 tam 472:
1.30 ohara 473: 現在 OpenXM 規格に対応しているクライアントソフトウェアには
474: asir, sm1, Mathematica がある。
475: これらのクライアントソフトウェアから
476: OpenXM 規格に対応したサーバを呼び出すことができる。
477: 現在 OpenXM 規約に対応しているサーバソフトウェアには、
478: asir, sm1, gnuplot, Mathematica などがあり、
479: それぞれ ox\_asir, ox\_sm1, ox\_math という名前で提供されている。
480: また、 OpenMath 規格の XML 表現で表現されたデータと CMO 形式の
481: データを変換するソフトウェアが JAVA によって実装されており、
482: OMproxy という名前で提供されている。
1.1 tam 483:
484: \end{document}
FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>