Annotation of OpenXM/doc/genkou19991125.tex, Revision 1.49
1.1 tam 1: \documentclass{jarticle}
2:
1.30 ohara 3: \title{タイトル未定}
1.1 tam 4: \author{
1.34 tam 5: 前川 将秀\thanks{神戸大学理学部数学科},
6: 野呂 正行\thanks{富士通研究所},
1.40 tam 7: 小原 功任\thanks{金沢大学理学部計算科学教室}, \\
1.41 tam 8: 奥谷 行央
1.35 tam 9: %\thanks{神戸大学大学院自然科学研究科博士課程前期課程数学専攻},
10: \thanks{神戸大学大学院自然科学研究科数学専攻},
1.34 tam 11: 高山 信毅\thanks{神戸大学理学部数学教室},
1.35 tam 12: 田村 恭士
13: %\thanks{神戸大学大学院自然科学研究科博士課程後期課程情報メディア科学専攻計算システム講座}
14: \thanks{神戸大学大学院自然科学研究科情報メディア科学専攻}
1.1 tam 15: }
1.30 ohara 16: \date{1999年11月25日}
1.2 tam 17: %\pagestyle{empty}
1.1 tam 18:
19: \begin{document}
20: \maketitle
21:
1.30 ohara 22: \section{OpenXMとは}
23:
1.43 tam 24: OpenXM は数学プロセス間でメッセージを交換するための規約である。
25: 数学プロセス間でメッセージをやりとりすることにより、
26: ある数学プロセスから他の数学プロセスを呼び出して計算を行なったり、
27: 他のマシンで計算を行なわせたりすることが目的である。
28: なお、 OpenXM とは Open message eXchange protocol for Mathematics の略である。
29: OpenXM の開発の発端は野呂と高山により、
30: asir と kan/sm1 を相互に呼び出す機能を実装したことである。
1.31 tam 31:
1.40 tam 32: %発端となった asir と kan/sm1 での実装時には、
33: 初期の実装では、相手側のローカル言語の文法に従った文字列を送っていた。
1.41 tam 34: 現在の OpenXM 規約では共通表現形式によるメッセージを用いている。
1.43 tam 35: この方法では相手側のソフトが asir なのか kan/sm1 なのかを判別するなどして、
36: 相手側のローカル言語の文法に合わせた文字列を作成する必要がなくなる。
1.41 tam 37: しかし、ローカル言語の文法に従った文字列を送る方法も、
38: 効率的であるとはいい難いが、使いやすい。
1.43 tam 39: そのため、 OpenXM 規約では共通表現形式の中の文字列として、
40: ローカル言語の文法に従った文字列を用いた
41: メッセージの交換も可能となっている。
1.41 tam 42:
43: %OpenXM 規約独自のデータ形式である CMO 形式(Common Mathematical Object format)
44: %以外にも、 MP や OpenMath の XML, binary 表現形式といった他の形式をも
45: %扱えるようにしてある。
46:
1.43 tam 47: OpenXM 規約では通信路の確保の方法に幾らかの自由度があるが、
48: 現在は TCP/IP ソケットを用いた実装しかない。
49: %通信の実現方法は通信路のとりかたにより変わる。
50: そこで、以後ここでは具体的な実装は TCP/IP ソケットを
51: 用いていると仮定する。
1.39 tam 52:
1.30 ohara 53:
1.36 tam 54: \section{OpenXM のメッセージの構造}
1.30 ohara 55:
1.43 tam 56: OpenXM で規定されている TCP/IP 実装によるメッセージは
57: バイトストリームとなっており、
1.36 tam 58: 次のような構造になっている。
1.30 ohara 59:
1.36 tam 60: \begin{tabular}{|c|c|} \hline
61: ヘッダ & \hspace{10mm} ボディ \hspace{10mm} \\ \hline
62: \end{tabular}
63:
64: ヘッダの長さは 8 バイトであると定められている。
65: ボディの長さはメッセージごとに異なっているが、
1.40 tam 66: 長さは $0$ でもよい。
1.38 tam 67:
1.36 tam 68: ヘッダは次の二つの情報を持っている。
1.30 ohara 69: \begin{enumerate}
1.43 tam 70: \item 前半の 4 バイト。メッセージの種類を表わす識別子であり、
1.36 tam 71: タグと呼ばれる。
1.43 tam 72: \item 後半の 4 バイト。メッセージにつけられた通し番号である。
1.30 ohara 73: \end{enumerate}
1.36 tam 74: それぞれの 4 バイトは 32 ビット整数とみなされて扱われる。
75: この場合に用いられる整数の表現方法の説明については後述するが、
76: 基本的に表現方法はいくつかの選択肢から選ぶことが可能となっており、
77: またその選択は通信路の確立時に一度だけなされることに注意しなければならない。
1.45 tam 78: OpenXM 規約で定義されているタグの整数値で
79: よく使われると思うものを以下にあげておく。
80:
81: \begin{verbatim}
82: #define OX_COMMAND 513
83: #define OX_DATA 514
84: \end{verbatim}
1.30 ohara 85:
1.43 tam 86: ボディの中身はタグによるメッセージの種類によって
1.37 tam 87: それぞれ独立に決められるようになっている。
1.43 tam 88: もし、システム固有の表現を OpenXM 規約のメッセージに
89: 埋め込んで使いたい場合には、
1.44 tam 90: タグの値をこのような用途のために推奨されている
91: 整数値の範囲に設定し、
1.43 tam 92: システム固有の表現をボディに埋め込めばよい。
1.42 tam 93:
94:
95: \section{OpenXM の計算モデル}
96:
1.44 tam 97: %{\Huge この節では計算モデルの話をしなければいけません}
1.42 tam 98:
99: OpenXM 規約での計算とはメッセージを交換することである。
100: また、 OpenXM 規約ではクライアント・サーバモデルを採用しているので、
101: メッセージの交換はサーバとクライアントの間で行なわれる。
102: クライアントからサーバへメッセージを送り、
103: サーバからクライアントがメッセージを受け取ることによって
104: 計算の結果が得られる。
105:
106: サーバはスタックマシンであると仮定されており、
1.45 tam 107: サーバがクライアントから受け取ったメッセージは、
108: タグが OX\_COMMAND でなければすべてスタックに積まれる。
109: タグが OX\_COMMAND となっているメッセージは
110: スタックマシンへの命令であり、このメッセージを受け取ったサーバは
111: それに対応する動作を行なうことが期待されている。
112: しかし、サーバはメッセージを受け取らない限り、
113: 自ら何か動作を行なおうとはしない。
114: これは毎回サーバへメッセージを送るたびに、
115: いつもサーバからのメッセージをクライアントが待つ必要がないことを意味する。
1.42 tam 116: このため、クライアントはサーバの状態を気にせずにメッセージを送り、
117: 一旦メッセージを送付し終えた後、
118: サーバへ送ったメッセージの結果を
119: サーバから待つことなしに次の動作に移ることができる。
120:
1.30 ohara 121:
122: \section{OpenXM の計算の進行方法}
123:
1.45 tam 124: サーバが行うのは基本的に次の事柄だけである。
125: クライアントからメッセージを受け取ると、
126: サーバはまずメッセージの識別子を調べ、
127: タグが OX\_COMMAND のメッセージでなければスタックに積む。
128: タグが OX\_COMMAND のメッセージであればメッセージのボディから
129: スタックマシンの命令コードを取りだし、
1.39 tam 130: あらかじめ規約で定められた動作を行なう。
131:
1.45 tam 132: 上の説明でわかるように、
1.39 tam 133: サーバはクライアントからの指示なしに、
1.45 tam 134: 自らメッセージを送らないことに注意する必要がある。
1.39 tam 135: %(例外? ox\_asir の mathcap)。
1.30 ohara 136:
1.45 tam 137: サーバがクライアントから受け取ったメッセージはすべてスタックに積まれている。
138: 次いでサーバにスタックマシンへの命令を送ると、
1.39 tam 139: 初めてサーバはデータをスタックに積む以外のなんらかの動作を行なう。
1.30 ohara 140: このとき、必要があればサーバはスタックから必要なだけデータを取り出す。
141: ここで、クライアントからの命令による動作中にたとえエラーが発生したとしても
142: サーバはエラーオブジェクトをスタックに積むだけで、
1.45 tam 143: 明示されない限りエラーをクライアントへ返さないことに注意しなければならない。
1.30 ohara 144:
145: 結果が生じる動作をサーバが行なった場合、
1.41 tam 146: サーバは動作の結果をスタックに積む。
1.30 ohara 147: サーバに行なわせた動作の結果をクライアントが知りたい場合、
1.45 tam 148: スタックからデータを取り出し送信を行なう命令をサーバ側へ送ればよい。
1.39 tam 149:
1.45 tam 150: %{\Huge 以下、書き直し}
1.3 tam 151:
1.45 tam 152: クライアントがサーバへメッセージを送り、
153: 計算の結果を得るという手順を追っていくと次のようになる。
1.3 tam 154:
155: \begin{enumerate}
1.45 tam 156: \item まず、クライアントがサーバへメッセージを送る。
157: サーバは送られてきたメッセージをスタックに積む。
158: \item クライアントがサーバにスタックマシンへの命令を送ると、
159: サーバは必要なだけスタックからデータを取り出し、
160: 実行した結果をスタックに積む。
161: \item 最後に「スタックからデータを取り出し送信を行なう命令」を
1.30 ohara 162: サーバへ送ると、サーバはスタックから計算結果の入っている
163: データを取り出し、クライアントへ送出する。
1.4 tam 164: \end{enumerate}
1.2 tam 165:
1.1 tam 166:
1.30 ohara 167: \section{CMO のデータ構造}
1.4 tam 168:
1.45 tam 169: OpenXM 規約では、数学的オブジェクトを表現するオリジナルの方法として
170: CMO 形式(Common Mathematical Object format)を定義している。
1.46 tam 171: この CMO 形式を使ってメッセージを送るには、
172: タグを OX\_DATA にすればよい。
1.47 tam 173: CMO 形式におけるメッセージのボディ部分について以下で説明するが、
1.46 tam 174: %OpenXM 規約で定義されているメッセージを実際に作成する場合、
1.30 ohara 175: CMO 形式で定義されている多倍長整数を理解しておくと、
1.47 tam 176: CMO 形式の他のデータ構造だけでなく、
177: OpenXM 規約で定義されている様々なデータ構造を理解する助けになると思えるので、
178: ここでは CMO 形式の多倍長整数のデータ構造についてのみ説明する。
1.30 ohara 179:
180: CMO 形式で定義されているデータは多倍長整数以外にも
181: 文字列やリスト構造などがある。どのようなデータであるかは
1.47 tam 182: データの先頭にある(メッセージの識別子とは別にある)タグを見れば
183: 判別できるようになっている。
184: これはメッセージの種類の判別の仕方とおなじである。
1.30 ohara 185: なお、タグは各データ毎に 32 bit の整数で表されており、
186: 多倍長整数は 20 となっている。
1.47 tam 187: よく使われると思われる CMO 形式のタグをあげておく。
188: \begin{verbatim}
189: #define CMO_INT32 2 /* 32 ビット整数 */
190: #define CMO_STRING 4 /* 文字列 */
191: #define CMO_LIST 17 /* リスト構造 */
192: #define CMO_ZZ 20 /* 多倍長整数 */
193: \end{verbatim}
194:
195: ここで TCP/IP 実装における 32 bit の整数の
196: 表現方法について説明する必要がある。
197: OpenXM 規約の TCP/IP 実装ではバイトストリームで 32 bit の整数 20 を
1.30 ohara 198: {\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。
199: この表現方法の違いはクライアントとサーバの最初の接続時に
200: 双方の合意で決定することになっている。
1.47 tam 201: なお、合意がない場合には前者の表現方法
202: (以後、この表現方法をネットワークバイトオーダーと呼ぶ)を
1.30 ohara 203: 使うことになっている。
204: また、負の数を表現する必要があるときには、
205: 2 の補数表現を使うことになっている。
206:
1.48 tam 207: CMO 形式の多倍長整数は、 GNU MP LIBRARY 等を参考にしており、
208: 符合付き絶対値表現を用いている。
209: タグ以降の形式は次のようになる。
210:
211: \begin{tabular}{|c|c|c|c|c|} \hline
212: $f$ & $b_0$ & $b_1$ & $\cdots$ & $b_{n-1}$ \\ \hline
213: \end{tabular}
214:
215: ここで、 1 つの枠は 4 バイトを表し、
216: $f$ は符合付き 32 ビット整数を、
217: $b_0$, $b_1$, $\cdots$, $b_{n-1}$ は符合なし 32 ビット整数を表している。
218: さらに、 $|f| = n$ が成り立たなければならない。
219: このオブジェクトは
220: \[ \mbox{sgn}(f) \times \{ b_0 (2^{32})^0 + b_1 (2^{32})^1 + \cdots
221: + b_{n-1} (2^{32})^{n-1} \} \]
222: という整数であると定義されている。
223: ただし、
224: \[ \mbox{sgn}(f) = \left\{ \begin{array}{ll}
225: 1 & f>0 \\
226: 0 & f=0 \\
227: -1 & f<0 \\ \end{array} \right. \]
228: である。
1.30 ohara 229:
230: ここで具体例をだそう。
1.48 tam 231: $4294967298 = 1 \times 2^{32} + 2$ を CMO 形式の
232: ネットワークバイトオーダー、多倍長整数で表現すると、
1.6 tam 233: \begin{center}
234: {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01}
235: \end{center}
1.30 ohara 236: となる。また、同じ表現方法で $-1$ を表現すると、
1.6 tam 237: \begin{center}
238: {\tt 00 00 00 14 ff ff ff ff 00 00 00 01}
239: \end{center}
1.30 ohara 240: となる。
1.4 tam 241:
1.1 tam 242:
1.30 ohara 243: \section{MathCap について}
1.6 tam 244:
1.48 tam 245: OpenXM 規約では、通信時に用いられるメッセージの種類を
246: 各ソフトウェアが制限する方法を用意している。
247: なぜなら、サーバおよびクライアント双方ともに OpenXM で規定されている
248: すべてのメッセージの種類を受け取れるわけではないからである。
249: そこで、 OpenXM では相手側が受け取ることができる
250: メッセージの種類を収得する方法を用意している。
1.30 ohara 251:
252: CMO 形式で定義されている MathCap データは
253: %理解可能なメッセージの
254: 受け取ることができるデータ形式を表すデータであり、
255: 要求されればサーバはサーバ自身の MathCap データをスタックに積む。
256: また、クライアントから MathCap データをサーバへ送ることもでき、
257: MathCap データをサーバとクライアントの間で交換することによって、
258: お互いに相手側が受け取ることができないデータ形式で
259: メッセージを送ってしまうのを防ぐことができる。
260: なお、 MathCap データの中では CMO 形式で定義されている
261: 32 bit 整数、文字列、リスト構造が使われており、
262: MathCap データに含まれている内容を理解できるためには
263: 必然的にこれらも理解できる必要がある。
264:
265: OpenXM 対応版の asir サーバである ox\_asir が返す MathCap を以下に示す。
266:
1.48 tam 267: なお、 $a_1$, $a_2$, $\cdots$, $a_n$ を要素に
268: 持つリスト構造を {\tt [$a_1$, $a_2$, $\cdots$, $a_n$]} 、
269: 文字列 ``string'' を {\tt "string"} 、 32 bit 整数を
270: それに対応する 10 進数の整数で示す。
1.7 tam 271:
1.30 ohara 272: %↓手で作ったので間違えている可能性あり。
273: %%古いバージョン。差し替えの必要あり。
1.7 tam 274: \begin{verbatim}
275: [ [199901160,"ox_asir"],
276: [276,275,258,262,263,266,267,268,274
277: ,269,272,265,264,273,300,270,271],
1.8 tam 278: [ [514,[1,2,3,4,5,2130706433,2130706434
279: ,17,19,20,21,22,24,25,26,31,27,33,60]],
280: [2144202544,[0,1]]
1.7 tam 281: ]
282: ]
283: \end{verbatim}
284:
1.31 tam 285: この MathCap データのリスト構造は大きく分けて 3 つの部分に分かれる。
286: 最初の {\tt [199901160,"ox\_asir"]} の部分にはサーバの情報が入っている。
287: %この最初の要素がまたリスト構造となっており、
288: 最初の要素はバージョンナンバーを、次の要素はサーバの名前を表している。
289:
290: 次の {\tt [276,275,$\cdots$,271]} の部分は
1.48 tam 291: スタックマシンに対する命令のうち、利用可能な命令の種類を表している。
292: スタックマシンへの命令はすべて 32 ビットの整数で表しており、
293: このリストは利用可能な命令に対応する 32 ビットの整数のリストとなっている。
1.31 tam 294:
295: 最後の {\tt [ [514,[1,2,3,$\cdots$,60]],[2144202544,[0,1]] ]} の部分は
296: 理解可能なデータの形式を表している。
297: この部分はさらに {\tt [514,[1,2,3,$\cdots$,60]]} と
298: {\tt [2144202544,[0,1]]} にの部分に分けることができ、
299: それぞれが一つのデータ形式についての情報となっている。
300: どのデータ形式についての情報かは最初の要素にある整数値をみれば
301: 分かるようになっている。
302: この整数値は CMO 形式では 514 となっている。
303: 最初のデータ形式を区別する整数値以後の要素は
304: 各データ形式によってどのように使われるか定まっている。
1.40 tam 305: CMO 形式では理解可能なデータのタグがリストの中に収まっている。
306: 前節で CMO 形式では多倍長整数を表すタグが 20 であることを述べたが、
1.31 tam 307: このリストに 20 が含まれているので、
308: ox\_asir は CMO 形式の多倍長整数を受け取れることがわかる。
309:
310: なお、データが受け取れることと、
311: データの論理構造が理解できることとはまったく別物であるので
312: 注意する必要がある。
313:
314:
315: \section{セキュリティ対策}
316:
1.49 ! tam 317: OpenXM 規約は TCP/IP ソケットを用いて通信路を確保することを
! 318: 考慮している。
! 319: ネットワークによって接続される現在の多くのソフトウェアたちと同様に、
! 320: OpenXM 規約もまた通信時のセキュリティについて注意している。
! 321:
! 322: 侵入者に攻撃の機会をできるだけ与えないように、
! 323: 接続が必要になった時のみ接続を待つようにし、
1.31 tam 324: 常に接続に関与するといったことは避けている。
1.49 ! tam 325: また、侵入者が接続を行なう一瞬のすきを狙ってくる可能性もあるので、
! 326: 接続を行なう時に接続を待つポート番号をランダムに決めている。
1.31 tam 327: さらにもう一段安全性を高めるために、
328: 接続時に 1 回だけ使用可能なパスワードを作成し、
329: そのパスワードを使って認証を行なう。
330: このパスワードは一旦使用されれば無効にするので、
1.49 ! tam 331: もし仮になんらかの手段でパスワードが洩れたとしても安全だと考えている。
1.31 tam 332:
1.49 ! tam 333: %なお、上記のポート番号とパスワードは安全な手段で送られて
! 334: %いると仮定している。
! 335: %また、同一のコンピュータ上に悪意のあるユーザはいないと仮定している
! 336: %ことに注意しなければならない。
! 337: %なぜなら、現在の実装ではサーバ、およびクライアントの動作している
! 338: %コンピュータ上ではこのポート番号とパスワードがわかってしまうためである。
1.31 tam 339:
340: なお、接続が確立した後のメッセージの送受信に関しては、
1.49 ! tam 341: 特に暗号化などの処置を行っているわけではない。
1.31 tam 342: もし必要があれば、通信路の暗号化を行なう機能がある
1.49 ! tam 343: ソフトウェア ssh を使うことを考えている。
1.31 tam 344:
345:
346: \section{他のプロジェクト}
347:
348: 他のプロジェクトについても触れておこう。
349:
350: OpenMath プロジェクトは数学的なオブジェクトを
351: コンピュータ上で表現する方法を決定している。
352: 各ソフトウェア間でオブジェクトを交換する際の
353: オブジェクトの変換手順についても述べられている。
354: 表現方法は一つだけでなく、 XML 表現や binary 表現などが
355: 用意されている。
356: 詳細は
357:
358: http://www.openmath.org/omsoc/index.html A.M.Cohen
359:
360:
361: 以下は書いてる途中。
362:
363: NetSolve
364:
365: http://www.cs.utk.edu/netsolve/
366:
367:
368: MP
369:
370: http://symbolicNet.mcs.kent.edu/SN/areas/protocols/mp.html
371:
372:
373: MCP
374:
375: http://horse.mcs.kent.edu/~pwang/
376:
377:
378: \section{現在提供されているソフトウェア}
379:
380: 現在 OpenXM 規格に対応しているクライアントには
381: asir, sm1, Mathematica がある。
382: これらのクライアントから
383: OpenXM 規格に対応したサーバを呼び出すことができる。
384: 現在 OpenXM 規約に対応しているサーバソフトウェアには、
385: asir, sm1, gnuplot, Mathematica などがあり、
386: それぞれ ox\_asir, ox\_sm1, ox\_math という名前で提供されている。
387: また、 OpenMath 規格の XML 表現で表現されたデータと CMO 形式の
388: データを変換するソフトウェアが JAVA によって実装されており、
389: OMproxy という名前で提供されている。
1.33 tam 390:
1.49 ! tam 391: \begin{thebibliography}{9}
! 392: \item OpenXM の設計と実装
! 393: \item Open asir 入門
! 394: \end{thebibliography}
1.1 tam 395:
396: \end{document}
FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>