Annotation of OpenXM/doc/genkou19991125.tex, Revision 1.52
1.1 tam 1: \documentclass{jarticle}
2:
1.52 ! tam 3: %% $OpenXM: OpenXM/doc/genkou19991125.tex,v 1.51 1999/12/23 04:02:19 ohara Exp $
1.51 ohara 4:
1.52 ! tam 5: \usepackage{jssac}
! 6: \title{タイのトル}
1.50 ohara 7: \title{
8: 1. いいかげんスタイルファイルをかえよう。\\
9: 2. 意味もない修飾過剰な語句は排除しましょう。
10: TCP/IP ソケットとか、TCP/IP 実装とか何のこっちゃと思いました。
11: }
1.52 ! tam 12:
! 13: \author{前 川 将 秀\affil{神戸大学理学部数学科}
! 14: \mail{maekawa@math.sci.kobe-u.ac.jp}
! 15: \and 野 呂 正 行\affil{富士通研究所}
! 16: \mail{}
! 17: \and 小 原 功 任\affil{金沢大学理学部計算科学教室}
! 18: \mail{}
! 19: \and 奥 谷 行 央\affil{神戸大学大学院自然科学研究科数学専攻}
! 20: \mail{okutani@math.sci.kobe-u.ac.jp}
! 21: \and 高 山 信 毅\affil{神戸大学理学部数学教室}
! 22: \mail{taka@math.sci.kobe-u.ac.jp}
! 23: \and 田 村 恭 士\affil{神戸大学大学院自然科学研究科情報メディア科学専攻}
! 24: \mail{tamura@math.sci.kobe-u.ac.jp}
1.1 tam 25: }
1.52 ! tam 26: \art{}
1.1 tam 27:
28: \begin{document}
29: \maketitle
30:
1.30 ohara 31: \section{OpenXMとは}
32:
1.43 tam 33: OpenXM は数学プロセス間でメッセージを交換するための規約である。
34: 数学プロセス間でメッセージをやりとりすることにより、
35: ある数学プロセスから他の数学プロセスを呼び出して計算を行なったり、
36: 他のマシンで計算を行なわせたりすることが目的である。
37: なお、 OpenXM とは Open message eXchange protocol for Mathematics の略である。
38: OpenXM の開発の発端は野呂と高山により、
39: asir と kan/sm1 を相互に呼び出す機能を実装したことである。
1.31 tam 40:
1.50 ohara 41: {\bf\large 以下の説明がなぜ必要なのかは全然分からないけれど、}
42: 初期の実装では、相手側のローカル言語の文法に従った文字列を送っていた。こ
43: の方法では相手側のソフトが asir なのか kan/sm1 なのかを判別するなどして、
44: 相手側のローカル言語の文法に合わせた文字列を作成しなければならない。この
45: ローカル言語の文法に従った文字列を送る方法は、効率的であるとはいい難いが、
46: 使いやすいとも言える。
47:
48: 現在の OpenXM 規約では共通表現形式によるメッセージを用いている。上記の文
49: 字列を送る方法の利点を生かすため、OpenXM 規約では共通表現形式の中の文字
50: 列として、ローカル言語の文法に従った文字列を用いたメッセージの交換も可能
51: となっている。{\large\bf しかし、こんな細かいことをここで説明しなければ
52: ならない理由がやっぱり分からないなぁ。構成的におかしいと思うけどなぁ。意
53: 味不明。}
54:
55: OpenXM 規約では通信の方法に幾らかの自由度があるが、現在のところは TCP/IP
56: を用いた通信しか実装されていない。そこで、この論文では具体的な実装は
57: TCP/IP を用いていると仮定する。
1.30 ohara 58:
1.36 tam 59: \section{OpenXM のメッセージの構造}
1.30 ohara 60:
1.50 ohara 61: OpenXM で規定されている TCP/IP 実装によるメッセージはバイトストリームと
62: なっており、次のような構造になっている。
1.30 ohara 63:
1.50 ohara 64: \begin{tabular}{|c|c|}
65: \hline
66: ヘッダ & \hspace{10mm} ボディ \hspace{10mm} \\
67: \hline
1.36 tam 68: \end{tabular}
69:
70: ヘッダの長さは 8 バイトであると定められている。
71: ボディの長さはメッセージごとに異なっているが、
1.40 tam 72: 長さは $0$ でもよい。
1.38 tam 73:
1.36 tam 74: ヘッダは次の二つの情報を持っている。
1.30 ohara 75: \begin{enumerate}
1.43 tam 76: \item 前半の 4 バイト。メッセージの種類を表わす識別子であり、
1.36 tam 77: タグと呼ばれる。
1.43 tam 78: \item 後半の 4 バイト。メッセージにつけられた通し番号である。
1.30 ohara 79: \end{enumerate}
1.36 tam 80: それぞれの 4 バイトは 32 ビット整数とみなされて扱われる。
81: この場合に用いられる整数の表現方法の説明については後述するが、
82: 基本的に表現方法はいくつかの選択肢から選ぶことが可能となっており、
83: またその選択は通信路の確立時に一度だけなされることに注意しなければならない。
1.50 ohara 84: 現在のOpenXM 規約では、タグ(整数値)として
85: 以下のものが定義されている。
1.45 tam 86:
87: \begin{verbatim}
1.50 ohara 88:
1.45 tam 89: #define OX_COMMAND 513
1.50 ohara 90: #define OX_DATA 514
91: 足りないものは追加しましょう。怠けてはダメよ。
92:
1.45 tam 93: \end{verbatim}
1.30 ohara 94:
1.50 ohara 95: ボディの構造はメッセージの種類によって異なる。
96: この論文では、OX\_DATA と OX\_COMMAND で識別されるメッセージについてのみ、
97: 説明する。
98:
99: 既存のメッセージでは対応できない場合は、新しい識別子を定義することで新し
100: い種類のメッセージを作成することができる。この方法は各数学ソフトウェアの
101: 固有の表現を含むメッセージを作成したい場合などに有効である。新しい識別子
102: の定義方法については、\cite{OpenXM-1999} を参照すること。
1.42 tam 103:
104: \section{OpenXM の計算モデル}
105:
1.44 tam 106: %{\Huge この節では計算モデルの話をしなければいけません}
1.42 tam 107:
1.50 ohara 108: OpenXM 規約での計算とはメッセージを交換することである。また、 OpenXM 規
109: 約ではクライアント・サーバモデルを採用しているので、メッセージの交換はサー
110: バとクライアントの間で行なわれる。クライアントからサーバへメッセージを送
111: り、クライアントがサーバからメッセージを受け取ることによって計算の結果が
112: 得られる。
113:
114: サーバはスタックマシンである。サーバがクライアントから受け取ったメッセー
115: ジは、タグが OX\_COMMAND でなければすべてスタックに積まれる。タグが
116: OX\_COMMAND となっているメッセージはスタックマシンへの命令であり、このメッ
117: セージを受け取ったサーバはそれに対応する動作を行なうことが期待されている。
118: サーバはメッセージを受け取らない限り、自ら何か動作をおこなわない。
119:
120: {\large\bf 意味不明な書き方だけど、} これは毎回サーバへメッセージを送る
121: たびに、いつもサーバからのメッセージをクライアントが待つ必要がないことを
122: 意味する。このため、クライアントはサーバの状態を気にせずにメッセージを送
123: り、一旦メッセージを送付し終えた後、サーバへ送ったメッセージの結果をサー
124: バから待つことなしに次の動作に移ることができる。
1.42 tam 125:
1.50 ohara 126: \section{OpenXM の計算の進行方法}
1.30 ohara 127:
1.50 ohara 128: 前の節と重複しているのでもう少しちゃんと考えて欲しいのだけれど、
1.30 ohara 129:
1.45 tam 130: サーバが行うのは基本的に次の事柄だけである。
131: クライアントからメッセージを受け取ると、
132: サーバはまずメッセージの識別子を調べ、
133: タグが OX\_COMMAND のメッセージでなければスタックに積む。
134: タグが OX\_COMMAND のメッセージであればメッセージのボディから
135: スタックマシンの命令コードを取りだし、
1.39 tam 136: あらかじめ規約で定められた動作を行なう。
137:
1.45 tam 138: 上の説明でわかるように、
1.39 tam 139: サーバはクライアントからの指示なしに、
1.45 tam 140: 自らメッセージを送らないことに注意する必要がある。
1.39 tam 141: %(例外? ox\_asir の mathcap)。
1.30 ohara 142:
1.45 tam 143: サーバがクライアントから受け取ったメッセージはすべてスタックに積まれている。
144: 次いでサーバにスタックマシンへの命令を送ると、
1.39 tam 145: 初めてサーバはデータをスタックに積む以外のなんらかの動作を行なう。
1.30 ohara 146: このとき、必要があればサーバはスタックから必要なだけデータを取り出す。
147: ここで、クライアントからの命令による動作中にたとえエラーが発生したとしても
148: サーバはエラーオブジェクトをスタックに積むだけで、
1.45 tam 149: 明示されない限りエラーをクライアントへ返さないことに注意しなければならない。
1.30 ohara 150:
151: 結果が生じる動作をサーバが行なった場合、
1.41 tam 152: サーバは動作の結果をスタックに積む。
1.30 ohara 153: サーバに行なわせた動作の結果をクライアントが知りたい場合、
1.45 tam 154: スタックからデータを取り出し送信を行なう命令をサーバ側へ送ればよい。
1.39 tam 155:
1.45 tam 156: %{\Huge 以下、書き直し}
1.3 tam 157:
1.45 tam 158: クライアントがサーバへメッセージを送り、
159: 計算の結果を得るという手順を追っていくと次のようになる。
1.3 tam 160:
161: \begin{enumerate}
1.45 tam 162: \item まず、クライアントがサーバへメッセージを送る。
163: サーバは送られてきたメッセージをスタックに積む。
164: \item クライアントがサーバにスタックマシンへの命令を送ると、
165: サーバは必要なだけスタックからデータを取り出し、
166: 実行した結果をスタックに積む。
167: \item 最後に「スタックからデータを取り出し送信を行なう命令」を
1.30 ohara 168: サーバへ送ると、サーバはスタックから計算結果の入っている
169: データを取り出し、クライアントへ送出する。
1.4 tam 170: \end{enumerate}
1.2 tam 171:
1.1 tam 172:
1.30 ohara 173: \section{CMO のデータ構造}
1.4 tam 174:
1.50 ohara 175: OpenXM 規約では、数学的オブジェクトを表現する方法として
1.45 tam 176: CMO 形式(Common Mathematical Object format)を定義している。
1.46 tam 177: この CMO 形式を使ってメッセージを送るには、
178: タグを OX\_DATA にすればよい。
1.47 tam 179: CMO 形式におけるメッセージのボディ部分について以下で説明するが、
1.46 tam 180: %OpenXM 規約で定義されているメッセージを実際に作成する場合、
1.30 ohara 181: CMO 形式で定義されている多倍長整数を理解しておくと、
1.47 tam 182: CMO 形式の他のデータ構造だけでなく、
183: OpenXM 規約で定義されている様々なデータ構造を理解する助けになると思えるので、
184: ここでは CMO 形式の多倍長整数のデータ構造についてのみ説明する。
1.30 ohara 185:
186: CMO 形式で定義されているデータは多倍長整数以外にも
187: 文字列やリスト構造などがある。どのようなデータであるかは
1.47 tam 188: データの先頭にある(メッセージの識別子とは別にある)タグを見れば
189: 判別できるようになっている。
190: これはメッセージの種類の判別の仕方とおなじである。
1.30 ohara 191: なお、タグは各データ毎に 32 bit の整数で表されており、
192: 多倍長整数は 20 となっている。
1.47 tam 193: よく使われると思われる CMO 形式のタグをあげておく。
194: \begin{verbatim}
195: #define CMO_INT32 2 /* 32 ビット整数 */
196: #define CMO_STRING 4 /* 文字列 */
197: #define CMO_LIST 17 /* リスト構造 */
198: #define CMO_ZZ 20 /* 多倍長整数 */
199: \end{verbatim}
200:
201: ここで TCP/IP 実装における 32 bit の整数の
202: 表現方法について説明する必要がある。
203: OpenXM 規約の TCP/IP 実装ではバイトストリームで 32 bit の整数 20 を
1.30 ohara 204: {\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。
205: この表現方法の違いはクライアントとサーバの最初の接続時に
206: 双方の合意で決定することになっている。
1.47 tam 207: なお、合意がない場合には前者の表現方法
208: (以後、この表現方法をネットワークバイトオーダーと呼ぶ)を
1.30 ohara 209: 使うことになっている。
210: また、負の数を表現する必要があるときには、
211: 2 の補数表現を使うことになっている。
212:
1.50 ohara 213: CMO 形式の多倍長整数は、 Gnu MPライブラリ等を参考にしており、
1.48 tam 214: 符合付き絶対値表現を用いている。
215: タグ以降の形式は次のようになる。
216:
217: \begin{tabular}{|c|c|c|c|c|} \hline
218: $f$ & $b_0$ & $b_1$ & $\cdots$ & $b_{n-1}$ \\ \hline
219: \end{tabular}
220:
221: ここで、 1 つの枠は 4 バイトを表し、
222: $f$ は符合付き 32 ビット整数を、
223: $b_0$, $b_1$, $\cdots$, $b_{n-1}$ は符合なし 32 ビット整数を表している。
224: さらに、 $|f| = n$ が成り立たなければならない。
225: このオブジェクトは
226: \[ \mbox{sgn}(f) \times \{ b_0 (2^{32})^0 + b_1 (2^{32})^1 + \cdots
227: + b_{n-1} (2^{32})^{n-1} \} \]
228: という整数であると定義されている。
229: ただし、
230: \[ \mbox{sgn}(f) = \left\{ \begin{array}{ll}
231: 1 & f>0 \\
232: 0 & f=0 \\
233: -1 & f<0 \\ \end{array} \right. \]
234: である。
1.30 ohara 235:
236: ここで具体例をだそう。
1.48 tam 237: $4294967298 = 1 \times 2^{32} + 2$ を CMO 形式の
238: ネットワークバイトオーダー、多倍長整数で表現すると、
1.6 tam 239: \begin{center}
240: {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01}
241: \end{center}
1.30 ohara 242: となる。また、同じ表現方法で $-1$ を表現すると、
1.6 tam 243: \begin{center}
244: {\tt 00 00 00 14 ff ff ff ff 00 00 00 01}
245: \end{center}
1.30 ohara 246: となる。
1.4 tam 247:
1.1 tam 248:
1.50 ohara 249: \section{mathcap について}
1.30 ohara 250:
1.50 ohara 251: OpenXM 規約では、通信時に用いられるメッセージの種類を各ソフトウェアが制
252: 限する方法を用意している。これは各ソフトウェアの実装によってはすべてのメッ
253: セージをサポートするのが困難な場合があるからである。また、各ソフトウェア
254: でメッセージの種類を拡張したい場合にも有効である。
255: この制限(あるいは拡張)は mathcap と呼ばれるデータ構造によって行われる。
256: この節では mathcap のデータ構造と、具体的なメッセージの制限の手続きにつ
257: いて説明する。
258:
259: まず、手続きについて説明しよう。
260:
261: \begin{quote}
262: 説明。説明。説明。説明。説明。
263: 説明。説明。説明。説明。説明。
264: 説明。説明。説明。説明。説明。
265: 説明。説明。説明。説明。説明。
266: \end{quote}
267:
268: 次に mathcap のデータ構造について説明する。
269:
270: \begin{quote}
271: 説明。説明。説明。説明。説明。
272: 説明。説明。説明。説明。説明。
273: 説明。説明。説明。説明。説明。
274: 説明。説明。説明。説明。説明。
275: \end{quote}
276:
277: 具体的な mathcap の例をあげる。
278:
279: \begin{quote}
280: 説明。説明。説明。説明。説明。
281: 説明。説明。説明。説明。説明。
282: 説明。説明。説明。説明。説明。
283: 説明。説明。説明。説明。説明。
284: \end{quote}
285:
286:
287: {\large\bf これより以降は意味不明で私にはよく分かりませんでしたので、
288: たぶん読者も分からないでしょうね、というのはいいとして、}
289: CMO 形式で定義されている mathcap データは
1.30 ohara 290: 受け取ることができるデータ形式を表すデータであり、
1.50 ohara 291: 要求されればサーバはサーバ自身の mathcap データをスタックに積む。
292: また、クライアントから mathcap データをサーバへ送ることもでき、
293: mathcap データをサーバとクライアントの間で交換することによって、
1.30 ohara 294: お互いに相手側が受け取ることができないデータ形式で
295: メッセージを送ってしまうのを防ぐことができる。
1.50 ohara 296: なお、 mathcap データの中では CMO 形式で定義されている
1.30 ohara 297: 32 bit 整数、文字列、リスト構造が使われており、
1.50 ohara 298: mathcap データに含まれている内容を理解できるためには
299: 必然的にこれらも理解できる必要がある(ってことは CMO 形式のところでこれら
300: を説明しなければならないってことですね、田村君)。
1.30 ohara 301:
1.50 ohara 302: OpenXM 対応版の asir サーバである ox\_asir が返す mathcap を以下に示す。
1.30 ohara 303:
1.48 tam 304: なお、 $a_1$, $a_2$, $\cdots$, $a_n$ を要素に
305: 持つリスト構造を {\tt [$a_1$, $a_2$, $\cdots$, $a_n$]} 、
306: 文字列 ``string'' を {\tt "string"} 、 32 bit 整数を
307: それに対応する 10 進数の整数で示す。
1.7 tam 308:
1.30 ohara 309: %↓手で作ったので間違えている可能性あり。
310: %%古いバージョン。差し替えの必要あり。
1.7 tam 311: \begin{verbatim}
312: [ [199901160,"ox_asir"],
313: [276,275,258,262,263,266,267,268,274
314: ,269,272,265,264,273,300,270,271],
1.8 tam 315: [ [514,[1,2,3,4,5,2130706433,2130706434
316: ,17,19,20,21,22,24,25,26,31,27,33,60]],
317: [2144202544,[0,1]]
1.7 tam 318: ]
319: ]
320: \end{verbatim}
321:
1.50 ohara 322: この mathcap データのリスト構造は大きく分けて 3 つの部分に分かれる。
1.31 tam 323: 最初の {\tt [199901160,"ox\_asir"]} の部分にはサーバの情報が入っている。
324: %この最初の要素がまたリスト構造となっており、
325: 最初の要素はバージョンナンバーを、次の要素はサーバの名前を表している。
326:
327: 次の {\tt [276,275,$\cdots$,271]} の部分は
1.48 tam 328: スタックマシンに対する命令のうち、利用可能な命令の種類を表している。
329: スタックマシンへの命令はすべて 32 ビットの整数で表しており、
330: このリストは利用可能な命令に対応する 32 ビットの整数のリストとなっている。
1.31 tam 331:
332: 最後の {\tt [ [514,[1,2,3,$\cdots$,60]],[2144202544,[0,1]] ]} の部分は
333: 理解可能なデータの形式を表している。
334: この部分はさらに {\tt [514,[1,2,3,$\cdots$,60]]} と
335: {\tt [2144202544,[0,1]]} にの部分に分けることができ、
336: それぞれが一つのデータ形式についての情報となっている。
337: どのデータ形式についての情報かは最初の要素にある整数値をみれば
338: 分かるようになっている。
339: この整数値は CMO 形式では 514 となっている。
340: 最初のデータ形式を区別する整数値以後の要素は
341: 各データ形式によってどのように使われるか定まっている。
1.40 tam 342: CMO 形式では理解可能なデータのタグがリストの中に収まっている。
343: 前節で CMO 形式では多倍長整数を表すタグが 20 であることを述べたが、
1.31 tam 344: このリストに 20 が含まれているので、
345: ox\_asir は CMO 形式の多倍長整数を受け取れることがわかる。
346:
347: なお、データが受け取れることと、
348: データの論理構造が理解できることとはまったく別物であるので
349: 注意する必要がある。
350:
351:
352: \section{セキュリティ対策}
353:
1.50 ohara 354: OpenXM 規約は TCP/IP を用いて通信を行うことを考慮している規約である。
355: ネットワークによって接続される現代の多くのソフトウェアと同様、
1.49 tam 356: OpenXM 規約もまた通信時のセキュリティについて注意している。
1.50 ohara 357: 以下、このことについて説明しよう。
358:
359: {\large\bf 意味不明なことを書いているが、}
360: 侵入者に攻撃の機会をできるだけ与えないようするた
361: めに、接続が必要になった時のみ接続を待つようにし、
362: 常に接続に関与するといったことは避けている(やっぱり意味不明である)。
1.49 tam 363:
364: また、侵入者が接続を行なう一瞬のすきを狙ってくる可能性もあるので、
1.50 ohara 365: 接続を行なう時に接続を待つポート番号をランダムに決めている(誰が決めてい
366: るのかはやっぱり不明であるが)。
1.31 tam 367: さらにもう一段安全性を高めるために、
368: 接続時に 1 回だけ使用可能なパスワードを作成し、
1.50 ohara 369: そのパスワードを使って認証を行なう(誰がパスワードを決めて誰が認証を行っ
370: ているのかが不明だけど)。
1.31 tam 371: このパスワードは一旦使用されれば無効にするので、
1.49 tam 372: もし仮になんらかの手段でパスワードが洩れたとしても安全だと考えている。
1.31 tam 373:
1.49 tam 374: %なお、上記のポート番号とパスワードは安全な手段で送られて
375: %いると仮定している。
376: %また、同一のコンピュータ上に悪意のあるユーザはいないと仮定している
377: %ことに注意しなければならない。
378: %なぜなら、現在の実装ではサーバ、およびクライアントの動作している
379: %コンピュータ上ではこのポート番号とパスワードがわかってしまうためである。
1.31 tam 380:
381: なお、接続が確立した後のメッセージの送受信に関しては、
1.49 tam 382: 特に暗号化などの処置を行っているわけではない。
1.31 tam 383: もし必要があれば、通信路の暗号化を行なう機能がある
1.49 tam 384: ソフトウェア ssh を使うことを考えている。
1.31 tam 385:
386: \section{他のプロジェクト}
387:
388: 他のプロジェクトについても触れておこう。
389:
390: OpenMath プロジェクトは数学的なオブジェクトを
391: コンピュータ上で表現する方法を決定している。
392: 各ソフトウェア間でオブジェクトを交換する際の
393: オブジェクトの変換手順についても述べられている。
394: 表現方法は一つだけでなく、 XML 表現や binary 表現などが
395: 用意されている。
396: 詳細は
397:
398: http://www.openmath.org/omsoc/index.html A.M.Cohen
399:
400:
401: 以下は書いてる途中。
402:
403: NetSolve
404:
405: http://www.cs.utk.edu/netsolve/
406:
407:
408: MP
409:
410: http://symbolicNet.mcs.kent.edu/SN/areas/protocols/mp.html
411:
412:
413: MCP
414:
415: http://horse.mcs.kent.edu/~pwang/
416:
417:
418: \section{現在提供されているソフトウェア}
419:
420: 現在 OpenXM 規格に対応しているクライアントには
421: asir, sm1, Mathematica がある。
422: これらのクライアントから
423: OpenXM 規格に対応したサーバを呼び出すことができる。
424: 現在 OpenXM 規約に対応しているサーバソフトウェアには、
425: asir, sm1, gnuplot, Mathematica などがあり、
426: それぞれ ox\_asir, ox\_sm1, ox\_math という名前で提供されている。
427: また、 OpenMath 規格の XML 表現で表現されたデータと CMO 形式の
428: データを変換するソフトウェアが JAVA によって実装されており、
429: OMproxy という名前で提供されている。
1.33 tam 430:
1.50 ohara 431: \begin{thebibliography}{99}
432: \bibitem{OpenXM-1999}
433: 野呂正行, 高山信毅.
434: {Open XM の設計と実装 --- Open message eXchange protocol for Mathematics},
435: 1999/11/22
436: \bibitem{Ohara-Takayama-Noro-1999}
437: 小原功任, 高山信毅, 野呂正行.
438: {Open asir 入門}, 1999, 数式処理, Vol 7, No 2, 2--17. (ISBN4-87243-086-7, SEG 出版, Tokyo).
1.49 tam 439: \end{thebibliography}
1.1 tam 440:
441: \end{document}
FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>