OpenXM/doc/genkou19991125.tex - diff

Return to genkou19991125.tex CVS log

Up to [local] / OpenXM / doc

Diff for /OpenXM/doc/Attic/genkou19991125.tex between version 1.35 and 1.47

-version 1.35, 1999/12/21 16:00:56
+version 1.47, 1999/12/22 18:01:06
 Line 4
 Line 4
 Line 4
  \author{
  前川 将秀\thanks{神戸大学理学部数学科},
  野呂 正行\thanks{富士通研究所},
- 小原 功任\thanks{金沢大学理学部計算科学科}, \\
+ 小原 功任\thanks{金沢大学理学部計算科学教室}, \\
- 奥谷 幸夫
+ 奥谷 行央
  %\thanks{神戸大学大学院自然科学研究科博士課程前期課程数学専攻},
  \thanks{神戸大学大学院自然科学研究科数学専攻},
  高山 信毅\thanks{神戸大学理学部数学教室},
 Line 21
 Line 21
 Line 21
  \section{OpenXMとは}
- OpenXM は数学プロセス間でメッセージを交換するための規約である。数学プロ
+ OpenXM は数学プロセス間でメッセージを交換するための規約である。
- セス間でメッセージをやりとりさせることにより、ある数学プロセスから他の数
+ 数学プロセス間でメッセージをやりとりすることにより、
- 学プロセスを呼び出して計算を行なったり、他のマシンで計算を行なわせたりす
+ ある数学プロセスから他の数学プロセスを呼び出して計算を行なったり、
- ることが目的である。なお、 OpenXM とは Open message eXchange protocol
+ 他のマシンで計算を行なわせたりすることが目的である。
- for Mathematics の略である。
+ なお、 OpenXM とは Open message eXchange protocol for Mathematics の略である。
- OpenXM の開発の発端は野呂正行と高山信毅により、 asir と kan/sm1 を
+ OpenXM の開発の発端は野呂と高山により、
- 相互に呼び出す機能を実装したことである。
+ asir と kan/sm1 を相互に呼び出す機能を実装したことである。
- %\footnote{この段落必要?}
- 発端となった asir と kan/sm1 での実装時には、
+ %発端となった asir と kan/sm1 での実装時には、
- お互いに相手側のコマンド文字列を送っていた。
+ 初期の実装では、相手側のローカル言語の文法に従った文字列を送っていた。
- この方法は現在の OpenXM 規約でも形を変えて可能ではあるが、
+ 現在の OpenXM 規約では共通表現形式によるメッセージを用いている。
- 使いやすい反面、効率的であるとはいい難い。
+ この方法では相手側のソフトが asir なのか kan/sm1 なのかを判別するなどして、
- さらに、この方法では相手側のソフトが asir なのか kan/sm1 なのかを
+ 相手側のローカル言語の文法に合わせた文字列を作成する必要がなくなる。
- 判別して、相手側に合わせてコマンド文字列を作成する必要がある。
+ しかし、ローカル言語の文法に従った文字列を送る方法も、
+ 効率的であるとはいい難いが、使いやすい。
+ そのため、 OpenXM 規約では共通表現形式の中の文字列として、
+ ローカル言語の文法に従った文字列を用いた
+ メッセージの交換も可能となっている。
- これ以外の方法として、
+ %OpenXM 規約独自のデータ形式である CMO 形式(Common Mathematical Object format)
- OpenXM 規約では共通表現形式によるメッセージも用意している。
+ %以外にも、 MP や OpenMath の XML, binary 表現形式といった他の形式をも
- OpenXM 規約独自のデータ形式である CMO 形式(Common Mathematical Object format)
+ %扱えるようにしてある。
- 以外にも、 MP や OpenMath の XML, binary 表現形式といった他の形式をも
- 扱えるようにしてある。
- なお、現在の OpenXM 規約では、
- 前述のコマンド文字列も CMO 形式などの何らかのデータ形式の中の
- 文字列として表現して送る必要がある。
- \section{OpenXM の計算モデル}
+ OpenXM 規約では通信路の確保の方法に幾らかの自由度があるが、
+ 現在は TCP/IP ソケットを用いた実装しかない。
+ %通信の実現方法は通信路のとりかたにより変わる。
+ そこで、以後ここでは具体的な実装は TCP/IP ソケットを
+ 用いていると仮定する。
- {\Huge この節では計算モデルの話をしなければいけませんよ、田村君}
- OpenXM 規約での計算とはメッセージを交換することである。
+ \section{OpenXM のメッセージの構造}
- そして、そのメッセージの交換はサーバとクライアントの間で行なわれる。
- クライアントからサーバへメッセージを送り、
- サーバからクライアントがメッセージを受け取ることによって
- 計算の結果が得られる。
- サーバはスタックマシンであると仮定されており、
+ OpenXM で規定されている TCP/IP 実装によるメッセージは
- サーバがクライアントから受け取ったメッセージはすべてスタックに積まれる。
+ バイトストリームとなっており、
- ただし、OpenXM のメッセージの中にはサーバに行なわせたい動作に
+ 次のような構造になっている。
- 対応するデータがあり、
- このメッセージを受け取ったサーバはそれに対応する動作を
- 行なうことが期待されている。
- しかし、サーバは命令されない限り何も動作を行なおうとはしない。
- このため、クライアントはサーバへ送ったメッセージの結果を
- サーバから
- これはクライアントがサーバへ一旦メッセージを送付し終えると、
+ \begin{tabular}{|c|c|} \hline
- あとはサーバ側の状態を気にせずにクライアントは
+ ヘッダ  & \hspace{10mm} ボディ \hspace{10mm} \\ \hline
- クライアント自身の仕事に戻れることを意味する。
+ \end{tabular}
+ ヘッダの長さは 8 バイトであると定められている。
+ ボディの長さはメッセージごとに異なっているが、
+ 長さは $0$ でもよい。
- \section{OpenXM のメッセージの構造}
+ ヘッダは次の二つの情報を持っている。
+ \begin{enumerate}
+ \item   前半の 4 バイト。メッセージの種類を表わす識別子であり、
+         タグと呼ばれる。
+ \item   後半の 4 バイト。メッセージにつけられた通し番号である。
+ \end{enumerate}
+ それぞれの 4 バイトは 32 ビット整数とみなされて扱われる。
+ この場合に用いられる整数の表現方法の説明については後述するが、
+ 基本的に表現方法はいくつかの選択肢から選ぶことが可能となっており、
+ またその選択は通信路の確立時に一度だけなされることに注意しなければならない。
+ OpenXM 規約で定義されているタグの整数値で
+ よく使われると思うものを以下にあげておく。
- {\Huge この節では構造の話をしなければいけませんよ、田村君}
- OpenXM のメッセージはバイトストリームであり、次のような構造を持つ。
  \begin{verbatim}
- ヘッダ  ボディ
+ #define OX_COMMAND      513
+ #define OX_DATA 514
  \end{verbatim}
- ヘッダの長さは8バイトであると定められている。ボディの長さはメッセージご
- とに異なる($0$でもよい)。
- ヘッダは次の二つの情報を持つ。
- \begin{enumerate}
- \item 前半の4バイト。タグと呼ばれ、メッセージの種類を表わす識別子である。
- \item 後半の4バイト。メッセージにつけられた通し番号である。
- \end{enumerate}
- それぞれの4バイトは32ビット整数とみなされて処理される。
+ ボディの中身はタグによるメッセージの種類によって
- この場合に用いられる整数の表現方法については後述するが、基本的に
+ それぞれ独立に決められるようになっている。
- 表現方法はいくつかの選択肢から選ぶことが可能であり、
+ もし、システム固有の表現を OpenXM 規約のメッセージに
- また選択は通信路の確立時に一度だけなされることに注意しておこう。
+ 埋め込んで使いたい場合には、
+ タグの値をこのような用途のために推奨されている
+ 整数値の範囲に設定し、
+ システム固有の表現をボディに埋め込めばよい。
- {\Huge 以下、書き直してね。}
- ボディの中のデータがどのように格納されているかは
+ \section{OpenXM の計算モデル}
- 各データ形式がそれぞれ独立に決められるようになっている。
- もし、 OpenXM 規約でメッセージのやりとりを行ないたいが、
- まだ規約で定義されていないデータ形式を使いたい場合は、
- タグをまだ使われてなさそうな値
- (システム固有の表現のために推奨されている値がある)
- に設定し、 ボディの部分にデータを埋め込めばよい。
- なお、すべてのメッセージに ボディが必要というわけではなく、
- ボディのないメッセージも OpenXM 規約には存在することに
- 注意しなければならない。
- サーバに対する動作に対応したデータは SM 形式として定義されている。
+ %{\Huge この節では計算モデルの話をしなければいけません}
- SM 形式以外のデータでは、サーバは受け取ったデータをスタックに積む
- 以外の動作をしないことになっている。
- つまり、 SM 形式のデータがデータを受け取る以外の動作を
- サーバに行なわせる唯一のデータ形式である。
- このデータを受け取る以外の動作の中には、
- データになんらかの加工を施す動作も入っている。
- このデータになんらかの加工を施す動作の中には
- 数学的な演算を行なう動作も含まれている。
- 以後、データになんらかの加工を施す動作のことを計算と呼ぶことにする。
- \section{OpenXM の計算の進行方法}
+ OpenXM 規約での計算とはメッセージを交換することである。
+ また、 OpenXM 規約ではクライアント・サーバモデルを採用しているので、
+ メッセージの交換はサーバとクライアントの間で行なわれる。
+ クライアントからサーバへメッセージを送り、
+ サーバからクライアントがメッセージを受け取ることによって
+ 計算の結果が得られる。
- OpenXM における計算とはメッセージの交換のことである。既に計算モデルの節
+ サーバはスタックマシンであると仮定されており、
- で説明したが(説明されているはずである)、OpenXM はサーバ・クライアントモ
+ サーバがクライアントから受け取ったメッセージは、
- デルを採用していて、サーバはスタックマシンの構造を持つ。サーバが行うのは
+ タグが OX\_COMMAND でなければすべてスタックに積まれる。
- 基本的に次の事柄に限られる。クライアントからメッセージを送られるとサーバ
+ タグが OX\_COMMAND となっているメッセージは
- は、まずメッセージの識別子を調べ、OX\_COMMAND でなければスタックに積む。
+ スタックマシンへの命令であり、このメッセージを受け取ったサーバは
- OX\_COMMAND であればメッセージのボディからスタックマシンのオペコードを取
+ それに対応する動作を行なうことが期待されている。
- りだし、あらかじめ規約で定められたアクションを起こす。
+ しかし、サーバはメッセージを受け取らない限り、
+ 自ら何か動作を行なおうとはしない。
+ これは毎回サーバへメッセージを送るたびに、
+ いつもサーバからのメッセージをクライアントが待つ必要がないことを意味する。
+ このため、クライアントはサーバの状態を気にせずにメッセージを送り、
+ 一旦メッセージを送付し終えた後、
+ サーバへ送ったメッセージの結果を
+ サーバから待つことなしに次の動作に移ることができる。
- 上の説明でわかるように、サーバはクライアントからの指示なしに、自らメッセー
- ジを送ることはない(例外? ox\_asir の mathcap)。
- {\Huge 以下、書き直してね、田村君}
+ \section{OpenXM の計算の進行方法}
+ サーバが行うのは基本的に次の事柄だけである。
+ クライアントからメッセージを受け取ると、
+ サーバはまずメッセージの識別子を調べ、
+ タグが OX\_COMMAND のメッセージでなければスタックに積む。
+ タグが OX\_COMMAND のメッセージであればメッセージのボディから
+ スタックマシンの命令コードを取りだし、
+ あらかじめ規約で定められた動作を行なう。
- % クライアントがサーバへなんらかの計算を行なわせる場合、
+ 上の説明でわかるように、
- % クライアントからサーバへ計算させたいデータをメッセージとして送り、
+ サーバはクライアントからの指示なしに、
- % そしてその結果をサーバからメッセージで受け取ることによって計算は行なわれる。
+ 自らメッセージを送らないことに注意する必要がある。
- % ただし、サーバは結果の送信すらも命令されなければ行なうことはなく、
+ %(例外? ox\_asir の mathcap)。
- % クライアントは結果を受け取らずにサーバに次々と
- % 計算を行なわせることも可能である。
- サーバがクライアントから受け取ったメッセージはすべてスタックに積まれる。
+ サーバがクライアントから受け取ったメッセージはすべてスタックに積まれている。
- ただし、このままでは受け取ったメッセージに含まれるデータを
+ 次いでサーバにスタックマシンへの命令を送ると、
- スタックに積み上げていくだけで、サーバは計算を行なおうとはしない。
+ 初めてサーバはデータをスタックに積む以外のなんらかの動作を行なう。
- 次いでサーバに行なわせたい動作に対応したデータを送ると、
- 初めてサーバは計算などの、なんらかの動作を行なう。
  このとき、必要があればサーバはスタックから必要なだけデータを取り出す。
  ここで、クライアントからの命令による動作中にたとえエラーが発生したとしても
  サーバはエラーオブジェクトをスタックに積むだけで、
- 明示されない限りエラーを返さないことに注意しなければならない。
+ 明示されない限りエラーをクライアントへ返さないことに注意しなければならない。
  結果が生じる動作をサーバが行なった場合、
- サーバは動作の結果をスタックに積んでいる。
+ サーバは動作の結果をスタックに積む。
  サーバに行なわせた動作の結果をクライアントが知りたい場合、
- スタックからデータを取り出し送信を行なう命令に対応した SM 形式のデータを
+ スタックからデータを取り出し送信を行なう命令をサーバ側へ送ればよい。
- サーバ側へ送ればよい。
- クライアントがサーバへ計算を行なわせ、結果を得るという手順を追っていくと、
+ %{\Huge 以下、書き直し}
- 次のようになる。
+ クライアントがサーバへメッセージを送り、
+ 計算の結果を得るという手順を追っていくと次のようになる。
  \begin{enumerate}
- \item   まず、クライアントがサーバへ計算させたいデータを送る。
+ \item   まず、クライアントがサーバへメッセージを送る。
-         サーバは送られてきたデータをスタックに積む。
+         サーバは送られてきたメッセージをスタックに積む。
- \item   クライアントがサーバに「計算を行なう動作に対応したデータ」を
+ \item   クライアントがサーバにスタックマシンへの命令を送ると、
-         送ると、サーバは必要なだけスタックからデータを取り出し、
+         サーバは必要なだけスタックからデータを取り出し、
-         実行した計算の結果をスタックに積む。
+         実行した結果をスタックに積む。
- \item   最後に「データを取り出し送信を行なう命令に対応したデータ」を
+ \item   最後に「スタックからデータを取り出し送信を行なう命令」を
          サーバへ送ると、サーバはスタックから計算結果の入っている
          データを取り出し、クライアントへ送出する。
  \end{enumerate}
-Line 172  OX\_COMMAND であればメッセージのボディからスタックマシ
+Line 166  OX\_COMMAND であればメッセージのボディからスタックマシ
 Line 172  OX\_COMMAND であればメッセージのボディからスタックマシ
 Line 166  OX\_COMMAND であればメッセージのボディからスタックマシ
  \section{CMO のデータ構造}
- OpenXM 間でやりとりされるメッセージを実際に作成する場合、
+ OpenXM 規約では、数学的オブジェクトを表現するオリジナルの方法として
+ CMO 形式(Common Mathematical Object format)を定義している。
+ この CMO 形式を使ってメッセージを送るには、
+ タグを OX\_DATA にすればよい。
+ CMO 形式におけるメッセージのボディ部分について以下で説明するが、
+ %OpenXM 規約で定義されているメッセージを実際に作成する場合、
  CMO 形式で定義されている多倍長整数を理解しておくと、
- CMO 形式の他のデータ構造だけでなく、 OX 形式、 SM 形式のデータを
+ CMO 形式の他のデータ構造だけでなく、
- 理解する助けになると思えるので、 CMO 形式の多倍長整数の
+ OpenXM 規約で定義されている様々なデータ構造を理解する助けになると思えるので、
- データ構造について説明する。
+ ここでは CMO 形式の多倍長整数のデータ構造についてのみ説明する。
  CMO 形式で定義されているデータは多倍長整数以外にも
  文字列やリスト構造などがある。どのようなデータであるかは
- データの先頭にあるタグを見れば判別できるようになっている。
+ データの先頭にある(メッセージの識別子とは別にある)タグを見れば
- これはメッセージのデータの判別の仕方とおなじである。
+ 判別できるようになっている。
+ これはメッセージの種類の判別の仕方とおなじである。
  なお、タグは各データ毎に 32 bit の整数で表されており、
  多倍長整数は 20 となっている。
- ここで 32 bit の整数の表現方法について説明する必要がある。
+ よく使われると思われる CMO 形式のタグをあげておく。
- OpenXM ではバイト列で 32 bit の整数 20 を
+ \begin{verbatim}
+ #define CMO_INT32  2  /* 32 ビット整数 */
+ #define CMO_STRING 4  /* 文字列        */
+ #define CMO_LIST   17 /* リスト構造    */
+ #define CMO_ZZ     20 /* 多倍長整数    */
+ \end{verbatim}
+ ここで TCP/IP 実装における 32 bit の整数の
+ 表現方法について説明する必要がある。
+ OpenXM 規約の TCP/IP 実装ではバイトストリームで 32 bit の整数 20 を
  {\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。
  この表現方法の違いはクライアントとサーバの最初の接続時に
  双方の合意で決定することになっている。
- なお、合意がない場合には
+ なお、合意がない場合には前者の表現方法
- 前者の表現方法(以後、この表現方法を network byte order と呼ぶ)を
+ (以後、この表現方法をネットワークバイトオーダーと呼ぶ)を
  使うことになっている。
  また、負の数を表現する必要があるときには、
 の補数表現を使うことになっている。
  表現したい多倍長整数の絶対値を 2 進数で表した場合の桁数を $n$ と
- したとき、次にくるデータは $[(n+31)/32]$ を 32 bit の整数となる。
+ したとき、次にくるデータは $[(n+31)/32]$ を 32 bit の整数で表した値となる。
  これは多倍長整数の絶対値を $2^{32}$ 進数で表した場合の桁数ととってもよい。
  ただし、表現したい数が負の場合は $[(n+31)/32]$ を 32 bit の整数で表した値を
 の補数表現で負にして、正の場合と区別する。
-Line 212  $b_0$, $b_1$, $\cdots$, $b_k$ をそれぞれ 32 bit 整数で
+Line 221  $b_0$, $b_1$, $\cdots$, $b_k$ をそれぞれ 32 bit 整数で
 Line 212  $b_0$, $b_1$, $\cdots$, $b_k$ をそれぞれ 32 bit 整数で
 Line 221  $b_0$, $b_1$, $\cdots$, $b_k$ をそれぞれ 32 bit 整数で
  参考にして合わせてある。
  ここで具体例をだそう。
- $4294967298 = 1 \times 2^{32} + 2$ を network byte order の多倍長整数で
+ $4294967298 = 1 \times 2^{32} + 2$ をネットワークバイトオーダーの多倍長整数で
  表現すると、
  \begin{center}
          {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01}
-Line 286  OpenXM 対応版の asir サーバである ox\_asir が返す Math
+Line 295  OpenXM 対応版の asir サーバである ox\_asir が返す Math
 Line 286  OpenXM 対応版の asir サーバである ox\_asir が返す Math
 Line 295  OpenXM 対応版の asir サーバである ox\_asir が返す Math
  この整数値は CMO 形式では 514 となっている。
  最初のデータ形式を区別する整数値以後の要素は
  各データ形式によってどのように使われるか定まっている。
- CMO 形式では理解可能なデータの tag がリストの中に収まっている。
+ CMO 形式では理解可能なデータのタグがリストの中に収まっている。
- 前節で CMO 形式では多倍長整数を表す tag が 20 であることを述べたが、
+ 前節で CMO 形式では多倍長整数を表すタグが 20 であることを述べたが、
  このリストに 20 が含まれているので、
  ox\_asir は CMO 形式の多倍長整数を受け取れることがわかる。
-Line 297  ox\_asir は CMO 形式の多倍長整数を受け取れることがわか
+Line 306  ox\_asir は CMO 形式の多倍長整数を受け取れることがわか
 Line 297  ox\_asir は CMO 形式の多倍長整数を受け取れることがわか
 Line 306  ox\_asir は CMO 形式の多倍長整数を受け取れることがわか
  %{\tt [514,[1, 2, $\cdots$]]} の最初の 514 はこのリストが CMO 形式
  %での理解可能なデータを表していることを示しており、
  %その後のリストでは CMO 層で定義されているデータのうち、
- %理解可能なデータの tag が並んでいる。
+ %理解可能なデータのタグが並んでいる。
  なお、データが受け取れることと、
  データの論理構造が理解できることとはまったく別物であるので
-Line 320  OpenXM に対応したソフトウェアをクラックしても
+Line 329  OpenXM に対応したソフトウェアをクラックしても
 Line 320  OpenXM に対応したソフトウェアをクラックしても
 Line 329  OpenXM に対応したソフトウェアをクラックしても
  しかし、これだけでは侵入者が接続を行なう一瞬のすきを
  狙ってくる可能性もある。
  そこで接続を行なう時に、
- 接続を待つ port 番号をランダムに決めている。
+ 接続を待つポート番号をランダムに決めている。
- こうすることで、特定の port 番号を狙って接続を行なう
+ こうすることで、特定のポート番号を狙って接続を行なう
  瞬間を待つ手口を幾らか防ぐことができる。
  さらにもう一段安全性を高めるために、
-Line 330  OpenXM に対応したソフトウェアをクラックしても
+Line 339  OpenXM に対応したソフトウェアをクラックしても
 Line 330  OpenXM に対応したソフトウェアをクラックしても
 Line 339  OpenXM に対応したソフトウェアをクラックしても
  このパスワードは一旦使用されれば無効にするので、
  もし仮になんらかの手段でパスワードが洩れたとしても安全である。
- なお、上記の port 番号とパスワードは安全な手段で送られて
+ なお、上記のポート番号とパスワードは安全な手段で送られて
  いると仮定している。
  また、同一のコンピュータ上に悪意のあるユーザはいないと仮定している
  ことに注意しなければならない。
  なぜなら、現在の実装ではサーバ、およびクライアントの動作している
- コンピュータ上ではこの port 番号とパスワードがわかってしまうためである。
+ コンピュータ上ではこのポート番号とパスワードがわかってしまうためである。
  なお、接続が確立した後のメッセージの送受信に関しては、
  特に暗号化などの処置が行なわれているわけではない。

FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>