OpenXM/doc/genkou19991125.tex - diff

Return to genkou19991125.tex CVS log

Up to [local] / OpenXM / doc

Diff for /OpenXM/doc/Attic/genkou19991125.tex between version 1.39 and 1.75

-version 1.39, 1999/12/21 20:02:51
+version 1.75, 1999/12/24 17:59:42
 Line 1
 Line 1
 Line 1
  \documentclass{jarticle}
- \title{タイトル未定}
+ %% $OpenXM: OpenXM/doc/genkou19991125.tex,v 1.74 1999/12/24 16:59:48 tam Exp $
- \author{
- 前川 将秀\thanks{神戸大学理学部数学科},
+ \usepackage{jssac}
- 野呂 正行\thanks{富士通研究所},
+ \title{
- 小原 功任\thanks{金沢大学理学部計算科学科}, \\
+. 意味もない修飾過剰な語句は排除しましょう。\\
- 奥谷 幸夫
+. せっかく fill しているのをいじらないでくれ。\\
- %\thanks{神戸大学大学院自然科学研究科博士課程前期課程数学専攻},
+. 田村が遊んでばかりでおればかり仕事をしているのはどう考えても不公平だ。
- \thanks{神戸大学大学院自然科学研究科数学専攻},
+ なんで仕事をしないのか、いい加減仕事をしろ、田村。
- 高山 信毅\thanks{神戸大学理学部数学教室},
+ %↑すみません、家で御飯食べてました。
- 田村 恭士
- %\thanks{神戸大学大学院自然科学研究科博士課程後期課程情報メディア科学専攻計算システム講座}
- \thanks{神戸大学大学院自然科学研究科情報メディア科学専攻}
  }
- \date{1999年11月25日}
- %\pagestyle{empty}
+ \author{奥 谷 　 行 央\affil{神戸大学大学院自然科学研究科}
+                 \mail{okutani@math.sci.kobe-u.ac.jp}
+   \and  小 原 　 功 任\affil{金沢大学理学部}
+                 \mail{ohara@kappa.s.kanazawa-u.ac.jp}
+   \and  高 山 　 信 毅\affil{神戸大学理学部}
+                 \mail{takayama@math.sci.kobe-u.ac.jp}
+   \and  田 村 　 恭 士\affil{神戸大学大学院自然科学研究科}
+                 \mail{tamura@math.sci.kobe-u.ac.jp}
+   \and  野 呂 　 正 行\affil{富士通研究所}
+                 \mail{noro@para.flab.fujitsu.co.jp}
+   \and  前 川 　 将 秀\affil{神戸大学理学部}
+                 \mail{maekawa@math.sci.kobe-u.ac.jp}
+ }
+ \art{}
  \begin{document}
  \maketitle
  \section{OpenXMとは}
- OpenXM は数学プロセス間でメッセージを交換するための規約である。数学プロ
+ OpenXM は数学プロセス間でメッセージを交換するための規約である。
- セス間でメッセージをやりとりさせることにより、ある数学プロセスから他の数
+ 数学プロセス間でメッセージをやりとりすることにより、
- 学プロセスを呼び出して計算を行なったり、他のマシンで計算を行なわせたりす
+ ある数学プロセスから他の数学プロセスを呼び出して計算を行なったり、
- ることが目的である。なお、 OpenXM とは Open message eXchange protocol
+ 他のマシンで計算を行なわせたりすることが目的である。
- for Mathematics の略である。
+ なお、 OpenXM とは Open message eXchange protocol for Mathematics の略である。
- OpenXM の開発の発端は野呂正行と高山信毅により、 asir と kan/sm1 を
+ OpenXM の開発の発端は野呂と高山により、
- 相互に呼び出す機能を実装したことである。
+ asir と kan/sm1 を相互に呼び出す機能を実装したことである。
- %\footnote{この段落必要?}
- 発端となった asir と kan/sm1 での実装時には、
+ 初期の実装では、相手側のローカル言語の文法に従った文字列を送っていた。
- お互いに相手側のコマンド文字列を送っていた。
+ この方法では相手側のソフトが asir なのか kan/sm1 なのかを判別するなどして、
- この方法は現在の OpenXM 規約でも形を変えて可能ではあるが、
+ 相手側のローカル言語の文法に合わせた文字列を作成しなければならない。
- 使いやすい反面、効率的であるとはいい難い。
+ このローカル言語の文法に従った文字列を送る方法は、
- さらに、この方法では相手側のソフトが asir なのか kan/sm1 なのかを
+ 効率的であるとはいい難いが、使いやすいとも言える。
- 判別して、相手側に合わせてコマンド文字列を作成する必要がある。
- これ以外の方法として、
+ 現在の OpenXM 規約では共通表現形式によるメッセージを用いている。
- OpenXM 規約では共通表現形式によるメッセージも用意している。
+ 上記の文字列を送る方法の利点を生かすため、
- OpenXM 規約独自のデータ形式である CMO 形式(Common Mathematical Object format)
+ OpenXM 規約では共通表現形式の中の文字列として、
- 以外にも、 MP や OpenMath の XML, binary 表現形式といった他の形式をも
+ ローカル言語の文法に従った文字列を用いたメッセージの交換も可能となっている。
- 扱えるようにしてある。
- なお、現在の OpenXM 規約では、
- 前述のコマンド文字列も CMO 形式などの何らかのデータ形式の中の
- 文字列として表現して送る必要がある。
- \section{OpenXM の計算モデル}
+ OpenXM 規約では通信の方法に幾らかの自由度があるが、
+ 現在のところは TCP/IP を用いた通信しか実装されていない。
+ そこで、この論文では具体的な実装は TCP/IP を用いていると仮定する。
- {\Huge この節では計算モデルの話をしなければいけません}
- OpenXM 規約での計算とはメッセージを交換することである。
- そして、そのメッセージの交換はサーバとクライアントの間で行なわれる。
- クライアントからサーバへメッセージを送り、
- サーバからクライアントがメッセージを受け取ることによって
- 計算の結果が得られる。
- サーバはスタックマシンであると仮定されており、
- サーバがクライアントから受け取ったメッセージはすべてスタックに積まれる。
- ただし、OpenXM のメッセージの中にはサーバに行なわせたい動作に
- 対応するデータがあり、
- このメッセージを受け取ったサーバはそれに対応する動作を
- 行なうことが期待されている。
- しかし、サーバは命令されない限り何も動作を行なおうとはしない。
- このため、クライアントはサーバの状態を気にせずにメッセージを送り、
- 一旦メッセージを送付し終えた後、
- サーバへ送ったメッセージの結果を
- サーバから待つことなしに次の動作に移ることができる。
- なお、サーバに対する動作に対応したデータは SM 形式として定義されている。
- SM 形式以外のデータでは、サーバは受け取ったデータをスタックに積む
- 以外の動作をしないことになっている。
- つまり、 SM 形式のデータがサーバにデータを受け取る以外の動作を
- 行なわせる唯一のデータ形式である。
  \section{OpenXM のメッセージの構造}
- %{\Huge この節では構造の話をしなければいけません}
+ 通信の方法によってメッセージの構造は変わる。
+ 前節で仮定したとおり、この論文では TCP/IP の場合についてのみ説明を行なう。
- OpenXM で規定されているメッセージはバイトストリームであり、
+ OpenXM 規約で規定されているメッセージはバイトストリームとなっており、
  次のような構造になっている。
- \begin{tabular}{|c|c|} \hline
+ \begin{tabular}{|c|c|}
- ヘッダ  & \hspace{10mm} ボディ \hspace{10mm} \\ \hline
+ \hline
+ ヘッダ  & \hspace{10mm} ボディ \hspace{10mm} \\
+ \hline
  \end{tabular}
  ヘッダの長さは 8 バイトであると定められている。
  ボディの長さはメッセージごとに異なっているが、
- 長さは $0$ でもよいことになっている
+ 長さは $0$ でもよい。
- %なお、すべてのメッセージに ボディが必要というわけではなく、
- %ボディのないメッセージも OpenXM 規約には存在することに
- %注意しなければならない。
  ヘッダは次の二つの情報を持っている。
  \begin{enumerate}
- \item   前半の 4 バイトにある、メッセージの種類を表わす識別子。
+ \item   前半の 4 バイト。メッセージの種類を表わす識別子であり、
          タグと呼ばれる。
- \item   後半の 4 バイトにある、メッセージにつけられた通し番号。
+ \item   後半の 4 バイト。メッセージにつけられた通し番号である。
  \end{enumerate}
  それぞれの 4 バイトは 32 ビット整数とみなされて扱われる。
- この場合に用いられる整数の表現方法の説明については後述するが、
+ この場合に用いられる整数の表現方法については後述するが、
  基本的に表現方法はいくつかの選択肢から選ぶことが可能となっており、
  またその選択は通信路の確立時に一度だけなされることに注意しなければならない。
+ 現在のOpenXM 規約では、タグ(整数値)として
+ 以下のものが定義されている。
- %{\Huge 以下、書き直し}
+ \begin{verbatim}
+ #define OX_COMMAND              513
+ #define OX_DATA                 514
+ #define OX_SYNC_BALL            515
+ #define OX_DATA_WITH_LENGTH     521
+ #define OX_DATA_OPENMATH_XML    523
+ #define OX_DATA_OPENMATH_BINARY 524
+ #define OX_DATA_MP              525
+ \end{verbatim}
- ボディの中身は各データ形式によって
+ ボディの構造はメッセージの種類によって異なる。
- それぞれ独立に決められるようになっている。
+ タグが OX\_COMMAND となっているメッセージはスタックマシンへの命令であり、
- もし、 OpenXM 規約でまだ定義されていないデータ形式を使いたい場合は、
+ それ以外のメッセージは何らかのオブジェクトを表している。
- メッセージのヘッダのタグをまだ使われてない整数値に設定し、
+ この論文では OX\_DATA と OX\_COMMAND で識別される
- ボディにデータを埋め込めばよい。
+ メッセージについてのみ、説明する。
- なお、このような用途にも使えるように、
- タグにはシステム固有の表現用に推奨されている整数の範囲がある。
+ 既存のメッセージでは対応できない場合は、新しい識別子を定義することで新し
+ い種類のメッセージを作成することができる。この方法は各数学ソフトウェアの
+ 固有の表現を含むメッセージを作成したい場合などに有効である。新しい識別子
+ の定義方法については、\cite{OpenXM-1999} を参照すること。
- \section{OpenXM の計算の進行方法}
+ \section{OpenXM の計算モデル}
- OpenXM における計算とはメッセージの交換のことである。
+ OpenXM 規約での計算とはメッセージを交換することである。また、 OpenXM 規
- 既に計算モデルの節で説明したが、
+ 約ではクライアント・サーバモデルを採用しているので、メッセージの交換はサー
- OpenXM はサーバ・クライアントモデルを採用していて、
+ バとクライアントの間で行なわれる。クライアントからサーバへメッセージを送
- サーバはスタックマシンの構造を持つ。
+ り、クライアントがサーバからメッセージを受け取ることによって計算の結果が
- サーバが行うのは基本的に次の事柄に限られる。
+ 得られる。このメッセージのやりとりはクライアントの主導で行われる。つまり、
- クライアントからメッセージを受け取るとサーバは、
+ クライアントは自由にメッセージをサーバに送付してもよいが、サーバからは自
- まずメッセージの識別子を調べ、 SM 形式のデータでなければスタックに積む。
+ 発的にメッセージが送付されることはない。この原理はサーバはスタックマシン
- SM 形式のデータであればメッセージのボディから
+ であることで実現される。スタックマシンの構造については \ref{sec:oxsm} 節
- スタックマシンのオペコードを取りだし、
+ で述べる。
- あらかじめ規約で定められた動作を行なう。
- %上の説明でわかるように、
+ サーバがクライアントから受け取ったオブジェクト(つまり OX\_COMMAND でない
- サーバはクライアントからの指示なしに、
+ メッセージのボディ)はすべてスタックに積まれる。スタックマシンへの命令
- 自らメッセージを送らないことに注意しなければならない。
+ (OX\_COMMAND で識別されるメッセージのボディ)を受け取ったサーバは命令に対
- %(例外? ox\_asir の mathcap)。
+ 応する動作を行なう。このとき、命令によってはスタックからオブジェクトを取
+ り出すことがあり、また(各数学システムでの)計算結果をスタックに積むことが
+ ある。もし、与えられたデータが正しくないなどの理由でエラーが生じた場合に
+ はサーバはエラーオブジェクトをスタックに積む。計算結果をクライアントが得
+ る場合にはスタックマシンの命令 SM\_popCMO または SM\_popString をサーバ
+ に送らなければならない。これらの命令を受け取ってはじめて、サーバからクラ
+ イアントへメッセージが送られる。
- サーバがクライアントから受け取ったメッセージはすべてスタックに積まれる。
- 次いでサーバに SM 形式のデータを送ると、
- 初めてサーバはデータをスタックに積む以外のなんらかの動作を行なう。
- このとき、必要があればサーバはスタックから必要なだけデータを取り出す。
- ここで、クライアントからの命令による動作中にたとえエラーが発生したとしても
- サーバはエラーオブジェクトをスタックに積むだけで、
- 明示されない限りエラーを返さないことに注意しなければならない。
- 結果が生じる動作をサーバが行なった場合、
- サーバは動作の結果をスタックに積んでいる。
- サーバに行なわせた動作の結果をクライアントが知りたい場合、
- スタックからデータを取り出し送信を行なう命令に対応した SM 形式のデータを
- サーバ側へ送ればよい。
  {\Huge 以下、書き直し}
- クライアントがサーバへ計算を行なわせ、結果を得るという手順を追っていくと、
+ まとめると、クライアントがサーバへメッセージを送り、
- 次のようになる。
+ 計算の結果を得るという手順は以下のようになる。
  \begin{enumerate}
- \item   まず、クライアントがサーバへ計算させたいデータを送る。
+ \item
-         サーバは送られてきたデータをスタックに積む。
+ まず、クライアントがサーバへオブジェクトを送る。サーバは送られてきたオブ
- \item   クライアントがサーバに「計算を行なう動作に対応したデータ」を
+ ジェクトをスタックに積む。
-         送ると、サーバは必要なだけスタックからデータを取り出し、
+ \item
-         実行した計算の結果をスタックに積む。
+ クライアントがサーバに命令を送ると、サーバは必要なだけスタックからデータ
- \item   最後に「データを取り出し送信を行なう命令に対応したデータ」を
+ を取り出し、実行した結果をスタックに積む。
-         サーバへ送ると、サーバはスタックから計算結果の入っている
+ %って書いてるけど、命令がSM\_popCMO とか SM\_shutdown の場合は?
-         データを取り出し、クライアントへ送出する。
+ \item
+ 最後に SM\_popCMO もしくは SM\_popString をサーバへ送ると、
+ サーバはスタックから計算結果の入っているデータを取り出し、
+ クライアントへ送出する。
  \end{enumerate}
+ \section{OpenXM スタックマシン}\label{sec:oxsm}
- \section{CMO のデータ構造}
+ OpenXM 規約ではサーバはスタックマシンであると定義している。以下、OpenXM
+ スタックマシンと呼ぶ。この節ではOpenXM スタックマシンの構造について説明
+ しよう。
- OpenXM 間でやりとりされるメッセージを実際に作成する場合、
+ まず、OpenXM 規約は通信時にやりとりされる共通のデータ形式については規定
- CMO 形式で定義されている多倍長整数を理解しておくと、
+ するが、OpenXM スタックマシンがスタックに積む、オブジェクトの構造までは
- CMO 形式の他のデータ構造だけでなく、 OX 形式、 SM 形式のデータを
+ 規定しない。つまり、オブジェクトの構造は各数学システムごとに異なっている
- 理解する助けになると思えるので、 CMO 形式の多倍長整数の
+ ということである。このことは通信路からデータを受け取った際に、各数学シス
- データ構造について説明する。
+ テムが固有のデータ構造に変換してからスタックに積むことを意味する。この変
+ 換は1対1対応である必要はない。
- CMO 形式で定義されているデータは多倍長整数以外にも
+ 次に OpenXM スタックマシンの命令コードについて説明する。OpenXM スタック
- 文字列やリスト構造などがある。どのようなデータであるかは
+ マシンにおけるすべての命令は4バイトの長さを持つ。OpenXM 規約の他の規定と
- データの先頭にあるタグを見れば判別できるようになっている。
+ 同様に、4バイトのデータは32ビット整数と見なされるので、この論文でもその
- これはメッセージのデータの判別の仕方とおなじである。
+ 表記にしたがう。OpenXM スタックマシンに対する命令はスタックに積まれるこ
- なお、タグは各データ毎に 32 bit の整数で表されており、
+ とはない。現在のところ、OpenXM 規約では以下の命令が定義されている。
- 多倍長整数は 20 となっている。
- ここで 32 bit の整数の表現方法について説明する必要がある。
- OpenXM ではバイト列で 32 bit の整数 20 を
- {\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。
- この表現方法の違いはクライアントとサーバの最初の接続時に
- 双方の合意で決定することになっている。
- なお、合意がない場合には
- 前者の表現方法(以後、この表現方法を network byte order と呼ぶ)を
- 使うことになっている。
- また、負の数を表現する必要があるときには、
-の補数表現を使うことになっている。
- 表現したい多倍長整数の絶対値を 2 進数で表した場合の桁数を $n$ と
+ \begin{verbatim}
- したとき、次にくるデータは $[(n+31)/32]$ を 32 bit の整数となる。
+ #define SM_popSerializedLocalObject               258
- これは多倍長整数の絶対値を $2^{32}$ 進数で表した場合の桁数ととってもよい。
+ #define SM_popCMO                                 262
- ただし、表現したい数が負の場合は $[(n+31)/32]$ を 32 bit の整数で表した値を
+ #define SM_popString                              263
-の補数表現で負にして、正の場合と区別する。
- 表現したい多倍長整数の絶対値が $2^{32}$ 進数で $(b_0 b_1 ... b_k)_{2^{32}}$
+ #define SM_mathcap                                264
- と表せるとき、次にくるデータは $b_0$, $b_1$, $\cdots$, $b_k$ を
+ #define SM_pops                                   265
- それぞれ 32 bit の整数で表現した値となる。
+ #define SM_setName                                266
- %以下は書き直しの必要があるかも...
+ #define SM_evalName                               267
- なお、 GNU MP LIBRARY を用いると、
+ #define SM_executeStringByLocalParser             268
- C 言語から多倍長整数や任意精度浮動小数を扱うことができる。
+ #define SM_executeFunction                        269
- $b_0$, $b_1$, $\cdots$, $b_k$ をそれぞれ 32 bit 整数で表現した値は
+ #define SM_beginBlock                             270
- この GNU MP LIBRARY で用いられている多倍長整数で使われている形式を
+ #define SM_endBlock                               271
- 参考にして合わせてある。
+ #define SM_shutdown                               272
+ #define SM_setMathCap                             273
+ #define SM_executeStringByLocalParserInBatchMode  274
+ #define SM_getsp                                  275
+ #define SM_dupErrors                              276
- ここで具体例をだそう。
+ #define SM_DUMMY_sendcmo                          280
- $4294967298 = 1 \times 2^{32} + 2$ を network byte order の多倍長整数で
+ #define SM_sync_ball                              281
- 表現すると、
- \begin{center}
-         {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01}
- \end{center}
- となる。また、同じ表現方法で $-1$ を表現すると、
- \begin{center}
-         {\tt 00 00 00 14 ff ff ff ff 00 00 00 01}
- \end{center}
- となる。
+ #define SM_control_kill                          1024
+ #define SM_control_to_debug_mode                 1025
+ #define SM_control_exit_debug_mode               1026
+ #define SM_control_ping                          1027
+ #define SM_control_start_watch_thread            1028
+ #define SM_control_stop_watch_thread             1029
+ #define SM_control_reset_connection              1030
+ \end{verbatim}
- \section{MathCap について}
+ %以下、どういうときに結果をスタックに積むかエラーの場合どうするかの説明が
+ %必要であろう。
- サーバおよびクライアント双方ともに OpenXM で規定されている
+ スタックマシンに対する命令の中には実行の結果が存在するものがある。
- メッセージの中のデータ形式をすべて受け取れるわけではない。
+ 結果が存在する命令を実行した場合、サーバはその結果をスタックに積む。
- しかも、 OpenXM 規約で規定されているデータ形式だけが
+ たとえば、 SM\_executeStringByLocalParser は
- 受渡しに使われるというわけではない。
+ スタックに積まれているオブジェクトを
- そこで、 OpenXM では相手側が受け取ることができるデータ形式を
+ サーバ側のローカル言語の文法に従った文字列とみなして計算を行なうが、
- 収得する方法を用意している。
+ 行なった結果はローカル言語で記述した文字列でスタックに積まれる。
+ なお、命令の実行中にエラーが起こり、結果が得られなかった場合には、
+ エラーオブジェクトがスタックに積まれる。
- CMO 形式で定義されている MathCap データは
- %理解可能なメッセージの
- 受け取ることができるデータ形式を表すデータであり、
- 要求されればサーバはサーバ自身の MathCap データをスタックに積む。
- また、クライアントから MathCap データをサーバへ送ることもでき、
- MathCap データをサーバとクライアントの間で交換することによって、
- お互いに相手側が受け取ることができないデータ形式で
- メッセージを送ってしまうのを防ぐことができる。
- なお、 MathCap データの中では CMO 形式で定義されている
-bit 整数、文字列、リスト構造が使われており、
- MathCap データに含まれている内容を理解できるためには
- 必然的にこれらも理解できる必要がある。
- OpenXM 対応版の asir サーバである ox\_asir が返す MathCap を以下に示す。
+ \section{CMO のデータ構造}\label{sec:cmo}
- %なお、 $a_1$, $a_2$, $\cdots$, $a_n$ を要素に
+ OpenXM 規約では、数学的オブジェクトを表現する方法として CMO 形式(Common
- %持つリスト構造を {\tt [$a_1$, $a_2$, $\cdots$, $a_n$]} 、
+ Mathematical Object format)を定義している。この CMO 形式にしたがったデー
- %文字列 ``string'' を {\tt "string"} 、 32 bit 整数を
+ タは、識別子が OX\_DATA であるようなメッセージのボディになることを想定し
- %それに対応する 10 進数の整数で示す。
+ ている。
- %↓手で作ったので間違えている可能性あり。
+ CMO 形式におけるデータ構造は次のような構造をもつ。
- %%古いバージョン。差し替えの必要あり。
+ \begin{tabular}{|c|c|} \hline
+ ヘッダ        & \hspace{10mm} ボディ \hspace{10mm} \\ \hline
+ \end{tabular}
+ ヘッダは4バイトである。ボディの長さはそれぞれのデータによって異なるが、
+でもよい。
+ メッセージと同様にヘッダは4バイト単位に管理される。すなわち、CMO ではヘッ
+ ダは一つだけの情報を含む。この4バイトのヘッダのことをタグともいう。さて、
+ CMO では、タグによってボディの論理的構造が決定する。すなわち、タグはそれ
+ ぞれのデータ構造と1対1に対応する識別子である。それぞれの論理的構造は
+ \cite{OpenXM-1999} に詳述されている。現在の OpenXM 規約では以下の CMO が
+ 定義されている。
  \begin{verbatim}
- [ [199901160,"ox_asir"],
+ #define CMO_ERROR2  0x7f000002
-   [276,275,258,262,263,266,267,268,274
+ #define CMO_NULL    1
-     ,269,272,265,264,273,300,270,271],
+ #define CMO_INT32   2
-   [ [514,[1,2,3,4,5,2130706433,2130706434
+ #define CMO_DATUM   3
-           ,17,19,20,21,22,24,25,26,31,27,33,60]],
+ #define CMO_STRING  4
-     [2144202544,[0,1]]
+ #define CMO_MATHCAP 5
-   ]
- ]
+ #define CMO_START_SIGNATURE      0x7fabcd03
+ #define CMO_ARRAY                16
+ #define CMO_LIST                 17
+ #define CMO_ATOM                 18
+ #define CMO_MONOMIAL32           19
+ #define CMO_ZZ                   20
+ #define CMO_QQ                   21
+ #define CMO_ZERO                 22
+ #define CMO_DMS_GENERIC          24
+ #define CMO_DMS_OF_N_VARIABLES   25
+ #define CMO_RING_BY_NAME         26
+ #define CMO_RECURSIVE_POLYNOMIAL 27
+ #define CMO_LIST_R               28
+ #define CMO_INT32COEFF                 30
+ #define CMO_DISTRIBUTED_POLYNOMIAL     31
+ #define CMO_POLYNOMIAL_IN_ONE_VARIABLE 33
+ #define CMO_RATIONAL                   34
+ #define CMO_64BIT_MACHINE_DOUBLE           40
+ #define CMO_ARRAY_OF_64BIT_MACHINE_DOUBLE  41
+ #define CMO_128BIT_MACHINE_DOUBLE          42
+ #define CMO_ARRAY_OF_128BIT_MACHINE_DOUBLE 43
+ #define CMO_BIGFLOAT          50
+ #define CMO_IEEE_DOUBLE_FLOAT 51
+ #define CMO_INDETERMINATE 60
+ #define CMO_TREE          61
+ #define CMO_LAMBDA        62
  \end{verbatim}
- この MathCap データのリスト構造は大きく分けて 3 つの部分に分かれる。
+ この中で CMO\_ERROR2, CMO\_NULL, CMO\_INT32, CMO\_DATUM, CMO\_STRING,
- 最初の {\tt [199901160,"ox\_asir"]} の部分にはサーバの情報が入っている。
+ CMO\_MATHCAP, CMO\_LIST で識別されるオブジェクトは最も基本的なオブジェ
- %この最初の要素がまたリスト構造となっており、
+ クトであって、すべての OpenXM 対応システムに実装されていなければならない。
- 最初の要素はバージョンナンバーを、次の要素はサーバの名前を表している。
- 次の {\tt [276,275,$\cdots$,271]} の部分は
+ これらについての解説を行う前に記法について、少し説明しておく。
- サーバに対する動作に対応した理解可能なデータの種類を表している。
+ この論文では、大文字で CMO\_INT32 と書いた場合には、上記で定義した識別子
- サーバの動作に対するデータはすべて 32 bit の整数で表しており、
+ を表わす。また CMO\_INT32 で識別されるオブジェクトのクラス(あるいはデー
- このリストは理解可能なデータに対応する 32 bit 整数のリストとなっている。
+ タ構造)を cmo\_int32 と小文字で表わすことにする。
- 最後の {\tt [ [514,[1,2,3,$\cdots$,60]],[2144202544,[0,1]] ]} の部分は
+ さて cmo を表現するための一つの記法を導入する。この記法は CMO expression
- 理解可能なデータの形式を表している。
+ と呼ばれている。その正確な形式的定義は \cite{OpenXM-1999} を参照すること。
- この部分はさらに {\tt [514,[1,2,3,$\cdots$,60]]} と
- {\tt [2144202544,[0,1]]} にの部分に分けることができ、
- それぞれが一つのデータ形式についての情報となっている。
- どのデータ形式についての情報かは最初の要素にある整数値をみれば
- 分かるようになっている。
- この整数値は CMO 形式では 514 となっている。
- 最初のデータ形式を区別する整数値以後の要素は
- 各データ形式によってどのように使われるか定まっている。
- CMO 形式では理解可能なデータの tag がリストの中に収まっている。
- 前節で CMO 形式では多倍長整数を表す tag が 20 であることを述べたが、
- このリストに 20 が含まれているので、
- ox\_asir は CMO 形式の多倍長整数を受け取れることがわかる。
- %%このリストの要素はまたリストとなっており、
+ まず CMO expssion は Lisp 風表現の一種で、 cmo を括弧で囲んだリストとし
- %この最後の部分もまたリストとなっており、
+ て表現する。それぞれの要素はカンマで区切る。
- %あるデータ形式で理解可能なものを表現したリストを要素としている。
+ 例えば、
- %{\tt [514,[1, 2, $\cdots$]]} の最初の 514 はこのリストが CMO 形式
+ \begin{quote}
- %での理解可能なデータを表していることを示しており、
+ (17, {\sl int32}, (CMO\_NULL), (2, {\sl int32} $n$))
- %その後のリストでは CMO 層で定義されているデータのうち、
+ \end{quote}
- %理解可能なデータの tag が並んでいる。
+ は CMO expression である。ここで、小文字の斜体で表された``{\sl int32}''
+ は 4バイトの任意のデータを表す記号であり、``{\sl int32} $n$'' は同じく 4
+ バイトのデータであるが以下の説明で $n$ と表すことを示す。また数字 17, 2
+ などは 4バイトのデータで整数値としてみたときの値を意味する。CMO\_NULL は
+ 識別子(すなわち数字 1 と等価)である。この記法から上記のデータは 20 バイ
+ トの大きさのデータであることが分かる。
- なお、データが受け取れることと、
+ さて、この記法のもとで cmo\_int32 を次のデータ構造を持つと定義する。
- データの論理構造が理解できることとはまったく別物であるので
+ \begin{quote}
- 注意する必要がある。
+ cmo\_int32 := (CMO\_INT32,  {\sl int32})
+ \end{quote}
+ {\Huge 同様に cmo\_string, cmo\_list などを定義}
+ cmo\_string := (CMO\_STRING, {\sl int32}, string)
+ cmo\_list := (CMO\_LIST, {\sl int32},...
+ % ここで 32 bit の整数の表現方法について触れておく。
+ % OpenXM 規約ではバイトストリームで 32 bit の整数 20 を
+ % {\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。
+ % この表現方法の違いはクライアントとサーバの最初の接続時に
+ % 双方の合意で決定することになっている。
+ % なお、合意がない場合には前者の表現方法
+ % (以後、この表現方法をネットワークバイトオーダーと呼ぶ)を
+ % 使うことになっている。
+ % また、負の数を表現する必要があるときには、
+ % 2 の補数表現を使うことになっている。
+ % 先ほどの、 (CMO\_INT32, 123456789) をネットワークバイトオーダーで
+ % バイト列に直すと、
+ % \begin{center}
+ %       {\tt 00 00 00 02 07 5b cd 15}
+ % \end{center}
+ % となり、
+ % (CMO\_STRING, 6, ``OpenXM'') は
+ % \begin{center}
+ %       {\tt 00 00 00 04 00 00 00 06 4f 70 65 6e 58 4d}
+ % \end{center}
+ % となる。
+ % CMO 形式の多倍長整数は、 Gnu MPライブラリ等を参考にしており、
+ % 符号付き絶対値表現を用いている。
+ % タグ以降の形式は次のようになる。
+ % \begin{tabular}{|c|c|c|c|c|} \hline
+ % $f$ & $b_0$ & $b_1$ & $\cdots$ & $b_{n-1}$ \\ \hline
+ % \end{tabular}
+ % ここで、 1 つの枠は 4 バイトを表し、
+ % $f$ は符号付き 32 ビット整数を、
+ % $b_0$, $b_1$, $\cdots$, $b_{n-1}$ は符号なし 32 ビット整数を表している。
+ % さらに、 $|f| = n$ が成り立たなければならない。
+ % このオブジェクトは
+ % \[ \mbox{sgn}(f) \times \{ b_0 (2^{32})^0 + b_1 (2^{32})^1 + \cdots
+ %       + b_{n-1} (2^{32})^{n-1} \}     \]
+ % という整数であると定義されている。
+ % ただし、
+ % \[ \mbox{sgn}(f) = \left\{ \begin{array}{ll}
+ %         1       & f>0 \\
+ %         0       & f=0 \\
+ %         -1      & f<0 \\ \end{array} \right.  \]
+ % である。
+ % ここで具体例をだそう。
+ % $4294967298 = 1 \times 2^{32} + 2$ を CMO 形式の
+ % ネットワークバイトオーダー、多倍長整数で表現すると、
+ % \begin{center}
+ %       {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01}
+ % \end{center}
+ % となる。また、同じ表現方法で $-1$ を表現すると、
+ % \begin{center}
+ %       {\tt 00 00 00 14 ff ff ff ff 00 00 00 01}
+ % \end{center}
+ % となる。
+ \section{mathcap について}
+ OpenXM 規約では、通信時に用いられるメッセージの種類を各ソフトウェアが制
+ 限する方法を用意している。これは各ソフトウェアの実装によってはすべてのメッ
+ セージをサポートするのが困難な場合があるからである。また、各ソフトウェア
+ でメッセージの種類を拡張したい場合にも有効である。この制限(あるいは拡張)
+ は mathcap と呼ばれるデータ構造によって行われる。この節では mathcap のデー
+ タ構造と、具体的なメッセージの制限の手続きについて説明する。
+ では、手続きについて説明しよう。
+ 第一にサーバの機能を制限するには次のようにする。クライアントが mathcap
+ オブジェクトをサーバへ送ると、サーバは受け取ったmathcap をスタックに積む。
+ 次にクライアントが命令 SM\_setMathCap を送ると、サーバはスタックの最上位
+ に積まれている mathcap オブジェクトを取り出し、mathcap で設定されていな
+ いメッセージをクライアントへ送らないように制限を行う。
+ 第二にクライアントを制限するには次のようにする。クライアントがサーバに命
+ 令 SM\_mathcap を送ると、サーバは mathcap オブジェクトをスタックに積む。
+ さらに命令 SM\_popCMO を送ると、サーバはスタックの最上位のオブジェクト
+ (すなわち mathcap オブジェクト)をボディとするメッセージをクライアントに
+ 送付する。クライアントはそのオブジェクトを解析して、制限をかける。
+ 次に mathcap のデータ構造について説明する。
+ mathcap は CMO の一種であるので、すでに説明したように
+ \begin{verbatim}
+ ヘッダ     ボディ
+ \end{verbatim}
+ の構造を持ちヘッダの値は 5 である(\ref{sec:cmo} 節を参照のこと)。
+ ボディは cmo\_list オブジェクトでなければならない。
+ さて、mathcap オブジェクトのボディの cmo\_list オブジェクトは以下の条件を
+ 満たすことを要求される。
+ まず、その cmo\_list オブジェクトは少なくともリスト長が 3 以上でなければ
+ ならない。
+ \[      \begin{tabular}{|c|c|c|} \hline
+         $A$ & $B$ & $C$ \\ \hline
+         \end{tabular}   \]
+ 第一要素 $A$ はまた cmo\_list であり、リスト長は 4 以上、
+ $a_1$ は 32 ビット整数でバージョンナンバーを、
+ $a_2$ は文字列でシステムの名前を表すことになっている。
+ \[      \begin{tabular}{|c|c|} \hline
+         $a_1$ & $a_2$   \\ \hline
+         \end{tabular}   \]
+番目の要素 $B$ の部分は次のようなリスト構造をしている。
+ この $b_1$, $b_2$, $\cdots$, $b_n$ はすべて 32 ビットの整数である。
+ スタックマシンへの命令はすべて 32 ビットの整数で表しており、
+ 各 $b_i$ は利用可能な命令に対応する 32 ビットの整数となっている。
+ \[      \begin{tabular}{|c|c|c|c|} \hline
+         $b_1$ & $b_2$ & $\cdots$ & $b_n$        \\ \hline
+         \end{tabular}   \]
+番目の要素 $C$ は以下のようなリスト構造をしている。
+ \[  \overbrace{
+         \begin{tabular}{|c|c|c|c|} \hline
+         $c_1$ & $c_2$ & $\cdots$ & $c_n$        \\ \hline
+         \end{tabular}
+    }^{C}        \]
+ %$n$ は OX\_COMMAND 以外の受け取れるメッセージのタグの種類の数に等しい。
+ %要素数は 1 でももちろん構わない。
+ 各 $c_i$ もまた以下のようなリスト構造となっており、
+ どの $c_i$ も最初の要素が 32 ビットの整数となっている。
+ \[  \overbrace{
+         \begin{tabular}{|c|c|c|c|c|} \hline
+         $c_{i1}$ (32 ビットの整数) & $c_{i2}$ & $c_{i3}$ &
+                 $\cdots$ & $c_{im}$     \\ \hline
+         \end{tabular}
+    }^{c_i}      \]
+ このリストの最初の整数値は受け取れるメッセージのタグが入っている。
+ $c_{i2}$ 以降については最初の $c_{i1}$ の値によってそれぞれ異なる。
+ ここでは、最初の要素が OX\_DATA の場合についてのみ説明する。
+ この $c_{i1}$ が OX\_DATA の場合、
+ リスト $c_i$ は CMO 形式についての情報を表しており、
+ $m=2$ と決められている。
+ $c_{i1}$ にはもちろんのこと OX\_DATA が入っており、
+ $c_{i2}$ は以下の図のようなリスト構造になっている。
+ 各要素は 32 ビットの整数であり、
+ 受け取ることが可能な CMO 形式のタグが入る。
+ \[  \overbrace{
+         \begin{tabular}{|c|c|c|c|c|} \hline
+         $c_{i21}$ & $c_{i22}$ & $\cdots$ & $c_{i2l}$    \\ \hline
+         \end{tabular}
+    }^{c_{i2}}   \]
+ %なお、 mathcap データの中では CMO 形式で定義されている
+ %32 bit 整数、文字列、リスト構造が使われており、
+ %mathcap データに含まれている内容を理解できるためには
+ %必然的にこれらも理解できる必要がある
+ %(ってことは CMO 形式のところでこれらを
+ %説明しなければならないってことです)。
+ 具体的な mathcap の例をあげよう。
+ %なお、 $a_1$, $a_2$, $\cdots$, $a_n$ を要素に
+ %持つリスト構造を {\tt [$a_1$, $a_2$, $\cdots$, $a_n$]} 、
+ %文字列 ``string'' を {\tt "string"} 、 32 bit 整数を
+ %それに対応する 10 進数の整数で示す。
+ 名前が ``ox\_test''、バージョンナンバーが 199911250 のサーバであれば、
+ $A$ の部分は
+ \begin{tabular}{|c|c|} \hline
+ 199911250 & "ox\_test" \\ \hline
+ \end{tabular}
+ となる。
+ さらに、このサーバのスタックマシンが
+ 命令コード 2, 3, 5, 7, 11 番を利用可能
+ (実際にはこのような命令コードは存在しない)であれば、 $B$ の部分は
+ \begin{tabular}{|c|c|c|c|c|} \hline
+& 3 & 5 & 7 & 11 \\ \hline
+ \end{tabular}
+ となり、
+ CMO 形式の 32 ビット整数、文字列、 mathcap 、リスト構造のみが
+ 受け取れるときには、 $C$ の部分は
+ \begin{tabular}{|c|} \hline
+         \\[-5mm]
+         \begin{tabular}{|c|c|} \hline
+                 & \\[-5mm]
+                 OX\_DATA &
+                 \begin{tabular}{|c|c|c|c|} \hline
+                 CMO\_INT32 & CMO\_STRING & CMO\_MATHCAP & CMO\_LIST \\ \hline
+                 \end{tabular} \\[0.8mm] \hline
+         \end{tabular} \\[1.4mm] \hline
+ \end{tabular} \\
+ となる。
+ CMO\_ZZ がないので、このサーバは多倍長整数が送られてこないことを期待して
+ いる。
+ なお、データが受け取れることと、データの論理構造が理解できることとはまっ
+ たく別物であるので注意する必要がある。
+ {\Huge ってなんででしょうか? データの論理構造を知らないと受け取れないと
+ 思うんですが$\ldots$}
  \section{セキュリティ対策}
- OpenXM では幾らかのセキュリティ対策を考えている。
+ OpenXM 規約は TCP/IP を用いて通信を行うことを考慮している。ネットワーク
- OpenXM に対応したソフトウェアをクラックしても
+ によって接続される現代の多くのソフトウェアと同様、OpenXM 規約もまた通信
- 大した利点はないと思えるが、それは設計上の話であって、
+ 時のセキュリティについて注意している。以下、このことについて説明しよう。
- 予期せぬ手段で攻撃を受けた場合にどのような事態を
- 招くかは想像し難い。
- そこで、 OpenXM では侵入者に攻撃の機会を
+ {\large\bf 意味不明なことを書いているが、}
- できるだけ与えないようにしている。
- 具体的には、接続が必要になった時のみ接続を待つようにし、
- 常に接続に関与するといったことは避けている。
- しかし、これだけでは侵入者が接続を行なう一瞬のすきを
+ 侵入者に攻撃の機会をできるだけ与えないようするた
- 狙ってくる可能性もある。
+ めに、接続が必要になった時のみ接続を待つようにし、
- そこで接続を行なう時に、
+ 常に接続に関与するといったことは避けている(やっぱり意味不明である)。
- 接続を待つ port 番号をランダムに決めている。
- こうすることで、特定の port 番号を狙って接続を行なう
- 瞬間を待つ手口を幾らか防ぐことができる。
+ また、侵入者が接続を行なう一瞬のすきを狙ってくる可能性もあるので、
+ 接続を行なう時に接続を待つポート番号をランダムに決めている(誰が決めてい
+ るのかはやっぱり不明であるが)。
  さらにもう一段安全性を高めるために、
  接続時に 1 回だけ使用可能なパスワードを作成し、
- そのパスワードを使って認証を行なう。
+ そのパスワードを使って認証を行なう(誰がパスワードを決めて誰が認証を行っ
+ ているのかが不明だけど)。
  このパスワードは一旦使用されれば無効にするので、
- もし仮になんらかの手段でパスワードが洩れたとしても安全である。
+ もし仮になんらかの手段でパスワードが洩れたとしても安全だと考えている。
- なお、上記の port 番号とパスワードは安全な手段で送られて
- いると仮定している。
- また、同一のコンピュータ上に悪意のあるユーザはいないと仮定している
- ことに注意しなければならない。
- なぜなら、現在の実装ではサーバ、およびクライアントの動作している
- コンピュータ上ではこの port 番号とパスワードがわかってしまうためである。
  なお、接続が確立した後のメッセージの送受信に関しては、
- 特に暗号化などの処置が行なわれているわけではない。
+ 特に暗号化などの処置を行っているわけではない。
  もし必要があれば、通信路の暗号化を行なう機能がある
- ソフトウェアを使うことを考えている。
+ ソフトウェア ssh を使うことを考えている。
  \section{他のプロジェクト}
  他のプロジェクトについても触れておこう。
- OpenMath プロジェクトは数学的なオブジェクトを
+ \begin{itemize}
- コンピュータ上で表現する方法を決定している。
+ \item OpenMath\\
- 各ソフトウェア間でオブジェクトを交換する際の
+ OpenMath プロジェクトは数学的なオブジェクトをコンピュータ上で表現する方
- オブジェクトの変換手順についても述べられている。
+ 法を規定している。各ソフトウェア間でオブジェクトを交換する際のオブジェク
- 表現方法は一つだけでなく、 XML 表現や binary 表現などが
+ トの変換手順につても定められている。表現方法は幾つかの段階で定められて
- 用意されている。
+ いて、XML 表現やバイナリ表現などが用意されている。詳細は
- 詳細は
- http://www.openmath.org/omsoc/index.html A.M.Cohen
+ http://www.openmath.org/omsoc/   A.M.Cohen
+ \item NetSolve
- 以下は書いてる途中。
- NetSolve
  http://www.cs.utk.edu/netsolve/
+ \item MP
- MP
  http://symbolicNet.mcs.kent.edu/SN/areas/protocols/mp.html
+ \item MCP
- MCP
  http://horse.mcs.kent.edu/~pwang/
+ \end{itemize}
  \section{現在提供されているソフトウェア}
- 現在 OpenXM 規格に対応しているクライアントには
+ 現在 OpenXM 規約に対応しているクライアントにはasir, sm1, Mathematica が
- asir, sm1, Mathematica がある。
+ ある。これらのクライアントから OpenXM 規約に対応したサーバを呼び出すこと
- これらのクライアントから
+ ができる。現在 OpenXM 規約に対応しているサーバソフトウェアには、asir,
- OpenXM 規格に対応したサーバを呼び出すことができる。
+ sm1, gnuplot, Mathematica などがあり、それぞれ ox\_asir, ox\_sm1,
- 現在 OpenXM 規約に対応しているサーバソフトウェアには、
+ ox\_sm1\_gnuplot, ox\_math という名前で提供されている。また、 OpenMath
-  asir, sm1, gnuplot, Mathematica などがあり、
+ 規約の XML 表現で表現されたオブジェクトと CMO 形式のオブジェクトを変換す
- それぞれ ox\_asir, ox\_sm1, ox\_math という名前で提供されている。
+ るソフトウェアが JAVA によって実装されており、OMproxy という名前で提供さ
- また、 OpenMath 規格の XML 表現で表現されたデータと CMO 形式の
+ れている。
- データを変換するソフトウェアが JAVA によって実装されており、
- OMproxy という名前で提供されている。
+ \begin{thebibliography}{99}
+ \bibitem{Ohara-Takayama-Noro-1999}
+ 小原功任, 高山信毅, 野呂正行:
+ {Open asir 入門}, 1999, 数式処理, Vol 7, No 2, 2--17. (ISBN4-87243-086-7, SEG 出版, Tokyo).
+ \bibitem{OpenXM-1999}
+ 野呂正行, 高山信毅:
+ {Open XM の設計と実装 --- Open message eXchange protocol for Mathematics},
+/11/22
+ \end{thebibliography}
  \end{document}

FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>