OpenXM/doc/genkou19991125.tex - diff

Return to genkou19991125.tex CVS log

Up to [local] / OpenXM / doc

Diff for /OpenXM/doc/Attic/genkou19991125.tex between version 1.42 and 1.124

-version 1.42, 1999/12/22 13:01:20
+version 1.124, 2000/01/07 09:27:02
 Line 1
 Line 1
 Line 1
  \documentclass{jarticle}
- \title{タイトル未定}
+ %% $OpenXM: OpenXM/doc/genkou19991125.tex,v 1.123 2000/01/07 09:20:32 tam Exp $
- \author{
- 前川 将秀\thanks{神戸大学理学部数学科},
+ \usepackage{jssac}
- 野呂 正行\thanks{富士通研究所},
- 小原 功任\thanks{金沢大学理学部計算科学教室}, \\
+ \title{OpenXM プロジェクトの現状について}
- 奥谷 行央
+ \author{奥 谷 　 行 央\affil{神戸大学大学院自然科学研究科}
- %\thanks{神戸大学大学院自然科学研究科博士課程前期課程数学専攻},
+                 \mail{okutani@math.sci.kobe-u.ac.jp}
- \thanks{神戸大学大学院自然科学研究科数学専攻},
+   \and  小 原 　 功 任\affil{金沢大学理学部}
- 高山 信毅\thanks{神戸大学理学部数学教室},
+                 \mail{ohara@kappa.s.kanazawa-u.ac.jp}
- 田村 恭士
+   \and  高 山 　 信 毅\affil{神戸大学理学部}
- %\thanks{神戸大学大学院自然科学研究科博士課程後期課程情報メディア科学専攻計算システム講座}
+                 \mail{takayama@math.sci.kobe-u.ac.jp}
- \thanks{神戸大学大学院自然科学研究科情報メディア科学専攻}
+   \and  田 村 　 恭 士\affil{神戸大学大学院自然科学研究科}
+                 \mail{tamura@math.sci.kobe-u.ac.jp}
+   \and  野 呂 　 正 行\affil{富士通研究所}
+                 \mail{noro@para.flab.fujitsu.co.jp}
+   \and  前 川 　 将 秀\affil{神戸大学理学部}
+                 \mail{maekawa@math.sci.kobe-u.ac.jp}
  }
- \date{1999年11月25日}
+ \art{}
- %\pagestyle{empty}
  \begin{document}
  \maketitle
  \section{OpenXMとは}
- OpenXM は数学プロセス間でメッセージを交換するための規約である。数学プロ
+ OpenXM は数学プロセス間でメッセージを交換するための規約である.  数学プロ
- セス間でメッセージをやりとりさせることにより、ある数学プロセスから他の数
+ セス間でメッセージをやりとりすることにより, ある数学プロセスから他の数学
- 学プロセスを呼び出して計算を行なったり、他のマシンで計算を行なわせたりす
+ プロセスを呼び出して計算を行なったり, 他のマシンで計算を行なわせたりする
- ることが目的である。なお、 OpenXM とは Open message eXchange protocol
+ ことが目的である.  なお, OpenXM とは Open message eXchange protocol for
- for Mathematics の略である。
+ Mathematics の略である.  OpenXM の開発の発端は野呂と高山により, asir と
- OpenXM の開発の発端は野呂と高山により、 asir と kan/sm1 を
+ kan/sm1 を相互に呼び出す機能を実装したことである.
- 相互に呼び出す機能を実装したことである。
- %\footnote{この段落必要?}
- %発端となった asir と kan/sm1 での実装時には、
+ 初期の実装では, 相手側のローカル言語の文法に従った文字列を送っていた.
- 初期の実装では、相手側のローカル言語の文法に従った文字列を送っていた。
+ この方法では相手側のソフトが asir なのか kan/sm1 なのかを判別するなどし
- 現在の OpenXM 規約では共通表現形式によるメッセージを用いている。
+ て, 相手側のローカル言語の文法に合わせた文字列を作成しなければならない.
- この方法では相手側のソフトが asir なのか kan/sm1 なのかを判別して、
+ このローカル言語の文法に従った文字列を送る方法は, 効率的であるとはいい難
- 相手側のローカル言語の文法に合わせて文字列を作成する必要がない。
+ いが, 使いやすいとも言える.
- しかし、ローカル言語の文法に従った文字列を送る方法も、
- 効率的であるとはいい難いが、使いやすい。
- そのため、 OpenXM 規約では共通表現形式の中の文字列として
- 表現して送ることが可能となっている。
- %OpenXM 規約独自のデータ形式である CMO 形式(Common Mathematical Object format)
+ 現在の OpenXM 規約では共通表現形式によるメッセージを用いている.  上記の
- %以外にも、 MP や OpenMath の XML, binary 表現形式といった他の形式をも
+ 文字列を送る方法の利点を生かすため, OpenXM 規約では共通表現形式の中の文
- %扱えるようにしてある。
+ 字列として, ローカル言語の文法に従った文字列を用いたメッセージの交換も可
+ 能となっている.
- {\Huge TCP/IP 実装の話}
+ OpenXM 規約では通信の方法に自由度があるが, 現在のところは TCP/IP を用い
+ た通信しか実装されていない.
+ \footnote{ただし asir には MPI を用いた実装もある.}
+ そこで, この論文では TCP/IP を用いた実装に準拠してOpenXM の説明をする.
- OpenXM 規約では通信路の確保の仕方に
+ \section{OpenXM のメッセージの構造}\label{sec:messages}
+ 通信の方法によってメッセージの構造は変わる.  この論文では TCP/IP の場合
+ についてのみ説明を行なう.
- \section{OpenXM のメッセージの構造}
+ OpenXM 規約で規定されているメッセージはバイトストリームとなっており, 次
+ のような構造になっている.
- %{\Huge この節では構造の話をしなければいけません}
+ \begin{center}
+ \begin{tabular}{|c|c|}
- OpenXM で規定されているメッセージはバイトストリームであり、
+ \hline
- 次のような構造になっている。
+ ヘッダ  & \hspace{10mm} ボディ \hspace{10mm} \\
+ \hline
- \begin{tabular}{|c|c|} \hline
- ヘッダ  & \hspace{10mm} ボディ \hspace{10mm} \\ \hline
  \end{tabular}
+ \end{center}
+ ヘッダの長さは 8 バイトであると定められている.  ボディの長さはメッセージ
+ ごとに異なっているが, 長さは $0$ でもよい.
- ヘッダの長さは 8 バイトであると定められている。
+ ヘッダは次の二つの情報を持っている.
- ボディの長さはメッセージごとに異なっているが、
- 長さは $0$ でもよい。
- ヘッダは次の二つの情報を持っている。
  \begin{enumerate}
- \item   前半の 4 バイトにある、メッセージの種類を表わす識別子。
+ \item
-         タグと呼ばれる。
+ 前半の 4 バイト.  メッセージの種類を表す識別子であり, タグと呼ばれる.
- \item   後半の 4 バイトにある、メッセージにつけられた通し番号。
+ \item
+ 後半の 4 バイト.  メッセージにつけられた通し番号である.
  \end{enumerate}
- それぞれの 4 バイトは 32 ビット整数とみなされて扱われる。
+ それぞれの 4 バイトは 32 ビット整数とみなされて扱われる.
- この場合に用いられる整数の表現方法の説明については後述するが、
- 基本的に表現方法はいくつかの選択肢から選ぶことが可能となっており、
- またその選択は通信路の確立時に一度だけなされることに注意しなければならない。
- %{\Huge 以下、書き直し}
+ この場合に用いられる 32 ビット整数の表現方法について説明しておこう.  問
+ 題になるのは負数の表現とバイトオーダーの問題である.  まず, 負数を表す必
+ 要があるときには2の補数表現を使うことになっている.  次にバイトオーダーで
+ あるが, OpenXM 規約は複数のバイトオーダーを許容する.  ただし一つの通信路
+ ではひとつのバイトオーダーのみが許され, 通信路の確立時に一度だけ選ばれる.
- ボディの中身は各データ形式によって
+ 現在のOpenXM 規約では, タグ(整数値)として以下のものが定義されている.
- それぞれ独立に決められるようになっている。
- もし、 OpenXM 規約でまだ定義されていないデータ形式を使いたい場合は、
- メッセージのヘッダのタグをまだ使われてない整数値に設定し、
- ボディの部分にデータを埋め込めばよい。
- なお、このような用途にも使えるように、
- タグにはシステム固有の表現用に推奨されている整数の範囲がある。
+ \begin{verbatim}
+ #define OX_COMMAND               513
+ #define OX_DATA                  514
+ #define OX_SYNC_BALL             515
+ #define OX_DATA_WITH_LENGTH      521
+ #define OX_DATA_OPENMATH_XML     523
+ #define OX_DATA_OPENMATH_BINARY  524
+ #define OX_DATA_MP               525
+ \end{verbatim}
+ ボディの構造はメッセージの種類によって異なる.  OX\_COMMAND で識別される
+ メッセージはスタックマシンへの命令であり, それ以外のメッセージは何らかの
+ オブジェクトを表している.  この論文では OX\_DATA と OX\_COMMAND で識別さ
+ れるメッセージについてのみ, 説明する.
+ 既存のメッセージでは対応できない場合は, 新しい識別子を定義することで新し
+ い種類のメッセージを作成することができる.  この方法は各数学ソフトウェア
+ の固有の表現を含むメッセージを作成したい場合などに有効である.  新しい識
+ 別子の定義方法については, \cite{OpenXM-1999} を参照すること.
  \section{OpenXM の計算モデル}
- {\Huge この節では計算モデルの話をしなければいけません}
+ OpenXM 規約での計算とはメッセージを交換することである.  また, OpenXM 規
+ 約ではクライアント・サーバモデルを採用しているので, メッセージの交換はサー
+ バとクライアントの間で行なわれる.
+ \footnote{現在, 主に野呂が OpenXM の計算モデルの拡張を考えている.  効率
+ 的な分散計算のアルゴリズムの多くはサーバ同士の通信も要求するからである.}
+ クライアントからサーバへメッセージを送り, クライアントがサーバからメッセー
+ ジを受け取ることによって計算の結果が得られる.  このメッセージのやりとり
+ はクライアントの主導で行われる.  つまり, クライアントは自由にメッセージ
+ をサーバに送付してもよいが, サーバからは自発的にメッセージが送付されるこ
+ とはない.  この原理はサーバはスタックマシンであることで実現される.  スタッ
+ クマシンの構造については \ref{sec:oxsm} 節で述べる.
- OpenXM 規約での計算とはメッセージを交換することである。
+ サーバがクライアントから受け取ったオブジェクト(つまり OX\_COMMAND でない
- また、 OpenXM 規約ではクライアント・サーバモデルを採用しているので、
+ メッセージのボディ)はすべてスタックに積まれる.  スタックマシンへの命令
- メッセージの交換はサーバとクライアントの間で行なわれる。
+ (OX\_COMMAND で識別されるメッセージのボディ)を受け取ったサーバは命令に対
- クライアントからサーバへメッセージを送り、
+ 応する動作を行なう.  このとき, 命令によってはスタックからオブジェクトを
- サーバからクライアントがメッセージを受け取ることによって
+ 取り出すことがあり, また(各数学システムでの)計算結果をスタックに積むこと
- 計算の結果が得られる。
+ がある.  もし, 与えられたデータが正しくないなどの理由でエラーが生じた場
+ 合にはサーバはエラーオブジェクトをスタックに積む.  計算結果をクライアン
+ トが得る場合にはスタックマシンの命令 SM\_popCMO または SM\_popString を
+ サーバに送らなければならない.  これらの命令を受け取ってはじめて, サーバ
+ からクライアントへメッセージが送られる.
- サーバはスタックマシンであると仮定されており、
+ まとめると, クライアントがサーバへメッセージを送り, 計算の結果を得るとい
- サーバがクライアントから受け取ったメッセージはすべてスタックに積まれる。
+ う手順は以下のようになる.
- ただし、OpenXM のメッセージの中にはサーバに行なわせたい動作に
- 対応するデータがあり、
- このメッセージを受け取ったサーバはそれに対応する動作を
- 行なうことが期待されている。
- しかし、サーバは命令されない限り何も動作を行なおうとはしない。
- このため、クライアントはサーバの状態を気にせずにメッセージを送り、
- 一旦メッセージを送付し終えた後、
- サーバへ送ったメッセージの結果を
- サーバから待つことなしに次の動作に移ることができる。
- なお、サーバに対する動作に対応したデータは SM 形式として定義されている。
+ \begin{enumerate}
- SM 形式以外のデータでは、サーバは受け取ったデータをスタックに積む
+ \item
- 以外の動作をしないことになっている。
+ まず, クライアントがサーバへオブジェクトを送る.  サーバは送られてきたオ
- つまり、 SM 形式のデータがサーバにデータを受け取る以外の動作を
+ ブジェクトをスタックに積む.
- 行なわせる唯一のデータ形式である。
+ \item
+ クライアントがサーバに計算の命令を送ると, サーバはあらかじめ定めれらた動
+ 作を行う.  一部の命令はスタックの状態を変更する.  例えば
+ SM\_executeFunction, \\ SM\_executeStringByLocalParser などの命令は, ス
+ タック上のオブジェクトから計算を行う.  SM\_popCMO もしくは SM\_popString
+ は, スタックの最上位のオブジェクトを取りだし, クライアントに送り返す.
+ \end{enumerate}
- \section{OpenXM の計算の進行方法}
+ \section{OpenXM スタックマシン}\label{sec:oxsm}
- OpenXM における計算とはメッセージの交換のことである。
+ OpenXM 規約ではサーバはスタックマシンであると定義している.  以下, OpenXM
- 既に計算モデルの節で説明したが、
+ スタックマシンと呼ぶ.  この節ではOpenXM スタックマシンの構造について説明
- OpenXM はサーバ・クライアントモデルを採用していて、
+ しよう.
- サーバはスタックマシンの構造を持つ。
- サーバが行うのは基本的に次の事柄に限られる。
- クライアントからメッセージを受け取るとサーバは、
- まずメッセージの識別子を調べ、 SM 形式のデータでなければスタックに積む。
- SM 形式のデータであればメッセージのボディから
- スタックマシンのオペコードを取りだし、
- あらかじめ規約で定められた動作を行なう。
- %上の説明でわかるように、
+ まず, OpenXM 規約は通信時にやりとりされる共通のデータ形式については規定
- サーバはクライアントからの指示なしに、
+ するが, OpenXM スタックマシンがスタックに積む, オブジェクトの構造までは
- 自らメッセージを送らないことに注意しなければならない。
+ 規定しない.  つまり, オブジェクトの構造は各数学システムごとに異なってい
- %(例外? ox\_asir の mathcap)。
+ るということである.  このことは通信路からデータを受け取った際に, 各数学
+ システムが固有のデータ構造に変換してからスタックに積むことを意味する.
+ この変換は1対1対応である必要はない.  もちろん, 恣意的に変換してよいわけ
+ ではなく, 数学システムごとに変換方法をあらかじめ定めておく必要がある.
+ このような共通のデータ形式と各システムでの固有のデータ形式との変換の問題
+ は OpenXM に限ったことではない.  OpenMath (\ref{sec:other} 節を参照のこ
+ と) ではこの変換を行うソフトウェアを Phrasebook と呼んでいる.
- サーバがクライアントから受け取ったメッセージはすべてスタックに積まれる。
+ 次に OpenXM スタックマシンの命令コードについて説明する.  OpenXM スタック
- 次いでサーバに SM 形式のデータを送ると、
+ マシンにおけるすべての命令は 4 バイトの長さを持つ.  OpenXM 規約の他の規
- 初めてサーバはデータをスタックに積む以外のなんらかの動作を行なう。
+ 定と同様に, 4 バイトのデータは32ビット整数と見なされるので, この論文でも
- このとき、必要があればサーバはスタックから必要なだけデータを取り出す。
+ その表記にしたがう.  OpenXM スタックマシンに対する命令はスタックに積まれ
- ここで、クライアントからの命令による動作中にたとえエラーが発生したとしても
+ ることはない.  現在のところ, OpenXM 規約では以下の命令が定義されている.
- サーバはエラーオブジェクトをスタックに積むだけで、
- 明示されない限りエラーを返さないことに注意しなければならない。
- 結果が生じる動作をサーバが行なった場合、
+ \begin{verbatim}
- サーバは動作の結果をスタックに積む。
+ #define SM_popSerializedLocalObject               258
- サーバに行なわせた動作の結果をクライアントが知りたい場合、
+ #define SM_popCMO                                 262
- スタックからデータを取り出し送信を行なう命令に対応した SM 形式のデータを
+ #define SM_popString                              263
- サーバ側へ送ればよい。
+ #define SM_mathcap                                264
+ #define SM_pops                                   265
+ #define SM_setName                                266
+ #define SM_evalName                               267
+ #define SM_executeStringByLocalParser             268
+ #define SM_executeFunction                        269
+ #define SM_beginBlock                             270
+ #define SM_endBlock                               271
+ #define SM_shutdown                               272
+ #define SM_setMathCap                             273
+ #define SM_executeStringByLocalParserInBatchMode  274
+ #define SM_getsp                                  275
+ #define SM_dupErrors                              276
+ #define SM_DUMMY_sendcmo                          280
+ #define SM_sync_ball                              281
+ #define SM_control_kill                          1024
+ #define SM_control_to_debug_mode                 1025
+ #define SM_control_exit_debug_mode               1026
+ #define SM_control_ping                          1027
+ #define SM_control_start_watch_thread            1028
+ #define SM_control_stop_watch_thread             1029
+ #define SM_control_reset_connection              1030
+ \end{verbatim}
- {\Huge 以下、書き直し}
+ スタックマシンに対する命令の中には実行によって結果が返ってくるものがある.
+ 結果が返ってくる命令を実行した場合, サーバはその結果をスタックに積む.
+ たとえば, 命令 SM\_executeStringByLocalParser はスタックに積まれているオ
+ ブジェクトをサーバ側のローカル言語の文法に従った文字列とみなして計算を行
+ なうが, 行なった計算の結果はスタックに積まれる.
- クライアントがサーバへ計算を行なわせ、結果を得るという手順を追っていくと、
+ なお, 命令の実行中にエラーが起こり, 結果が得られなかった場合には,
- 次のようになる。
+ エラーオブジェクトがスタックに積まれる.
- \begin{enumerate}
+ \section{CMO のデータ構造}\label{sec:cmo}
- \item   まず、クライアントがサーバへ計算させたいデータを送る。
-         サーバは送られてきたデータをスタックに積む。
- \item   クライアントがサーバに「計算を行なう動作に対応したデータ」を
-         送ると、サーバは必要なだけスタックからデータを取り出し、
-         実行した計算の結果をスタックに積む。
- \item   最後に「データを取り出し送信を行なう命令に対応したデータ」を
-         サーバへ送ると、サーバはスタックから計算結果の入っている
-         データを取り出し、クライアントへ送出する。
- \end{enumerate}
+ OpenXM 規約では, 数学的オブジェクトを表現する方法として CMO 形式(Common
+ Mathematical Object format)を定義している.  この CMO 形式にしたがったデー
+ タは, 識別子が OX\_DATA であるようなメッセージのボディになることを想定し
+ ている.
- \section{CMO のデータ構造}
+ CMO 形式におけるデータ構造は次のような構造をもつ.
+ \begin{center}
+ \begin{tabular}{|c|c|}
+ \hline
+ ヘッダ        & \hspace{10mm} ボディ \hspace{10mm} \\
+ \hline
+ \end{tabular}
+ \end{center}
+ ヘッダは4バイトである.  ボディの長さはそれぞれのデータによって異なるが,
+でもよい.
- OpenXM 間でやりとりされるメッセージを実際に作成する場合、
+ メッセージと同様にヘッダは4バイト単位に管理される.  すなわち, CMO では
- CMO 形式で定義されている多倍長整数を理解しておくと、
+ ヘッダは一つだけの情報を含む.  この4バイトのヘッダのことをタグともいう.
- CMO 形式の他のデータ構造だけでなく、 OX 形式、 SM 形式のデータを
+ さて, CMO では, タグによってボディの論理的構造が決定する.  すなわち, タ
- 理解する助けになると思えるので、 CMO 形式の多倍長整数の
+ グはそれぞれのデータ構造と1対1に対応する識別子である.  それぞれの論理的
- データ構造について説明する。
+ 構造は\cite{OpenXM-1999} に詳述されている.  現在の OpenXM 規約では以下の
+ CMO が定義されている.
- CMO 形式で定義されているデータは多倍長整数以外にも
+ \begin{verbatim}
- 文字列やリスト構造などがある。どのようなデータであるかは
+ #define CMO_ERROR2                         0x7f000002
- データの先頭にあるタグを見れば判別できるようになっている。
+ #define CMO_NULL                           1
- これはメッセージのデータの判別の仕方とおなじである。
+ #define CMO_INT32                          2
- なお、タグは各データ毎に 32 bit の整数で表されており、
+ #define CMO_DATUM                          3
- 多倍長整数は 20 となっている。
+ #define CMO_STRING                         4
- ここで 32 bit の整数の表現方法について説明する必要がある。
+ #define CMO_MATHCAP                        5
- OpenXM ではバイト列で 32 bit の整数 20 を
+ #define CMO_ARRAY                          16
- {\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。
+ #define CMO_LIST                           17
- この表現方法の違いはクライアントとサーバの最初の接続時に
+ #define CMO_ATOM                           18
- 双方の合意で決定することになっている。
+ #define CMO_MONOMIAL32                     19
- なお、合意がない場合には
+ #define CMO_ZZ                             20
- 前者の表現方法(以後、この表現方法を network byte order と呼ぶ)を
+ #define CMO_QQ                             21
- 使うことになっている。
+ #define CMO_ZERO                           22
- また、負の数を表現する必要があるときには、
+ #define CMO_DMS_GENERIC                    24
-の補数表現を使うことになっている。
+ #define CMO_DMS_OF_N_VARIABLES             25
+ #define CMO_RING_BY_NAME                   26
+ #define CMO_RECURSIVE_POLYNOMIAL           27
+ #define CMO_LIST_R                         28
+ #define CMO_INT32COEFF                     30
+ #define CMO_DISTRIBUTED_POLYNOMIAL         31
+ #define CMO_POLYNOMIAL_IN_ONE_VARIABLE     33
+ #define CMO_RATIONAL                       34
+ #define CMO_64BIT_MACHINE_DOUBLE           40
+ #define CMO_ARRAY_OF_64BIT_MACHINE_DOUBLE  41
+ #define CMO_128BIT_MACHINE_DOUBLE          42
+ #define CMO_ARRAY_OF_128BIT_MACHINE_DOUBLE 43
+ #define CMO_BIGFLOAT                       50
+ #define CMO_IEEE_DOUBLE_FLOAT              51
+ #define CMO_INDETERMINATE                  60
+ #define CMO_TREE                           61
+ #define CMO_LAMBDA                         62
+ \end{verbatim}
- 表現したい多倍長整数の絶対値を 2 進数で表した場合の桁数を $n$ と
+ この中で CMO\_ERROR2, CMO\_NULL, CMO\_INT32, CMO\_DATUM, CMO\_STRING,
- したとき、次にくるデータは $[(n+31)/32]$ を 32 bit の整数となる。
+ CMO\_MATHCAP, CMO\_LIST で識別されるオブジェクトは最も基本的なオブジェ
- これは多倍長整数の絶対値を $2^{32}$ 進数で表した場合の桁数ととってもよい。
+ クトであって, すべての OpenXM 対応システムに実装されていなければならない.
- ただし、表現したい数が負の場合は $[(n+31)/32]$ を 32 bit の整数で表した値を
-の補数表現で負にして、正の場合と区別する。
- 表現したい多倍長整数の絶対値が $2^{32}$ 進数で $(b_0 b_1 ... b_k)_{2^{32}}$
+ これらについての解説を行う前に記法について, 少し説明しておく.  この論文
- と表せるとき、次にくるデータは $b_0$, $b_1$, $\cdots$, $b_k$ を
+ では, 大文字で CMO\_INT32 と書いた場合には, 上記で定義した識別子を表す.
- それぞれ 32 bit の整数で表現した値となる。
+ また CMO\_INT32 で識別されるオブジェクトのクラス(あるいはデータ構造) を
- %以下は書き直しの必要があるかも...
+ cmo\_int32 と小文字で表すことにする.
- なお、 GNU MP LIBRARY を用いると、
- C 言語から多倍長整数や任意精度浮動小数を扱うことができる。
- $b_0$, $b_1$, $\cdots$, $b_k$ をそれぞれ 32 bit 整数で表現した値は
- この GNU MP LIBRARY で用いられている多倍長整数で使われている形式を
- 参考にして合わせてある。
- ここで具体例をだそう。
+ さて cmo を表現するための一つの記法を導入する.  この記法は CMO expression
- $4294967298 = 1 \times 2^{32} + 2$ を network byte order の多倍長整数で
+ と呼ばれている.  その正確な形式的定義は \cite{OpenXM-1999} を参照すること.
- 表現すると、
- \begin{center}
-         {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01}
- \end{center}
- となる。また、同じ表現方法で $-1$ を表現すると、
- \begin{center}
-         {\tt 00 00 00 14 ff ff ff ff 00 00 00 01}
- \end{center}
- となる。
+ CMO expssion は Lisp 風表現の一種で, cmo を括弧で囲んだリストとして表現
+ する.  それぞれの要素はカンマで区切る.  例えば,
+ \begin{quote}
+ (17, {\sl int32}, (CMO\_NULL), (2, {\sl int32} $n$))
+ \end{quote}
+ は CMO expression である.  ここで, 小文字の斜体で表された``{\sl int32}''
+ は 4 バイトの任意のデータを表す記号であり, ``{\sl int32} $n$'' は同じく
+バイトのデータであるが以下の説明で $n$ と表すことを示す.  また数字 17,
+などは 4 バイトのデータで整数値としてみたときの値を意味する.  CMO\_NULL
+ は識別子(すなわち数字 1 と等価)である.  この記法から上記のデータは 20 バ
+ イトの大きさのデータであることが分かる.  なお, CMO expression は単なる表
+ 記法であることに特に注意してほしい.
- \section{MathCap について}
+ さて, この記法のもとで cmo\_int32 を次のデータ構造であると定義する.
+ \begin{quote}
+ cmo\_int32 := (CMO\_INT32,  {\sl int32})
+ \end{quote}
+ 同様に, cmo\_null, cmo\_string, cmo\_list, cmo\_mathcap のシンタッ
+ クスは次のように定義される.
+ \begin{quote}
+ cmo\_null := (CMO\_NULL) \\
+ cmo\_string := (CMO\_STRING, {\sl int32} $n$, {\sl string} $s$) \\
+ cmo\_list := (CMO\_LIST, {\sl int32} $m$, {\sl cmo} $c_1$, $\ldots$,
+ {\sl cmo} $c_m$) \\
+ cmo\_mathcap := (CMO\_MATHCAP, {\sl cmo\_list})
+ \end{quote}
+ ただし, {\sl string}は適当な長さのバイト列を表す.  $s$ のバイト長は $n$
+ と一致することが要求される.
- サーバおよびクライアント双方ともに OpenXM で規定されている
+ \section{mathcap について}
- メッセージの中のデータ形式をすべて受け取れるわけではない。
- しかも、 OpenXM 規約で規定されているデータ形式だけが
- 受渡しに使われるというわけではない。
- そこで、 OpenXM では相手側が受け取ることができるデータ形式を
- 収得する方法を用意している。
- CMO 形式で定義されている MathCap データは
+ OpenXM 規約では, 通信時に用いられるメッセージの種類を各ソフトウェアが制
- %理解可能なメッセージの
+ 限する方法を用意している.  これは各ソフトウェアの実装によってはすべての
- 受け取ることができるデータ形式を表すデータであり、
+ メッセージをサポートするのが困難な場合があるからである.  また, 各ソフト
- 要求されればサーバはサーバ自身の MathCap データをスタックに積む。
+ ウェアでメッセージの種類を拡張したい場合にも有効である.  この制限(あるい
- また、クライアントから MathCap データをサーバへ送ることもでき、
+ は拡張) は mathcap と呼ばれるデータ構造によって行われる.  この節では
- MathCap データをサーバとクライアントの間で交換することによって、
+ mathcap のデータ構造と, 具体的なメッセージの制限の手続きについて説明する.
- お互いに相手側が受け取ることができないデータ形式で
- メッセージを送ってしまうのを防ぐことができる。
- なお、 MathCap データの中では CMO 形式で定義されている
-bit 整数、文字列、リスト構造が使われており、
- MathCap データに含まれている内容を理解できるためには
- 必然的にこれらも理解できる必要がある。
- OpenXM 対応版の asir サーバである ox\_asir が返す MathCap を以下に示す。
+ まず, 手続きについて説明しよう.
- %なお、 $a_1$, $a_2$, $\cdots$, $a_n$ を要素に
+ 第一にサーバの機能を制限するには次のようにする.  クライアントが mathcap
- %持つリスト構造を {\tt [$a_1$, $a_2$, $\cdots$, $a_n$]} 、
+ オブジェクトをサーバへ送ると, サーバは受け取ったmathcap をスタックに積む.
- %文字列 ``string'' を {\tt "string"} 、 32 bit 整数を
+ 次にクライアントが命令 SM\_setMathCap を送ると, サーバはスタックの最上位
- %それに対応する 10 進数の整数で示す。
+ に積まれている mathcap オブジェクトを取り出し, mathcap で設定されていな
+ いメッセージをクライアントへ送らないように制限を行う.
- %↓手で作ったので間違えている可能性あり。
+ 第二にクライアントを制限するには次のようにする.  まず, クライアントがサー
- %%古いバージョン。差し替えの必要あり。
+ バに命令 SM\_mathcap を送ると, サーバは mathcap オブジェクトをスタックに
- \begin{verbatim}
+ 積む.  さらに命令 SM\_popCMO を送ると, サーバはスタックの最上位のオブジェ
- [ [199901160,"ox_asir"],
+ クト(すなわち mathcap オブジェクト)をボディとするメッセージをクライアン
-   [276,275,258,262,263,266,267,268,274
+ トに送付する.  クライアントはそのオブジェクトを解析して, 制限をかける.
-     ,269,272,265,264,273,300,270,271],
-   [ [514,[1,2,3,4,5,2130706433,2130706434
-           ,17,19,20,21,22,24,25,26,31,27,33,60]],
-     [2144202544,[0,1]]
-   ]
- ]
- \end{verbatim}
- この MathCap データのリスト構造は大きく分けて 3 つの部分に分かれる。
+ 次に mathcap のデータ構造について説明する.
- 最初の {\tt [199901160,"ox\_asir"]} の部分にはサーバの情報が入っている。
+ mathcap は cmo の一種であるので, すでに説明したように
- %この最初の要素がまたリスト構造となっており、
+ \begin{quote}
- 最初の要素はバージョンナンバーを、次の要素はサーバの名前を表している。
+ cmo\_mathcap := (CMO\_MATHCAP, {\sl cmo\_list})
+ \end{quote}
+ の構造をもつ(\ref{sec:cmo} 節を参照のこと).
+ ボディは cmo\_list オブジェクトでなければならない.
- 次の {\tt [276,275,$\cdots$,271]} の部分は
+ さて, mathcap オブジェクトのボディの cmo\_list オブジェクトは以下の条件
- サーバに対する動作に対応した理解可能なデータの種類を表している。
+ を満たすことを要求される.  まず, その cmo\_list オブジェクトは少なくとも
- サーバの動作に対するデータはすべて 32 bit の整数で表しており、
+ リスト長が 3 以上でなければならない.
- このリストは理解可能なデータに対応する 32 bit 整数のリストとなっている。
+ \begin{quote}
+ (CMO\_LIST, {\sl int32}, {\sl cmo} $a$, {\sl cmo} $b$, {\sl cmo} $c$, $\ldots$)
+ \end{quote}
- 最後の {\tt [ [514,[1,2,3,$\cdots$,60]],[2144202544,[0,1]] ]} の部分は
+ 第一要素 $a$ はまた cmo\_list であり, リスト長は 4 以上, $a_1$ は
- 理解可能なデータの形式を表している。
+ cmo\_int32 でバージョンを表す.  $a_2$, $a_3$, $a_4$ は cmo\_string であ
- この部分はさらに {\tt [514,[1,2,3,$\cdots$,60]]} と
+ り, それぞれ数学システムの名前, バージョン, HOSTTYPE を表すことになって
- {\tt [2144202544,[0,1]]} にの部分に分けることができ、
+ いる.
- それぞれが一つのデータ形式についての情報となっている。
+ \begin{quote}
- どのデータ形式についての情報かは最初の要素にある整数値をみれば
+ (CMO\_LIST, {\sl int32},
- 分かるようになっている。
+ {\sl cmo\_int32} $a_1$, {\sl cmo\_string} $a_2$, {\sl cmo\_string}
- この整数値は CMO 形式では 514 となっている。
+ $a_3$, {\sl cmo\_string} $a_4$, $\ldots$)
- 最初のデータ形式を区別する整数値以後の要素は
+ \end{quote}
- 各データ形式によってどのように使われるか定まっている。
- CMO 形式では理解可能なデータのタグがリストの中に収まっている。
- 前節で CMO 形式では多倍長整数を表すタグが 20 であることを述べたが、
- このリストに 20 が含まれているので、
- ox\_asir は CMO 形式の多倍長整数を受け取れることがわかる。
- %%このリストの要素はまたリストとなっており、
+ 第二要素 $b$ も cmo\_list であり, OpenXM スタックマシンを制御するために
- %この最後の部分もまたリストとなっており、
+ 用いられる.  各 $b_i$ は cmo\_int32 であり, ボディはスタックマシンの命令
- %あるデータ形式で理解可能なものを表現したリストを要素としている。
+ コードである.  \ref{sec:oxsm} 節で説明したが, スタックマシンへの命令はす
- %{\tt [514,[1, 2, $\cdots$]]} の最初の 514 はこのリストが CMO 形式
+ べて {\sl int32} で表されていたことに注意しよう.
- %での理解可能なデータを表していることを示しており、
+ \begin{quote}
- %その後のリストでは CMO 層で定義されているデータのうち、
+ (CMO\_LIST, {\sl int32} $n$,
- %理解可能なデータのタグが並んでいる。
+ {\sl cmo\_int32} $b_1$, $\ldots$, {\sl cmo\_int32} $b_n$)
+ \end{quote}
- なお、データが受け取れることと、
+ 第三要素 $c$ は以下のような cmo\_list であり, オブジェクトの送受信を制御
- データの論理構造が理解できることとはまったく別物であるので
+ するために用いられる.  送受信の制御はメッセージの種類ごとに行われる.
- 注意する必要がある。
+ \begin{quote}
+ (CMO\_LIST, {\sl int32} $m$, {\sl cmo\_list} $\ell_1$, $\ldots$,
+ {\sl cmo\_list} $\ell_m$)
+ \end{quote}
+ 各 $\ell_i$ が制御のための情報を表す.  どの $\ell_i$ も一つ以上の要素を
+ 持っており, 第一要素は必ず cmo\_int32 となっていなければならない.  これ
+ は制御すべきメッセージの識別子を入れるためである.
+ 各 $\ell_i$ の構造はメッセージの種類によって異なる.  ここでは, OX\_DATA
+ の場合についてのみ説明する.  第一要素が OX\_DATA の場合, リスト $\ell_i$
+ は以下のような構造となっている.  各 $c_i$ は cmo\_int32 であり, そのボディ
+ は CMO の識別子である.  $c_i$ で指示された CMO のみが送受信することを許
+ される.
+ \begin{quote}
+ (CMO\_LIST, 2, (CMO\_INT32, OX\_DATA), \\
+ \ \ (CMO\_LIST, {\sl int32} $k$, {\sl cmo\_int32} $c_1$,
+ $\ldots$, {\sl cmo\_int32} $c_k$))
+ \end{quote}
- \section{セキュリティ対策}
+ 具体的な mathcap の例をあげよう.  名前が ``ox\_test'', バージョンナンバー
+ が 199911250 のサーバで, Linux 上で動いており, このサーバのスタックマシ
+ ンが命令 SM\_popCMO, SM\_popString, SM\_mathcap,
+ SM\_executeStringByLocalParser を利用可能で, かつ オブジェクトを
+ cmo\_int32, cmo\_string, cmo\_mathcap, cmo\_list のみに制限したいときの
+ mathcap は
+ \begin{quote}
+ (CMO\_MATHCAP, (CMO\_LIST, 3, \\
+ $\quad$ (CMO\_LIST, 4, (CMO\_INT32, $199911250$), (CMO\_STRING, 7, ``ox\_test''), \\
+ $\qquad$ (CMO\_STRING, 9, ``199911250''), (CMO\_STRING, 4, ``i386'')) \\
+ $\quad$ (CMO\_LIST, $5$, (CMO\_INT32, SM\_popCMO), \\
+ $\qquad$ (CMO\_INT32, SM\_popString), (CMO\_INT32, SM\_mathcap), \\
+ $\qquad$ (CMO\_INT32, SM\_executeStringByLocalParser)) \\
+ $\quad$ (CMO\_LIST, $1$, (CMO\_LIST, $2$, (CMO\_INT32, OX\_DATA), \\
+ $\qquad$ (CMO\_LIST, $4$, (CMO\_INT32, CMO\_INT32), \\
+ $\qquad\quad$ (CMO\_INT32, CMO\_STRING), (CMO\_INT32, CMO\_MATHCAP), \\
+ $\qquad\quad$ (CMO\_INT32, CMO\_LIST))))))
+ \end{quote}
+ になる.
- OpenXM では幾らかのセキュリティ対策を考えている。
- OpenXM に対応したソフトウェアをクラックしても
- 大した利点はないと思えるが、それは設計上の話であって、
- 予期せぬ手段で攻撃を受けた場合にどのような事態を
- 招くかは想像し難い。
- そこで、 OpenXM では侵入者に攻撃の機会を
+ \section{セキュリティ対策}
- できるだけ与えないようにしている。
- 具体的には、接続が必要になった時のみ接続を待つようにし、
- 常に接続に関与するといったことは避けている。
- しかし、これだけでは侵入者が接続を行なう一瞬のすきを
+ OpenXM 規約は TCP/IP を用いて通信を行うことを考慮している.  したがって
- 狙ってくる可能性もある。
+ ネットワークによって接続される現代の多くのソフトウェアと同様, OpenXM 規
- そこで接続を行なう時に、
+ 約もまた通信時のセキュリティについて注意している.  以下, このことについ
- 接続を待つポート番号をランダムに決めている。
+ て説明しよう.
- こうすることで、特定のポート番号を狙って接続を行なう
- 瞬間を待つ手口を幾らか防ぐことができる。
- さらにもう一段安全性を高めるために、
+ 第一に OpenXM では侵入者に攻撃の機会をできるだけ与えないようにするため,
- 接続時に 1 回だけ使用可能なパスワードを作成し、
+ サーバは接続が必要になった時のみ起動している.  しかし, これだけでは接続
- そのパスワードを使って認証を行なう。
+ を行なう一瞬のすきを狙われる可能性もある.  そこで接続を行なう時に, 接続
- このパスワードは一旦使用されれば無効にするので、
+ を行なうポート番号を毎回変えている.  こうすることで, 特定のポート番号を
- もし仮になんらかの手段でパスワードが洩れたとしても安全である。
+ 狙って接続を行なう手口を防ぐことができる.
- なお、上記のポート番号とパスワードは安全な手段で送られて
+ さらにもう一段安全性を高めるために, 接続時に一時パスワードをクライアント
- いると仮定している。
+ が作成し, そのパスワードを使って認証を行なう.  このパスワードは一旦使用
- また、同一のコンピュータ上に悪意のあるユーザはいないと仮定している
+ されれば無効になるので, もし仮になんらかの手段でパスワードが洩れたとして
- ことに注意しなければならない。
+ も安全である.
- なぜなら、現在の実装ではサーバ、およびクライアントの動作している
- コンピュータ上ではこのポート番号とパスワードがわかってしまうためである。
- なお、接続が確立した後のメッセージの送受信に関しては、
+ なお, メッセージ自体には特に暗号化などの処置を行っていないので, そのまま
- 特に暗号化などの処置が行なわれているわけではない。
+ ではパケット盗聴などを受ける可能性がある.  現在の実装では, 必要ならば
- もし必要があれば、通信路の暗号化を行なう機能がある
+ ssh を利用して対応している.
- ソフトウェアを使うことを考えている。
- \section{他のプロジェクト}
+ \section{OpenXM 以外のプロジェクト}\label{sec:other}
- 他のプロジェクトについても触れておこう。
+ OpenXM 以外にも数式処理システム間の通信や数学データの共通表現を目指した
+ プロジェクトは存在する.  ここでは他のプロジェクトについても触れておこう.
- OpenMath プロジェクトは数学的なオブジェクトを
+ \begin{itemize}
- コンピュータ上で表現する方法を決定している。
+ \item ESPRIT OpenMath Project
- 各ソフトウェア間でオブジェクトを交換する際の
- オブジェクトの変換手順についても述べられている。
- 表現方法は一つだけでなく、 XML 表現や binary 表現などが
- 用意されている。
- 詳細は
- http://www.openmath.org/omsoc/index.html A.M.Cohen
+ http://www.nag.co.uk/projects/openmath/omsoc/
+ 数学的対象の SGML 的表記の標準化を目指した大規模なプロジェクト.  このプ
+ ロジェクトでは数学データを数学的意味を保ったままで如何に表現すべきかとい
+ う問題を追求している.  したがって既存の表現, 例えば \TeX による数式の表
+ 現と OpenMath による数式の表現とでは, 本質的に意味が異なる.  OpenMath で
+ 定義された表現は, 異なる種類の数式処理システムの間で情報を交換するときに
+ 利用することができる.  しかしながら, 数学システム同士の通信, 例えばある
+ 数学システムから別の数学システムを呼び出して計算させる方法などは, このプ
+ ロジェクトの対象外である. OpenXM における共通データ形式と数学システム固
+ 有のオブジェクトとの変換は OpenMath 規約の Phrasebook と同じアイデアを用
+ いている.
- 以下は書いてる途中。
- NetSolve
+ \item NetSolve
  http://www.cs.utk.edu/netsolve/
+ NetSolve はクライアント・サーバ型の分散システムであり, 単なる計算システ
+ ム以上のものを目指している.  クライアントは必要に応じて, サーバを呼び出
+ して計算をさせる.  NetSolve の特徴は, サーバの呼び出しに Agent というソ
+ フトウェアを介在させることである.  Agent は呼び出し先などを決定するデー
+ タベース的役割を果たす.  また Agent によって負荷分散が可能になる.  現在
+ の NetSolve は RPC を基礎にして実装されている.
- MP
- http://symbolicNet.mcs.kent.edu/SN/areas/protocols/mp.html
+ \item MP (Multi Project)
+ http://symbolicnet.mcs.kent.edu/SN/areas/protocols/mp.html
- MCP
+ 数学的なデータの共通表現を提供するプロジェクト.  MP の主な関心は, この
+ 共通表現の最適化である.  数学システム間で, 命令を送信したりデータを受
+ け渡す仕組み(control integration)は, このプロジェクトの対象外である.
+ MP は既存の control integration に対して補完的役割を果たす.
- http://horse.mcs.kent.edu/~pwang/
+ MP では数式を構文木の一種(annotated syntax tree)と捉える.  annotated
+ syntax tree には数学的な意味を保ったまま表現されているという特徴がある
+ (この点は OpenMath と似ている).  MP が提供する共通表現とは, この構文木の
+ バイナリエンコーディング, つまりバイト列での表現のことである.  MP の定義
+ する表現ではバイト列の長さが最適化されている.  また, バイトオーダーの選
+ 択も可能である(\ref{sec:messages} 節参照のこと).
+ このプロジェクトでは C 言語および GNU Common Lisp で実装を行なっている.
+ C 言語による実装(MP-C ライブラリ)は上記のウェブページから収得可能である.
+ このライブラリを用いて通信を行なうには, なんらかの control integration
+ が必要である.  control integration としては, ソケット, MPI, PVM などが利
+ 用できる.
+ \item MCP (Mathematical Computation Protocol)
+ http://horse.mcs.kent.edu/\~{}pwang/
+ 数学的なデータや命令を含むメッセージをやりとりするための
+ HTTP に似たプロトコル.
+ MCP は control integration であり,
+ クライアント・サーバ型の通信モデルを採用している.
+ MCP のメッセージはヘッダとボディから構成されている.
+ ヘッダはテキストであり, 最初に現れる空行でヘッダとボディは
+ 区切られている.
+ 数式はボディに記述されて送られる.
+ 数式の表現方法としては MP や OpenMath で定められたものを
+ 使用することが考えられている.
+ 実際, 数式の表現に OpenMath 規約の XML 表現を用いた実装があり,
+ GAP と Axiom の間で通信が行なわれている.
+ この場合, MCP によって送信されるメッセージは
+ ボディに OpenMath 形式で数式を記述したテキストである.
+ \end{itemize}
  \section{現在提供されているソフトウェア}
- 現在 OpenXM 規格に対応しているクライアントには
+ 現在 OpenXM 規約に対応しているクライアントにはasir, sm1, Mathematica が
- asir, sm1, Mathematica がある。
+ ある.  これらのクライアントから OpenXM 規約に対応したサーバを呼び出すこ
- これらのクライアントから
+ とができる.  また OpenXM 規約に対応しているサーバには, asir, sm1,
- OpenXM 規格に対応したサーバを呼び出すことができる。
+ Mathematica, gnuplot, PHC pack などがあり, それぞれ ox\_asir, ox\_sm1,
- 現在 OpenXM 規約に対応しているサーバソフトウェアには、
+ ox\_math, ox\_sm1\_gnuplot, ox\_sm1\_phc という名前で提供されている.
-  asir, sm1, gnuplot, Mathematica などがあり、
+ さらに OpenMath 規約の XML 表現で表現されたオブジェクトと CMO 形式のオブ
- それぞれ ox\_asir, ox\_sm1, ox\_math という名前で提供されている。
+ ジェクトを相互変換するソフトウェアが JAVA によって実装されており,
- また、 OpenMath 規格の XML 表現で表現されたデータと CMO 形式の
+ OMproxy という名前で提供されている.
- データを変換するソフトウェアが JAVA によって実装されており、
- OMproxy という名前で提供されている。
+ \begin{thebibliography}{99}
+ \bibitem{OpenMath1.0}
+ O. Caprotti, A. M. Cohen: The OpenMath Standard, February 1999.
+ (http://www.nag.co.uk/projects/OpenMath/omstd/partI.ps.gz)
+ \bibitem{NetSolve1.2b}
+ H. Casanova, J. Dongarra, A. Karainov, J. Wasniewski:
+ Users' Guide to NetSolve, October 27 1998.
+ (http://www.cs.utk.edu/netsolve/download/ug.ps)
+ \bibitem{MP}
+ S. Gray, N. Kajler, P. S. Wang:
+ Design and Implementation of MP,
+ a Protocol for Efficient Exchange of Mathematical Expressions,
+ {\it Journal of Symbolic Computation}, {\bf 11}, 1996, 1--25.
+ (ftp://ftp.mcs.kent.edu/dist/MP/mp-jsc-96.ps.gz)
+ \bibitem{OpenXM-1999}
+ 野呂 正行, 高山 信毅: {Open XM の設計と実装 --- Open message eXchange protocol for Mathematics}, December 31 1999.
+ (http://www.math.sci.kobe-u.ac.jp/openxxx/openxm-jp.tex)
+ \bibitem{Ohara-Takayama-Noro-1999}
+ 小原 功任, 高山 信毅, 野呂 正行: Open asir 入門,
+ {\it 数式処理}, {\bf Vol 7}(No 2), 1999, 2--17.
+ (ISBN 4-87243-086-7, SEG 出版, Tokyo).
+ \bibitem{ISSAC99}
+ P. S. Wang:
+ Design and Protocol for Internet Accessible Mathematical Computation,
+ {\it Proceedings of the 1999 International Symposium on Symbolic and Algebraic Computation}, 1999, 291--298.
+ (ISBN 1-58113-073-2, ACM, New York 1999.).
+ \end{thebibliography}
  \end{document}

FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>