=================================================================== RCS file: /home/cvs/OpenXM/doc/Attic/genkou19991125.tex,v retrieving revision 1.51 retrieving revision 1.93 diff -u -p -r1.51 -r1.93 --- OpenXM/doc/Attic/genkou19991125.tex 1999/12/23 04:02:19 1.51 +++ OpenXM/doc/Attic/genkou19991125.tex 1999/12/25 17:56:56 1.93 @@ -1,439 +1,514 @@ - \documentclass{jarticle} -%% $OpenXM$ +%% $OpenXM: OpenXM/doc/genkou19991125.tex,v 1.92 1999/12/25 17:05:28 tam Exp $ -\title{ -1. いいかげんスタイルファイルをかえよう。\\ -2. 意味もない修飾過剰な語句は排除しましょう。 -TCP/IP ソケットとか、TCP/IP 実装とか何のこっちゃと思いました。 +\usepackage{jssac} + +\title{OpenXM の現状について} +\author{奥 谷   行 央\affil{神戸大学大学院自然科学研究科} + \mail{okutani@math.sci.kobe-u.ac.jp} + \and 小 原   功 任\affil{金沢大学理学部} + \mail{ohara@kappa.s.kanazawa-u.ac.jp} + \and 高 山   信 毅\affil{神戸大学理学部} + \mail{takayama@math.sci.kobe-u.ac.jp} + \and 田 村   恭 士\affil{神戸大学大学院自然科学研究科} + \mail{tamura@math.sci.kobe-u.ac.jp} + \and 野 呂   正 行\affil{富士通研究所} + \mail{noro@para.flab.fujitsu.co.jp} + \and 前 川   将 秀\affil{神戸大学理学部} + \mail{maekawa@math.sci.kobe-u.ac.jp} } -\author{ -前川 将秀\thanks{神戸大学理学部数学科}, -野呂 正行\thanks{富士通研究所}, -小原 功任\thanks{金沢大学理学部計算科学教室}, \\ -奥谷 行央 -%\thanks{神戸大学大学院自然科学研究科博士課程前期課程数学専攻}, -\thanks{神戸大学大学院自然科学研究科数学専攻}, -高山 信毅\thanks{神戸大学理学部数学教室}, -田村 恭士 -%\thanks{神戸大学大学院自然科学研究科博士課程後期課程情報メディア科学専攻計算システム講座} -\thanks{神戸大学大学院自然科学研究科情報メディア科学専攻} -} -\date{1999年11月25日} -%\pagestyle{empty} +\art{} \begin{document} \maketitle + \section{OpenXMとは} -OpenXM は数学プロセス間でメッセージを交換するための規約である。 -数学プロセス間でメッセージをやりとりすることにより、 -ある数学プロセスから他の数学プロセスを呼び出して計算を行なったり、 -他のマシンで計算を行なわせたりすることが目的である。 -なお、 OpenXM とは Open message eXchange protocol for Mathematics の略である。 -OpenXM の開発の発端は野呂と高山により、 -asir と kan/sm1 を相互に呼び出す機能を実装したことである。 +OpenXM は数学プロセス間でメッセージを交換するための規約である. 数学プロ +セス間でメッセージをやりとりすることにより, ある数学プロセスから他の数学 +プロセスを呼び出して計算を行なったり, 他のマシンで計算を行なわせたりする +ことが目的である. なお, OpenXM とは Open message eXchange protocol for +Mathematics の略である. OpenXM の開発の発端は野呂と高山により, asir と +kan/sm1 を相互に呼び出す機能を実装したことである. -{\bf\large 以下の説明がなぜ必要なのかは全然分からないけれど、} -初期の実装では、相手側のローカル言語の文法に従った文字列を送っていた。こ -の方法では相手側のソフトが asir なのか kan/sm1 なのかを判別するなどして、 -相手側のローカル言語の文法に合わせた文字列を作成しなければならない。この -ローカル言語の文法に従った文字列を送る方法は、効率的であるとはいい難いが、 -使いやすいとも言える。 +初期の実装では, 相手側のローカル言語の文法に従った文字列を送っていた. +この方法では相手側のソフトが asir なのか kan/sm1 なのかを判別するなどし +て, 相手側のローカル言語の文法に合わせた文字列を作成しなければならない. +このローカル言語の文法に従った文字列を送る方法は, 効率的であるとはいい難 +いが, 使いやすいとも言える. -現在の OpenXM 規約では共通表現形式によるメッセージを用いている。上記の文 -字列を送る方法の利点を生かすため、OpenXM 規約では共通表現形式の中の文字 -列として、ローカル言語の文法に従った文字列を用いたメッセージの交換も可能 -となっている。{\large\bf しかし、こんな細かいことをここで説明しなければ -ならない理由がやっぱり分からないなぁ。構成的におかしいと思うけどなぁ。意 -味不明。} +現在の OpenXM 規約では共通表現形式によるメッセージを用いている. 上記の +文字列を送る方法の利点を生かすため, OpenXM 規約では共通表現形式の中の文 +字列として, ローカル言語の文法に従った文字列を用いたメッセージの交換も可 +能となっている. -OpenXM 規約では通信の方法に幾らかの自由度があるが、現在のところは TCP/IP -を用いた通信しか実装されていない。そこで、この論文では具体的な実装は -TCP/IP を用いていると仮定する。 +OpenXM 規約では通信の方法に幾らかの自由度があるが, 現在のところは TCP/IP +を用いた通信しか実装されていない. \footnote{asir には MPI を用いた実装 +もある.} そこで, この論文では具体的な実装は TCP/IP を用いていると仮定す +る. \section{OpenXM のメッセージの構造} -OpenXM で規定されている TCP/IP 実装によるメッセージはバイトストリームと -なっており、次のような構造になっている。 +通信の方法によってメッセージの構造は変わる. この論文では TCP/IP の場合 +についてのみ説明を行なう. +OpenXM 規約で規定されているメッセージはバイトストリームとなっており, 次 +のような構造になっている. + \begin{tabular}{|c|c|} \hline ヘッダ & \hspace{10mm} ボディ \hspace{10mm} \\ \hline \end{tabular} -ヘッダの長さは 8 バイトであると定められている。 -ボディの長さはメッセージごとに異なっているが、 -長さは $0$ でもよい。 +ヘッダの長さは 8 バイトであると定められている. ボディの長さはメッセージ +ごとに異なっているが, 長さは $0$ でもよい. -ヘッダは次の二つの情報を持っている。 +ヘッダは次の二つの情報を持っている. \begin{enumerate} -\item 前半の 4 バイト。メッセージの種類を表わす識別子であり、 - タグと呼ばれる。 -\item 後半の 4 バイト。メッセージにつけられた通し番号である。 +\item +前半の 4 バイト. メッセージの種類を表わす識別子であり, タグと呼ばれる. +\item +後半の 4 バイト. メッセージにつけられた通し番号である. \end{enumerate} -それぞれの 4 バイトは 32 ビット整数とみなされて扱われる。 -この場合に用いられる整数の表現方法の説明については後述するが、 -基本的に表現方法はいくつかの選択肢から選ぶことが可能となっており、 -またその選択は通信路の確立時に一度だけなされることに注意しなければならない。 -現在のOpenXM 規約では、タグ(整数値)として -以下のものが定義されている。 +それぞれの 4 バイトは 32 ビット整数とみなされて扱われる. -\begin{verbatim} +この場合に用いられる 32 ビット整数の表現方法について説明しておこう. 問 +題になるのは負数の表現とバイトオーダーの問題である. まず, 負数を表す必 +要があるときには2の補数表現を使うことになっている. 次にバイトオーダーで +あるが, OpenXM 規約は複数のバイトオーダーを許容する. ただし一つの通信路 +ではひとつのバイトオーダーのみが許され, 通信路の確立時に一度だけ選ばれる. -#define OX_COMMAND 513 -#define OX_DATA 514 -足りないものは追加しましょう。怠けてはダメよ。 +現在のOpenXM 規約では, タグ(整数値)として以下のものが定義されている. +\begin{verbatim} +#define OX_COMMAND 513 +#define OX_DATA 514 +#define OX_SYNC_BALL 515 +#define OX_DATA_WITH_LENGTH 521 +#define OX_DATA_OPENMATH_XML 523 +#define OX_DATA_OPENMATH_BINARY 524 +#define OX_DATA_MP 525 \end{verbatim} -ボディの構造はメッセージの種類によって異なる。 -この論文では、OX\_DATA と OX\_COMMAND で識別されるメッセージについてのみ、 -説明する。 +ボディの構造はメッセージの種類によって異なる. OX\_COMMAND で識別される +メッセージはスタックマシンへの命令であり, それ以外のメッセージは何らかの +オブジェクトを表している. この論文では OX\_DATA と OX\_COMMAND で識別さ +れるメッセージについてのみ, 説明する. -既存のメッセージでは対応できない場合は、新しい識別子を定義することで新し -い種類のメッセージを作成することができる。この方法は各数学ソフトウェアの -固有の表現を含むメッセージを作成したい場合などに有効である。新しい識別子 -の定義方法については、\cite{OpenXM-1999} を参照すること。 +既存のメッセージでは対応できない場合は, 新しい識別子を定義することで新し +い種類のメッセージを作成することができる. この方法は各数学ソフトウェアの +固有の表現を含むメッセージを作成したい場合などに有効である. 新しい識別子 +の定義方法については, \cite{OpenXM-1999} を参照すること. + \section{OpenXM の計算モデル} -%{\Huge この節では計算モデルの話をしなければいけません} +OpenXM 規約での計算とはメッセージを交換することである. また, OpenXM 規 +約ではクライアント・サーバモデルを採用しているので, メッセージの交換はサー +バとクライアントの間で行なわれる. クライアントからサーバへメッセージを送 +り, クライアントがサーバからメッセージを受け取ることによって計算の結果が +得られる. このメッセージのやりとりはクライアントの主導で行われる. つまり, +クライアントは自由にメッセージをサーバに送付してもよいが, サーバからは自 +発的にメッセージが送付されることはない. この原理はサーバはスタックマシン +であることで実現される. スタックマシンの構造については \ref{sec:oxsm} 節 +で述べる. -OpenXM 規約での計算とはメッセージを交換することである。また、 OpenXM 規 -約ではクライアント・サーバモデルを採用しているので、メッセージの交換はサー -バとクライアントの間で行なわれる。クライアントからサーバへメッセージを送 -り、クライアントがサーバからメッセージを受け取ることによって計算の結果が -得られる。 +サーバがクライアントから受け取ったオブジェクト(つまり OX\_COMMAND でない +メッセージのボディ)はすべてスタックに積まれる. スタックマシンへの命令 +(OX\_COMMAND で識別されるメッセージのボディ)を受け取ったサーバは命令に対 +応する動作を行なう. このとき, 命令によってはスタックからオブジェクトを取 +り出すことがあり, また(各数学システムでの)計算結果をスタックに積むことが +ある. もし, 与えられたデータが正しくないなどの理由でエラーが生じた場合に +はサーバはエラーオブジェクトをスタックに積む. 計算結果をクライアントが得 +る場合にはスタックマシンの命令 SM\_popCMO または SM\_popString をサーバ +に送らなければならない. これらの命令を受け取ってはじめて, サーバからクラ +イアントへメッセージが送られる. -サーバはスタックマシンである。サーバがクライアントから受け取ったメッセー -ジは、タグが OX\_COMMAND でなければすべてスタックに積まれる。タグが -OX\_COMMAND となっているメッセージはスタックマシンへの命令であり、このメッ -セージを受け取ったサーバはそれに対応する動作を行なうことが期待されている。 -サーバはメッセージを受け取らない限り、自ら何か動作をおこなわない。 +まとめると, クライアントがサーバへメッセージを送り, 計算の結果を得るとい +う手順は以下のようになる. -{\large\bf 意味不明な書き方だけど、} これは毎回サーバへメッセージを送る -たびに、いつもサーバからのメッセージをクライアントが待つ必要がないことを -意味する。このため、クライアントはサーバの状態を気にせずにメッセージを送 -り、一旦メッセージを送付し終えた後、サーバへ送ったメッセージの結果をサー -バから待つことなしに次の動作に移ることができる。 +\begin{enumerate} +\item +まず, クライアントがサーバへオブジェクトを送る. サーバは送られてきたオ +ブジェクトをスタックに積む. +\item +クライアントがサーバに計算の命令を送ると, サーバはあらかじめ定めれらた動 +作を行う. 一部の命令はスタックの状態を変更する. 例えば +SM\_executeFunction, \\ SM\_executeStringByLocalParser などの命令は, ス +タック上のオブジェクトから計算を行う. SM\_popCMO もしくは SM\_popString +は, スタックの最上位のオブジェクトを取りだし, クライアントに送り返す. +\end{enumerate} -\section{OpenXM の計算の進行方法} -前の節と重複しているのでもう少しちゃんと考えて欲しいのだけれど、 +\section{OpenXM スタックマシン}\label{sec:oxsm} -サーバが行うのは基本的に次の事柄だけである。 -クライアントからメッセージを受け取ると、 -サーバはまずメッセージの識別子を調べ、 -タグが OX\_COMMAND のメッセージでなければスタックに積む。 -タグが OX\_COMMAND のメッセージであればメッセージのボディから -スタックマシンの命令コードを取りだし、 -あらかじめ規約で定められた動作を行なう。 +OpenXM 規約ではサーバはスタックマシンであると定義している. 以下, OpenXM +スタックマシンと呼ぶ. この節ではOpenXM スタックマシンの構造について説明 +しよう. -上の説明でわかるように、 -サーバはクライアントからの指示なしに、 -自らメッセージを送らないことに注意する必要がある。 -%(例外? ox\_asir の mathcap)。 +まず, OpenXM 規約は通信時にやりとりされる共通のデータ形式については規定 +するが, OpenXM スタックマシンがスタックに積む, オブジェクトの構造までは +規定しない. つまり, オブジェクトの構造は各数学システムごとに異なっている +ということである. このことは通信路からデータを受け取った際に, 各数学シス +テムが固有のデータ構造に変換してからスタックに積むことを意味する. この変 +換は1対1対応である必要はない. -サーバがクライアントから受け取ったメッセージはすべてスタックに積まれている。 -次いでサーバにスタックマシンへの命令を送ると、 -初めてサーバはデータをスタックに積む以外のなんらかの動作を行なう。 -このとき、必要があればサーバはスタックから必要なだけデータを取り出す。 -ここで、クライアントからの命令による動作中にたとえエラーが発生したとしても -サーバはエラーオブジェクトをスタックに積むだけで、 -明示されない限りエラーをクライアントへ返さないことに注意しなければならない。 +次に OpenXM スタックマシンの命令コードについて説明する. OpenXM スタック +マシンにおけるすべての命令は4バイトの長さを持つ. OpenXM 規約の他の規定と +同様に, 4バイトのデータは32ビット整数と見なされるので, この論文でもその +表記にしたがう. OpenXM スタックマシンに対する命令はスタックに積まれるこ +とはない. 現在のところ, OpenXM 規約では以下の命令が定義されている. -結果が生じる動作をサーバが行なった場合、 -サーバは動作の結果をスタックに積む。 -サーバに行なわせた動作の結果をクライアントが知りたい場合、 -スタックからデータを取り出し送信を行なう命令をサーバ側へ送ればよい。 +\begin{verbatim} +#define SM_popSerializedLocalObject 258 +#define SM_popCMO 262 +#define SM_popString 263 -%{\Huge 以下、書き直し} +#define SM_mathcap 264 +#define SM_pops 265 +#define SM_setName 266 +#define SM_evalName 267 +#define SM_executeStringByLocalParser 268 +#define SM_executeFunction 269 +#define SM_beginBlock 270 +#define SM_endBlock 271 +#define SM_shutdown 272 +#define SM_setMathCap 273 +#define SM_executeStringByLocalParserInBatchMode 274 +#define SM_getsp 275 +#define SM_dupErrors 276 -クライアントがサーバへメッセージを送り、 -計算の結果を得るという手順を追っていくと次のようになる。 +#define SM_DUMMY_sendcmo 280 +#define SM_sync_ball 281 -\begin{enumerate} -\item まず、クライアントがサーバへメッセージを送る。 - サーバは送られてきたメッセージをスタックに積む。 -\item クライアントがサーバにスタックマシンへの命令を送ると、 - サーバは必要なだけスタックからデータを取り出し、 - 実行した結果をスタックに積む。 -\item 最後に「スタックからデータを取り出し送信を行なう命令」を - サーバへ送ると、サーバはスタックから計算結果の入っている - データを取り出し、クライアントへ送出する。 -\end{enumerate} +#define SM_control_kill 1024 +#define SM_control_to_debug_mode 1025 +#define SM_control_exit_debug_mode 1026 +#define SM_control_ping 1027 +#define SM_control_start_watch_thread 1028 +#define SM_control_stop_watch_thread 1029 +#define SM_control_reset_connection 1030 +\end{verbatim} +スタックマシンに対する命令の中には実行によって結果が返ってくるものがある. +結果が返ってくる命令を実行した場合, サーバはその結果をスタックに積む. +たとえば, 命令 SM\_executeStringByLocalParser はスタックに積まれているオ +ブジェクトをサーバ側のローカル言語の文法に従った文字列とみなして計算を行 +なうが, 行なった計算の結果はスタックに積まれる. -\section{CMO のデータ構造} +なお, 命令の実行中にエラーが起こり, 結果が得られなかった場合には, +エラーオブジェクトがスタックに積まれる. -OpenXM 規約では、数学的オブジェクトを表現する方法として -CMO 形式(Common Mathematical Object format)を定義している。 -この CMO 形式を使ってメッセージを送るには、 -タグを OX\_DATA にすればよい。 -CMO 形式におけるメッセージのボディ部分について以下で説明するが、 -%OpenXM 規約で定義されているメッセージを実際に作成する場合、 -CMO 形式で定義されている多倍長整数を理解しておくと、 -CMO 形式の他のデータ構造だけでなく、 -OpenXM 規約で定義されている様々なデータ構造を理解する助けになると思えるので、 -ここでは CMO 形式の多倍長整数のデータ構造についてのみ説明する。 +\section{CMO のデータ構造}\label{sec:cmo} -CMO 形式で定義されているデータは多倍長整数以外にも -文字列やリスト構造などがある。どのようなデータであるかは -データの先頭にある(メッセージの識別子とは別にある)タグを見れば -判別できるようになっている。 -これはメッセージの種類の判別の仕方とおなじである。 -なお、タグは各データ毎に 32 bit の整数で表されており、 -多倍長整数は 20 となっている。 -よく使われると思われる CMO 形式のタグをあげておく。 -\begin{verbatim} -#define CMO_INT32 2 /* 32 ビット整数 */ -#define CMO_STRING 4 /* 文字列 */ -#define CMO_LIST 17 /* リスト構造 */ -#define CMO_ZZ 20 /* 多倍長整数 */ -\end{verbatim} +OpenXM 規約では, 数学的オブジェクトを表現する方法として CMO 形式(Common +Mathematical Object format)を定義している. この CMO 形式にしたがったデー +タは, 識別子が OX\_DATA であるようなメッセージのボディになることを想定し +ている. -ここで TCP/IP 実装における 32 bit の整数の -表現方法について説明する必要がある。 -OpenXM 規約の TCP/IP 実装ではバイトストリームで 32 bit の整数 20 を -{\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。 -この表現方法の違いはクライアントとサーバの最初の接続時に -双方の合意で決定することになっている。 -なお、合意がない場合には前者の表現方法 -(以後、この表現方法をネットワークバイトオーダーと呼ぶ)を -使うことになっている。 -また、負の数を表現する必要があるときには、 -2 の補数表現を使うことになっている。 +CMO 形式におけるデータ構造は次のような構造をもつ. -CMO 形式の多倍長整数は、 Gnu MPライブラリ等を参考にしており、 -符合付き絶対値表現を用いている。 -タグ以降の形式は次のようになる。 - -\begin{tabular}{|c|c|c|c|c|} \hline -$f$ & $b_0$ & $b_1$ & $\cdots$ & $b_{n-1}$ \\ \hline +\begin{tabular}{|c|c|} \hline +ヘッダ & \hspace{10mm} ボディ \hspace{10mm} \\ \hline \end{tabular} -ここで、 1 つの枠は 4 バイトを表し、 -$f$ は符合付き 32 ビット整数を、 -$b_0$, $b_1$, $\cdots$, $b_{n-1}$ は符合なし 32 ビット整数を表している。 -さらに、 $|f| = n$ が成り立たなければならない。 -このオブジェクトは -\[ \mbox{sgn}(f) \times \{ b_0 (2^{32})^0 + b_1 (2^{32})^1 + \cdots - + b_{n-1} (2^{32})^{n-1} \} \] -という整数であると定義されている。 -ただし、 -\[ \mbox{sgn}(f) = \left\{ \begin{array}{ll} - 1 & f>0 \\ - 0 & f=0 \\ - -1 & f<0 \\ \end{array} \right. \] -である。 +ヘッダは4バイトである. ボディの長さはそれぞれのデータによって異なるが, +0でもよい. -ここで具体例をだそう。 -$4294967298 = 1 \times 2^{32} + 2$ を CMO 形式の -ネットワークバイトオーダー、多倍長整数で表現すると、 -\begin{center} - {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01} -\end{center} -となる。また、同じ表現方法で $-1$ を表現すると、 -\begin{center} - {\tt 00 00 00 14 ff ff ff ff 00 00 00 01} -\end{center} -となる。 +メッセージと同様にヘッダは4バイト単位に管理される. すなわち, CMO ではヘッ +ダは一つだけの情報を含む. この4バイトのヘッダのことをタグともいう. さて, +CMO では, タグによってボディの論理的構造が決定する. すなわち, タグはそれ +ぞれのデータ構造と1対1に対応する識別子である. それぞれの論理的構造は +\cite{OpenXM-1999} に詳述されている. 現在の OpenXM 規約では以下の CMO が +定義されている. +\begin{verbatim} +#define CMO_ERROR2 0x7f000002 +#define CMO_NULL 1 +#define CMO_INT32 2 +#define CMO_DATUM 3 +#define CMO_STRING 4 +#define CMO_MATHCAP 5 -\section{mathcap について} +#define CMO_START_SIGNATURE 0x7fabcd03 +#define CMO_ARRAY 16 +#define CMO_LIST 17 +#define CMO_ATOM 18 +#define CMO_MONOMIAL32 19 +#define CMO_ZZ 20 +#define CMO_QQ 21 +#define CMO_ZERO 22 +#define CMO_DMS_GENERIC 24 +#define CMO_DMS_OF_N_VARIABLES 25 +#define CMO_RING_BY_NAME 26 +#define CMO_RECURSIVE_POLYNOMIAL 27 +#define CMO_LIST_R 28 -OpenXM 規約では、通信時に用いられるメッセージの種類を各ソフトウェアが制 -限する方法を用意している。これは各ソフトウェアの実装によってはすべてのメッ -セージをサポートするのが困難な場合があるからである。また、各ソフトウェア -でメッセージの種類を拡張したい場合にも有効である。 -この制限(あるいは拡張)は mathcap と呼ばれるデータ構造によって行われる。 -この節では mathcap のデータ構造と、具体的なメッセージの制限の手続きにつ -いて説明する。 +#define CMO_INT32COEFF 30 +#define CMO_DISTRIBUTED_POLYNOMIAL 31 +#define CMO_POLYNOMIAL_IN_ONE_VARIABLE 33 +#define CMO_RATIONAL 34 -まず、手続きについて説明しよう。 +#define CMO_64BIT_MACHINE_DOUBLE 40 +#define CMO_ARRAY_OF_64BIT_MACHINE_DOUBLE 41 +#define CMO_128BIT_MACHINE_DOUBLE 42 +#define CMO_ARRAY_OF_128BIT_MACHINE_DOUBLE 43 -\begin{quote} -説明。説明。説明。説明。説明。 -説明。説明。説明。説明。説明。 -説明。説明。説明。説明。説明。 -説明。説明。説明。説明。説明。 -\end{quote} +#define CMO_BIGFLOAT 50 +#define CMO_IEEE_DOUBLE_FLOAT 51 -次に mathcap のデータ構造について説明する。 +#define CMO_INDETERMINATE 60 +#define CMO_TREE 61 +#define CMO_LAMBDA 62 +\end{verbatim} +この中で CMO\_ERROR2, CMO\_NULL, CMO\_INT32, CMO\_DATUM, CMO\_STRING, +CMO\_MATHCAP, CMO\_LIST で識別されるオブジェクトは最も基本的なオブジェ +クトであって, すべての OpenXM 対応システムに実装されていなければならない. + +これらについての解説を行う前に記法について, 少し説明しておく. +この論文では, 大文字で CMO\_INT32 と書いた場合には, 上記で定義した識別子 +を表わす. また CMO\_INT32 で識別されるオブジェクトのクラス(あるいはデー +タ構造)を cmo\_int32 と小文字で表わすことにする. + +さて cmo を表現するための一つの記法を導入する. この記法は CMO expression +と呼ばれている. その正確な形式的定義は \cite{OpenXM-1999} を参照すること. + +まず CMO expssion は Lisp 風表現の一種で, cmo を括弧で囲んだリストとし +て表現する. それぞれの要素はカンマで区切る. +例えば, \begin{quote} -説明。説明。説明。説明。説明。 -説明。説明。説明。説明。説明。 -説明。説明。説明。説明。説明。 -説明。説明。説明。説明。説明。 +(17, {\sl int32}, (CMO\_NULL), (2, {\sl int32} $n$)) \end{quote} +は CMO expression である. ここで, 小文字の斜体で表された``{\sl int32}'' +は 4バイトの任意のデータを表す記号であり, ``{\sl int32} $n$'' は同じく 4 +バイトのデータであるが以下の説明で $n$ と表すことを示す. また数字 17, 2 +などは 4バイトのデータで整数値としてみたときの値を意味する. CMO\_NULL は +識別子(すなわち数字 1 と等価)である. この記法から上記のデータは 20 バイ +トの大きさのデータであることが分かる. なお, CMO expression は単なる表記 +法であることに特に注意してほしい. -具体的な mathcap の例をあげる。 - +さて, この記法のもとで cmo\_int32 を次のデータ構造であると定義する. \begin{quote} -説明。説明。説明。説明。説明。 -説明。説明。説明。説明。説明。 -説明。説明。説明。説明。説明。 -説明。説明。説明。説明。説明。 +cmo\_int32 := (CMO\_INT32, {\sl int32}) \end{quote} +同様に, cmo\_null, cmo\_string, cmo\_list, cmo\_mathcap のシンタッ +クスは次のように定義される. +\begin{quote} +cmo\_null := (CMO\_NULL) \\ +cmo\_string := (CMO\_STRING, {\sl int32} $n$, {\sl string} $s$) \\ +cmo\_list := (CMO\_LIST, {\sl int32} $m$, {\sl cmo} $c_1$, $\ldots$, +{\sl cmo} $c_m$) \\ +cmo\_mathcap := (CMO\_MATHCAP, {\sl cmo\_list}) +\end{quote} +ただし, {\sl string}は適当な長さのバイト列を表す. $s$ のバイト長は $n$ +と一致することが要求される. +\section{mathcap について} -{\large\bf これより以降は意味不明で私にはよく分かりませんでしたので、 -たぶん読者も分からないでしょうね、というのはいいとして、} -CMO 形式で定義されている mathcap データは -受け取ることができるデータ形式を表すデータであり、 -要求されればサーバはサーバ自身の mathcap データをスタックに積む。 -また、クライアントから mathcap データをサーバへ送ることもでき、 -mathcap データをサーバとクライアントの間で交換することによって、 -お互いに相手側が受け取ることができないデータ形式で -メッセージを送ってしまうのを防ぐことができる。 -なお、 mathcap データの中では CMO 形式で定義されている -32 bit 整数、文字列、リスト構造が使われており、 -mathcap データに含まれている内容を理解できるためには -必然的にこれらも理解できる必要がある(ってことは CMO 形式のところでこれら -を説明しなければならないってことですね、田村君)。 +OpenXM 規約では, 通信時に用いられるメッセージの種類を各ソフトウェアが制 +限する方法を用意している. これは各ソフトウェアの実装によってはすべてのメッ +セージをサポートするのが困難な場合があるからである. また, 各ソフトウェア +でメッセージの種類を拡張したい場合にも有効である. この制限(あるいは拡張) +は mathcap と呼ばれるデータ構造によって行われる. この節では mathcap のデー +タ構造と, 具体的なメッセージの制限の手続きについて説明する. -OpenXM 対応版の asir サーバである ox\_asir が返す mathcap を以下に示す。 +では, 手続きについて説明しよう. -なお、 $a_1$, $a_2$, $\cdots$, $a_n$ を要素に -持つリスト構造を {\tt [$a_1$, $a_2$, $\cdots$, $a_n$]} 、 -文字列 ``string'' を {\tt "string"} 、 32 bit 整数を -それに対応する 10 進数の整数で示す。 +第一にサーバの機能を制限するには次のようにする. クライアントが mathcap +オブジェクトをサーバへ送ると, サーバは受け取ったmathcap をスタックに積む. +次にクライアントが命令 SM\_setMathCap を送ると, サーバはスタックの最上位 +に積まれている mathcap オブジェクトを取り出し, mathcap で設定されていな +いメッセージをクライアントへ送らないように制限を行う. -%↓手で作ったので間違えている可能性あり。 -%%古いバージョン。差し替えの必要あり。 -\begin{verbatim} -[ [199901160,"ox_asir"], - [276,275,258,262,263,266,267,268,274 - ,269,272,265,264,273,300,270,271], - [ [514,[1,2,3,4,5,2130706433,2130706434 - ,17,19,20,21,22,24,25,26,31,27,33,60]], - [2144202544,[0,1]] - ] -] -\end{verbatim} +第二にクライアントを制限するには次のようにする. クライアントがサーバに命令 \\ +SM\_mathcap を送ると, サーバは mathcap オブジェクトをスタックに積む. +さらに命令 SM\_popCMO を送ると, サーバはスタックの最上位のオブジェクト +(すなわち mathcap オブジェクト)をボディとするメッセージをクライアントに +送付する. クライアントはそのオブジェクトを解析して, 制限をかける. -この mathcap データのリスト構造は大きく分けて 3 つの部分に分かれる。 -最初の {\tt [199901160,"ox\_asir"]} の部分にはサーバの情報が入っている。 -%この最初の要素がまたリスト構造となっており、 -最初の要素はバージョンナンバーを、次の要素はサーバの名前を表している。 +次に mathcap のデータ構造について説明する. +mathcap は cmo の一種であるので, すでに説明したように +\begin{quote} +cmo\_mathcap := (CMO\_MATHCAP, {\sl cmo\_list}) +\end{quote} +の構造をもつ(\ref{sec:cmo} 節を参照のこと). +ボディは cmo\_list オブジェクトでなければならない. -次の {\tt [276,275,$\cdots$,271]} の部分は -スタックマシンに対する命令のうち、利用可能な命令の種類を表している。 -スタックマシンへの命令はすべて 32 ビットの整数で表しており、 -このリストは利用可能な命令に対応する 32 ビットの整数のリストとなっている。 +さて, mathcap オブジェクトのボディの cmo\_list オブジェクトは以下の条件 +を満たすことを要求される. まず, その cmo\_list オブジェクトは少なくとも +リスト長が 3 以上でなければならない. +\begin{quote} +(CMO\_LIST, {\sl int32}, {\sl cmo} $a$, {\sl cmo} $b$, {\sl cmo} $c$, $\ldots$) +\end{quote} -最後の {\tt [ [514,[1,2,3,$\cdots$,60]],[2144202544,[0,1]] ]} の部分は -理解可能なデータの形式を表している。 -この部分はさらに {\tt [514,[1,2,3,$\cdots$,60]]} と -{\tt [2144202544,[0,1]]} にの部分に分けることができ、 -それぞれが一つのデータ形式についての情報となっている。 -どのデータ形式についての情報かは最初の要素にある整数値をみれば -分かるようになっている。 -この整数値は CMO 形式では 514 となっている。 -最初のデータ形式を区別する整数値以後の要素は -各データ形式によってどのように使われるか定まっている。 -CMO 形式では理解可能なデータのタグがリストの中に収まっている。 -前節で CMO 形式では多倍長整数を表すタグが 20 であることを述べたが、 -このリストに 20 が含まれているので、 -ox\_asir は CMO 形式の多倍長整数を受け取れることがわかる。 +第一要素 $a$ はまた cmo\_list であり, リスト長は 4 以上, $a_1$ は +cmo\_int32 でバージョンを表す. $a_2$, $a_3$, $a_4$ は cmo\_string であり, +それぞれシステムの名前, バージョン, HOSTTYPE を表すことになっている. +\begin{quote} +(CMO\_LIST, {\sl int32}, +{\sl cmo\_int32} $a_1$, {\sl cmo\_string} $a_2$, {\sl cmo\_string} +$a_3$, {\sl cmo\_string} $a_4$, $\ldots$) +\end{quote} -なお、データが受け取れることと、 -データの論理構造が理解できることとはまったく別物であるので -注意する必要がある。 +第二要素 $b$ の部分は次のようなリスト構造をしている. +この $b_1$, $b_2$, $\ldots$, $b_n$ はすべて cmo\_int32 である. +\ref{sec:oxsm} 節で説明したが, +スタックマシンへの命令はすべて {\sl int32} で表されていたことに注意しよ +う. 各 $b_i$ は利用可能な命令をボディとした cmo\_int32 となっている. +\begin{quote} +(CMO\_LIST, {\sl int32} $n$, + {\sl cmo\_int32} $b_1$, {\sl cmo\_int32} $b_2$, + $\ldots$, {\sl cmo\_int32} $b_n$) +\end{quote} +第三要素 $c$ は以下のようなリスト構造をしていなければならない. +\begin{quote} +(CMO\_LIST, {\sl int32} $m$, + {\sl cmo\_list} $list_1$, {\sl cmo\_list} $list_2$, + $\ldots$, {\sl cmo\_list} $list_m$) +\end{quote} +どの $list_i$ も 1 つ以上の要素を持っており, +1 番目の要素は必ず cmo\_int32 となっていなければならない. +これは受け取れるオブジェクトのメッセージの識別子を +入れるためである. +ここでは, OX\_DATA の場合についてのみ説明する. + +1 番目の要素が OX\_DATA の場合, +リスト $list_i$ は以下のような構造となっている. +各 $c_{ij}$ は cmo\_int32 であり, +受け取ることが可能な CMO 形式のタグとなる. +\begin{quote} +(CMO\_LIST, 2, (CMO\_INT32, OX\_DATA), \\ +\ \ (CMO\_LIST, {\sl int32} $k$, + {\sl cmo\_int32} $c_{i1}$, {\sl cmo\_int32} $c_{i2}$, + $\ldots$, {\sl cmo\_int32} $c_{ik}$)) +\end{quote} + +具体的な mathcap の例をあげよう. 名前が ``ox\_test'', バージョンナンバー +が 199911250 のサーバで, PC-UNIX 上で動いており, +このサーバのスタックマシンが命令 SM\_popCMO, SM\_popString, +SM\_mathcap, SM\_executeStringByLocalParser を利用可能, +かつ cmo\_int32, cmo\_string, cmo\_mathcap, cmo\_list のみに制限したい +ときの mathcap は +\begin{quote} +(CMO\_LIST, 3, \\ +\ \ (CMO\_LIST, 4, (CMO\_INT32, $199911250$), (CMO\_STRING, 7, "ox\_test"), \\ +\ \ \ \ (CMO\_STRING, 9, "199911250"), (CMO\_STRING, 4, "i386")) \\ +\ \ (CMO\_LIST, $5$, (CMO\_INT32, SM\_popCMO), \\ +\ \ \ \ (CMO\_INT32, SM\_popString), (CMO\_INT32, SM\_mathcap), \\ +\ \ \ \ (CMO\_INT32, SM\_executeStringByLocalParser)) \\ +\ \ (CMO\_LIST, $1$, \\ +\ \ \ \ (CMO\_LIST, $2$, (CMO\_INT32, OX\_DATA), \\ +\ \ \ \ \ \ (CMO\_LIST, $4$, (CMO\_INT32, CMO\_INT32), \\ +\ \ \ \ \ \ \ \ (CMO\_INT32, CMO\_STRING), (CMO\_INT32, CMO\_MATHCAP), \\ +\ \ \ \ \ \ \ \ (CMO\_INT32, CMO\_LIST))))) +\end{quote} +になる. + + \section{セキュリティ対策} -OpenXM 規約は TCP/IP を用いて通信を行うことを考慮している規約である。 -ネットワークによって接続される現代の多くのソフトウェアと同様、 -OpenXM 規約もまた通信時のセキュリティについて注意している。 -以下、このことについて説明しよう。 +OpenXM 規約は TCP/IP を用いて通信を行うことを考慮している. ネットワーク +によって接続される現代の多くのソフトウェアと同様, OpenXM 規約もまた通信 +時のセキュリティについて注意している. 以下, このことについて説明しよう. -{\large\bf 意味不明なことを書いているが、} -侵入者に攻撃の機会をできるだけ与えないようするた -めに、接続が必要になった時のみ接続を待つようにし、 -常に接続に関与するといったことは避けている(やっぱり意味不明である)。 +第一に OpenXM では侵入者に攻撃の機会をできるだけ与えないようにするため, +サーバは接続が必要になった時のみ起動している. しかし, これだけでは接続 +を行なう一瞬のすきを狙われる可能性もある. そこで接続を行なう時に, 接続 +を行なうポート番号を毎回変えている. こうすることで, 特定のポート番号を +狙って接続を行なう手口を防ぐことができる. -また、侵入者が接続を行なう一瞬のすきを狙ってくる可能性もあるので、 -接続を行なう時に接続を待つポート番号をランダムに決めている(誰が決めてい -るのかはやっぱり不明であるが)。 -さらにもう一段安全性を高めるために、 -接続時に 1 回だけ使用可能なパスワードを作成し、 -そのパスワードを使って認証を行なう(誰がパスワードを決めて誰が認証を行っ -ているのかが不明だけど)。 -このパスワードは一旦使用されれば無効にするので、 -もし仮になんらかの手段でパスワードが洩れたとしても安全だと考えている。 +さらにもう一段安全性を高めるために, 接続時に一時パスワードをクライアント +が作成し, そのパスワードを使って認証を行なう. このパスワードは一旦使用 +されれば無効になるので, もし仮になんらかの手段でパスワードが洩れたとして +も安全である. -%なお、上記のポート番号とパスワードは安全な手段で送られて -%いると仮定している。 -%また、同一のコンピュータ上に悪意のあるユーザはいないと仮定している -%ことに注意しなければならない。 -%なぜなら、現在の実装ではサーバ、およびクライアントの動作している -%コンピュータ上ではこのポート番号とパスワードがわかってしまうためである。 +なお, メッセージ自体には特に暗号化などの処置を行っていないので, そのまま +ではパケット盗聴などを受ける可能性がある. 現在の実装では, 必要ならば +ssh を利用して対応している. -なお、接続が確立した後のメッセージの送受信に関しては、 -特に暗号化などの処置を行っているわけではない。 -もし必要があれば、通信路の暗号化を行なう機能がある -ソフトウェア ssh を使うことを考えている。 \section{他のプロジェクト} -他のプロジェクトについても触れておこう。 +他のプロジェクトについても触れておこう. -OpenMath プロジェクトは数学的なオブジェクトを -コンピュータ上で表現する方法を決定している。 -各ソフトウェア間でオブジェクトを交換する際の -オブジェクトの変換手順についても述べられている。 -表現方法は一つだけでなく、 XML 表現や binary 表現などが -用意されている。 -詳細は +\begin{itemize} +\item ESPRIT OpenMath Project -http://www.openmath.org/omsoc/index.html A.M.Cohen +http://www.openmath.org/omsoc/ +数学的対象の SGML 的表記の標準化を目指した大規模なプロジェクト. 異なる種 +類の数式処理システムの間で情報を交換するときに, OpenMath で定義された表 +現を利用することができる. 実際の情報交換の手続きにはいろいろなものが考 +えられるが, 例えば MCP (Mathematical Computation Protocol) なる手続きが +考案されている. MCP によって送信されるデータは, 本文に OpenMath 形式で +数式を記述したテキストで, いささかメイルに似ていなくもない. 実際にこの +方法で GAP と Axiom の間で通信が行われている. -以下は書いてる途中。 +\item NetSolve -NetSolve - http://www.cs.utk.edu/netsolve/ +NetSolve はクライアント・サーバ型の分散システムであり, 単なる計算システ +ム以上のものを目指している. クライアントは必要に応じて, サーバを呼び出 +して計算をさせる. NetSolve の特徴は, サーバの呼び出しに Agent というソ +フトウェアを介在させることである. Agent は呼び出し先などを決定するデー +タベース的役割を果たす. また Agent によって負荷分散が可能になる. 現在 +の NetSolve は RPC を基礎にして実装されている. -MP +\item MP http://symbolicNet.mcs.kent.edu/SN/areas/protocols/mp.html +科学技術計算を行なうソフトウェア間で数学的なデータを効率的に交換 +させることを目的としたプロトコルを作成している. 木構造を用いて +簡単, かつ柔軟なものを目指しており, データの表現方法や交換方法に +負わずにソフトウェアを作ることができるようにしようとしている. +現在すでに, C 言語で利用可能なライブラリが提供されている. -MCP +\item MCP -http://horse.mcs.kent.edu/~pwang/ +http://horse.mcs.kent.edu/\~{}pwang/ +数学的な計算を行なうための HTTP スタイルのプロトコル. +クライアント・サーバモデルを採用しており, +ピアツーピアのストリームコネクションを行なう. +数学的なオブジェクトを MP や MathML で定められた方法で +表現することが考えられている. +すでに OpenMath を用いた実装が存在する. + +\end{itemize} + + \section{現在提供されているソフトウェア} -現在 OpenXM 規格に対応しているクライアントには -asir, sm1, Mathematica がある。 -これらのクライアントから -OpenXM 規格に対応したサーバを呼び出すことができる。 -現在 OpenXM 規約に対応しているサーバソフトウェアには、 - asir, sm1, gnuplot, Mathematica などがあり、 -それぞれ ox\_asir, ox\_sm1, ox\_math という名前で提供されている。 -また、 OpenMath 規格の XML 表現で表現されたデータと CMO 形式の -データを変換するソフトウェアが JAVA によって実装されており、 -OMproxy という名前で提供されている。 +現在 OpenXM 規約に対応しているクライアントにはasir, sm1, Mathematica がある. +これらのクライアントから OpenXM 規約に対応したサーバを呼び出すこと +ができる. 現在 OpenXM 規約に対応しているサーバソフトウェアには, asir, +sm1, gnuplot, Mathematica, PHC pack などがあり, +それぞれ ox\_asir, ox\_sm1, ox\_sm1\_gnuplot, ox\_math, ox\_sm1\_phc +という名前で提供されている. また, OpenMath +規約の XML 表現で表現されたオブジェクトと CMO 形式のオブジェクトを変換す +るソフトウェアが JAVA によって実装されており, OMproxy という名前で提供さ +れている. \begin{thebibliography}{99} -\bibitem{OpenXM-1999} -野呂正行, 高山信毅. -{Open XM の設計と実装 --- Open message eXchange protocol for Mathematics}, -1999/11/22 \bibitem{Ohara-Takayama-Noro-1999} -小原功任, 高山信毅, 野呂正行. -{Open asir 入門}, 1999, 数式処理, Vol 7, No 2, 2--17. (ISBN4-87243-086-7, SEG 出版, Tokyo). +小原功任, 高山信毅, 野呂正行: + {Open asir 入門}, 1999, 数式処理, + Vol 7, No 2, 2--17. (ISBN4-87243-086-7, SEG 出版, Tokyo). + +\bibitem{OpenXM-1999} +野呂正行, 高山信毅: + {Open XM の設計と実装 + --- Open message eXchange protocol for Mathematics}, + 1999/11/22 \end{thebibliography} \end{document}