version 1.4, 1999/12/18 12:57:48 |
version 1.111, 1999/12/28 08:02:49 |
|
|
\documentclass{jarticle} |
\documentclass{jarticle} |
|
|
\title{\bf Open XM($B%?%$%H%kL$Dj(B)} |
%% $OpenXM: OpenXM/doc/genkou19991125.tex,v 1.110 1999/12/27 11:05:43 tam Exp $ |
\author{ |
|
Maekawa \\ |
|
Noro \\ |
|
: \\ |
|
: \\ |
|
} |
|
\date{ 1999$BG/(B, 11$B7n(B25$BF|(B} |
|
|
|
%\pagestyle{empty} |
\usepackage{jssac} |
|
|
|
\title{OpenXM プロジェクトの現状について} |
|
\author{奥 谷 行 央\affil{神戸大学大学院自然科学研究科} |
|
\mail{okutani@math.sci.kobe-u.ac.jp} |
|
\and 小 原 功 任\affil{金沢大学理学部} |
|
\mail{ohara@kappa.s.kanazawa-u.ac.jp} |
|
\and 高 山 信 毅\affil{神戸大学理学部} |
|
\mail{takayama@math.sci.kobe-u.ac.jp} |
|
\and 田 村 恭 士\affil{神戸大学大学院自然科学研究科} |
|
\mail{tamura@math.sci.kobe-u.ac.jp} |
|
\and 野 呂 正 行\affil{富士通研究所} |
|
\mail{noro@para.flab.fujitsu.co.jp} |
|
\and 前 川 将 秀\affil{神戸大学理学部} |
|
\mail{maekawa@math.sci.kobe-u.ac.jp} |
|
} |
|
\art{} |
|
|
\begin{document} |
\begin{document} |
\maketitle |
\maketitle |
|
|
\section{OpenXM $B$N7W;;%b%G%k(B} |
\section{OpenXMとは} |
|
|
OpenXM $B$O?t3X%=%U%H4V$G%a%C%;!<%8$r8r49$9$k$?$a$N5,Ls$G$"$k!#(B |
OpenXM は数学プロセス間でメッセージを交換するための規約である. 数学プロ |
OpenXM $B$H$O(B Open message eXchange protocol for Mathematics $B$NN,$G$"$k!#(B |
セス間でメッセージをやりとりすることにより, ある数学プロセスから他の数学 |
$B?t3X%=%U%H4V$G%a%C%;!<%8$r$d$j$H$j$5$;$k$3$H$K$h$j!"(B |
プロセスを呼び出して計算を行なったり, 他のマシンで計算を行なわせたりする |
$B$"$k?t3X%=%U%H$+$iB>$N?t3X%=%U%H$r8F$S=P$7$F7W;;$r9T$J$C$?$j!"(B |
ことが目的である. なお, OpenXM とは Open message eXchange protocol for |
$BB>$N%^%7%s$G7W;;$r9T$J$o$;$?$j$G$-$k$h$&$K$9$k!#(B |
Mathematics の略である. OpenXM の開発の発端は野呂と高山により, asir と |
$BH/C<$OLnO$@59T$H9b;3?.5#$K$h$j!"(B asir $B$H(B kan/sm1 $B$r(B |
kan/sm1 を相互に呼び出す機能を実装したことである. |
$BAj8_$K8F$S=P$95!G=$r<BAu$7$?$3$H$G$"$k!#(B |
|
$B8=:_$NL\I8$O!"%U%j!<$N?t3X%=%U%H$rAj8_$K@\B3$7$F(B |
|
$B9%$-$J8@8l$+$i4JC1$KB>$N?t3X%=%U%H$r;H$($k$h$&$K$9$k$3$H$G$"$k!#(B |
|
|
|
$BH/C<$H$J$C$?(B asir $B$H(B kan/sm1 $B$G$N<BAu;~$K$O!"(B |
初期の実装では, 相手側のローカル言語の文法に従った文字列を送っていた. |
$B$*8_$$$KAj<jB&$N%3%^%s%IJ8;zNs$rAw$C$F$$$?!#(B |
この方法では相手側のソフトが asir なのか kan/sm1 なのかを判別するなどし |
$B$3$NJ}K!$O8=:_$N(B OpenXM $B5,Ls$G$b2DG=$G$"$j!"(B |
て, 相手側のローカル言語の文法に合わせた文字列を作成しなければならない. |
$B;H$$$d$9$/$O$"$k$,!"8zN(E*$G$"$k$H$O$$$$Fq$$!#(B |
このローカル言語の文法に従った文字列を送る方法は, 効率的であるとはいい難 |
$B$5$i$K!"$3$NJ}K!$G$OAj<jB&$N%=%U%H$,(B asir $B$J$N$+(B kan/sm1 $B$J$N$+$r(B |
いが, 使いやすいとも言える. |
$BH=JL$7$F!"Aj<jB&$K9g$o$;$F%3%^%s%IJ8;zNs$r:n@.$9$kI,MW$,$"$k!#(B |
|
|
|
$B$3$l0J30$NJ}K!$H$7$F!"(B OpenXM $B5,Ls$G$O6&DLI=8=7A<0$K$h$k(B |
現在の OpenXM 規約では共通表現形式によるメッセージを用いている. 上記の |
$B%a%C%;!<%8$rMQ0U$7$F$$$k!#(B |
文字列を送る方法の利点を生かすため, OpenXM 規約では共通表現形式の中の文 |
OpenXM $B5,LsFH<+$N%G!<%?7A<0$G$"$k(B CMO $B7A<0(B(Common Mathematical Object format) |
字列として, ローカル言語の文法に従った文字列を用いたメッセージの交換も可 |
$B0J30$K$b!"(B MP $B$d(B OpenMath $B$N(B XML, binary $BI=8=7A<0$H$$$C$?B>$N7A<0$r$b(B |
能となっている. |
$B07$($k$h$&$K$7$F$"$k!#(B |
|
|
|
|
OpenXM 規約では通信の方法に自由度があるが, 現在のところは TCP/IP を用い |
|
た通信しか実装されていない. |
|
\footnote{ただし asir には MPI を用いた実装もある.} |
|
そこで, この論文では TCP/IP を用いた実装に準拠してOpenXM の説明をする. |
|
|
\section{OpenXM $B$N%a%C%;!<%8$N9=B$(B} |
|
|
|
OpenXM $B$G5,Dj$7$F$$$k%a%C%;!<%8$OO@M}E*$K(B |
\section{OpenXM のメッセージの構造} |
OX $BAX!"(B SM $BAX!"(B CMO $BAX$KJ,$1$k$3$H$,$G$-$k!#(B |
|
$B$3$NCf$G!"%a%C%;!<%8$H$7$FAw$k$3$H$,2DG=$J$N$O(B |
|
OX $BAX$GDj5A$5$l$?$b$N$@$1$G$"$j!"(B |
|
SM $BAX!"(B CMO $BAX$GDj5A$5$l$F$$$k%G!<%?$O(B |
|
OX $BAX$GDj5A$5$l$F$$$k%G!<%?$N0lIt$KKd$a9~$^$l$F(B |
|
$BAw$i$l$k!#(B |
|
SM $BAX!"(B CMO $BAX$GDj5A$5$l$F$$$k%G!<%?0J30$K$b(B |
|
$BA0=R$N(B MP $B$d(B OpenMath $B$N(B XML, binary $BI=8=$b(B |
|
OX $BAX$KKd$a9~$^$l$FAw$i$l$k$o$1$G$"$k$,!"(B |
|
$B$I$N$h$&$J%G!<%?$,Kd$a9~$^$l$F$$$k$+$O!"(B |
|
OX $BAX$N@hF,$N(B tag $B$r8+$l$PH=JL$G$-$k$h$&$K$J$C$F$$$k!#(B |
|
|
|
|
通信の方法によってメッセージの構造は変わる. この論文では TCP/IP の場合 |
|
についてのみ説明を行なう. |
|
|
\section{OpenXM $B$N7W;;$N?J9TJ}K!(B} |
OpenXM 規約で規定されているメッセージはバイトストリームとなっており, 次 |
|
のような構造になっている. |
|
\begin{center} |
|
\begin{tabular}{|c|c|} |
|
\hline |
|
ヘッダ & \hspace{10mm} ボディ \hspace{10mm} \\ |
|
\hline |
|
\end{tabular} |
|
\end{center} |
|
ヘッダの長さは 8 バイトであると定められている. ボディの長さはメッセージ |
|
ごとに異なっているが, 長さは $0$ でもよい. |
|
|
OpenXM $B5,Ls$G$N%a%C%;!<%8$N8r49$O%5!<%P$H%/%i%$%"%s%H$N4V$G(B |
ヘッダは次の二つの情報を持っている. |
$B9T$J$o$l$k!#%/%i%$%"%s%H$+$i%5!<%P$X7W;;$5$;$?$$%G!<%?$r(B |
\begin{enumerate} |
$B%a%C%;!<%8$H$7$FAw$j!"<!$$$G%5!<%P$K9T$J$o$;$?$$F0:n$K(B |
\item |
$BBP1~$7$?%G!<%?$rAw$k$3$H$K$h$C$F!"7W;;$J$I$N!"$J$s$i$+$NF0:n$r(B |
前半の 4 バイト. メッセージの種類を表す識別子であり, タグと呼ばれる. |
$B%5!<%P$K9T$J$o$;$k!#%5!<%P$O7k2L$NAw?.$bL?Na$5$l$J$1$l$P(B |
\item |
$B9T$J$&$3$H$O$J$/!"%/%i%$%"%s%H$O7k2L$r<u$1<h$i$:$K%5!<%P$K<!!9$H(B |
後半の 4 バイト. メッセージにつけられた通し番号である. |
$B7W;;$r9T$J$o$;$k$3$H$b2DG=$G$"$k!#$J$*!"%5!<%P$KBP$9$kF0:n$KBP1~$7$?(B |
\end{enumerate} |
$B%G!<%?$O(B SM $BAX$GDj5A$5$l$F$*$j!"(B SM $BAX0J30$N%G!<%?$G$O%5!<%P$O(B |
それぞれの 4 バイトは 32 ビット整数とみなされて扱われる. |
$B%G!<%?$r<u$1<h$k0J30$NF0:n$r$7$J$$$3$H$K$J$C$F$$$k!#(B |
|
|
|
$B%5!<%P$O%9%?%C%/$r;}$C$F$$$k$H2>Dj$5$l$F$*$j!"<u$1<h$C$?(B |
この場合に用いられる 32 ビット整数の表現方法について説明しておこう. 問 |
$B%a%C%;!<%8$O$9$Y$F%9%?%C%/$K@Q$^$l$k!#$3$3$G!"(B SM $BAX$GDj5A$5$l$?(B |
題になるのは負数の表現とバイトオーダーの問題である. まず, 負数を表す必 |
$B%G!<%?$r<u$1<h$C$?>l9g$K$O!"$=$l$KBP1~$9$kF0:n$r9T$J$&!#(B |
要があるときには2の補数表現を使うことになっている. 次にバイトオーダーで |
$B$3$N$H$-!"I,MW$,$"$l$P%5!<%P$O%9%?%C%/$+$i%G!<%?$r<h$j=P$9!#(B |
あるが, OpenXM 規約は複数のバイトオーダーを許容する. ただし一つの通信路 |
$B%/%i%$%"%s%H$+$i$NL?Na$K$h$kF0:nCf$K%(%i!<$,H/@8$7$?$H$7$F$b!"(B |
ではひとつのバイトオーダーのみが許され, 通信路の確立時に一度だけ選ばれる. |
$B%5!<%P$O%(%i!<%*%V%8%'%/%H$r%9%?%C%/$K@Q$`$@$1$G!"(B |
|
$BL@<($5$l$J$$8B$j%(%i!<$rJV$5$J$$$3$H$KCm0U$7$J$1$l$P$J$i$J$$!#(B |
|
|
|
$B7k2L$,@8$8$kF0:n$r%5!<%P$,9T$J$C$?>l9g!"(B |
現在のOpenXM 規約では, タグ(整数値)として以下のものが定義されている. |
$B%5!<%P$OF0:n$N7k2L$r%9%?%C%/$K@Q$s$G$$$k!#(B |
|
$B%5!<%P$K9T$J$o$;$?F0:n$N7k2L$r%/%i%$%"%s%H$,CN$j$?$$>l9g!"(B |
|
$B%9%?%C%/$+$i%G!<%?$r<h$j=P$7Aw?.$r9T$J$&L?Na$KBP1~$7$?(B SM $BAX$N%G!<%?$r(B |
|
$B%5!<%PB&$XAw$l$P$h$$!#(B |
|
|
|
$B%/%i%$%"%s%H$,%5!<%P$X7W;;$r9T$J$o$;!"7k2L$rF@$k$H$$$&<j=g$rDI$C$F$$$/$H!"(B |
\begin{verbatim} |
$B<!$N$h$&$K$J$k!#(B |
#define OX_COMMAND 513 |
|
#define OX_DATA 514 |
|
#define OX_SYNC_BALL 515 |
|
#define OX_DATA_WITH_LENGTH 521 |
|
#define OX_DATA_OPENMATH_XML 523 |
|
#define OX_DATA_OPENMATH_BINARY 524 |
|
#define OX_DATA_MP 525 |
|
\end{verbatim} |
|
|
|
ボディの構造はメッセージの種類によって異なる. OX\_COMMAND で識別される |
|
メッセージはスタックマシンへの命令であり, それ以外のメッセージは何らかの |
|
オブジェクトを表している. この論文では OX\_DATA と OX\_COMMAND で識別さ |
|
れるメッセージについてのみ, 説明する. |
|
|
|
既存のメッセージでは対応できない場合は, 新しい識別子を定義することで新し |
|
い種類のメッセージを作成することができる. この方法は各数学ソフトウェア |
|
の固有の表現を含むメッセージを作成したい場合などに有効である. 新しい識 |
|
別子の定義方法については, \cite{OpenXM-1999} を参照すること. |
|
|
|
|
|
\section{OpenXM の計算モデル} |
|
|
|
OpenXM 規約での計算とはメッセージを交換することである. また, OpenXM 規 |
|
約ではクライアント・サーバモデルを採用しているので, メッセージの交換はサー |
|
バとクライアントの間で行なわれる. |
|
\footnote{現在, 主に野呂が OpenXM の計算モデルの拡張を考えている. 効率 |
|
的な分散計算のアルゴリズムの多くはサーバ同士の通信も要求するからである.} |
|
クライアントからサーバへメッセージを送り, クライアントがサーバからメッセー |
|
ジを受け取ることによって計算の結果が得られる. このメッセージのやりとり |
|
はクライアントの主導で行われる. つまり, クライアントは自由にメッセージ |
|
をサーバに送付してもよいが, サーバからは自発的にメッセージが送付されるこ |
|
とはない. この原理はサーバはスタックマシンであることで実現される. スタッ |
|
クマシンの構造については \ref{sec:oxsm} 節で述べる. |
|
|
|
サーバがクライアントから受け取ったオブジェクト(つまり OX\_COMMAND でない |
|
メッセージのボディ)はすべてスタックに積まれる. スタックマシンへの命令 |
|
(OX\_COMMAND で識別されるメッセージのボディ)を受け取ったサーバは命令に対 |
|
応する動作を行なう. このとき, 命令によってはスタックからオブジェクトを |
|
取り出すことがあり, また(各数学システムでの)計算結果をスタックに積むこと |
|
がある. もし, 与えられたデータが正しくないなどの理由でエラーが生じた場 |
|
合にはサーバはエラーオブジェクトをスタックに積む. 計算結果をクライアン |
|
トが得る場合にはスタックマシンの命令 SM\_popCMO または SM\_popString を |
|
サーバに送らなければならない. これらの命令を受け取ってはじめて, サーバ |
|
からクライアントへメッセージが送られる. |
|
|
|
まとめると, クライアントがサーバへメッセージを送り, 計算の結果を得るとい |
|
う手順は以下のようになる. |
|
|
\begin{enumerate} |
\begin{enumerate} |
\item $B$^$:!"%/%i%$%"%s%H$,%5!<%P$X7W;;$5$;$?$$%G!<%?$rAw$k!#(B |
\item |
$B%5!<%P$OAw$i$l$F$-$?%G!<%?$r%9%?%C%/$K@Q$`!#(B |
まず, クライアントがサーバへオブジェクトを送る. サーバは送られてきたオ |
\item $B%/%i%$%"%s%H$,%5!<%P$K7W;;$r9T$J$&F0:n$KBP1~$7$?%G!<%?$r(B |
ブジェクトをスタックに積む. |
$BAw$k$H!"%5!<%P$OI,MW$J$@$1%9%?%C%/$+$i%G!<%?$r<h$j=P$7!"(B |
\item |
$B<B9T$7$?7W;;$N7k2L$r%9%?%C%/$K@Q$`!#(B |
クライアントがサーバに計算の命令を送ると, サーバはあらかじめ定めれらた動 |
\item $B:G8e$K!V%G!<%?$r<h$j=P$7Aw?.$r9T$J$&L?Na$KBP1~$7$?%G!<%?!W$r(B |
作を行う. 一部の命令はスタックの状態を変更する. 例えば |
$B%5!<%P$XAw$k$H!"%5!<%P$O%9%?%C%/$+$i7W;;7k2L$NF~$C$F$$$k(B |
SM\_executeFunction, \\ SM\_executeStringByLocalParser などの命令は, ス |
$B%G!<%?$r<h$j=P$7!"%/%i%$%"%s%H$XAw=P$9$k!#(B |
タック上のオブジェクトから計算を行う. SM\_popCMO もしくは SM\_popString |
|
は, スタックの最上位のオブジェクトを取りだし, クライアントに送り返す. |
\end{enumerate} |
\end{enumerate} |
|
|
|
|
\section{CMO $B$N%G!<%?9=B$(B} |
\section{OpenXM スタックマシン}\label{sec:oxsm} |
|
|
OpenXM $B4V$G$d$j$H$j$5$l$k%a%C%;!<%8$r<B:]$K:n@.$9$k>l9g!"(B |
OpenXM 規約ではサーバはスタックマシンであると定義している. 以下, OpenXM |
CMO $BAX$GDj5A$5$l$F$$$kB?G\D9@0?t$rM}2r$7$F$*$/$H!"(B |
スタックマシンと呼ぶ. この節ではOpenXM スタックマシンの構造について説明 |
CMO $BAX$NB>$N%G!<%?9=B$$@$1$G$J$/!"(B OX $BAX!"(B SM $BAX$N%G!<%?$r(B |
しよう. |
$BM}2r$9$k=u$1$K$J$k$H;W$($k$N$G!"(B CMO $BAX$NB?G\D9@0?t$N(B |
|
$B%G!<%?9=B$$K$D$$$F@bL@$9$k!#(B |
|
|
|
CMO $BAX$GDj5A$5$l$F$$$k%G!<%?$OB?G\D9@0?t0J30$K$b(B |
まず, OpenXM 規約は通信時にやりとりされる共通のデータ形式については規定 |
$BJ8;zNs$d%j%9%H$J$I$,$"$k!#$I$N$h$&$J%G!<%?$G$"$k$+$O(B |
するが, OpenXM スタックマシンがスタックに積む, オブジェクトの構造までは |
$B%G!<%?$N@hF,$K$"$k(B tag $B$r8+$l$PH=JL$G$-$k$h$&$K$J$C$F$$$k!#(B |
規定しない. つまり, オブジェクトの構造は各数学システムごとに異なってい |
$B$3$l$O(B OX $BAX$G$N%G!<%?$NH=JL$N;EJ}$H$*$J$8$G$"$k!#(B |
るということである. このことは通信路からデータを受け取った際に, 各数学 |
$B$J$*!"(B tag $B$O3F%G!<%?Kh$K(B 32 bit $B$N@0?t$GI=$5$l$F$*$j!"(B |
システムが固有のデータ構造に変換してからスタックに積むことを意味する. |
$BB?G\D9@0?t$O(B 20 $B$H$J$C$F$$$k!#(B |
この変換は1対1対応である必要はない. もちろん, 恣意的に変換してよいわけ |
|
ではなく, 数学システムごとに変換方法をあらかじめ定めておく必要がある. |
|
このような共通のデータ形式と各システムでの固有のデータ形式との変換の問題 |
|
は OpenXM に限ったことではない. OpenMath (\ref{sec:other} 節を参照のこ |
|
と) ではこの変換を行うソフトウェアを Phrasebook と呼んでいる. |
|
|
$BI=8=$7$?$$B?G\D9@0?t$N@dBPCM$r(B 2 $B?J?t$GI=$7$?>l9g$N7e?t$r(B $n$ $B$H(B |
次に OpenXM スタックマシンの命令コードについて説明する. OpenXM スタック |
$B$7$?$H$-!"<!$K$/$k%G!<%?$O(B $[(n+31)/32]$ $B$r(B 32 bit $B$N@0?t$H$J$k!#(B |
マシンにおけるすべての命令は 4 バイトの長さを持つ. OpenXM 規約の他の規 |
$B$3$l$OB?G\D9@0?t$N@dBPCM$r(B $2^32$ $B?J?t$GI=$7$?>l9g$N7e?t$H$H$C$F$b$h$$!#(B |
定と同様に, 4 バイトのデータは32ビット整数と見なされるので, この論文でも |
$B$?$@$7!"I=8=$7$?$$?t$,Ii$N>l9g$O$3$N(B 32 bit $B$NCM$O(B 2 $B$NJd?tI=8=$GIi$K$J$k!#(B |
その表記にしたがう. OpenXM スタックマシンに対する命令はスタックに積まれ |
|
ることはない. 現在のところ, OpenXM 規約では以下の命令が定義されている. |
|
|
|
\begin{verbatim} |
|
#define SM_popSerializedLocalObject 258 |
|
#define SM_popCMO 262 |
|
#define SM_popString 263 |
|
#define SM_mathcap 264 |
|
#define SM_pops 265 |
|
#define SM_setName 266 |
|
#define SM_evalName 267 |
|
#define SM_executeStringByLocalParser 268 |
|
#define SM_executeFunction 269 |
|
#define SM_beginBlock 270 |
|
#define SM_endBlock 271 |
|
#define SM_shutdown 272 |
|
#define SM_setMathCap 273 |
|
#define SM_executeStringByLocalParserInBatchMode 274 |
|
#define SM_getsp 275 |
|
#define SM_dupErrors 276 |
|
#define SM_DUMMY_sendcmo 280 |
|
#define SM_sync_ball 281 |
|
#define SM_control_kill 1024 |
|
#define SM_control_to_debug_mode 1025 |
|
#define SM_control_exit_debug_mode 1026 |
|
#define SM_control_ping 1027 |
|
#define SM_control_start_watch_thread 1028 |
|
#define SM_control_stop_watch_thread 1029 |
|
#define SM_control_reset_connection 1030 |
|
\end{verbatim} |
|
|
\section{MathCap $B$K$D$$$F(B} |
スタックマシンに対する命令の中には実行によって結果が返ってくるものがある. |
|
結果が返ってくる命令を実行した場合, サーバはその結果をスタックに積む. |
|
たとえば, 命令 SM\_executeStringByLocalParser はスタックに積まれているオ |
|
ブジェクトをサーバ側のローカル言語の文法に従った文字列とみなして計算を行 |
|
なうが, 行なった計算の結果はスタックに積まれる. |
|
|
\section{security $BBP:v(B} |
なお, 命令の実行中にエラーが起こり, 結果が得られなかった場合には, |
|
エラーオブジェクトがスタックに積まれる. |
|
|
\section{$BB>$N%W%m%8%'%/%H(B} |
\section{CMO のデータ構造}\label{sec:cmo} |
|
|
\section{$B8=:_Ds6!$5$l$F$$$k%=%U%H%&%'%"(B} |
OpenXM 規約では, 数学的オブジェクトを表現する方法として CMO 形式(Common |
|
Mathematical Object format)を定義している. この CMO 形式にしたがったデー |
|
タは, 識別子が OX\_DATA であるようなメッセージのボディになることを想定し |
|
ている. |
|
|
|
CMO 形式におけるデータ構造は次のような構造をもつ. |
|
\begin{center} |
|
\begin{tabular}{|c|c|} |
|
\hline |
|
ヘッダ & \hspace{10mm} ボディ \hspace{10mm} \\ |
|
\hline |
|
\end{tabular} |
|
\end{center} |
|
ヘッダは4バイトである. ボディの長さはそれぞれのデータによって異なるが, |
|
0でもよい. |
|
|
|
メッセージと同様にヘッダは4バイト単位に管理される. すなわち, CMO では |
|
ヘッダは一つだけの情報を含む. この4バイトのヘッダのことをタグともいう. |
|
さて, CMO では, タグによってボディの論理的構造が決定する. すなわち, タ |
|
グはそれぞれのデータ構造と1対1に対応する識別子である. それぞれの論理的 |
|
構造は\cite{OpenXM-1999} に詳述されている. 現在の OpenXM 規約では以下の |
|
CMO が定義されている. |
|
|
|
\begin{verbatim} |
|
#define CMO_ERROR2 0x7f000002 |
|
#define CMO_NULL 1 |
|
#define CMO_INT32 2 |
|
#define CMO_DATUM 3 |
|
#define CMO_STRING 4 |
|
#define CMO_MATHCAP 5 |
|
#define CMO_ARRAY 16 |
|
#define CMO_LIST 17 |
|
#define CMO_ATOM 18 |
|
#define CMO_MONOMIAL32 19 |
|
#define CMO_ZZ 20 |
|
#define CMO_QQ 21 |
|
#define CMO_ZERO 22 |
|
#define CMO_DMS_GENERIC 24 |
|
#define CMO_DMS_OF_N_VARIABLES 25 |
|
#define CMO_RING_BY_NAME 26 |
|
#define CMO_RECURSIVE_POLYNOMIAL 27 |
|
#define CMO_LIST_R 28 |
|
#define CMO_INT32COEFF 30 |
|
#define CMO_DISTRIBUTED_POLYNOMIAL 31 |
|
#define CMO_POLYNOMIAL_IN_ONE_VARIABLE 33 |
|
#define CMO_RATIONAL 34 |
|
#define CMO_64BIT_MACHINE_DOUBLE 40 |
|
#define CMO_ARRAY_OF_64BIT_MACHINE_DOUBLE 41 |
|
#define CMO_128BIT_MACHINE_DOUBLE 42 |
|
#define CMO_ARRAY_OF_128BIT_MACHINE_DOUBLE 43 |
|
#define CMO_BIGFLOAT 50 |
|
#define CMO_IEEE_DOUBLE_FLOAT 51 |
|
#define CMO_INDETERMINATE 60 |
|
#define CMO_TREE 61 |
|
#define CMO_LAMBDA 62 |
|
\end{verbatim} |
|
|
|
この中で CMO\_ERROR2, CMO\_NULL, CMO\_INT32, CMO\_DATUM, CMO\_STRING, |
|
CMO\_MATHCAP, CMO\_LIST で識別されるオブジェクトは最も基本的なオブジェ |
|
クトであって, すべての OpenXM 対応システムに実装されていなければならない. |
|
|
|
これらについての解説を行う前に記法について, 少し説明しておく. この論文 |
|
では, 大文字で CMO\_INT32 と書いた場合には, 上記で定義した識別子を表す. |
|
また CMO\_INT32 で識別されるオブジェクトのクラス(あるいはデータ構造) を |
|
cmo\_int32 と小文字で表すことにする. |
|
|
|
さて cmo を表現するための一つの記法を導入する. この記法は CMO expression |
|
と呼ばれている. その正確な形式的定義は \cite{OpenXM-1999} を参照すること. |
|
|
|
CMO expssion は Lisp 風表現の一種で, cmo を括弧で囲んだリストとして表現 |
|
する. それぞれの要素はカンマで区切る. 例えば, |
|
\begin{quote} |
|
(17, {\sl int32}, (CMO\_NULL), (2, {\sl int32} $n$)) |
|
\end{quote} |
|
は CMO expression である. ここで, 小文字の斜体で表された``{\sl int32}'' |
|
は 4 バイトの任意のデータを表す記号であり, ``{\sl int32} $n$'' は同じく |
|
4 バイトのデータであるが以下の説明で $n$ と表すことを示す. また数字 17, |
|
2 などは 4 バイトのデータで整数値としてみたときの値を意味する. CMO\_NULL |
|
は識別子(すなわち数字 1 と等価)である. この記法から上記のデータは 20 バ |
|
イトの大きさのデータであることが分かる. なお, CMO expression は単なる表 |
|
記法であることに特に注意してほしい. |
|
|
|
さて, この記法のもとで cmo\_int32 を次のデータ構造であると定義する. |
|
\begin{quote} |
|
cmo\_int32 := (CMO\_INT32, {\sl int32}) |
|
\end{quote} |
|
同様に, cmo\_null, cmo\_string, cmo\_list, cmo\_mathcap のシンタッ |
|
クスは次のように定義される. |
|
\begin{quote} |
|
cmo\_null := (CMO\_NULL) \\ |
|
cmo\_string := (CMO\_STRING, {\sl int32} $n$, {\sl string} $s$) \\ |
|
cmo\_list := (CMO\_LIST, {\sl int32} $m$, {\sl cmo} $c_1$, $\ldots$, |
|
{\sl cmo} $c_m$) \\ |
|
cmo\_mathcap := (CMO\_MATHCAP, {\sl cmo\_list}) |
|
\end{quote} |
|
ただし, {\sl string}は適当な長さのバイト列を表す. $s$ のバイト長は $n$ |
|
と一致することが要求される. |
|
|
|
\section{mathcap について} |
|
|
|
OpenXM 規約では, 通信時に用いられるメッセージの種類を各ソフトウェアが制 |
|
限する方法を用意している. これは各ソフトウェアの実装によってはすべての |
|
メッセージをサポートするのが困難な場合があるからである. また, 各ソフト |
|
ウェアでメッセージの種類を拡張したい場合にも有効である. この制限(あるい |
|
は拡張) は mathcap と呼ばれるデータ構造によって行われる. この節では |
|
mathcap のデータ構造と, 具体的なメッセージの制限の手続きについて説明する. |
|
|
|
まず, 手続きについて説明しよう. |
|
|
|
第一にサーバの機能を制限するには次のようにする. クライアントが mathcap |
|
オブジェクトをサーバへ送ると, サーバは受け取ったmathcap をスタックに積む. |
|
次にクライアントが命令 SM\_setMathCap を送ると, サーバはスタックの最上位 |
|
に積まれている mathcap オブジェクトを取り出し, mathcap で設定されていな |
|
いメッセージをクライアントへ送らないように制限を行う. |
|
|
|
第二にクライアントを制限するには次のようにする. まず, クライアントがサー |
|
バに命令 SM\_mathcap を送ると, サーバは mathcap オブジェクトをスタックに |
|
積む. さらに命令 SM\_popCMO を送ると, サーバはスタックの最上位のオブジェ |
|
クト(すなわち mathcap オブジェクト)をボディとするメッセージをクライアン |
|
トに送付する. クライアントはそのオブジェクトを解析して, 制限をかける. |
|
|
|
次に mathcap のデータ構造について説明する. |
|
mathcap は cmo の一種であるので, すでに説明したように |
|
\begin{quote} |
|
cmo\_mathcap := (CMO\_MATHCAP, {\sl cmo\_list}) |
|
\end{quote} |
|
の構造をもつ(\ref{sec:cmo} 節を参照のこと). |
|
ボディは cmo\_list オブジェクトでなければならない. |
|
|
|
さて, mathcap オブジェクトのボディの cmo\_list オブジェクトは以下の条件 |
|
を満たすことを要求される. まず, その cmo\_list オブジェクトは少なくとも |
|
リスト長が 3 以上でなければならない. |
|
\begin{quote} |
|
(CMO\_LIST, {\sl int32}, {\sl cmo} $a$, {\sl cmo} $b$, {\sl cmo} $c$, $\ldots$) |
|
\end{quote} |
|
|
|
第一要素 $a$ はまた cmo\_list であり, リスト長は 4 以上, $a_1$ は |
|
cmo\_int32 でバージョンを表す. $a_2$, $a_3$, $a_4$ は cmo\_string であ |
|
り, それぞれ数学システムの名前, バージョン, HOSTTYPE を表すことになって |
|
いる. |
|
\begin{quote} |
|
(CMO\_LIST, {\sl int32}, |
|
{\sl cmo\_int32} $a_1$, {\sl cmo\_string} $a_2$, {\sl cmo\_string} |
|
$a_3$, {\sl cmo\_string} $a_4$, $\ldots$) |
|
\end{quote} |
|
|
|
第二要素 $b$ も cmo\_list であり, OpenXM スタックマシンを制御するために |
|
用いられる. 各 $b_i$ は cmo\_int32 であり, ボディはスタックマシンの命令 |
|
コードである. \ref{sec:oxsm} 節で説明したが, スタックマシンへの命令はす |
|
べて {\sl int32} で表されていたことに注意しよう. |
|
\begin{quote} |
|
(CMO\_LIST, {\sl int32} $n$, |
|
{\sl cmo\_int32} $b_1$, $\ldots$, {\sl cmo\_int32} $b_n$) |
|
\end{quote} |
|
|
|
第三要素 $c$ は以下のような cmo\_list であり, オブジェクトの送受信を制御 |
|
するために用いられる. 送受信の制御はメッセージの種類ごとに行われる. |
|
\begin{quote} |
|
(CMO\_LIST, {\sl int32} $m$, {\sl cmo\_list} $\ell_1$, $\ldots$, |
|
{\sl cmo\_list} $\ell_m$) |
|
\end{quote} |
|
各 $\ell_i$ が制御のための情報を表す. どの $\ell_i$ も一つ以上の要素を |
|
持っており, 第一要素は必ず cmo\_int32 となっていなければならない. これ |
|
は制御すべきメッセージの識別子を入れるためである. |
|
|
|
各 $\ell_i$ の構造はメッセージの種類によって異なる. ここでは, OX\_DATA |
|
の場合についてのみ説明する. 第一要素が OX\_DATA の場合, リスト $\ell_i$ |
|
は以下のような構造となっている. 各 $c_i$ は cmo\_int32 であり, そのボディ |
|
は CMO の識別子である. $c_i$ で指示された CMO のみが送受信することを許 |
|
される. |
|
\begin{quote} |
|
(CMO\_LIST, 2, (CMO\_INT32, OX\_DATA), \\ |
|
\ \ (CMO\_LIST, {\sl int32} $k$, {\sl cmo\_int32} $c_1$, |
|
$\ldots$, {\sl cmo\_int32} $c_k$)) |
|
\end{quote} |
|
|
|
具体的な mathcap の例をあげよう. 名前が ``ox\_test'', バージョンナンバー |
|
が 199911250 のサーバで, Linux 上で動いており, このサーバのスタックマシ |
|
ンが命令 SM\_popCMO, SM\_popString, SM\_mathcap, |
|
SM\_executeStringByLocalParser を利用可能で, かつ オブジェクトを |
|
cmo\_int32, cmo\_string, cmo\_mathcap, cmo\_list のみに制限したいときの |
|
mathcap は |
|
\begin{quote} |
|
(CMO\_MATHCAP, (CMO\_LIST, 3, \\ |
|
$\quad$ (CMO\_LIST, 4, (CMO\_INT32, $199911250$), (CMO\_STRING, 7, ``ox\_test''), \\ |
|
$\qquad$ (CMO\_STRING, 9, ``199911250''), (CMO\_STRING, 4, ``i386'')) \\ |
|
$\quad$ (CMO\_LIST, $5$, (CMO\_INT32, SM\_popCMO), \\ |
|
$\qquad$ (CMO\_INT32, SM\_popString), (CMO\_INT32, SM\_mathcap), \\ |
|
$\qquad$ (CMO\_INT32, SM\_executeStringByLocalParser)) \\ |
|
$\quad$ (CMO\_LIST, $1$, (CMO\_LIST, $2$, (CMO\_INT32, OX\_DATA), \\ |
|
$\qquad$ (CMO\_LIST, $4$, (CMO\_INT32, CMO\_INT32), \\ |
|
$\qquad\quad$ (CMO\_INT32, CMO\_STRING), (CMO\_INT32, CMO\_MATHCAP), \\ |
|
$\qquad\quad$ (CMO\_INT32, CMO\_LIST)))))) |
|
\end{quote} |
|
になる. |
|
|
|
|
|
\section{セキュリティ対策} |
|
|
|
OpenXM 規約は TCP/IP を用いて通信を行うことを考慮している. したがって |
|
ネットワークによって接続される現代の多くのソフトウェアと同様, OpenXM 規 |
|
約もまた通信時のセキュリティについて注意している. 以下, このことについ |
|
て説明しよう. |
|
|
|
第一に OpenXM では侵入者に攻撃の機会をできるだけ与えないようにするため, |
|
サーバは接続が必要になった時のみ起動している. しかし, これだけでは接続 |
|
を行なう一瞬のすきを狙われる可能性もある. そこで接続を行なう時に, 接続 |
|
を行なうポート番号を毎回変えている. こうすることで, 特定のポート番号を |
|
狙って接続を行なう手口を防ぐことができる. |
|
|
|
さらにもう一段安全性を高めるために, 接続時に一時パスワードをクライアント |
|
が作成し, そのパスワードを使って認証を行なう. このパスワードは一旦使用 |
|
されれば無効になるので, もし仮になんらかの手段でパスワードが洩れたとして |
|
も安全である. |
|
|
|
なお, メッセージ自体には特に暗号化などの処置を行っていないので, そのまま |
|
ではパケット盗聴などを受ける可能性がある. 現在の実装では, 必要ならば |
|
ssh を利用して対応している. |
|
|
|
|
|
\section{OpenXM 以外のプロジェクト}\label{sec:other} |
|
|
|
OpenXM 以外にも数式処理システム間の通信や数学データの共通表現を目指した |
|
プロジェクトは存在する. ここでは他のプロジェクトについても触れておこう. |
|
|
|
\begin{itemize} |
|
\item ESPRIT OpenMath Project |
|
|
|
http://www.openmath.org/omsoc/ |
|
|
|
数学的対象の SGML 的表記の標準化を目指した大規模なプロジェクト. このプ |
|
ロジェクトでは数学データを数学的意味を保ったままで如何に表現すべきかとい |
|
う問題を追求している. したがって既存の表現, 例えば \TeX による数式の表 |
|
現と OpenMath による数式の表現とでは, 本質的に意味が異なる. OpenMath で |
|
定義された表現は, 異なる種類の数式処理システムの間で情報を交換するときに |
|
利用することができる. しかしながら, 数学システム同士の通信, 例えばある |
|
数学システムから別の数学システムを呼び出して計算させる方法などは, このプ |
|
ロジェクトの対象外である. |
|
|
|
OpenXM 規約の CMO 形式の定義は OpenMath 規約の content dictionary の概念 |
|
に似ている(もちろん OpenMath の方がもっと大掛かりで厳密な規定である). |
|
また, 共通データ形式と数学システム固有のオブジェクトとの変換は OpenMath |
|
規約の Phrasebook と同じアイデアを用いている. |
|
|
|
\item NetSolve |
|
|
|
http://www.cs.utk.edu/netsolve/ |
|
|
|
NetSolve はクライアント・サーバ型の分散システムであり, 単なる計算システ |
|
ム以上のものを目指している. クライアントは必要に応じて, サーバを呼び出 |
|
して計算をさせる. NetSolve の特徴は, サーバの呼び出しに Agent というソ |
|
フトウェアを介在させることである. Agent は呼び出し先などを決定するデー |
|
タベース的役割を果たす. また Agent によって負荷分散が可能になる. 現在 |
|
の NetSolve は RPC を基礎にして実装されている. |
|
|
|
\item MP (Multi Project) |
|
|
|
http://symbolicnet.mcs.kent.edu/SN/areas/protocols/mp.html |
|
|
|
数学的オブジェクトのコンピュータ上での表現方法を扱うプロジェクト. |
|
MP では数学データを構文木を用いて扱い, |
|
その構文木のバイトストリームへの変換方法について規定している. |
|
計算方法については規定しておらず, |
|
RPC や OpenXM, 後述の MCP 等で用いることが考えられる. |
|
速度的な配慮もしており, 並列計算に用いることも |
|
考えられている. |
|
現在すでに C 言語によるライブラリが実装されており, |
|
Common Lisp による実装も行なわれている. |
|
|
|
|
|
|
|
%数学的なオブジェクトのバイト列による表現を目的とするプロジェクト. |
|
%%MP は数学的なデータを構文木を用いて表し, |
|
%科学技術計算を行なうソフトウェア間での情報交換に使えるよう |
|
%設計している. |
|
%この表現は通信方法に依存しないが, 速度面に配慮しており, |
|
%並列計算に使用することも考えられている. |
|
%すでに C 言語で利用可能なライブラリが提供されており, |
|
%現在は Lisp による実装も計画されている. |
|
|
|
\item MCP (Mathematical Computation Protocol) |
|
|
|
http://horse.mcs.kent.edu/\~{}pwang/ |
|
|
|
数学的な計算を行なうための HTTP に似たプロトコル. クライアント・サーバ |
|
モデルを採用しており, ピアツーピアのストリームコネクションを行なう. 交 |
|
換に用いられる数学データの表現方法についての規定はない. したがって数学 |
|
的なデータの表現には MP や OpenXM で定められたものを利用する. 実際, 数 |
|
学データの表現に OpenMath の XML 表現を用いた実装があり, GAP と Axiom の |
|
間で通信が行われている. この場合 MCP によって送信されるデータは, 本文に |
|
OpenMath 形式で数式を記述したテキストである. |
|
|
|
\end{itemize} |
|
|
|
|
|
\section{現在提供されているソフトウェア} |
|
|
|
現在 OpenXM 規約に対応しているクライアントにはasir, sm1, Mathematica が |
|
ある. これらのクライアントから OpenXM 規約に対応したサーバを呼び出すこ |
|
とができる. また OpenXM 規約に対応しているサーバには, asir, sm1, |
|
Mathematica, gnuplot, PHC pack などがあり, それぞれ ox\_asir, ox\_sm1, |
|
ox\_math, ox\_sm1\_gnuplot, ox\_sm1\_phc という名前で提供されている. |
|
さらに OpenMath 規約の XML 表現で表現されたオブジェクトと CMO 形式のオブ |
|
ジェクトを相互変換するソフトウェアが JAVA によって実装されており, |
|
OMproxy という名前で提供されている. |
|
|
|
\begin{thebibliography}{99} |
|
\bibitem{Ohara-Takayama-Noro-1999} |
|
小原功任, 高山信毅, 野呂正行: |
|
{Open asir 入門}, 1999, 数式処理, |
|
Vol 7, No 2, 2--17. (ISBN4-87243-086-7, SEG 出版, Tokyo). |
|
|
|
\bibitem{OpenXM-1999} |
|
野呂正行, 高山信毅: |
|
{Open XM の設計と実装 |
|
--- Open message eXchange protocol for Mathematics}, |
|
1999/11/22 |
|
\end{thebibliography} |
|
|
\end{document} |
\end{document} |