=================================================================== RCS file: /home/cvs/OpenXM/doc/Attic/genkou19991125.tex,v retrieving revision 1.5 retrieving revision 1.67 diff -u -p -r1.5 -r1.67 --- OpenXM/doc/Attic/genkou19991125.tex 1999/12/18 13:59:50 1.5 +++ OpenXM/doc/Attic/genkou19991125.tex 1999/12/24 08:08:48 1.67 @@ -1,147 +1,463 @@ \documentclass{jarticle} -\title{\bf Open XM($B%?%$%H%kL$Dj(B)} -\author{ - Maekawa \\ - Noro \\ - : \\ - : \\ -} -\date{ 1999$BG/(B, 11$B7n(B25$BF|(B} +%% $OpenXM: OpenXM/doc/genkou19991125.tex,v 1.66 1999/12/24 00:01:21 tam Exp $ -%\pagestyle{empty} +\usepackage{jssac} +\title{タイのトル} +\title{意味もない修飾過剰な語句は排除しましょう。} +\author{奥 谷   行 央\affil{神戸大学大学院自然科学研究科} + \mail{okutani@math.sci.kobe-u.ac.jp} + \and 小 原   功 任\affil{金沢大学理学部} + \mail{ohara@kappa.s.kanazawa-u.ac.jp} + \and 高 山   信 毅\affil{神戸大学理学部} + \mail{takayama@math.sci.kobe-u.ac.jp} + \and 田 村   恭 士\affil{神戸大学大学院自然科学研究科} + \mail{tamura@math.sci.kobe-u.ac.jp} + \and 野 呂   正 行\affil{富士通研究所} + \mail{noro@para.flab.fujitsu.co.jp} + \and 前 川   将 秀\affil{神戸大学理学部} + \mail{maekawa@math.sci.kobe-u.ac.jp} +} +\art{} + \begin{document} \maketitle -\section{OpenXM $B$N7W;;%b%G%k(B} +\section{OpenXMとは} -OpenXM $B$O?t3X%=%U%H4V$G%a%C%;!<%8$r8r49$9$k$?$a$N5,Ls$G$"$k!#(B -OpenXM $B$H$O(B Open message eXchange protocol for Mathematics $B$NN,$G$"$k!#(B -$B?t3X%=%U%H4V$G%a%C%;!<%8$r$d$j$H$j$5$;$k$3$H$K$h$j!"(B -$B$"$k?t3X%=%U%H$+$iB>$N?t3X%=%U%H$r8F$S=P$7$F7W;;$r9T$J$C$?$j!"(B -$BB>$N%^%7%s$G7W;;$r9T$J$o$;$?$j$G$-$k$h$&$K$9$k!#(B -$BH/C<$OLnO$@59T$H9b;3?.5#$K$h$j!"(B asir $B$H(B kan/sm1 $B$r(B -$BAj8_$K8F$S=P$95!G=$r$N?t3X%=%U%H$r;H$($k$h$&$K$9$k$3$H$G$"$k!#(B +OpenXM は数学プロセス間でメッセージを交換するための規約である。 +数学プロセス間でメッセージをやりとりすることにより、 +ある数学プロセスから他の数学プロセスを呼び出して計算を行なったり、 +他のマシンで計算を行なわせたりすることが目的である。 +なお、 OpenXM とは Open message eXchange protocol for Mathematics の略である。 +OpenXM の開発の発端は野呂と高山により、 +asir と kan/sm1 を相互に呼び出す機能を実装したことである。 -$BH/C<$H$J$C$?(B asir $B$H(B kan/sm1 $B$G$N$N7A<0$r$b(B -$B07$($k$h$&$K$7$F$"$k!#(B +現在の OpenXM 規約では共通表現形式によるメッセージを用いている。 +上記の文字列を送る方法の利点を生かすため、 +OpenXM 規約では共通表現形式の中の文字列として、 +ローカル言語の文法に従った文字列を用いたメッセージの交換も可能となっている。 +OpenXM 規約では通信の方法に幾らかの自由度があるが、 +現在のところは TCP/IP を用いた通信しか実装されていない。 +そこで、この論文では具体的な実装は TCP/IP を用いていると仮定する。 -\section{OpenXM $B$N%a%C%;!<%8$N9=B$(B} +\section{OpenXM のメッセージの構造} -OpenXM $B$G5,Dj$7$F$$$k%a%C%;!<%8$OO@M}E*$K(B -OX $BAX!"(B SM $BAX!"(B CMO $BAX$KJ,$1$k$3$H$,$G$-$k!#(B -$B$3$NCf$G!"%a%C%;!<%8$H$7$FAw$k$3$H$,2DG=$J$N$O(B -OX $BAX$GDj5A$5$l$?$b$N$@$1$G$"$j!"(B -SM $BAX!"(B CMO $BAX$GDj5A$5$l$F$$$k%G!<%?$O(B -OX $BAX$GDj5A$5$l$F$$$k%G!<%?$N0lIt$KKd$a9~$^$l$F(B -$BAw$i$l$k!#(B -SM $BAX!"(B CMO $BAX$GDj5A$5$l$F$$$k%G!<%?0J30$K$b(B -$BA0=R$N(B MP $B$d(B OpenMath $B$N(B XML, binary $BI=8=$b(B -OX $BAX$KKd$a9~$^$l$FAw$i$l$k$o$1$G$"$k$,!"(B -$B$I$N$h$&$J%G!<%?$,Kd$a9~$^$l$F$$$k$+$O!"(B -OX $BAX$N@hF,$N(B tag $B$r8+$l$PH=JL$G$-$k$h$&$K$J$C$F$$$k!#(B +通信の方法によってメッセージの構造は変わる。 +前節で仮定したとおり、この論文では TCP/IP の場合についてのみ説明を行なう。 +OpenXM 規約で規定されているメッセージはバイトストリームとなっており、 +次のような構造になっている。 -\section{OpenXM $B$N7W;;$N?J9TJ}K!(B} +\begin{tabular}{|c|c|} +\hline +ヘッダ & \hspace{10mm} ボディ \hspace{10mm} \\ +\hline +\end{tabular} -OpenXM $B5,Ls$G$N%a%C%;!<%8$N8r49$O%5!<%P$H%/%i%$%"%s%H$N4V$G(B -$B9T$J$o$l$k!#%/%i%$%"%s%H$+$i%5!<%P$X7W;;$5$;$?$$%G!<%?$r(B -$B%a%C%;!<%8$H$7$FAw$j!"Dj$5$l$F$*$j!"l9g$K$O!"$=$l$KBP1~$9$kF0:n$r9T$J$&!#(B -$B$3$N$H$-!"I,MW$,$"$l$P%5!<%P$O%9%?%C%/$+$i%G!<%?$rl9g!"(B -$B%5!<%P$OF0:n$N7k2L$r%9%?%C%/$K@Q$s$G$$$k!#(B -$B%5!<%P$K9T$J$o$;$?F0:n$N7k2L$r%/%i%$%"%s%H$,CN$j$?$$>l9g!"(B -$B%9%?%C%/$+$i%G!<%?$rl9g!"(B -CMO $BAX$GDj5A$5$l$F$$$kB?G\D9@0?t$rM}2r$7$F$*$/$H!"(B -CMO $BAX$NB>$N%G!<%?9=B$$@$1$G$J$/!"(B OX $BAX!"(B SM $BAX$N%G!<%?$r(B -$BM}2r$9$k=u$1$K$J$k$H;W$($k$N$G!"(B CMO $BAX$NB?G\D9@0?t$N(B -$B%G!<%?9=B$$K$D$$$F@bL@$9$k!#(B +OpenXM 規約では、数学的オブジェクトを表現する方法として +CMO 形式(Common Mathematical Object format)を定義している。 +この CMO 形式を使ってメッセージを送るには、 +タグを OX\_DATA にすればよい。 +CMO 形式におけるデータ構造について以下で説明するが、 +%OpenXM 規約で定義されているメッセージを実際に作成する場合、 +CMO 形式で定義されている多倍長整数を理解しておくと、 +CMO 形式の他のデータ構造だけでなく、 +OpenXM 規約で定義されている様々なデータ構造を理解する助けになると思えるので、 +ここでは CMO 形式の多倍長整数のデータ構造についてのみ説明する。 -CMO $BAX$GDj5A$5$l$F$$$k%G!<%?$OB?G\D9@0?t0J30$K$b(B -$BJ8;zNs$d%j%9%H$J$I$,$"$k!#$I$N$h$&$J%G!<%?$G$"$k$+$O(B -$B%G!<%?$N@hF,$K$"$k(B tag $B$r8+$l$PH=JL$G$-$k$h$&$K$J$C$F$$$k!#(B -$B$3$l$O(B OX $BAX$G$N%G!<%?$NH=JL$N;EJ}$H$*$J$8$G$"$k!#(B -$B$J$*!"(B tag $B$O3F%G!<%?Kh$K(B 32 bit $B$N@0?t$GI=$5$l$F$*$j!"(B -$BB?G\D9@0?t$O(B 20 $B$H$J$C$F$$$k!#(B -$B$3$3$G(B 32 bit $B$N@0?t$NI=8=J}K!$K$D$$$F@bL@$9$kI,MW$,$"$k!#(B -%$B:r:#$N%3%s%T%e!<%?;v>p$+$i!"(B -%32 bit $B@0?t$b(B 8 bit $BC10L$G07$&$[$&$,ET9g$,$h$$!#(B -OpenXM $B$G$O(B 8 bit $BC10L$G(B $( \mbox{\tt 00 00 00 14})_{2^8}$ $B$HI=$9J}K!$H(B -$( \mbox{\tt 14 00 00 00})_{2^8}$ $B$HI=$9J}K!$,$"$k!#(B -$B$3$NI=8=J}K!$N0c$$$O%/%i%$%"%s%H$H%5!<%P$N:G=i$N@\B3;~$K(B -$BAPJ}$N9g0U$G7hDj$9$k$3$H$K$J$C$F$$$k!#$J$*!"9g0U$,$J$$>l9g$K$O(B -$BA0l9g$N7e?t$r(B $n$ $B$H(B -$B$7$?$H$-!"l9g$N7e?t$H$H$C$F$b$h$$!#(B -$B$?$@$7!"I=8=$7$?$$?t$,Ii$N>l9g$O$3$N(B 32 bit $B$N@0?tCM$O(B 2 $B$NJd?tI=8=$GIi$K$J$k!#(B +ここで 32 bit の整数の表現方法について説明する必要がある。 +OpenXM 規約ではバイトストリームで 32 bit の整数 20 を +{\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。 +この表現方法の違いはクライアントとサーバの最初の接続時に +双方の合意で決定することになっている。 +なお、合意がない場合には前者の表現方法 +(以後、この表現方法をネットワークバイトオーダーと呼ぶ)を +使うことになっている。 +また、負の数を表現する必要があるときには、 +2 の補数表現を使うことになっている。 -%$BI=8=$7$?$$B?G\D9@0?t$,Ii$G$"$C$F$b$3$l0J9_$N@bL@$O@5$N>l9g$H(B -%$BJQ$o$i$J$$$N$G!"0J8eB?G\D9@0?t$O@5$H$_$J$9!#(B +CMO 形式の多倍長整数は、 Gnu MPライブラリ等を参考にしており、 +符合付き絶対値表現を用いている。 +タグ以降の形式は次のようになる。 -$BI=8=$7$?$$B?G\D9@0?t$N@dBPCM$,(B $2^32$ $B?J?t$G(B $(b_0 b_1 ...)_{2^32}$ -$B$HI=$;$k$H$-!"0 \\ + 0 & f=0 \\ + -1 & f<0 \\ \end{array} \right. \] +である。 +ここで具体例をだそう。 +$4294967298 = 1 \times 2^{32} + 2$ を CMO 形式の +ネットワークバイトオーダー、多倍長整数で表現すると、 +\begin{center} + {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01} +\end{center} +となる。また、同じ表現方法で $-1$ を表現すると、 +\begin{center} + {\tt 00 00 00 14 ff ff ff ff 00 00 00 01} +\end{center} +となる。 -\section{MathCap $B$K$D$$$F(B} -\section{security $BBP:v(B} +\section{mathcap について} -\section{$BB>$N%W%m%8%'%/%H(B} +OpenXM 規約では、通信時に用いられるメッセージの種類を +各ソフトウェアが制限する方法を用意している。 +これは各ソフトウェアの実装によってはすべてのメッセージを +サポートするのが困難な場合があるからである。 +また、各ソフトウェアでメッセージの種類を拡張したい場合にも有効である。 +この制限(あるいは拡張)は CMO 形式で定義されている mathcap と +呼ばれるデータ構造によって行われる。 +この節では mathcap のデータ構造と、 +具体的なメッセージの制限の手続きについて説明する。 -\section{$B8=:_Ds6!$5$l$F$$$k%=%U%H%&%'%"(B} +まず、手続きについて説明しよう。 +クライアント側の mathcap をサーバへ送ると、 +すでに説明したように、サーバは受け取った mathcap をスタックに積み上げる。 +次にクライアントはスタックマシンへの命令をサーバへ送ることにより、 +サーバはスタックに積まれている mathcap を取り出し、 +mathcap で設定されていないメッセージをクライアント側へ +送らないように設定する。 +サーバ側の mathcap が欲しい場合には以下のようにする。 +クライアントがサーバに mathcap を要求すると、 +サーバはサーバ自身の mathcap をスタックに積む。 +さらにサーバにスタックからデータを取り出し送信を行なう命令を送れば、 +サーバはスタックにある mathcap をクライアントへ送出する。 +このようにしてクライアントはサーバ側の mathcap を受け取れるわけである。 + +次に mathcap のデータ構造について説明する。 +mathcap は CMO 形式で定義されており、 +1 つの CMO 形式のオブジェクトを持つ。 + +そのオブジェクトは以下で説明する 3 つの要素からなるリストでなければならない。 + +\[ \begin{tabular}{|c|c|c|} \hline + $A$ & $B$ & $C$ \\ \hline + \end{tabular} \] + +最初の要素 $A$ の部分は以下の図のようなリスト構造をしており、 +$a_1$ は 32 ビット整数でバージョンナンバーを、 +$a_2$ は文字列でシステムの名前を表すことになっている。 + +\[ \begin{tabular}{|c|c|} \hline + $a_1$ & $a_2$ \\ \hline + \end{tabular} \] + +2 番目の要素 $B$ の部分は次のようなリスト構造をしている。 +この $b_1$, $b_2$, $\cdots$, $b_n$ はすべて 32 ビットの整数である。 +スタックマシンへの命令はすべて 32 ビットの整数で表しており、 +各 $b_i$ は利用可能な命令に対応する 32 ビットの整数となっている。 + +\[ \begin{tabular}{|c|c|c|c|} \hline + $b_1$ & $b_2$ & $\cdots$ & $b_n$ \\ \hline + \end{tabular} \] + +3 番目の要素 $C$ は以下のようなリスト構造をしている。 +\[ \overbrace{ + \begin{tabular}{|c|c|c|c|} \hline + $c_1$ & $c_2$ & $\cdots$ & $c_n$ \\ \hline + \end{tabular} + }^{C} \] +%$n$ は OX\_COMMAND 以外の受け取れるメッセージのタグの種類の数に等しい。 +%要素数は 1 でももちろん構わない。 +各 $c_i$ もまた以下のようなリスト構造となっており、 +どの $c_i$ も最初の要素が 32 ビットの整数となっている。 +\[ \overbrace{ + \begin{tabular}{|c|c|c|c|c|} \hline + $c_{i1}$ (32 ビットの整数) & $c_{i2}$ & $c_{i3}$ & + $\cdots$ & $c_{im}$ \\ \hline + \end{tabular} + }^{c_i} \] +このリストの最初の整数値は受け取れるメッセージのタグが入っている。 +$c_{i2}$ 以降については最初の $c_{i1}$ の値によってそれぞれ異なる。 +ここでは、最初の要素が OX\_DATA の場合についてのみ説明する。 +この $c_{i1}$ が OX\_DATA の場合、 +リスト $c_i$ は CMO 形式についての情報を表しており、 +$m=2$ と決められている。 +$c_{i1}$ にはもちろんのこと OX\_DATA が入っており、 +$c_{i2}$ は以下の図のようなリスト構造になっている。 +各要素は 32 ビットの整数であり、 +受け取ることが可能な CMO 形式のタグが入る。 +\[ \overbrace{ + \begin{tabular}{|c|c|c|c|c|} \hline + $c_{i21}$ & $c_{i22}$ & $\cdots$ & $c_{i2l}$ \\ \hline + \end{tabular} + }^{c_{i2}} \] + +%なお、 mathcap データの中では CMO 形式で定義されている +%32 bit 整数、文字列、リスト構造が使われており、 +%mathcap データに含まれている内容を理解できるためには +%必然的にこれらも理解できる必要がある +%(ってことは CMO 形式のところでこれらを +%説明しなければならないってことです)。 + +具体的な mathcap の例をあげよう。 +%なお、 $a_1$, $a_2$, $\cdots$, $a_n$ を要素に +%持つリスト構造を {\tt [$a_1$, $a_2$, $\cdots$, $a_n$]} 、 +%文字列 ``string'' を {\tt "string"} 、 32 bit 整数を +%それに対応する 10 進数の整数で示す。 +名前が ``ox\_test'' 、バージョンナンバーが 199911250 のサーバであれば、 +$A$ の部分は +\begin{tabular}{|c|c|} \hline +199911250 & "ox\_test" \\ \hline +\end{tabular} +となる。 +さらに、このサーバのスタックマシンが +命令コード 2, 3, 5, 7, 11 番を利用可能 +(実際にはこのような命令コードは存在しない)であれば、 $B$ の部分は +\begin{tabular}{|c|c|c|c|c|} \hline +2 & 3 & 5 & 7 & 11 \\ \hline +\end{tabular} +となり、 +CMO 形式の 32 ビット整数、文字列、 mathcap 、リスト構造のみが +受け取れるときには、 $C$ の部分は +\begin{tabular}{|c|} \hline + \\[-5mm] + \begin{tabular}{|c|c|} \hline + & \\[-5mm] + OX\_DATA & + \begin{tabular}{|c|c|c|c|} \hline + CMO\_INT32 & CMO\_STRING & CMO\_MATHCAP & CMO\_LIST \\ \hline + \end{tabular} \\[0.8mm] \hline + \end{tabular} \\[1.4mm] \hline +\end{tabular} \\ +となる。 +CMO\_ZZ がないので、このサーバは多倍長整数が +送られてこないことを期待している。 + +なお、データが受け取れることと、 +データの論理構造が理解できることとはまったく別物であるので +注意する必要がある。 + + +\section{セキュリティ対策} + +OpenXM 規約は TCP/IP を用いて通信を行うことを考慮している。 +ネットワークによって接続される現代の多くのソフトウェアと同様、 +OpenXM 規約もまた通信時のセキュリティについて注意している。 +以下、このことについて説明しよう。 + +{\large\bf 意味不明なことを書いているが、} + +侵入者に攻撃の機会をできるだけ与えないようするた +めに、接続が必要になった時のみ接続を待つようにし、 +常に接続に関与するといったことは避けている(やっぱり意味不明である)。 + +また、侵入者が接続を行なう一瞬のすきを狙ってくる可能性もあるので、 +接続を行なう時に接続を待つポート番号をランダムに決めている(誰が決めてい +るのかはやっぱり不明であるが)。 +さらにもう一段安全性を高めるために、 +接続時に 1 回だけ使用可能なパスワードを作成し、 +そのパスワードを使って認証を行なう(誰がパスワードを決めて誰が認証を行っ +ているのかが不明だけど)。 +このパスワードは一旦使用されれば無効にするので、 +もし仮になんらかの手段でパスワードが洩れたとしても安全だと考えている。 + +%なお、上記のポート番号とパスワードは安全な手段で送られて +%いると仮定している。 +%また、同一のコンピュータ上に悪意のあるユーザはいないと仮定している +%ことに注意しなければならない。 +%なぜなら、現在の実装ではサーバ、およびクライアントの動作している +%コンピュータ上ではこのポート番号とパスワードがわかってしまうためである。 + +なお、接続が確立した後のメッセージの送受信に関しては、 +特に暗号化などの処置を行っているわけではない。 +もし必要があれば、通信路の暗号化を行なう機能がある +ソフトウェア ssh を使うことを考えている。 + +\section{他のプロジェクト} + +他のプロジェクトについても触れておこう。 + +\begin{itemize} +\item OpenMath + +OpenMath プロジェクトは数学的なオブジェクトを +コンピュータ上で表現する方法を決定している。 +各ソフトウェア間でオブジェクトを交換する際の +オブジェクトの変換手順についても述べられている。 +表現方法は一つだけでなく、 XML 表現や binary 表現などが +用意されている。 +詳細は + +http://www.openmath.org/omsoc/index.html A.M.Cohen + + +\item NetSolve + +http://www.cs.utk.edu/netsolve/ + + +\item MP + +http://symbolicNet.mcs.kent.edu/SN/areas/protocols/mp.html + + +\item MCP + +http://horse.mcs.kent.edu/~pwang/ +\end{itemize} + + +\section{現在提供されているソフトウェア} + +現在 OpenXM 規格に対応しているクライアントには +asir, sm1, Mathematica がある。 +これらのクライアントから +OpenXM 規格に対応したサーバを呼び出すことができる。 +現在 OpenXM 規約に対応しているサーバソフトウェアには、 + asir, sm1, gnuplot, Mathematica などがあり、 +それぞれ ox\_asir, ox\_sm1, ox\_sm1\_gnuplot, ox\_math +という名前で提供されている。 +また、 OpenMath 規格の XML 表現で表現されたオブジェクトと CMO 形式の +オブジェクトを変換するソフトウェアが JAVA によって実装されており、 +OMproxy という名前で提供されている。 + +\begin{thebibliography}{99} +\bibitem{Ohara-Takayama-Noro-1999} +小原功任, 高山信毅, 野呂正行: +{Open asir 入門}, 1999, 数式処理, Vol 7, No 2, 2--17. (ISBN4-87243-086-7, SEG 出版, Tokyo). +\bibitem{OpenXM-1999} +野呂正行, 高山信毅: +{Open XM の設計と実装 --- Open message eXchange protocol for Mathematics}, +1999/11/22 +\end{thebibliography} \end{document}