=================================================================== RCS file: /home/cvs/OpenXM/doc/Attic/genkou19991125.tex,v retrieving revision 1.4 retrieving revision 1.47 diff -u -p -r1.4 -r1.47 --- OpenXM/doc/Attic/genkou19991125.tex 1999/12/18 12:57:48 1.4 +++ OpenXM/doc/Attic/genkou19991125.tex 1999/12/22 18:01:06 1.47 @@ -1,129 +1,401 @@ \documentclass{jarticle} -\title{\bf Open XM($B%?%$%H%kL$Dj(B)} +\title{タイトル未定} \author{ - Maekawa \\ - Noro \\ - : \\ - : \\ +前川 将秀\thanks{神戸大学理学部数学科}, +野呂 正行\thanks{富士通研究所}, +小原 功任\thanks{金沢大学理学部計算科学教室}, \\ +奥谷 行央 +%\thanks{神戸大学大学院自然科学研究科博士課程前期課程数学専攻}, +\thanks{神戸大学大学院自然科学研究科数学専攻}, +高山 信毅\thanks{神戸大学理学部数学教室}, +田村 恭士 +%\thanks{神戸大学大学院自然科学研究科博士課程後期課程情報メディア科学専攻計算システム講座} +\thanks{神戸大学大学院自然科学研究科情報メディア科学専攻} } -\date{ 1999$BG/(B, 11$B7n(B25$BF|(B} - +\date{1999年11月25日} %\pagestyle{empty} \begin{document} \maketitle -\section{OpenXM $B$N7W;;%b%G%k(B} +\section{OpenXMとは} -OpenXM $B$O?t3X%=%U%H4V$G%a%C%;!<%8$r8r49$9$k$?$a$N5,Ls$G$"$k!#(B -OpenXM $B$H$O(B Open message eXchange protocol for Mathematics $B$NN,$G$"$k!#(B -$B?t3X%=%U%H4V$G%a%C%;!<%8$r$d$j$H$j$5$;$k$3$H$K$h$j!"(B -$B$"$k?t3X%=%U%H$+$iB>$N?t3X%=%U%H$r8F$S=P$7$F7W;;$r9T$J$C$?$j!"(B -$BB>$N%^%7%s$G7W;;$r9T$J$o$;$?$j$G$-$k$h$&$K$9$k!#(B -$BH/C<$OLnO$@59T$H9b;3?.5#$K$h$j!"(B asir $B$H(B kan/sm1 $B$r(B -$BAj8_$K8F$S=P$95!G=$r$N?t3X%=%U%H$r;H$($k$h$&$K$9$k$3$H$G$"$k!#(B +OpenXM は数学プロセス間でメッセージを交換するための規約である。 +数学プロセス間でメッセージをやりとりすることにより、 +ある数学プロセスから他の数学プロセスを呼び出して計算を行なったり、 +他のマシンで計算を行なわせたりすることが目的である。 +なお、 OpenXM とは Open message eXchange protocol for Mathematics の略である。 +OpenXM の開発の発端は野呂と高山により、 +asir と kan/sm1 を相互に呼び出す機能を実装したことである。 -$BH/C<$H$J$C$?(B asir $B$H(B kan/sm1 $B$G$N$N7A<0$r$b(B -$B07$($k$h$&$K$7$F$"$k!#(B +%OpenXM 規約独自のデータ形式である CMO 形式(Common Mathematical Object format) +%以外にも、 MP や OpenMath の XML, binary 表現形式といった他の形式をも +%扱えるようにしてある。 +OpenXM 規約では通信路の確保の方法に幾らかの自由度があるが、 +現在は TCP/IP ソケットを用いた実装しかない。 +%通信の実現方法は通信路のとりかたにより変わる。 +そこで、以後ここでは具体的な実装は TCP/IP ソケットを +用いていると仮定する。 -\section{OpenXM $B$N%a%C%;!<%8$N9=B$(B} -OpenXM $B$G5,Dj$7$F$$$k%a%C%;!<%8$OO@M}E*$K(B -OX $BAX!"(B SM $BAX!"(B CMO $BAX$KJ,$1$k$3$H$,$G$-$k!#(B -$B$3$NCf$G!"%a%C%;!<%8$H$7$FAw$k$3$H$,2DG=$J$N$O(B -OX $BAX$GDj5A$5$l$?$b$N$@$1$G$"$j!"(B -SM $BAX!"(B CMO $BAX$GDj5A$5$l$F$$$k%G!<%?$O(B -OX $BAX$GDj5A$5$l$F$$$k%G!<%?$N0lIt$KKd$a9~$^$l$F(B -$BAw$i$l$k!#(B -SM $BAX!"(B CMO $BAX$GDj5A$5$l$F$$$k%G!<%?0J30$K$b(B -$BA0=R$N(B MP $B$d(B OpenMath $B$N(B XML, binary $BI=8=$b(B -OX $BAX$KKd$a9~$^$l$FAw$i$l$k$o$1$G$"$k$,!"(B -$B$I$N$h$&$J%G!<%?$,Kd$a9~$^$l$F$$$k$+$O!"(B -OX $BAX$N@hF,$N(B tag $B$r8+$l$PH=JL$G$-$k$h$&$K$J$C$F$$$k!#(B +\section{OpenXM のメッセージの構造} +OpenXM で規定されている TCP/IP 実装によるメッセージは +バイトストリームとなっており、 +次のような構造になっている。 -\section{OpenXM $B$N7W;;$N?J9TJ}K!(B} +\begin{tabular}{|c|c|} \hline +ヘッダ & \hspace{10mm} ボディ \hspace{10mm} \\ \hline +\end{tabular} -OpenXM $B5,Ls$G$N%a%C%;!<%8$N8r49$O%5!<%P$H%/%i%$%"%s%H$N4V$G(B -$B9T$J$o$l$k!#%/%i%$%"%s%H$+$i%5!<%P$X7W;;$5$;$?$$%G!<%?$r(B -$B%a%C%;!<%8$H$7$FAw$j!"Dj$5$l$F$*$j!"l9g$K$O!"$=$l$KBP1~$9$kF0:n$r9T$J$&!#(B -$B$3$N$H$-!"I,MW$,$"$l$P%5!<%P$O%9%?%C%/$+$i%G!<%?$rl9g!"(B -$B%5!<%P$OF0:n$N7k2L$r%9%?%C%/$K@Q$s$G$$$k!#(B -$B%5!<%P$K9T$J$o$;$?F0:n$N7k2L$r%/%i%$%"%s%H$,CN$j$?$$>l9g!"(B -$B%9%?%C%/$+$i%G!<%?$rl9g!"(B -CMO $BAX$GDj5A$5$l$F$$$kB?G\D9@0?t$rM}2r$7$F$*$/$H!"(B -CMO $BAX$NB>$N%G!<%?9=B$$@$1$G$J$/!"(B OX $BAX!"(B SM $BAX$N%G!<%?$r(B -$BM}2r$9$k=u$1$K$J$k$H;W$($k$N$G!"(B CMO $BAX$NB?G\D9@0?t$N(B -$B%G!<%?9=B$$K$D$$$F@bL@$9$k!#(B +OpenXM 規約では、数学的オブジェクトを表現するオリジナルの方法として +CMO 形式(Common Mathematical Object format)を定義している。 +この CMO 形式を使ってメッセージを送るには、 +タグを OX\_DATA にすればよい。 +CMO 形式におけるメッセージのボディ部分について以下で説明するが、 +%OpenXM 規約で定義されているメッセージを実際に作成する場合、 +CMO 形式で定義されている多倍長整数を理解しておくと、 +CMO 形式の他のデータ構造だけでなく、 +OpenXM 規約で定義されている様々なデータ構造を理解する助けになると思えるので、 +ここでは CMO 形式の多倍長整数のデータ構造についてのみ説明する。 -CMO $BAX$GDj5A$5$l$F$$$k%G!<%?$OB?G\D9@0?t0J30$K$b(B -$BJ8;zNs$d%j%9%H$J$I$,$"$k!#$I$N$h$&$J%G!<%?$G$"$k$+$O(B -$B%G!<%?$N@hF,$K$"$k(B tag $B$r8+$l$PH=JL$G$-$k$h$&$K$J$C$F$$$k!#(B -$B$3$l$O(B OX $BAX$G$N%G!<%?$NH=JL$N;EJ}$H$*$J$8$G$"$k!#(B -$B$J$*!"(B tag $B$O3F%G!<%?Kh$K(B 32 bit $B$N@0?t$GI=$5$l$F$*$j!"(B -$BB?G\D9@0?t$O(B 20 $B$H$J$C$F$$$k!#(B +CMO 形式で定義されているデータは多倍長整数以外にも +文字列やリスト構造などがある。どのようなデータであるかは +データの先頭にある(メッセージの識別子とは別にある)タグを見れば +判別できるようになっている。 +これはメッセージの種類の判別の仕方とおなじである。 +なお、タグは各データ毎に 32 bit の整数で表されており、 +多倍長整数は 20 となっている。 +よく使われると思われる CMO 形式のタグをあげておく。 +\begin{verbatim} +#define CMO_INT32 2 /* 32 ビット整数 */ +#define CMO_STRING 4 /* 文字列 */ +#define CMO_LIST 17 /* リスト構造 */ +#define CMO_ZZ 20 /* 多倍長整数 */ +\end{verbatim} -$BI=8=$7$?$$B?G\D9@0?t$N@dBPCM$r(B 2 $B?J?t$GI=$7$?>l9g$N7e?t$r(B $n$ $B$H(B -$B$7$?$H$-!"l9g$N7e?t$H$H$C$F$b$h$$!#(B -$B$?$@$7!"I=8=$7$?$$?t$,Ii$N>l9g$O$3$N(B 32 bit $B$NCM$O(B 2 $B$NJd?tI=8=$GIi$K$J$k!#(B +ここで TCP/IP 実装における 32 bit の整数の +表現方法について説明する必要がある。 +OpenXM 規約の TCP/IP 実装ではバイトストリームで 32 bit の整数 20 を +{\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。 +この表現方法の違いはクライアントとサーバの最初の接続時に +双方の合意で決定することになっている。 +なお、合意がない場合には前者の表現方法 +(以後、この表現方法をネットワークバイトオーダーと呼ぶ)を +使うことになっている。 +また、負の数を表現する必要があるときには、 +2 の補数表現を使うことになっている。 +表現したい多倍長整数の絶対値を 2 進数で表した場合の桁数を $n$ と +したとき、次にくるデータは $[(n+31)/32]$ を 32 bit の整数で表した値となる。 +これは多倍長整数の絶対値を $2^{32}$ 進数で表した場合の桁数ととってもよい。 +ただし、表現したい数が負の場合は $[(n+31)/32]$ を 32 bit の整数で表した値を + 2 の補数表現で負にして、正の場合と区別する。 -\section{MathCap $B$K$D$$$F(B} +表現したい多倍長整数の絶対値が $2^{32}$ 進数で $(b_0 b_1 ... b_k)_{2^{32}}$ +と表せるとき、次にくるデータは $b_0$, $b_1$, $\cdots$, $b_k$ を +それぞれ 32 bit の整数で表現した値となる。 +%以下は書き直しの必要があるかも... +なお、 GNU MP LIBRARY を用いると、 +C 言語から多倍長整数や任意精度浮動小数を扱うことができる。 +$b_0$, $b_1$, $\cdots$, $b_k$ をそれぞれ 32 bit 整数で表現した値は +この GNU MP LIBRARY で用いられている多倍長整数で使われている形式を +参考にして合わせてある。 -\section{security $BBP:v(B} +ここで具体例をだそう。 +$4294967298 = 1 \times 2^{32} + 2$ をネットワークバイトオーダーの多倍長整数で +表現すると、 +\begin{center} + {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01} +\end{center} +となる。また、同じ表現方法で $-1$ を表現すると、 +\begin{center} + {\tt 00 00 00 14 ff ff ff ff 00 00 00 01} +\end{center} +となる。 -\section{$BB>$N%W%m%8%'%/%H(B} -\section{$B8=:_Ds6!$5$l$F$$$k%=%U%H%&%'%"(B} +\section{MathCap について} + +サーバおよびクライアント双方ともに OpenXM で規定されている +メッセージの中のデータ形式をすべて受け取れるわけではない。 +しかも、 OpenXM 規約で規定されているデータ形式だけが +受渡しに使われるというわけではない。 +そこで、 OpenXM では相手側が受け取ることができるデータ形式を +収得する方法を用意している。 + +CMO 形式で定義されている MathCap データは +%理解可能なメッセージの +受け取ることができるデータ形式を表すデータであり、 +要求されればサーバはサーバ自身の MathCap データをスタックに積む。 +また、クライアントから MathCap データをサーバへ送ることもでき、 +MathCap データをサーバとクライアントの間で交換することによって、 +お互いに相手側が受け取ることができないデータ形式で +メッセージを送ってしまうのを防ぐことができる。 +なお、 MathCap データの中では CMO 形式で定義されている +32 bit 整数、文字列、リスト構造が使われており、 +MathCap データに含まれている内容を理解できるためには +必然的にこれらも理解できる必要がある。 + +OpenXM 対応版の asir サーバである ox\_asir が返す MathCap を以下に示す。 + +%なお、 $a_1$, $a_2$, $\cdots$, $a_n$ を要素に +%持つリスト構造を {\tt [$a_1$, $a_2$, $\cdots$, $a_n$]} 、 +%文字列 ``string'' を {\tt "string"} 、 32 bit 整数を +%それに対応する 10 進数の整数で示す。 + +%↓手で作ったので間違えている可能性あり。 +%%古いバージョン。差し替えの必要あり。 +\begin{verbatim} +[ [199901160,"ox_asir"], + [276,275,258,262,263,266,267,268,274 + ,269,272,265,264,273,300,270,271], + [ [514,[1,2,3,4,5,2130706433,2130706434 + ,17,19,20,21,22,24,25,26,31,27,33,60]], + [2144202544,[0,1]] + ] +] +\end{verbatim} + +この MathCap データのリスト構造は大きく分けて 3 つの部分に分かれる。 +最初の {\tt [199901160,"ox\_asir"]} の部分にはサーバの情報が入っている。 +%この最初の要素がまたリスト構造となっており、 +最初の要素はバージョンナンバーを、次の要素はサーバの名前を表している。 + +次の {\tt [276,275,$\cdots$,271]} の部分は +サーバに対する動作に対応した理解可能なデータの種類を表している。 +サーバの動作に対するデータはすべて 32 bit の整数で表しており、 +このリストは理解可能なデータに対応する 32 bit 整数のリストとなっている。 + +最後の {\tt [ [514,[1,2,3,$\cdots$,60]],[2144202544,[0,1]] ]} の部分は +理解可能なデータの形式を表している。 +この部分はさらに {\tt [514,[1,2,3,$\cdots$,60]]} と +{\tt [2144202544,[0,1]]} にの部分に分けることができ、 +それぞれが一つのデータ形式についての情報となっている。 +どのデータ形式についての情報かは最初の要素にある整数値をみれば +分かるようになっている。 +この整数値は CMO 形式では 514 となっている。 +最初のデータ形式を区別する整数値以後の要素は +各データ形式によってどのように使われるか定まっている。 +CMO 形式では理解可能なデータのタグがリストの中に収まっている。 +前節で CMO 形式では多倍長整数を表すタグが 20 であることを述べたが、 +このリストに 20 が含まれているので、 +ox\_asir は CMO 形式の多倍長整数を受け取れることがわかる。 + +%%このリストの要素はまたリストとなっており、 +%この最後の部分もまたリストとなっており、 +%あるデータ形式で理解可能なものを表現したリストを要素としている。 +%{\tt [514,[1, 2, $\cdots$]]} の最初の 514 はこのリストが CMO 形式 +%での理解可能なデータを表していることを示しており、 +%その後のリストでは CMO 層で定義されているデータのうち、 +%理解可能なデータのタグが並んでいる。 + +なお、データが受け取れることと、 +データの論理構造が理解できることとはまったく別物であるので +注意する必要がある。 + + +\section{セキュリティ対策} + +OpenXM では幾らかのセキュリティ対策を考えている。 +OpenXM に対応したソフトウェアをクラックしても +大した利点はないと思えるが、それは設計上の話であって、 +予期せぬ手段で攻撃を受けた場合にどのような事態を +招くかは想像し難い。 + +そこで、 OpenXM では侵入者に攻撃の機会を +できるだけ与えないようにしている。 +具体的には、接続が必要になった時のみ接続を待つようにし、 +常に接続に関与するといったことは避けている。 + +しかし、これだけでは侵入者が接続を行なう一瞬のすきを +狙ってくる可能性もある。 +そこで接続を行なう時に、 +接続を待つポート番号をランダムに決めている。 +こうすることで、特定のポート番号を狙って接続を行なう +瞬間を待つ手口を幾らか防ぐことができる。 + +さらにもう一段安全性を高めるために、 +接続時に 1 回だけ使用可能なパスワードを作成し、 +そのパスワードを使って認証を行なう。 +このパスワードは一旦使用されれば無効にするので、 +もし仮になんらかの手段でパスワードが洩れたとしても安全である。 + +なお、上記のポート番号とパスワードは安全な手段で送られて +いると仮定している。 +また、同一のコンピュータ上に悪意のあるユーザはいないと仮定している +ことに注意しなければならない。 +なぜなら、現在の実装ではサーバ、およびクライアントの動作している +コンピュータ上ではこのポート番号とパスワードがわかってしまうためである。 + +なお、接続が確立した後のメッセージの送受信に関しては、 +特に暗号化などの処置が行なわれているわけではない。 +もし必要があれば、通信路の暗号化を行なう機能がある +ソフトウェアを使うことを考えている。 + + +\section{他のプロジェクト} + +他のプロジェクトについても触れておこう。 + +OpenMath プロジェクトは数学的なオブジェクトを +コンピュータ上で表現する方法を決定している。 +各ソフトウェア間でオブジェクトを交換する際の +オブジェクトの変換手順についても述べられている。 +表現方法は一つだけでなく、 XML 表現や binary 表現などが +用意されている。 +詳細は + +http://www.openmath.org/omsoc/index.html A.M.Cohen + + +以下は書いてる途中。 + +NetSolve + +http://www.cs.utk.edu/netsolve/ + + +MP + +http://symbolicNet.mcs.kent.edu/SN/areas/protocols/mp.html + + +MCP + +http://horse.mcs.kent.edu/~pwang/ + + +\section{現在提供されているソフトウェア} + +現在 OpenXM 規格に対応しているクライアントには +asir, sm1, Mathematica がある。 +これらのクライアントから +OpenXM 規格に対応したサーバを呼び出すことができる。 +現在 OpenXM 規約に対応しているサーバソフトウェアには、 + asir, sm1, gnuplot, Mathematica などがあり、 +それぞれ ox\_asir, ox\_sm1, ox\_math という名前で提供されている。 +また、 OpenMath 規格の XML 表現で表現されたデータと CMO 形式の +データを変換するソフトウェアが JAVA によって実装されており、 +OMproxy という名前で提供されている。 + \end{document}