[BACK]Return to genkou19991125.tex CVS log [TXT][DIR] Up to [local] / OpenXM / doc

Annotation of OpenXM/doc/genkou19991125.tex, Revision 1.46

1.1       tam         1: \documentclass{jarticle}
                      2:
1.30      ohara       3: \title{タイトル未定}
1.1       tam         4: \author{
1.34      tam         5: 前川 将秀\thanks{神戸大学理学部数学科},
                      6: 野呂 正行\thanks{富士通研究所},
1.40      tam         7: 小原 功任\thanks{金沢大学理学部計算科学教室}, \\
1.41      tam         8: 奥谷 行央
1.35      tam         9: %\thanks{神戸大学大学院自然科学研究科博士課程前期課程数学専攻},
                     10: \thanks{神戸大学大学院自然科学研究科数学専攻},
1.34      tam        11: 高山 信毅\thanks{神戸大学理学部数学教室},
1.35      tam        12: 田村 恭士
                     13: %\thanks{神戸大学大学院自然科学研究科博士課程後期課程情報メディア科学専攻計算システム講座}
                     14: \thanks{神戸大学大学院自然科学研究科情報メディア科学専攻}
1.1       tam        15: }
1.30      ohara      16: \date{1999年11月25日}
1.2       tam        17: %\pagestyle{empty}
1.1       tam        18:
                     19: \begin{document}
                     20: \maketitle
                     21:
1.30      ohara      22: \section{OpenXMとは}
                     23:
1.43      tam        24: OpenXM は数学プロセス間でメッセージを交換するための規約である。
                     25: 数学プロセス間でメッセージをやりとりすることにより、
                     26: ある数学プロセスから他の数学プロセスを呼び出して計算を行なったり、
                     27: 他のマシンで計算を行なわせたりすることが目的である。
                     28: なお、 OpenXM とは Open message eXchange protocol for Mathematics の略である。
                     29: OpenXM の開発の発端は野呂と高山により、
                     30: asir と kan/sm1 を相互に呼び出す機能を実装したことである。
1.31      tam        31:
1.40      tam        32: %発端となった asir と kan/sm1 での実装時には、
                     33: 初期の実装では、相手側のローカル言語の文法に従った文字列を送っていた。
1.41      tam        34: 現在の OpenXM 規約では共通表現形式によるメッセージを用いている。
1.43      tam        35: この方法では相手側のソフトが asir なのか kan/sm1 なのかを判別するなどして、
                     36: 相手側のローカル言語の文法に合わせた文字列を作成する必要がなくなる。
1.41      tam        37: しかし、ローカル言語の文法に従った文字列を送る方法も、
                     38: 効率的であるとはいい難いが、使いやすい。
1.43      tam        39: そのため、 OpenXM 規約では共通表現形式の中の文字列として、
                     40: ローカル言語の文法に従った文字列を用いた
                     41: メッセージの交換も可能となっている。
1.41      tam        42:
                     43: %OpenXM 規約独自のデータ形式である CMO 形式(Common Mathematical Object format)
                     44: %以外にも、 MP や OpenMath の XML, binary 表現形式といった他の形式をも
                     45: %扱えるようにしてある。
                     46:
1.43      tam        47: OpenXM 規約では通信路の確保の方法に幾らかの自由度があるが、
                     48: 現在は TCP/IP ソケットを用いた実装しかない。
                     49: %通信の実現方法は通信路のとりかたにより変わる。
                     50: そこで、以後ここでは具体的な実装は TCP/IP ソケットを
                     51: 用いていると仮定する。
1.39      tam        52:
1.30      ohara      53:
1.36      tam        54: \section{OpenXM のメッセージの構造}
1.30      ohara      55:
1.43      tam        56: OpenXM で規定されている TCP/IP 実装によるメッセージは
                     57: バイトストリームとなっており、
1.36      tam        58: 次のような構造になっている。
1.30      ohara      59:
1.36      tam        60: \begin{tabular}{|c|c|} \hline
                     61: ヘッダ & \hspace{10mm} ボディ \hspace{10mm} \\ \hline
                     62: \end{tabular}
                     63:
                     64: ヘッダの長さは 8 バイトであると定められている。
                     65: ボディの長さはメッセージごとに異なっているが、
1.40      tam        66: 長さは $0$ でもよい。
1.38      tam        67:
1.36      tam        68: ヘッダは次の二つの情報を持っている。
1.30      ohara      69: \begin{enumerate}
1.43      tam        70: \item  前半の 4 バイト。メッセージの種類を表わす識別子であり、
1.36      tam        71:        タグと呼ばれる。
1.43      tam        72: \item  後半の 4 バイト。メッセージにつけられた通し番号である。
1.30      ohara      73: \end{enumerate}
1.36      tam        74: それぞれの 4 バイトは 32 ビット整数とみなされて扱われる。
                     75: この場合に用いられる整数の表現方法の説明については後述するが、
                     76: 基本的に表現方法はいくつかの選択肢から選ぶことが可能となっており、
                     77: またその選択は通信路の確立時に一度だけなされることに注意しなければならない。
1.45      tam        78: OpenXM 規約で定義されているタグの整数値で
                     79: よく使われると思うものを以下にあげておく。
                     80:
                     81: \begin{verbatim}
                     82: #define        OX_COMMAND      513
                     83: #define        OX_DATA 514
                     84: \end{verbatim}
1.30      ohara      85:
1.43      tam        86: ボディの中身はタグによるメッセージの種類によって
1.37      tam        87: それぞれ独立に決められるようになっている。
1.43      tam        88: もし、システム固有の表現を OpenXM 規約のメッセージに
                     89: 埋め込んで使いたい場合には、
1.44      tam        90: タグの値をこのような用途のために推奨されている
                     91: 整数値の範囲に設定し、
1.43      tam        92: システム固有の表現をボディに埋め込めばよい。
1.42      tam        93:
                     94:
                     95: \section{OpenXM の計算モデル}
                     96:
1.44      tam        97: %{\Huge この節では計算モデルの話をしなければいけません}
1.42      tam        98:
                     99: OpenXM 規約での計算とはメッセージを交換することである。
                    100: また、 OpenXM 規約ではクライアント・サーバモデルを採用しているので、
                    101: メッセージの交換はサーバとクライアントの間で行なわれる。
                    102: クライアントからサーバへメッセージを送り、
                    103: サーバからクライアントがメッセージを受け取ることによって
                    104: 計算の結果が得られる。
                    105:
                    106: サーバはスタックマシンであると仮定されており、
1.45      tam       107: サーバがクライアントから受け取ったメッセージは、
                    108: タグが OX\_COMMAND でなければすべてスタックに積まれる。
                    109: タグが OX\_COMMAND となっているメッセージは
                    110: スタックマシンへの命令であり、このメッセージを受け取ったサーバは
                    111: それに対応する動作を行なうことが期待されている。
                    112: しかし、サーバはメッセージを受け取らない限り、
                    113: 自ら何か動作を行なおうとはしない。
                    114: これは毎回サーバへメッセージを送るたびに、
                    115: いつもサーバからのメッセージをクライアントが待つ必要がないことを意味する。
1.42      tam       116: このため、クライアントはサーバの状態を気にせずにメッセージを送り、
                    117: 一旦メッセージを送付し終えた後、
                    118: サーバへ送ったメッセージの結果を
                    119: サーバから待つことなしに次の動作に移ることができる。
                    120:
1.30      ohara     121:
                    122: \section{OpenXM の計算の進行方法}
                    123:
1.45      tam       124: サーバが行うのは基本的に次の事柄だけである。
                    125: クライアントからメッセージを受け取ると、
                    126: サーバはまずメッセージの識別子を調べ、
                    127: タグが OX\_COMMAND のメッセージでなければスタックに積む。
                    128: タグが OX\_COMMAND のメッセージであればメッセージのボディから
                    129: スタックマシンの命令コードを取りだし、
1.39      tam       130: あらかじめ規約で定められた動作を行なう。
                    131:
1.45      tam       132: 上の説明でわかるように、
1.39      tam       133: サーバはクライアントからの指示なしに、
1.45      tam       134: 自らメッセージを送らないことに注意する必要がある。
1.39      tam       135: %(例外? ox\_asir の mathcap)。
1.30      ohara     136:
1.45      tam       137: サーバがクライアントから受け取ったメッセージはすべてスタックに積まれている。
                    138: 次いでサーバにスタックマシンへの命令を送ると、
1.39      tam       139: 初めてサーバはデータをスタックに積む以外のなんらかの動作を行なう。
1.30      ohara     140: このとき、必要があればサーバはスタックから必要なだけデータを取り出す。
                    141: ここで、クライアントからの命令による動作中にたとえエラーが発生したとしても
                    142: サーバはエラーオブジェクトをスタックに積むだけで、
1.45      tam       143: 明示されない限りエラーをクライアントへ返さないことに注意しなければならない。
1.30      ohara     144:
                    145: 結果が生じる動作をサーバが行なった場合、
1.41      tam       146: サーバは動作の結果をスタックに積む。
1.30      ohara     147: サーバに行なわせた動作の結果をクライアントが知りたい場合、
1.45      tam       148: スタックからデータを取り出し送信を行なう命令をサーバ側へ送ればよい。
1.39      tam       149:
1.45      tam       150: %{\Huge 以下、書き直し}
1.3       tam       151:
1.45      tam       152: クライアントがサーバへメッセージを送り、
                    153: 計算の結果を得るという手順を追っていくと次のようになる。
1.3       tam       154:
                    155: \begin{enumerate}
1.45      tam       156: \item  まず、クライアントがサーバへメッセージを送る。
                    157:        サーバは送られてきたメッセージをスタックに積む。
                    158: \item  クライアントがサーバにスタックマシンへの命令を送ると、
                    159:        サーバは必要なだけスタックからデータを取り出し、
                    160:        実行した結果をスタックに積む。
                    161: \item  最後に「スタックからデータを取り出し送信を行なう命令」を
1.30      ohara     162:        サーバへ送ると、サーバはスタックから計算結果の入っている
                    163:        データを取り出し、クライアントへ送出する。
1.4       tam       164: \end{enumerate}
1.2       tam       165:
1.1       tam       166:
1.30      ohara     167: \section{CMO のデータ構造}
1.4       tam       168:
1.45      tam       169: OpenXM 規約では、数学的オブジェクトを表現するオリジナルの方法として
                    170: CMO 形式(Common Mathematical Object format)を定義している。
1.46    ! tam       171: この CMO 形式を使ってメッセージを送るには、
        !           172: タグを OX\_DATA にすればよい。
1.45      tam       173:
1.46    ! tam       174:
        !           175: %OpenXM 規約で定義されているメッセージを実際に作成する場合、
1.30      ohara     176: CMO 形式で定義されている多倍長整数を理解しておくと、
                    177: CMO 形式の他のデータ構造だけでなく、 OX 形式、 SM 形式のデータを
1.46    ! tam       178: 理解する助けになると思えるので、
        !           179: 以下 CMO 形式の多倍長整数のデータ構造について説明する。
1.30      ohara     180:
                    181: CMO 形式で定義されているデータは多倍長整数以外にも
                    182: 文字列やリスト構造などがある。どのようなデータであるかは
                    183: データの先頭にあるタグを見れば判別できるようになっている。
                    184: これはメッセージのデータの判別の仕方とおなじである。
                    185: なお、タグは各データ毎に 32 bit の整数で表されており、
                    186: 多倍長整数は 20 となっている。
                    187: ここで 32 bit の整数の表現方法について説明する必要がある。
                    188: OpenXM ではバイト列で 32 bit の整数 20 を
                    189: {\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。
                    190: この表現方法の違いはクライアントとサーバの最初の接続時に
                    191: 双方の合意で決定することになっている。
                    192: なお、合意がない場合には
                    193: 前者の表現方法(以後、この表現方法を network byte order と呼ぶ)を
                    194: 使うことになっている。
                    195: また、負の数を表現する必要があるときには、
                    196: 2 の補数表現を使うことになっている。
                    197:
                    198: 表現したい多倍長整数の絶対値を 2 進数で表した場合の桁数を $n$ と
                    199: したとき、次にくるデータは $[(n+31)/32]$ を 32 bit の整数となる。
                    200: これは多倍長整数の絶対値を $2^{32}$ 進数で表した場合の桁数ととってもよい。
                    201: ただし、表現したい数が負の場合は $[(n+31)/32]$ を 32 bit の整数で表した値を
                    202:  2 の補数表現で負にして、正の場合と区別する。
                    203:
                    204: 表現したい多倍長整数の絶対値が $2^{32}$ 進数で $(b_0 b_1 ... b_k)_{2^{32}}$
                    205: と表せるとき、次にくるデータは $b_0$, $b_1$, $\cdots$, $b_k$ を
                    206: それぞれ 32 bit の整数で表現した値となる。
                    207: %以下は書き直しの必要があるかも...
                    208: なお、 GNU MP LIBRARY を用いると、
                    209: C 言語から多倍長整数や任意精度浮動小数を扱うことができる。
                    210: $b_0$, $b_1$, $\cdots$, $b_k$ をそれぞれ 32 bit 整数で表現した値は
                    211: この GNU MP LIBRARY で用いられている多倍長整数で使われている形式を
                    212: 参考にして合わせてある。
                    213:
                    214: ここで具体例をだそう。
                    215: $4294967298 = 1 \times 2^{32} + 2$ を network byte order の多倍長整数で
                    216: 表現すると、
1.6       tam       217: \begin{center}
                    218:        {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01}
                    219: \end{center}
1.30      ohara     220: となる。また、同じ表現方法で $-1$ を表現すると、
1.6       tam       221: \begin{center}
                    222:        {\tt 00 00 00 14 ff ff ff ff 00 00 00 01}
                    223: \end{center}
1.30      ohara     224: となる。
1.4       tam       225:
1.1       tam       226:
1.30      ohara     227: \section{MathCap について}
1.6       tam       228:
1.30      ohara     229: サーバおよびクライアント双方ともに OpenXM で規定されている
                    230: メッセージの中のデータ形式をすべて受け取れるわけではない。
                    231: しかも、 OpenXM 規約で規定されているデータ形式だけが
                    232: 受渡しに使われるというわけではない。
                    233: そこで、 OpenXM では相手側が受け取ることができるデータ形式を
                    234: 収得する方法を用意している。
                    235:
                    236: CMO 形式で定義されている MathCap データは
                    237: %理解可能なメッセージの
                    238: 受け取ることができるデータ形式を表すデータであり、
                    239: 要求されればサーバはサーバ自身の MathCap データをスタックに積む。
                    240: また、クライアントから MathCap データをサーバへ送ることもでき、
                    241: MathCap データをサーバとクライアントの間で交換することによって、
                    242: お互いに相手側が受け取ることができないデータ形式で
                    243: メッセージを送ってしまうのを防ぐことができる。
                    244: なお、 MathCap データの中では CMO 形式で定義されている
                    245: 32 bit 整数、文字列、リスト構造が使われており、
                    246: MathCap データに含まれている内容を理解できるためには
                    247: 必然的にこれらも理解できる必要がある。
                    248:
                    249: OpenXM 対応版の asir サーバである ox\_asir が返す MathCap を以下に示す。
                    250:
                    251: %なお、 $a_1$, $a_2$, $\cdots$, $a_n$ を要素に
                    252: %持つリスト構造を {\tt [$a_1$, $a_2$, $\cdots$, $a_n$]} 、
                    253: %文字列 ``string'' を {\tt "string"} 、 32 bit 整数を
                    254: %それに対応する 10 進数の整数で示す。
1.7       tam       255:
1.30      ohara     256: %↓手で作ったので間違えている可能性あり。
                    257: %%古いバージョン。差し替えの必要あり。
1.7       tam       258: \begin{verbatim}
                    259: [ [199901160,"ox_asir"],
                    260:   [276,275,258,262,263,266,267,268,274
                    261:     ,269,272,265,264,273,300,270,271],
1.8       tam       262:   [ [514,[1,2,3,4,5,2130706433,2130706434
                    263:           ,17,19,20,21,22,24,25,26,31,27,33,60]],
                    264:     [2144202544,[0,1]]
1.7       tam       265:   ]
                    266: ]
                    267: \end{verbatim}
                    268:
1.31      tam       269: この MathCap データのリスト構造は大きく分けて 3 つの部分に分かれる。
                    270: 最初の {\tt [199901160,"ox\_asir"]} の部分にはサーバの情報が入っている。
                    271: %この最初の要素がまたリスト構造となっており、
                    272: 最初の要素はバージョンナンバーを、次の要素はサーバの名前を表している。
                    273:
                    274: 次の {\tt [276,275,$\cdots$,271]} の部分は
                    275: サーバに対する動作に対応した理解可能なデータの種類を表している。
                    276: サーバの動作に対するデータはすべて 32 bit の整数で表しており、
                    277: このリストは理解可能なデータに対応する 32 bit 整数のリストとなっている。
                    278:
                    279: 最後の {\tt [ [514,[1,2,3,$\cdots$,60]],[2144202544,[0,1]] ]} の部分は
                    280: 理解可能なデータの形式を表している。
                    281: この部分はさらに {\tt [514,[1,2,3,$\cdots$,60]]} と
                    282: {\tt [2144202544,[0,1]]} にの部分に分けることができ、
                    283: それぞれが一つのデータ形式についての情報となっている。
                    284: どのデータ形式についての情報かは最初の要素にある整数値をみれば
                    285: 分かるようになっている。
                    286: この整数値は CMO 形式では 514 となっている。
                    287: 最初のデータ形式を区別する整数値以後の要素は
                    288: 各データ形式によってどのように使われるか定まっている。
1.40      tam       289: CMO 形式では理解可能なデータのタグがリストの中に収まっている。
                    290: 前節で CMO 形式では多倍長整数を表すタグが 20 であることを述べたが、
1.31      tam       291: このリストに 20 が含まれているので、
                    292: ox\_asir は CMO 形式の多倍長整数を受け取れることがわかる。
                    293:
                    294: %%このリストの要素はまたリストとなっており、
                    295: %この最後の部分もまたリストとなっており、
                    296: %あるデータ形式で理解可能なものを表現したリストを要素としている。
                    297: %{\tt [514,[1, 2, $\cdots$]]} の最初の 514 はこのリストが CMO 形式
                    298: %での理解可能なデータを表していることを示しており、
                    299: %その後のリストでは CMO 層で定義されているデータのうち、
1.40      tam       300: %理解可能なデータのタグが並んでいる。
1.31      tam       301:
                    302: なお、データが受け取れることと、
                    303: データの論理構造が理解できることとはまったく別物であるので
                    304: 注意する必要がある。
                    305:
                    306:
                    307: \section{セキュリティ対策}
                    308:
                    309: OpenXM では幾らかのセキュリティ対策を考えている。
                    310: OpenXM に対応したソフトウェアをクラックしても
                    311: 大した利点はないと思えるが、それは設計上の話であって、
                    312: 予期せぬ手段で攻撃を受けた場合にどのような事態を
                    313: 招くかは想像し難い。
                    314:
                    315: そこで、 OpenXM では侵入者に攻撃の機会を
                    316: できるだけ与えないようにしている。
                    317: 具体的には、接続が必要になった時のみ接続を待つようにし、
                    318: 常に接続に関与するといったことは避けている。
                    319:
                    320: しかし、これだけでは侵入者が接続を行なう一瞬のすきを
                    321: 狙ってくる可能性もある。
                    322: そこで接続を行なう時に、
1.40      tam       323: 接続を待つポート番号をランダムに決めている。
                    324: こうすることで、特定のポート番号を狙って接続を行なう
1.31      tam       325: 瞬間を待つ手口を幾らか防ぐことができる。
                    326:
                    327: さらにもう一段安全性を高めるために、
                    328: 接続時に 1 回だけ使用可能なパスワードを作成し、
                    329: そのパスワードを使って認証を行なう。
                    330: このパスワードは一旦使用されれば無効にするので、
                    331: もし仮になんらかの手段でパスワードが洩れたとしても安全である。
                    332:
1.40      tam       333: なお、上記のポート番号とパスワードは安全な手段で送られて
1.31      tam       334: いると仮定している。
                    335: また、同一のコンピュータ上に悪意のあるユーザはいないと仮定している
                    336: ことに注意しなければならない。
                    337: なぜなら、現在の実装ではサーバ、およびクライアントの動作している
1.40      tam       338: コンピュータ上ではこのポート番号とパスワードがわかってしまうためである。
1.31      tam       339:
                    340: なお、接続が確立した後のメッセージの送受信に関しては、
                    341: 特に暗号化などの処置が行なわれているわけではない。
                    342: もし必要があれば、通信路の暗号化を行なう機能がある
                    343: ソフトウェアを使うことを考えている。
                    344:
                    345:
                    346: \section{他のプロジェクト}
                    347:
                    348: 他のプロジェクトについても触れておこう。
                    349:
                    350: OpenMath プロジェクトは数学的なオブジェクトを
                    351: コンピュータ上で表現する方法を決定している。
                    352: 各ソフトウェア間でオブジェクトを交換する際の
                    353: オブジェクトの変換手順についても述べられている。
                    354: 表現方法は一つだけでなく、 XML 表現や binary 表現などが
                    355: 用意されている。
                    356: 詳細は
                    357:
                    358: http://www.openmath.org/omsoc/index.html A.M.Cohen
                    359:
                    360:
                    361: 以下は書いてる途中。
                    362:
                    363: NetSolve
                    364:
                    365: http://www.cs.utk.edu/netsolve/
                    366:
                    367:
                    368: MP
                    369:
                    370: http://symbolicNet.mcs.kent.edu/SN/areas/protocols/mp.html
                    371:
                    372:
                    373: MCP
                    374:
                    375: http://horse.mcs.kent.edu/~pwang/
                    376:
                    377:
                    378: \section{現在提供されているソフトウェア}
                    379:
                    380: 現在 OpenXM 規格に対応しているクライアントには
                    381: asir, sm1, Mathematica がある。
                    382: これらのクライアントから
                    383: OpenXM 規格に対応したサーバを呼び出すことができる。
                    384: 現在 OpenXM 規約に対応しているサーバソフトウェアには、
                    385:  asir, sm1, gnuplot, Mathematica などがあり、
                    386: それぞれ ox\_asir, ox\_sm1, ox\_math という名前で提供されている。
                    387: また、 OpenMath 規格の XML 表現で表現されたデータと CMO 形式の
                    388: データを変換するソフトウェアが JAVA によって実装されており、
                    389: OMproxy という名前で提供されている。
1.33      tam       390:
1.1       tam       391:
                    392: \end{document}

FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>