=================================================================== RCS file: /home/cvs/OpenXM/src/ox_math/Attic/parse.c,v retrieving revision 1.1.1.1 retrieving revision 1.2 diff -u -p -r1.1.1.1 -r1.2 --- OpenXM/src/ox_math/Attic/parse.c 1999/10/29 08:06:41 1.1.1.1 +++ OpenXM/src/ox_math/Attic/parse.c 1999/11/02 06:11:58 1.2 @@ -1,21 +1,24 @@ /* -*- mode: C; coding: euc-japan -*- */ /* $OpenXM$ */ -/* $Id: parse.c,v 1.1.1.1 1999/10/29 08:06:41 ohara Exp $ */ +/* $Id: parse.c,v 1.2 1999/11/02 06:11:58 ohara Exp $ */ /* OX expression, CMO expression パーサ */ -/* cmo_addrev がセットされていれば、 - 厳密には CMO expression でないもの, 例えば - (CMO_STRING, "abcdef") も CMO に変換される. */ - #include #include #include #include +#include #include "oxtag.h" #include "ox.h" #include "parse.h" /* --- 構文解析部 --- */ +/* (重要)セマンティックスについての注意. + CMO_LIST, CMO_STRING は、あらかじめ与えられた要素の個数を無視する. + CMO_MONOMIAL32 は無視しない. (つまりおかしいときは構文エラーになる) +*/ + + /* parse.c, lex.c では, Lisp 表現された CMO 文字列を読み込み, バイト列を出力する. 中間表現として、cmo *を利用する. parse() はトークンの列から cmo *(の指す構造体)を生成する. @@ -28,11 +31,17 @@ /* 現在読み込み中のトークンを表す. */ static int token = 0; -/* yylval は lex() によってセットされる. */ -extern lex_value_t yylval; +/* トークンの属性値. yylval は lex() によってセットされる. */ +static union{ + int d; + char* sym; +} yylval; -int cmo_addrev = 1; /* CMO の省略記法を許すか否かのフラグ */ +/* pflag_cmo_addrev がセットされていれば、厳密には CMO expression では + ないもの, 例えば (CMO_STRING, "hello") も CMO に変換される. */ +static int pflag_cmo_addrev = 1; /* CMO の省略記法を許すか否かのフラグ */ + /* 関数の宣言 */ static int parse_error(char *s); static int parse_lf(); @@ -41,10 +50,15 @@ static int parse_left_parenthesis(); static int parse_comma(); static int parse_integer(); static cmo *parse_cmo_null(); -static cmo *parse_cmo_zz(); -static cmo *parse_cmo_list(); static cmo *parse_cmo_int32(); static cmo *parse_cmo_string(); +static cmo *parse_cmo_mathcap(); +static cmo *parse_cmo_dms_generic(); +static cmo *parse_cmo_ring_by_name(); +static cmo *parse_cmo_error2(); +static cmo *parse_cmo_zero(); +static cmo *parse_cmo_zz(); +static cmo *parse_cmo_list(); static cmo *parse_cmo(); static char *parse_string(); static int parse_sm(); @@ -52,45 +66,39 @@ static ox* parse_ox(); static ox* parse_ox_command(); static ox* parse_ox_data(); -static int parse_error(char *s) -{ - if (s != NULL) { - fprintf(stderr, "%s\n", s); - }else { - fprintf(stderr, "syntax error.\n"); - } - exit(1); /* 例外処理. 本当は longjmp すべきであろう. */ -} - -#define MIN_T_CMO (T_MAGIC + 0) -#define MAX_T_CMO (T_MAGIC + 256) - static int is_t_cmo(int token) { - return (token >= MIN_T_CMO && token < MAX_T_CMO) || token == T_CMO_ERROR2; + return (token >= MIN_T_CMO && token < MAX_T_CMO) || token == TOKEN(CMO_ERROR2); } -#define MIN_T_SM (T_MAGIC + 256) -#define MAX_T_SM (T_MAGIC + 1100) - static int is_t_sm(int token) { return token >= MIN_T_SM && token < MAX_T_SM; } -#define MIN_T_OX (T_MAGIC + 512) -#define MAX_T_OX (T_MAGIC + 600) - static int is_t_ox(int token) { return token >= MIN_T_OX && token < MAX_T_OX; } +static jmp_buf env_parse; + +/* 構文解析に失敗したことを意味する. */ +static int parse_error(char *s) +{ + fprintf(stderr, "%s\n", s); + longjmp(env_parse, 1); +} + /* この部分は書き換え予定. */ cmo *parse() { cmo *m; + if (setjmp(env_parse) != 0) { + return NULL; /* 構文解析に失敗したら NULL を返す. */ + } + do{ token = lex(); }while (token == '\n'); @@ -102,8 +110,7 @@ cmo *parse() }else if(is_t_ox(token)) { m = parse_ox(); }else { - parse_error("syntax error: unknown keyword."); - return NULL; + parse_error("syntax error: unknown symbol."); } parse_lf(); return m; @@ -126,11 +133,11 @@ static ox* parse_ox() ox *m = NULL; switch(token) { - case T_OX_COMMAND: + case TOKEN(OX_COMMAND): token = lex(); m = parse_ox_command(); break; - case T_OX_DATA: + case TOKEN(OX_DATA): token = lex(); m = parse_ox_data(); break; @@ -174,52 +181,74 @@ static ox* parse_ox_command() } /* 正しい入力ならば, parse_cmo を呼ぶ時点で, token には - T_CMO_xxx, T_OX_xxx のいずれかがセットされている. */ + TOKEN(CMO_xxx), TOKEN(OX_xxx) のいずれかがセットされている. */ static cmo *parse_cmo() { cmo *m = NULL; switch(token) { - case T_CMO_NULL: + case TOKEN(CMO_NULL): token = lex(); m = parse_cmo_null(); break; - case T_CMO_INT32: + case TOKEN(CMO_INT32): token = lex(); m = parse_cmo_int32(); break; - case T_CMO_STRING: + case TOKEN(CMO_STRING): token = lex(); m = parse_cmo_string(); break; - case T_CMO_ZZ: + case TOKEN(CMO_MATHCAP): token = lex(); - m = parse_cmo_zz(); + m = parse_cmo_mathcap(); break; - case T_CMO_LIST: + case TOKEN(CMO_LIST): token = lex(); m = parse_cmo_list(); break; + case TOKEN(CMO_MONOMIAL32): + token = lex(); + m = parse_cmo_monomial32(); + break; + case TOKEN(CMO_ZZ): + token = lex(); + m = parse_cmo_zz(); + break; + case TOKEN(CMO_ZERO): + token = lex(); + m = parse_cmo_zero(); + break; + case TOKEN(CMO_DMS_GENERIC): + token = lex(); + m = parse_cmo_dms_generic(); + break; + case TOKEN(CMO_RING_BY_NAME): + token = lex(); + m = parse_cmo_ring_by_name(); + break; + case TOKEN(CMO_ERROR2): + token = lex(); + m = parse_cmo_error2(); + break; default: parse_error("syntax error: invalid cmo_tag."); } return m; } -static int parse_right_parenthesis() +static int parse_left_parenthesis() { - if (token != ')') { - parse_error("syntax error: no right parenthesis exists."); - return 0; + if (token != '(') { + parse_error("syntax error: no left parenthesis."); } token = lex(); } -static int parse_left_parenthesis() +static int parse_right_parenthesis() { - if (token != '(') { - parse_error("syntax error: no left parenthesis exists."); - return 0; + if (token != ')') { + parse_error("syntax error: no right parenthesis."); } token = lex(); } @@ -227,70 +256,16 @@ static int parse_left_parenthesis() static int parse_comma() { if (token != ',') { - parse_error("syntax error: no comma exists."); - return 0; + parse_error("syntax error: no comma."); } token = lex(); - return 1; } -/* cmo_zz の内部を直接いじる. */ -static cmo *parse_cmo_zz() -{ - int length; - int i=0; - cmo_zz *m= NULL; - - parse_comma(); - length = parse_integer(); - if (token == ',') { - m = new_cmo_zz_size(length); - - length = abs(length); - for(i=0; impz->_mp_d[i] = parse_integer(); - } - }else if (cmo_addrev) { - m = new_cmo_zz_set_si(length); - }else { - parse_error("syntax error: invalid keyword."); - } - - parse_right_parenthesis(); - return (cmo *)m; -} - -static cmo *parse_cmo_list() -{ - int length=0; - int i=0; - cmo_list *m; - cmo *newcmo; - - parse_comma(); - - length = parse_integer(); - m = new_cmo_list(); - if (length<0) { - parse_error("semantics error: a list has negative length."); - } - - for(i=0; iexps[i] = parse_integer(); + } + parse_comma(); + parse_left_parenthesis(); + m->coef = parse_cmo(); + /* 意味的チェックの必要あり */ + parse_right_parenthesis(); + return (cmo *)m; +} + +/* cmo_zz の内部を直接いじる. */ +static cmo *parse_cmo_zz() +{ + int length; + int i=0; + cmo_zz *m= NULL; + + parse_comma(); + length = parse_integer(); + if (token == ',') { + m = new_cmo_zz_size(length); + + length = abs(length); + for(i=0; impz->_mp_d[i] = parse_integer(); } - }else if (cmo_addrev) { - s = parse_string(); + }else if (pflag_cmo_addrev) { + m = new_cmo_zz_set_si(length); }else { - parse_error("syntax error: invalid keyword."); + parse_error("syntax error: invalid symbol."); } - m = new_cmo_string(s); + parse_right_parenthesis(); return (cmo *)m; } -/* --- 字句解析部 --- */ +static cmo *parse_cmo_zero() +{ + parse_right_parenthesis(); + return (cmo *)new_cmo_zero(); +} -lex_value_t yylval; +static cmo *parse_cmo_dms_generic() +{ + parse_right_parenthesis(); + return (cmo *)new_cmo_dms_generic(); +} +static cmo *parse_cmo_ring_by_name() +{ + cmo *ob; + + parse_comma(); + parse_left_parenthesis(); + ob = parse_cmo(); + /* 意味的チェックが必要(ob->tag == CMO_STRINGでなければいけない) */ + parse_right_parenthesis(); + return (cmo *)new_cmo_ring_by_name(ob); +} + +static cmo *parse_cmo_error2() +{ + cmo *ob; + + parse_comma(); + parse_left_parenthesis(); + ob = parse_cmo(); + parse_right_parenthesis(); + return (cmo *)new_cmo_error2(ob); +} + +/* --- 字句解析部 --- */ + /* lexical analyzer で読み飛ばされる文字なら何を初期値にしてもよい */ static int c = ' '; @@ -371,9 +467,8 @@ int resetgetc() GETC = getchar; } -#define SIZE_BUFFER 1024 +#define SIZE_BUFFER 8192 static char buffer[SIZE_BUFFER]; -static char* PARS = "(),\n"; /* 桁溢れの場合の対策はない */ static int lex_digit() @@ -415,57 +510,67 @@ static char *lex_quoted_string() /* return NULL; */ } -/* キーワードを増やしたあと修正するのを忘れてはいけない */ -#undef NUM_OF_KEYWORDS 18 +typedef struct { + char *key; + int token; +} symbol; -static char *keywords[] = { - "CMO_INT32", "CMO_STRING", "CMO_LIST", "CMO_ZZ", "CMO_NULL", - "CMO_ZERO", "CMO_DATUM", - "SM_popCMO", "SM_popString", "SM_mathcap", "SM_pops", - "SM_executeStringByLocalParser", "SM_executeFunction", - "SM_setMathcap", - "SM_control_kill", "SM_control_reset_connection", - "OX_COMMAND", "OX_DATA", - NULL /* a gate keeper */ -}; +#define MK_KEY(x) { #x , TOKEN(x) } -static int token_of_keyword[] = { - T_CMO_INT32, T_CMO_STRING, T_CMO_LIST, T_CMO_ZZ, T_CMO_NULL, - T_CMO_ZERO, T_CMO_DATUM, - T_SM_popCMO, T_SM_popString, T_SM_mathcap, T_SM_pops, - T_SM_executeStringByLocalParser, T_SM_executeFunction, - T_SM_setMathcap, - T_SM_control_kill, T_SM_control_reset_connection, - T_OX_COMMAND, T_OX_DATA, - 0 /* dummy */ -}; +static symbol symbol_list[] = { + MK_KEY(CMO_NULL), + MK_KEY(CMO_INT32), + MK_KEY(CMO_DATUM), + MK_KEY(CMO_STRING), + MK_KEY(CMO_MATHCAP), + MK_KEY(CMO_LIST), + MK_KEY(CMO_MONOMIAL32), + MK_KEY(CMO_ZZ), + MK_KEY(CMO_ZERO), + MK_KEY(CMO_DMS_GENERIC), + MK_KEY(CMO_RING_BY_NAME), + MK_KEY(CMO_INDETERMINATE), + MK_KEY(CMO_ERROR2), + MK_KEY(SM_popCMO), + MK_KEY(SM_popString), + MK_KEY(SM_mathcap), + MK_KEY(SM_pops), + MK_KEY(SM_executeStringByLocalParser), + MK_KEY(SM_executeFunction), + MK_KEY(SM_setMathCap), + MK_KEY(SM_control_kill), + MK_KEY(SM_control_reset_connection), + MK_KEY(OX_COMMAND), MK_KEY(OX_DATA), + {NULL, 0} /* a gate keeper */ +}; -static int token_of_matched_keyword(char *key) +static int token_of_symbol(char *key) { - int i; - - for(i=0; keywords[i] != NULL; i++) { - if(strcmp(key, keywords[i])==0) { - return token_of_keyword[i]; - } - } + symbol *kp; + for(kp = symbol_list; kp->key != NULL; kp++) { + if (strcmp(key, kp->key)==0) { + return kp->token; + } + } +#if DEBUG fprintf(stderr, "lex error\n"); +#endif return 0; } -static int lex_keyword() +static int lex_symbol() { int i; for (i=0; i