OpenXM/src/kan96xx/Kan/scanner2.c - annotate

Return to scanner2.c CVS log
Up to [local] / OpenXM / src / kan96xx / Kan
Annotation of OpenXM/src/kan96xx/Kan/scanner2.c, Revision 1.1.1.1

1.1       maekawa     1: /*  scanner2.c (SM StackMachine) */
                      2: /* export: struct tokens decompostToTokens(char *str,int *sizep);
                      3:    scanner2.c is for getting tokens from a string.
                      4: */
                      5: #include <stdio.h>
                      6: #include "datatype.h"
                      7: #include "stackm.h"
                      8: struct tokens lookupTokens(struct tokens t);
                      9: int isLiteral(char *s);
                     10: struct object lookupLiteralString(char *s);
                     11: /****************  defined in stackm.h ****************************
                     12: typedef enum {INIT,GET,PUT,OPEN} actionType;
                     13:
                     14: struct tokens{
                     15:   char *token;
                     16:   int kind;
                     17: };
                     18:
                     19:
                     20: #define ID   2
                     21: #define DOLLAR 3    strings enclosed by dollar sign
                     22: #define EXECUTABLE_STRING 4  strings enclosed by {}
                     23: #define EXECUTABLE_ARRAY  8  Don't set it in this file.
                     24: ******************************************************************/
                     25:
                     26:
                     27: /*******   declaration-part of lexical analizer ********************/
                     28: #define mygetchar()  getSM()
                     29: /* to use getSM()  ( input from StringSM ),
                     30:    setup  StringSM;
                     31:    getokenSM(INIT);
                     32: */
                     33:
                     34:
                     35:
                     36:
                     37: #define BUF0LIMIT 40000
                     38: static char *StringSM;
                     39: static int StrpSM = 0;
                     40: static char BufSMorg[BUF0LIMIT];
                     41: static char *BufSM = BufSMorg;
                     42: static int Buf0limit = BUF0LIMIT ;
                     43: static int ExistSM = 0;
                     44: static int TypeSM = ID;
                     45:
                     46: /****************  end of declaration part of lexical analizer ******/
                     47:
                     48: static int getSM();
                     49: static putSM();
                     50: static struct tokens flushSM();
                     51: static isSpaceSM();
                     52: static isDollarSM();
                     53: static isBraceSM();
                     54: static isKakkoSM();
                     55: static isSymbolSM();
                     56: static struct tokens getokenSM2();
                     57:
                     58: /****************  code part of lexical analizer ********************/
                     59:
                     60: struct tokens *decomposeToTokens(str,sizep)
                     61: char *str;
                     62: int *sizep;
                     63: {
                     64:   struct tokens *tArray;
                     65:   struct tokens token;
                     66:   int k;
                     67:   int size;
                     68:
                     69:   StringSM = (char *) sGC_malloc((strlen(str)+3)*sizeof(char));
                     70:   if (StringSM == (char *)NULL) {
                     71:     errorScanner2("I have no memormy.");
                     72:   }
                     73:   strcpy(StringSM,str);
                     74:   getokenSM2(INIT);
                     75:   size = 0;
                     76:   token = getokenSM2(GET);
                     77:   while (token.kind != -1) {
                     78:     size++;
                     79:     token = getokenSM2(GET);
                     80:   }
                     81:
                     82:   tArray = (struct tokens *)sGC_malloc((size+1)*sizeof(struct tokens));
                     83:   strcpy(StringSM,str);
                     84:   getokenSM2(INIT);
                     85:   for (k=0; k<size; k++) {
                     86:     tArray[k] = getokenSM2(GET);
                     87:   }
                     88:
                     89:   *sizep = size;
                     90:   return(tArray);
                     91: }
                     92:
                     93:
                     94:
                     95: static int getSM()
                     96: /* get a letter from StringSM */
                     97: {
                     98:   int c;
                     99:   c = StringSM[StrpSM++];
                    100:   if (c == '\0') {
                    101:     StrpSM--;return(EOF);
                    102:   } else return(c);
                    103: }
                    104:
                    105: static putSM(c)
                    106: int c;
                    107: /* put a letter on BufSM */
                    108: {
                    109:   char *new; int i;
                    110:   BufSM[ExistSM++] = ((c=='\n')? ' ' : c);
                    111:   if (ExistSM >= Buf0limit-1)  {
                    112:     new = (char *) sGC_malloc(sizeof(char *)*Buf0limit*2) ;
                    113:     if (new == (char *)NULL) {
                    114:       fprintf(stderr,"No more memory in parserpass0.c\n");
                    115:       exit(18);
                    116:     }
                    117:     fprintf(stderr,"\nSystem Message: Increasing BufSM to %d in scanner2.c\n",Buf0limit*2);
                    118:     for (i=0; i<Buf0limit; i++) {
                    119:       new[i] = BufSM[i];
                    120:     }
                    121:     BufSM = new; Buf0limit *= 2;
                    122:   }
                    123: }
                    124:
                    125: static struct tokens flushSM()
                    126: {
                    127:   char *token;
                    128:   struct tokens r;
                    129:   if (ExistSM<=0) {
                    130:     fprintf(stderr,"\n flushSM() is called without data. Don't use the empty string $$. \n");
                    131:     r.token = (char *)NULL; r.kind = -10; /* -1 ==> -10 ***/
                    132:     return(r);
                    133:   }
                    134:   BufSM[ExistSM] = '\0';
                    135:   ExistSM = 0;
                    136:   token = (char *)sGC_malloc((strlen(BufSM)+1)*sizeof(char));
                    137:   strcpy(token,BufSM);
                    138:   r.token = token;
                    139:   r.kind = TypeSM;
                    140:   if (r.kind == ID) {
                    141:     if (isLiteral(r.token)) {
                    142:        r.object = lookupLiteralString(r.token);
                    143:     }else{
                    144:       r = lookupTokens(r); /* Compute hashing values */
                    145:     }
                    146:   }
                    147:   return(r);
                    148: }
                    149:
                    150: static isSpaceSM(c)
                    151: int c;
                    152: {
                    153:   if ((c <= ' ') && (c!= EOF)) return(1);
                    154:   else return(0);
                    155: }
                    156:
                    157: static isDollarSM(c)
                    158: int c;
                    159: {
                    160:   if (c == '$') return(1);
                    161:   else return(0);
                    162: }
                    163:
                    164: static isBraceSM(c)
                    165: int c;
                    166: {
                    167:   if (c == '{') return(1);
                    168:   else return(0);
                    169: }
                    170:
                    171: static isKakkoSM(c)
                    172: int c;
                    173: {
                    174:   if (c == '(') return(1);
                    175:   else return(0);
                    176: }
                    177:
                    178: static isSymbolSM(c)
                    179: int c;
                    180: {
                    181:   if ((c == '{') ||
                    182:       (c == '}') ||
                    183:       (c == '[') ||
                    184:       (c == ']') ||
                    185:       (c == '(') ||
                    186:       (c == ')'))
                    187:     return(1);
                    188:   else return(0);
                    189: }
                    190:
                    191: static struct tokens getokenSM2(kind,str)
                    192: actionType kind;
                    193: char *str;
                    194: {
                    195:   static int c;
                    196:   static struct tokens rnull;
                    197:   int level;
                    198:
                    199:   if (kind == INIT) {
                    200:     StrpSM = 0;
                    201:     ExistSM = 0;
                    202:
                    203:     c = mygetchar();
                    204:     rnull.token = (char *)NULL; rnull.kind = -1;
                    205:     return(rnull);
                    206:   }
                    207:
                    208:
                    209:
                    210:   for (;;) {
                    211:     TypeSM = ID;
                    212:     if (c == EOF) {
                    213:       if (ExistSM) return(flushSM());
                    214:       else return(rnull);
                    215:     } else if (isSpaceSM(c)) {
                    216:       if (ExistSM) {
                    217:        c = mygetchar(); return(flushSM());
                    218:       }else {
                    219:        while (isSpaceSM(c=mygetchar())) ;
                    220:       }
                    221:     } else if (isDollarSM(c)) { /* output contents in dollar signs. */
                    222:       if (ExistSM) return(flushSM());
                    223:       else {
                    224:        c = mygetchar();
                    225:        while ((c != EOF) && (c != '$')) {
                    226:          putSM(c);
                    227:          c = mygetchar();
                    228:        }
                    229:        if (c=='$') c=mygetchar();
                    230:        TypeSM = DOLLAR;
                    231:        return(flushSM());
                    232:       }
                    233:     } else if (isBraceSM(c)) { /* output contents in { }  */
                    234:       /*  { {  } } */
                    235:       level = 0;
                    236:       if (ExistSM) return(flushSM());
                    237:       else {
                    238:        c = mygetchar();
                    239:        while (1) {
                    240:          if (c == '%') { /* skip the comment in the brace. */
                    241:            while (((c=mygetchar()) != '\n') && (c != EOF))  ;
                    242:          }
                    243:          if (c == EOF) break;
                    244:          if ((c == '}') && (level <= 0)) break;
                    245:          if ( c == '{') ++level;
                    246:          if ( c == '}') --level;
                    247:          putSM(c);
                    248:          c = mygetchar();
                    249:        }
                    250:        if (c=='}') c=mygetchar();
                    251:        TypeSM = EXECUTABLE_STRING;
                    252:        return(flushSM());
                    253:       }
                    254:     } else if (isKakkoSM(c)) { /* output contents in (  )  */
                    255:       level = 0;
                    256:       if (ExistSM) return(flushSM());
                    257:       else {
                    258:        c = mygetchar();
                    259:        while (1) {
                    260:          if (c == EOF) break;
                    261:          if (c == '\\') { /* e.g. \(  */
                    262:            putSM(c);
                    263:            c = mygetchar();
                    264:            if (c == EOF) break;
                    265:          }else{
                    266:            if ((c == ')') && (level <= 0)) break;
                    267:            if ( c == '(') ++level;
                    268:            if ( c == ')') --level;
                    269:          }
                    270:          putSM(c);
                    271:          c = mygetchar();
                    272:        }
                    273:        if (c==')') c=mygetchar();
                    274:        TypeSM = DOLLAR;
                    275:        return(flushSM());
                    276:       }
                    277:     } else if (c=='%') { /* comment */
                    278:       while (((c=mygetchar()) != '\n') && (c != EOF))  ;
                    279:       if(ExistSM) return(flushSM());
                    280:     } else if (isSymbolSM(c)) { /* symbols. {,} etc */
                    281:       if(ExistSM) return(flushSM());
                    282:       else {
                    283:        putSM(c);
                    284:        c = mygetchar();
                    285:        return(flushSM());
                    286:       }
                    287:     } else { /* identifier */
                    288:       putSM(c);
                    289:       c =mygetchar();
                    290:       while ((!isDollarSM(c)) &&
                    291:             (!isSpaceSM(c))  &&
                    292:             (!isSymbolSM(c)) &&
                    293:             (c != EOF)) {
                    294:        putSM(c);
                    295:        c = mygetchar();
                    296:       }
                    297:       return(flushSM());
                    298:     }
                    299:   }
                    300: }
                    301:
                    302: /*********** end of code part of lexical analizer ********************/
                    303:
                    304:
                    305: errorScanner2(str)
                    306: char *str;
                    307: {
                    308:   fprintf(stderr,"Error (scanner2.c): %s\n",str);
                    309:   exit(10);
                    310: }
                    311:
FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>