source: app/src/common/common.h @ adb4c8d

help
Last change on this file since adb4c8d was a7b254c, checked in by obrebski <obrebski@…>, 17 years ago

jeśli nie ma pola podanego w opcji input-field, process_seg zwraca false

git-svn-id: svn://atos.wmid.amu.edu.pl/utt@40 e293616e-ec6a-49c2-aa92-f4a8b91c5d16

  • Property mode set to 100644
File size: 8.5 KB
Line 
1#ifndef __COMMON_H
2#define __COMMON_H
3
4#include <stdio.h>
5#include <ctype.h>
6#include <string.h>
7#include <stdlib.h>
8
9#include "../lib/const.h"
10
11#ifndef _CMDLINE_FILE
12#error _CMDLINE_FILE constant not defined!
13#else
14#include _CMDLINE_FILE
15#endif
16
17
18/**************************************************
19 * Stale dotyczace wejscia/wyjscia
20 */
21
22#define EMPTYFORM '*'
23#define INFIELD_SEP ':'
24#define MAXAUX 16
25#define FIELD_SEP " \t\n"
26
27
28// katalogi z plikami konfiguracyjnymi
29// nowe
30// stare - do wyrzucenia
31// #define CONFIG_DIR ".utt/conf"
32
33// nazwa zmiennej okreslajaca sciezke do danych
34
35// #define UTT_DIR_VAR "UTT_DIR"
36
37// sciezka do plikow z danymi (np UTT_DIR/pliki) wzgledem $HOME!
38
39// #define UTT_DIR_DEFAULT ".utt/pl/"
40
41/**************************************************/
42
43
44extern FILE* inputf;
45extern FILE* outputf;
46extern FILE* failedf;
47
48extern char* input_filename;
49extern char* output_filename;
50extern char* failed_filename;
51extern bool one_line;
52extern bool one_field;
53
54extern char input_field_prefix[];
55extern char output_field_prefix[];
56
57extern bool copy_processed;
58extern bool append_output;
59extern bool append_failed;
60
61//sciezka do katalogu z danymi
62extern char utt_dir[];
63
64extern void process_common_options(gengetopt_args_info* args, char* argv0);
65extern void process_config_files(gengetopt_args_info* args, char* argv0);
66
67extern int expand_path(char* inpath, char* outpath);
68
69extern int fieldprefix(char *name, char *prefix);
70
71
72/**************************************************
73 * problems with casing                           */
74// sprawdzenie wielkosci liter
75// warto¶æ zwracana:
76// 0 - wszystkie ma³e litery
77// 1 - pierwsza wielka, reszta male
78// 2 - wszystkie wielkie
79// 3 - inne
80inline int casing(char* s)
81{
82  int ret = isupper(*s) ? 1 : 0;
83  while(*++s != '\0')
84  {
85    if(isupper(*s))
86    {
87      if(ret==1) ret=2;
88      else if(ret==0) ret=3;
89    }
90    else
91    {
92      if(ret==2) ret=3;
93    }
94  }
95  return ret;
96}
97
98//
99inline void tolowers(char* s, char* d)
100{
101  *d=tolower(*s);
102  while(*s != '\0') * ++d = tolower(* ++s);
103}
104
105
106// przepisuje s do d
107// nadajac wielko¶æ liter zgodnie z warto¶ci± casing
108// casing - warto¶æ zwracana przez casing()
109// je¶li casing==3 przepisuje bez zmian (za ma³o informacji)
110inline void restorecasing(char *s, char *d, int casing)
111{
112  switch(casing)
113  {
114  case 0:
115  case 3:
116    *d=*s;
117    while(*s != '\0') * ++d = * ++s;
118    break;
119  case 1:
120    *d=toupper(*s);
121    while(*s != '\0') * ++d = * ++s;
122    break;
123  case 2:
124    *d=toupper(*s);
125    while(*s != '\0') * ++d = toupper(* ++s);
126    break;
127  }
128}
129
130/**************************************************/
131
132/*
133parameters:
134  -seg  - segment
135  -pref - field name or "1", "2", "3", "4" for the first four fields
136  +val  - field contents
137return value:
138  1 if specified field exists, 0 otherwise
139*/
140
141inline int getfield(char* seg, const char* pref, char* val)
142{
143
144  char* p=seg;
145  char* p0;
146
147  while(isspace(*p)) ++p;
148
149  // field "1"
150  p0=p; while(isdigit(*p)) ++p;
151  if(*pref=='1') if(p!=p0) { strncpy(val,p0,p-p0); val[p-p0]='\0'; return 1; } else return 0;
152 
153  while(isspace(*p)) ++p;
154
155  // field "2"
156  p0=p; while(isdigit(*p)) ++p;
157  if(*pref=='2') if(p!=p0) { strncpy(val,p0,p-p0); val[p-p0]='\0'; return 1; } else return 0;
158
159  while(isspace(*p)) ++p;
160
161  // field "3"
162  p0=p; while(isgraph(*p)) ++p; 
163  if(*pref=='3') if(p!=p0) { strncpy(val,p0,p-p0); val[p-p0]='\0'; return 1; } else return 0;
164
165  while(isspace(*p)) ++p;
166
167  // field "4"
168  p0=p; while(isgraph(*p)) ++p;
169  if(*pref=='4') if(p!=p0) { strncpy(val,p0,p-p0); val[p-p0]='\0'; return 1; } else return 0;
170
171  while(isspace(*p)) ++p;
172
173  // annotation fields
174  do p=strstr(p,pref); while(p!=NULL && *(p-1)!=' ' && *(p-1)!='\t');
175 
176  if(p==NULL) return 0;
177  else
178  {
179    p+=strlen(pref);
180    int len=strcspn(p,FIELD_SEP "\n\r\f\0");
181    strncpy(val,p,len);
182    val[len]='\0';
183    return 1;
184  }
185}
186
187
188inline
189bool process_seg(char* seg, gengetopt_args_info& args)
190{
191  char buf[256];
192  bool ret = !args.process_given;
193  if(args.process_given)
194    {
195      getfield(seg,"3",buf);
196      for(int i=0; i<args.process_given; ++i)
197        if(strcmp(args.process_arg[i],buf)==0)
198          {
199            ret=true;
200            break;
201          }
202    }
203
204  if(ret==false) return false; 
205
206  for(int i=0; i<args.select_given; ++i)
207    if(! getfield(seg,args.select_arg[i],buf))
208      return false;
209  for(int i=0; i<args.ignore_given; ++i)
210    if(getfield(seg,args.ignore_arg[i],buf))
211      return false;
212 
213  if(args.input_field_given & !getfield(seg,input_field_prefix,buf))
214    return false;
215
216  return true;
217}
218
219
220/*
221parameters:
222  -+seg - segment
223  -pref - prefix of the new field
224  -val  - contents of the new field
225return value:
226  1 - success, 0 - fail (limit on segment length exceeded)
227 */
228inline
229int addfield(char *seg, const char *pref, const char *val)
230     // zalozenie, ze seg konczy sie znakiem \n
231{
232  if(strlen(seg)+strlen(pref)+strlen(val) >= MAX_LINE) return 0; // bezpieczniej, ale wolniej
233
234  int seglen=strlen(seg);
235  sprintf(seg+(seglen-1)," %s%s\n",pref,val);
236  return 1;
237}
238
239/**************************************************/
240
241struct Seg
242{
243  int filepos, len;
244  char* tag;
245  char* form;
246  char* aux[MAXAUX];
247  int auxn;
248
249  bool parse(char* line);
250  char* getfield(char* fieldname);
251  void print(char* line);
252  bool addfield(char* s);
253  bool clearfields();
254};
255
256/**************************************************/
257
258/* definicja struktury wejscia/wyjscia
259 */
260struct Segment
261{
262  int filepos, len;
263  char* tag;
264  char* form;
265  char* aux[MAXAUX];
266  int auxn;
267
268  bool parse(char* line);
269  char* getfield(char* fieldname);
270  void print(char* line);
271  bool addfield(char* s);
272  bool clearfields();
273};
274
275/*
276 * Sprawdza czy nalezy przetwarzac dany segment.
277 */
278
279inline
280bool process_seg(Segment& s, gengetopt_args_info& args)
281{
282  bool ret = !args.process_given;
283
284  for(int i=0; i<args.process_given; ++i)
285    if(strcmp(args.process_arg[i],s.tag)==0)
286      {
287        ret=true;
288        break;
289      }
290
291  for(int i=0; i<args.select_given; ++i)
292    if(! s.getfield(args.select_arg[i]))
293      ret=false;
294
295  for(int i=0; i<args.ignore_given; ++i)
296    if(s.getfield(args.ignore_arg[i]))
297      ret=false;
298
299  return ret;
300}
301
302
303/*
304 * FUNKCJE OBSLUGUJACE WEJSCIE/WYJSCIE
305 */
306// napisy zostaj na miejscu (w line), tylko wskazniki sa ustawian
307// i zara dopisywane zera s dopisywane
308
309inline
310bool Segment::parse(char* line)
311{
312  auxn=0;
313  char* field;
314  if((field=strtok(line,FIELD_SEP))!=NULL)
315    filepos=atoi(field); // nie sprawdzana poprawnosc
316  else
317    return false;
318  if((field=strtok(NULL,FIELD_SEP))!=NULL)
319    len=atoi(field); // nie sprawdzana poprawnosc
320  else return false;
321  if((tag=strtok(NULL,FIELD_SEP))==NULL) return false;
322  if((form=strtok(NULL,FIELD_SEP))==NULL)
323    return true;
324  else
325    if(form[0] == EMPTYFORM && form[1] =='\0')
326      form=NULL;
327
328  while((aux[auxn]=strtok(NULL,FIELD_SEP))!=NULL) ++auxn;
329
330  return true;
331}
332
333
334inline char* Segment::getfield(char* f)
335{
336  int flen=strlen(f);
337  if(isalnum(*f))
338  {
339    for(int i=0; i<auxn; ++i)
340      if(strncmp(aux[i],f,flen)==0 && aux[i][flen]==INFIELD_SEP)
341        return aux[i]+flen+1;
342  } else
343  {
344    for(int i=0; i<auxn; ++i)
345    {
346      if(*f==*(aux[i]))
347        return aux[i]+1;
348    }
349  }
350  return NULL;
351}
352
353inline bool Segment::clearfields() {
354  for (int i=0; i<auxn; ++i) {
355    //    free(aux[i]);
356    aux[i] = NULL;
357  }
358  auxn=0;
359  return true;
360}
361
362inline // NIEEFEKTYWNE
363void Segment::print(char* line)
364{
365  sprintf(line,"%04d %02d %s", filepos, len, tag);
366  if(form)
367    {
368      strcat(line," ");
369      strcat(line,form);
370    }
371  else
372    if(auxn)
373      strcat(line," *");
374
375  for(int i=0; i<auxn; ++i)
376    {
377      strcat(line," ");
378      strcat(line,aux[i]);
379    }
380
381  strcat(line,"\n");
382}
383
384
385inline
386bool Segment::addfield(char* s)
387{
388  if(auxn<MAXAUX)
389    {
390      aux[auxn++]=s;
391      return true;
392    }
393  else
394    return false;
395}
396
397/**************************************************
398 * funkcje pomocne w operacjach na plikach        *
399 *  konfiguracyjnych                              *
400 **************************************************/
401
402// sprawdza istnienie pliku
403int file_accessible(const char* path);
404
405// sprawdza istnienie pliku konfiguracyjnego
406int config_file(const char* dir, const char* filename);
407
408/**************************************************/
409
410/* Pobiera wejscie
411 * parametry:
412 * - args - tablica stringow okresnajacych pola wejsciowe
413 * - args_len - rozmiar args
414 * - seg - segment
415 * wartosc - wskaznik do wejscia
416 */
417inline char*  getInput(char** args, int args_len, Segment seg) {
418  char* formp = NULL;
419  for (int i=0; i<args_len; ++i) {
420    if ('4' == args[i][0])
421      return seg.form;
422    if ((formp = seg.getfield(args[i])) != NULL) {
423      return formp;
424    }
425  }
426  return formp;
427}
428
429#endif
Note: See TracBrowser for help on using the repository browser.