source: _old/nawszelkiwypadek/tools/gue_dic/cut_prefs.pl @ 93afab8

Last change on this file since 93afab8 was a6e708f, checked in by tom <tom@…>, 13 years ago

ANULOWANIE POPRZEDNIEGO COMMITU

Revert "Replacing old implementation with working implementation"

This reverts commit 1e121f45e2d091fcd34a893291b8453e350d5884.

Please enter the commit message for your changes. Lines starting
with '#' will be ignored, and an empty message aborts the commit.

Committer: tom <tom@lim.(none)>

On branch master
Changes to be committed:

(use "git reset HEAD <file>..." to unstage)

modified: _old/app/Makefile
deleted: _old/app/conf/Makefile
deleted: _old/app/conf/compiledic.conf
deleted: _old/app/conf/cor.conf
deleted: _old/app/conf/dgc.conf
deleted: _old/app/conf/dgp.conf
deleted: _old/app/conf/gph.conf
deleted: _old/app/conf/grp.conf
deleted: _old/app/conf/gue.conf
deleted: _old/app/conf/kor.conf
deleted: _old/app/conf/lem.conf
deleted: _old/app/conf/mar.conf
deleted: _old/app/conf/ser.conf
deleted: _old/app/conf/utt.conf
modified: _old/app/src/common/Makefile
modified: _old/app/src/compiledic/Makefile
modified: _old/app/src/compiledic/aut2fsa.cc
modified: _old/app/src/cor/Makefile
modified: _old/app/src/dgp/Makefile
new file: _old/app/src/dgp/canonize
new file: _old/app/src/dgp/dgc
modified: _old/app/src/dgp/grammar.hh
modified: _old/app/src/dgp/mgraph.hh
modified: _old/app/src/dgp/sgraph.hh
modified: _old/app/src/dgp/thesymbols.hh
new file: _old/app/src/dgp/tre
modified: _old/app/src/gue/Makefile
modified: _old/app/src/gue/guess.cc
modified: _old/app/src/kor/Makefile
modified: _old/app/src/kor/corlist.cc
modified: _old/app/src/kor/corr.cc
new file: _old/app/src/kor/corr.hh
modified: _old/app/src/kor/main.cc
modified: _old/app/src/lem/Makefile
modified: _old/app/src/lem/lem.cc
modified: _old/app/src/lib/Makefile
modified: _old/app/src/lib/auttools.cc
modified: _old/app/src/lib/symtab.cc
modified: _old/app/src/lib/tft.h
modified: _old/app/src/lib/tfti.h
modified: _old/app/src/lib/ttrans.h
modified: _old/app/src/lib/word.cc
modified: _old/app/src/lib/word.h
modified: _old/app/src/tok.c/Makefile
modified: _old/app/src/tok.c/cmdline_tok.ggo
modified: _old/app/src/tok.c/common_tok.cc
modified: _old/app/src/tok/Makefile
modified: _old/nawszelkiwypadek/tools/aut2fsa
modified: _old/nawszelkiwypadek/tools/cor_dic/makeLabels.pl
modified: _old/nawszelkiwypadek/tools/cor_dic/prep.pl
modified: _old/nawszelkiwypadek/tools/fsm2aut
modified: _old/nawszelkiwypadek/tools/gue_dic/canon.pl
modified: _old/nawszelkiwypadek/tools/gue_dic/compile_user_dict.pl
modified: _old/nawszelkiwypadek/tools/gue_dic/count_prefs.pl
modified: _old/nawszelkiwypadek/tools/gue_dic/cut_prefs.pl
modified: _old/nawszelkiwypadek/tools/gue_dic/makeLabels.pl
modified: _old/nawszelkiwypadek/tools/gue_dic/prep.pl
modified: _old/nawszelkiwypadek/tools/gue_dic/prep_user_dict.pl
modified: _old/nawszelkiwypadek/tools/gue_dic/rmDup.pl
modified: _old/nawszelkiwypadek/tools/gue_dic/stat.pl
modified: _old/nawszelkiwypadek/tools/gue_dic/stat_pre.pl
modified: _old/nawszelkiwypadek/tools/lem_dic/makeLabels.pl
modified: _old/nawszelkiwypadek/tools/lem_dic/prep.pl
modified: auto/defaults
modified: auto/options
modified: auto/output/Makefile
modified: auto/output/config_h
modified: auto/summary
modified: configure

  • Property mode set to 100755
File size: 1.7 KB
Line 
1#! /usr/bin/perl
2
3use locale;
4use strict;
5
6if (@ARGV < 3) {
7    print "USAGE: cut_prefs.pl CUT_OFF TOTAL_PER ABS_CUT\n\n";
8    print "Obcina wpisy ma³o wa¿ne, opis nie jest uwzglêdniany\n";
9    print "je¿eli zachodzi jeden z warunków:\n";
10    print " - jezeli liczba wystapien danego opisu jest mniejsza\n";
11    print "   od \$CUT_OFF*(liczba wystapien poprzedniego opisu)\n";
12    print " - jezeli liczba wystapien danego opisu jest mniejsza\n";
13    print "   od \$TOTAL_PER*(suma wszystkich wystapien)\n";
14    print " - jezeli liczba wystapien danego opisu jest mniejsza\n";
15    print "   od \$ABS_CUT\n";
16    exit;
17}
18
19# jezeli liczba wystapien danego opisu jest mniejsza
20# od $CUT_OFF*(liczba wystapien poprzedniego opisu) - opis nie jest uwzgledniany
21my $CUT_OFF = shift;
22
23# jezeli liczba wystapien danego opisu jest mniejsza
24# od $TOTAL_PER*(suma wszystkich wystapien) - opis nie jest uwzgledniany
25my $TOTAL_PER = shift;
26
27# jezeli liczba wystapien danego opisu jest mniejsza
28# od $ABS_CUT - opis nie jest uwzgledniany
29my $ABS_CUT = shift;
30
31my $pref = "";
32my $oldPref = " ";
33my $countTotal = -1;
34my $count = -1;
35
36while (<>) {
37
38    if (($count == -1) && ($_ =~ /^$oldPref\t.*/)) {
39        next;
40    }
41
42    if ($pref =~ //) {
43        $_ =~ /^(\w+)\t.+\t(\d+)\t(\d+)/;
44        $pref = $1;
45        $count = $2;
46        $countTotal = $3;
47#       print "\$pref=$pref\t\$count=$count\t\$countTotal=$countTotal\n";
48    }
49    $_ =~ /\w+\t.+\t(\d+)\t\d+/;
50    my $c = $1;
51#     print "\$c=$c\t\$CUT_OFF*\$count=$CUT_OFF*$count\t\$TOTAL_PER*\$countTotal=".$TOTAL_PER*$countTotal."\n";
52    if (($CUT_OFF*$count < $c) && ($TOTAL_PER*$countTotal < $c) && ($ABS_CUT < $c)) {
53        $count = $c;
54        print $_;
55    } else {
56        $count = -1;
57        $oldPref = $pref;
58        $pref = "";
59    }
60}
Note: See TracBrowser for help on using the repository browser.