Hi Andrew, hi all,<div><br></div><div>could you suggest possible sources of error? I have checked for spaces that should be tabs, and it does not seem to be the case. There are tokens for which the tense attribute is empty. But that usually resulted into __UNDEF__ or something like that. Isn&#39;t that the case any more?</div>

<div><br></div><div>Best,</div><div>Marti</div><div><br></div><div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Nov 1, 2012 at 1:56 PM,  <span dir="ltr">&lt;<a href="mailto:cwb-request@sslmit.unibo.it" target="_blank">cwb-request@sslmit.unibo.it</a>&gt;</span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Send CWB mailing list submissions to<br>
        <a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a><br>
<br>
To subscribe or unsubscribe via the World Wide Web, visit<br>
        <a href="http://devel.sslmit.unibo.it/mailman/listinfo/cwb" target="_blank">http://devel.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
or, via email, send a message with subject or body &#39;help&#39; to<br>
        <a href="mailto:cwb-request@sslmit.unibo.it">cwb-request@sslmit.unibo.it</a><br>
<br>
You can reach the person managing the list at<br>
        <a href="mailto:cwb-owner@sslmit.unibo.it">cwb-owner@sslmit.unibo.it</a><br>
<br>
When replying, please edit your Subject line so it is more specific<br>
than &quot;Re: Contents of CWB digest...&quot;<br>
<br>
<br>
Today&#39;s Topics:<br>
<br>
   1. Re: Illegal division by zero (Stefan Evert)<br>
   2. Re: Illegal division by zero (Trevor Jenkins)<br>
   3. cwb-huffcode issues warning during cwb-encode (Mart? Quixal)<br>
   4. Re: cwb-huffcode issues warning during cwb-encode (Hardie, Andrew)<br>
   5. Re: cwb-huffcode issues warning during cwb-encode (Mart? Quixal)<br>
<br>
<br>
----------------------------------------------------------------------<br>
<br>
Message: 1<br>
Date: Thu, 1 Nov 2012 15:30:53 +0100<br>
From: Stefan Evert &lt;<a href="mailto:stefanML@collocations.de">stefanML@collocations.de</a>&gt;<br>
To: Open source development of the Corpus WorkBench<br>
        &lt;<a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a>&gt;<br>
Subject: Re: [CWB] Illegal division by zero<br>
Message-ID: &lt;<a href="mailto:CDFFCA68-5182-4367-97A1-CFCEC83ADC00@collocations.de">CDFFCA68-5182-4367-97A1-CFCEC83ADC00@collocations.de</a>&gt;<br>
Content-Type: text/plain; charset=iso-8859-1<br>
<br>
<br>
&gt; The Perl scripts that do BNCweb installation gather data from the BNC file headers to build this database (among other things). So, alas, there is only one solution: You go back to setup and repeat whatever steps got missed or went wrong, so that the headerinfo table gets filled in!<br>


<br>
I&#39;ve experienced similar errors -- e.g. distribution analysis shows all zeroes -- trying to get BNCweb installed on a university Web server I didn&#39;t have any access to.<br>
<br>
A likely cause is that the file exchange between the MySQL server and BNCweb doesn&#39;t work properly.  Keep in mind that<br>
<br>
  - BNCweb and the MySQL server must be running on the same machine<br>
  - the exchange directory must be readable and writable both by the Web server running BNCweb and by the MySQL server<br>
  - the bncweb account in MySQL needs the necessary permissions to access disk files (that&#39;s one of the highest permission in the system and the MySQL manual might have advised you not to grant it to users ...)<br>
<br>
Some versions of MySQL, depending on their configuration settings, may have additional limitations, such as disabling file access entirely or requiring that the exchange directory is world-readable and world-writable (i.e. _all_ users have full access there).<br>


<br>
Hope this helpsm<br>
Stefan<br>
<br>
------------------------------<br>
<br>
Message: 2<br>
Date: Thu, 1 Nov 2012 14:58:33 +0000<br>
From: Trevor Jenkins &lt;<a href="mailto:trevor.jenkins@suneidesis.com">trevor.jenkins@suneidesis.com</a>&gt;<br>
To: Open source development of the Corpus WorkBench<br>
        &lt;<a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a>&gt;<br>
Subject: Re: [CWB] Illegal division by zero<br>
Message-ID: &lt;<a href="mailto:601BF14C-3317-4043-97C1-2B6F83C80AA2@suneidesis.com">601BF14C-3317-4043-97C1-2B6F83C80AA2@suneidesis.com</a>&gt;<br>
Content-Type: text/plain; charset=&quot;iso-8859-1&quot;<br>
<br>
On 1 Nov 2012, at 14:04, &quot;Hardie, Andrew&quot; &lt;<a href="mailto:a.hardie@lancaster.ac.uk">a.hardie@lancaster.ac.uk</a>&gt; wrote:<br>
<br>
&gt; The Perl scripts that do BNCweb installation gather data from the BNC file headers to build this database (among other things). So, alas, there is only one solution: You go back to setup and repeat whatever steps got missed or went wrong, so that the headerinfo table gets filled in!<br>


<br>
Whilst the user should ensure that their data is correct perhaps a sanity check in those perl scripts is needed; &quot;oy mate, you&#39;ve not set the number of words per sentence properly&quot;.<br>
<br>
Regards, Trevor.<br>
<br>
&lt;&gt;&lt; Re: deemed!<br>
<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: &lt;<a href="http://devel.sslmit.unibo.it/pipermail/cwb/attachments/20121101/3bfb7513/attachment-0001.html" target="_blank">http://devel.sslmit.unibo.it/pipermail/cwb/attachments/20121101/3bfb7513/attachment-0001.html</a>&gt;<br>


<br>
------------------------------<br>
<br>
Message: 3<br>
Date: Thu, 1 Nov 2012 13:13:30 -0500<br>
From: Mart? Quixal &lt;<a href="mailto:marti.quixal@gmail.com">marti.quixal@gmail.com</a>&gt;<br>
To: <a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a><br>
Subject: [CWB] cwb-huffcode issues warning during cwb-encode<br>
Message-ID:<br>
        &lt;CAMtTwm_KFkFzecTFHkCOKsbhG-8r4EYZi_77YKG6uZfrmdaY=<a href="mailto:g@mail.gmail.com">g@mail.gmail.com</a>&gt;<br>
Content-Type: text/plain; charset=&quot;utf-8&quot;<br>
<br>
Hi,<br>
<br>
I am compiling a corpus with the following bash file:<br>
<br>
echo &quot;Deleting older version of CWB-formatted files in data directory&quot;<br>
echo &quot;&quot;<br>
rm /WebCorpora/data/fall/*<br>
<br>
echo &quot;Encoding corpus with CWB tools&quot;<br>
echo &quot;&quot;<br>
<br>
cwb-encode -d /WebCorpora/data/fall/ -R /WebCorpora/registry/fall -f<br>
/WebCorpora/upload/spintxFall4web.cpr -xsB -P lemma -P pos -P punct -P<br>
start -P end -P tense -P mood -P numb -P pers -P gend -V text:0+id -V<br>
speaker:0+type -V lang:0+code<br>
<br>
cwb-make -M 256 -r /WebCorpora/registry/ FALL<br>
echo &quot;DONE!&quot;<br>
date<br>
<br>
And I get the following message:<br>
<br>
WARNING (SHELL CMD &#39;/usr/local/bin/cwb-huffcode -r &#39;/WebCorpora/registry/&#39;<br>
-T -P tense FALL&#39;):<br>
-&gt; Warning on stderr:<br>
-&gt; Problem: No output generated -- no items?<br>
CWB::Indexer: Creation of component tense/CIS<br>
(/WebCorpora/data/fall/tense.huf) failed (aborted).<br>
 at /opt/local/bin/cwb-make line 76<br>
<br>
<br>
However, it seems that the corpus has been encoded. A couple of basic<br>
queries I did did work. Should I be worried or warned about future<br>
problems? Or I can just ignore this message?<br>
<br>
Best regards,<br>
Marti<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: &lt;<a href="http://devel.sslmit.unibo.it/pipermail/cwb/attachments/20121101/27c58539/attachment-0001.html" target="_blank">http://devel.sslmit.unibo.it/pipermail/cwb/attachments/20121101/27c58539/attachment-0001.html</a>&gt;<br>


<br>
------------------------------<br>
<br>
Message: 4<br>
Date: Thu, 1 Nov 2012 18:27:50 +0000<br>
From: &quot;Hardie, Andrew&quot; &lt;<a href="mailto:a.hardie@lancaster.ac.uk">a.hardie@lancaster.ac.uk</a>&gt;<br>
To: Open source development of the Corpus WorkBench<br>
        &lt;<a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a>&gt;<br>
Subject: Re: [CWB] cwb-huffcode issues warning during cwb-encode<br>
Message-ID:<br>
        &lt;28078EC3FBF1B940A3EF3D0D19BE351D0ECBA1@EX-0-MB1.lancs.local&gt;<br>
Content-Type: text/plain; charset=&quot;utf-8&quot;<br>
<br>
That message indicates that there was no data for the tense attribute.  That may mean that errors won?t show up till you query that attribute.<br>
<br>
Usually this means that something is wrong  in the original file.<br>
<br>
best<br>
<br>
Andrew.<br>
<br>
From: <a href="mailto:cwb-bounces@sslmit.unibo.it">cwb-bounces@sslmit.unibo.it</a> [mailto:<a href="mailto:cwb-bounces@sslmit.unibo.it">cwb-bounces@sslmit.unibo.it</a>] On Behalf Of Mart? Quixal<br>
Sent: 01 November 2012 18:14<br>
To: <a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a><br>
Subject: [CWB] cwb-huffcode issues warning during cwb-encode<br>
<br>
Hi,<br>
<br>
I am compiling a corpus with the following bash file:<br>
<br>
echo &quot;Deleting older version of CWB-formatted files in data directory&quot;<br>
echo &quot;&quot;<br>
rm /WebCorpora/data/fall/*<br>
<br>
echo &quot;Encoding corpus with CWB tools&quot;<br>
echo &quot;&quot;<br>
<br>
cwb-encode -d /WebCorpora/data/fall/ -R /WebCorpora/registry/fall -f /WebCorpora/upload/spintxFall4web.cpr -xsB -P lemma -P pos -P punct -P start -P end -P tense -P mood -P numb -P pers -P gend -V text:0+id -V speaker:0+type -V lang:0+code<br>


<br>
cwb-make -M 256 -r /WebCorpora/registry/ FALL<br>
echo &quot;DONE!&quot;<br>
date<br>
<br>
And I get the following message:<br>
<br>
WARNING (SHELL CMD &#39;/usr/local/bin/cwb-huffcode -r &#39;/WebCorpora/registry/&#39; -T -P tense FALL&#39;):<br>
-&gt; Warning on stderr:<br>
-&gt; Problem: No output generated -- no items?<br>
CWB::Indexer: Creation of component tense/CIS (/WebCorpora/data/fall/tense.huf) failed (aborted).<br>
 at /opt/local/bin/cwb-make line 76<br>
<br>
<br>
However, it seems that the corpus has been encoded. A couple of basic queries I did did work. Should I be worried or warned about future problems? Or I can just ignore this message?<br>
<br>
Best regards,<br>
Marti<br>
<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: &lt;<a href="http://devel.sslmit.unibo.it/pipermail/cwb/attachments/20121101/69ed3b09/attachment-0001.html" target="_blank">http://devel.sslmit.unibo.it/pipermail/cwb/attachments/20121101/69ed3b09/attachment-0001.html</a>&gt;<br>


<br>
------------------------------<br>
<br>
Message: 5<br>
Date: Thu, 1 Nov 2012 13:55:36 -0500<br>
From: Mart? Quixal &lt;<a href="mailto:marti.quixal@gmail.com">marti.quixal@gmail.com</a>&gt;<br>
To: <a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a><br>
Subject: Re: [CWB] cwb-huffcode issues warning during cwb-encode<br>
Message-ID:<br>
        &lt;<a href="mailto:CAMtTwm8kUHxki0tffingU4trcEzkpU2jCHmpDGCkRtWuLGco4g@mail.gmail.com">CAMtTwm8kUHxki0tffingU4trcEzkpU2jCHmpDGCkRtWuLGco4g@mail.gmail.com</a>&gt;<br>
Content-Type: text/plain; charset=&quot;utf-8&quot;<br>
<br>
Hi,<br>
<br>
I just realised that I my queries using the p-attribute word result in no<br>
matches at all.<br>
<br>
For instance (using cqp in command line):<br>
<br>
FALL&gt; &quot;a&quot;;<br>
0 matches.<br>
<br>
Could that be related to my error mentioned in the previous message?<br>
<br>
Best,<br>
Marti<br>
<br>
<br>
On Thu, Nov 1, 2012 at 1:13 PM, Mart? Quixal &lt;<a href="mailto:marti.quixal@gmail.com">marti.quixal@gmail.com</a>&gt; wrote:<br>
<br>
&gt; Hi,<br>
&gt;<br>
&gt; I am compiling a corpus with the following bash file:<br>
&gt;<br>
&gt; echo &quot;Deleting older version of CWB-formatted files in data directory&quot;<br>
&gt; echo &quot;&quot;<br>
&gt;  rm /WebCorpora/data/fall/*<br>
&gt;<br>
&gt; echo &quot;Encoding corpus with CWB tools&quot;<br>
&gt; echo &quot;&quot;<br>
&gt;<br>
&gt; cwb-encode -d /WebCorpora/data/fall/ -R /WebCorpora/registry/fall -f<br>
&gt; /WebCorpora/upload/spintxFall4web.cpr -xsB -P lemma -P pos -P punct -P<br>
&gt; start -P end -P tense -P mood -P numb -P pers -P gend -V text:0+id -V<br>
&gt; speaker:0+type -V lang:0+code<br>
&gt;<br>
&gt; cwb-make -M 256 -r /WebCorpora/registry/ FALL<br>
&gt; echo &quot;DONE!&quot;<br>
&gt; date<br>
&gt;<br>
&gt; And I get the following message:<br>
&gt;<br>
&gt; WARNING (SHELL CMD &#39;/usr/local/bin/cwb-huffcode -r &#39;/WebCorpora/registry/&#39;<br>
&gt; -T -P tense FALL&#39;):<br>
&gt; -&gt; Warning on stderr:<br>
&gt; -&gt; Problem: No output generated -- no items?<br>
&gt; CWB::Indexer: Creation of component tense/CIS<br>
&gt; (/WebCorpora/data/fall/tense.huf) failed (aborted).<br>
&gt;  at /opt/local/bin/cwb-make line 76<br>
&gt;<br>
&gt;<br>
&gt; However, it seems that the corpus has been encoded. A couple of basic<br>
&gt; queries I did did work. Should I be worried or warned about future<br>
&gt; problems? Or I can just ignore this message?<br>
&gt;<br>
&gt; Best regards,<br>
&gt; Marti<br>
&gt;<br>
&gt;<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: &lt;<a href="http://devel.sslmit.unibo.it/pipermail/cwb/attachments/20121101/eff19f22/attachment.html" target="_blank">http://devel.sslmit.unibo.it/pipermail/cwb/attachments/20121101/eff19f22/attachment.html</a>&gt;<br>


<br>
------------------------------<br>
<br>
_______________________________________________<br>
CWB mailing list<br>
<a href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a><br>
<a href="http://devel.sslmit.unibo.it/mailman/listinfo/cwb" target="_blank">http://devel.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
<br>
<br>
End of CWB Digest, Vol 71, Issue 3<br>
**********************************<br>
</blockquote></div><br><br>
</div></div>