On Tue, Jul 23, 2013 at 11:11 AM, Stefan Evert <span dir="ltr">&lt;<a href="mailto:stefanML@collocations.de" target="_blank">stefanML@collocations.de</a>&gt;</span> wrote:<br><div class="gmail_quote"><br><div class="gmail_quote">

<div class="im"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Now, could you please try the following queries in CQP on this corpus?<br>
<br>
        [word = &quot;Tai&quot;]<br>
        [word = &quot;dai&quot;]<br>
        [word = &quot;tai&quot;]<br>
        etc.<br>
<br>
If some of them crash, but others don&#39;t, your index is probably damaged. Otherwise, we&#39;ll have to dig deeper.  </blockquote><div><br></div></div><div>Every one works fine EXCEPT the last one in the list, &quot;jai&quot;, which causes the segmentation fault. </div>

<div class="im">
<div> </div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">How did you compile and install CWB?<br></blockquote><div><br></div></div><div>I&#39;m using Linux Mint KDE x64, so for 3.0 I downloaded the tarball and executed the installation script. For 3.4.7 (which overwrote the old installation) I installed from the SVN repository by editing the build properties and then following the instructions (make, etc.). I selected the &quot;standard&quot; installation option.</div>


<div><br></div><div>Now, when I change corpora the search executes correctly, which might point to a corrupt index. But I just replaced the problematic index with two different backup copies, one of them from a machine I haven&#39;t touched in a year, and the problem still occurs. (Just to be clear, by index I&#39;m talking about the directory with the *.cnt, *.crx, *.huf, etc. files).</div>


<div><br></div><div>Cheers,</div><div>Scott</div><div><div class="h5"><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
Cheers,<br>
Stefan<br>
<div><div><br>
<br>
On 23 Jul 2013, at 14:57, Scott Sadowsky &lt;<a href="mailto:ssadowsky@gmail.com" target="_blank">ssadowsky@gmail.com</a>&gt; wrote:<br>
<br>
&gt; That worked just fine. Here&#39;s the output:<br>
&gt;<br>
&gt; $ cwb-lexdecode -f -p &#39;.ai&#39; PERS-DIVER-USENET<br>
&gt;     165 Tai<br>
&gt;      57 dai<br>
&gt;     357 tai<br>
&gt;       7 Mai<br>
&gt;       3 Kai<br>
&gt;     357 vai<br>
&gt;      23 Vai<br>
&gt;       6 rai<br>
&gt;      81 cai<br>
&gt;      13 sai<br>
&gt;       4 Dai<br>
&gt;       1 uai<br>
&gt;      32 hai<br>
&gt;       1 Jai<br>
&gt;      23 mai<br>
&gt;       7 fai<br>
&gt;       2 lai<br>
&gt;       2 Wai<br>
&gt;       2 wai<br>
&gt;       6 nai<br>
&gt;       2 pai<br>
&gt;       5 Sai<br>
&gt;       4 bai<br>
&gt;       4 Cai<br>
&gt;       5 kai<br>
&gt;       4 gai<br>
&gt;       1 Bai<br>
&gt;       2 Rai<br>
&gt;       1 Lai<br>
&gt;       1 Fai<br>
&gt;       1 jai<br>
&gt; $<br>
&gt;<br>
<br>
</div></div></blockquote></div></div></div><br><br clear="all"><div class="im"><br></div></div>