Something very strange is going on. I&#39;ve replaced my index for this corpus with a third backup copy, and the following happened:<div><br></div><div><div>PERS-DIVER-USENET&gt; &quot;jai&quot;</div><div>0 matches.                                                  </div>

<div>PERS-DIVER-USENET&gt; &quot;.+ai&quot;</div><div>Segmentation fault (core dumped)  </div><div><br></div><div>Here the search for &quot;jai&quot;, which previously caused a segfault, worked. So all seemed good. But the search returned 0 hits, instead of the 1 which is returned by the command <span style="background-color:rgb(255,255,255);color:rgb(34,34,34);font-family:arial,sans-serif;font-size:12.727272033691406px">cwb-lexdecode -f -p &#39;.ai&#39; PERS-DIVER-USENET. So something isn&#39;t adding up here.</span></div>

<div><span style="background-color:rgb(255,255,255);color:rgb(34,34,34);font-family:arial,sans-serif;font-size:12.727272033691406px"><br></span></div><div><span style="background-color:rgb(255,255,255);color:rgb(34,34,34);font-family:arial,sans-serif;font-size:12.727272033691406px">Immediately after this, I ran the folloiwng</span></div>

<div>                          </div><div>$ cqp -eC</div><div>Welcome to CQP -- the  Colourful  Query  Processor .</div><div>[30: NBUS  31: NBUS  32: NBUS  33: NBUS  34: NBUS  35: NBUS  36: NBUS  37: NBUS  ]</div><div>[40: NBUS  41: NBUS  42: NBUS  43: NBUS  44: NBUS  45: NBUS  46: NBUS  47: NBUS  ]</div>

<div>[no corpus]&gt; PERS-DIVER-USENET </div><div>PERS-DIVER-USENET&gt; &quot;jai&quot;</div><div>Segmentation fault (core dumped)                            </div><div>$ </div><div><br></div><div>Now when I try the same search for &quot;jai&quot; that worked a minute ago, it segfaults.</div>

<div><br></div><div>I suspect the next step is to rebuild the index from scratch, but that involves decompressing a ZIP file with 1.2 million files inside it, which I&#39;d rather avoid if at all possible.</div><div><br>
</div>
<div>Cheers,</div><div>Scott</div><div><br></div><div><br></div><br><div class="gmail_quote">On Tue, Jul 23, 2013 at 11:11 AM, Stefan Evert <span dir="ltr">&lt;<a href="mailto:stefanML@collocations.de" target="_blank">stefanML@collocations.de</a>&gt;</span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Thanks.<br>
<br>
Now, could you please try the following queries in CQP on this corpus?<br>
<br>
        [word = &quot;Tai&quot;]<br>
        [word = &quot;dai&quot;]<br>
        [word = &quot;tai&quot;]<br>
        etc.<br>
<br>
If some of them crash, but others don&#39;t, your index is probably damaged. Otherwise, we&#39;ll have to dig deeper.  How did you compile and install CWB?<br>
<br>
Cheers,<br>
Stefan<br>
<div class="HOEnZb"><div class="h5"><br>
<br>
On 23 Jul 2013, at 14:57, Scott Sadowsky &lt;<a href="mailto:ssadowsky@gmail.com">ssadowsky@gmail.com</a>&gt; wrote:<br>
<br>
&gt; That worked just fine. Here&#39;s the output:<br>
&gt;<br>
&gt; $ cwb-lexdecode -f -p &#39;.ai&#39; PERS-DIVER-USENET<br>
&gt;     165 Tai<br>
&gt;      57 dai<br>
&gt;     357 tai<br>
&gt;       7 Mai<br>
&gt;       3 Kai<br>
&gt;     357 vai<br>
&gt;      23 Vai<br>
&gt;       6 rai<br>
&gt;      81 cai<br>
&gt;      13 sai<br>
&gt;       4 Dai<br>
&gt;       1 uai<br>
&gt;      32 hai<br>
&gt;       1 Jai<br>
&gt;      23 mai<br>
&gt;       7 fai<br>
&gt;       2 lai<br>
&gt;       2 Wai<br>
&gt;       2 wai<br>
&gt;       6 nai<br>
&gt;       2 pai<br>
&gt;       5 Sai<br>
&gt;       4 bai<br>
&gt;       4 Cai<br>
&gt;       5 kai<br>
&gt;       4 gai<br>
&gt;       1 Bai<br>
&gt;       2 Rai<br>
&gt;       1 Lai<br>
&gt;       1 Fai<br>
&gt;       1 jai<br>
&gt; $<br>
&gt;<br>
<br>
</div></div></blockquote></div><br><br></div>