On Thu, Jul 25, 2013 at 5:38 AM, Stefan Evert <span dir="ltr">&lt;<a href="mailto:stefanML@collocations.de" target="_blank">stefanML@collocations.de</a>&gt;</span> wrote:<div><br></div><div>Dear Stefan,</div><div><br><div class="gmail_quote">

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">I&#39;ve had similar problems myself recently.  One possibility is that recent development efforts introduced a bug in the indexing code that has been fixed again; so if you happened to build the index with one of the broken versions, it ended up damaged.  Difficult to track this down, since the current version (as well as release 3.0.1) appear to work fine.<br>

</blockquote><div><br></div><div>I made these indexes in 2010, with what must have been version 2.2 or something.</div><div><br></div><div>The new and old word indexes are indeed of different sizes, while the lemma and POS indexes are identical.</div>

<div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Do you happen to have copies of the old and new .crc and .crx files? Comparing these might give us a hint where the problem lies, though I don&#39;t think I&#39;ll have time for an in-depth look anytime soon.<br>

</blockquote><div><br></div><div>Yes, I kept copies. The word .crc and .crx files alone are 82 MB, but I can certainly send them to you by some means or another.</div><div><br></div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">


Best wishes from Lancaster, where I am attending a conference co-organized by Andrew,<br></blockquote><div><br></div><div>Have fun!</div><div><br></div><div>Best wishes,</div><div>Scott</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div class="HOEnZb"><div class="h5">
<br>
On 24 Jul 2013, at 20:48, Scott Sadowsky &lt;<a href="mailto:ssadowsky@gmail.com">ssadowsky@gmail.com</a>&gt; wrote:<br>
<br>
&gt; Dear Stefan,<br>
&gt;<br>
&gt; Thanks so much for your help. The following seems to have fixed the problem:<br>
&gt;<br>
&gt; If you have &quot;cwb-make&quot; from the CWB/Perl modules, you can simply trash the &quot;.crc&quot; and &quot;.crx&quot; files (which contain the actual lookup index that appears to be damaged) and rebuild them with<br>


&gt;         cwb-make [...] PERS-DIVER-USENET<br>
&gt;<br>
&gt; More testing will be needed to be sure, of course.<br>
&gt;<br>
&gt; Best wishes,<br>
&gt; Scott<br>
&gt;<br>
&gt;<br>
<br>
</div></div></blockquote></div><br></div>