I seem to have found a solution to the problem. It seems it was caused by line endings -- some of my files had CRLF endings instead of plain old unix-style ones. The search with POS works fine now.<div><br></div><div>Thanks for your help.</div>
<div>albert</div><div class="gmail_extra"><br><br><div class="gmail_quote">On 5 November 2012 15:34, Hardie, Andrew <span dir="ltr">&lt;<a href="mailto:a.hardie@lancaster.ac.uk" target="_blank">a.hardie@lancaster.ac.uk</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Albert,<br>
<br>
You may need to check whether pos has been configured properly as primary annotation.<br>
<br>
As a superuser, go to the main corpus search page then on the menu select &gt; Manage Annotation. See if the &quot;Primary annotation&quot; slot has POS selected. If not, change and update, then it should work.<br>
<br>
If, on the other hand, pos *IS* properly selected on that screen, let me know, and I&#39;ll look into what else might be causing the problem.<br>
<br>
(I am not sure why sometimes the primary annotation is not selected correctly at index time. A bug, of course, but none one I&#39;ve managed to track down yet as it seems to be intermittent. I&#39;ll work it out eventually.)<br>

<br>
best<br>
<br>
Andrew.<br>
<br>
==========================<br>
From: <a href="mailto:cwb-bounces@sslmit.unibo.it">cwb-bounces@sslmit.unibo.it</a> [mailto:<a href="mailto:cwb-bounces@sslmit.unibo.it">cwb-bounces@sslmit.unibo.it</a>] On Behalf Of Albert Gatt<br>
Sent: 05 November 2012 14:09<br>
To: <a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a><br>
Subject: [CWB] Problem encoding corpus with POS tags<br>
<div><div class="h5"><br>
I&#39;m trying to install a corpus which has word + POS, via CQPWeb. An example of the data is shown below:<br>
<br>
&lt;text id=&quot;lh1&quot;&gt;<br>
&lt;s id=&quot;0&quot;&gt;<br>
Anqas   MV<br>
għaraftek       VV<br>
...     PUN<br>
&lt;/s&gt;<br>
...<br>
&lt;/text&gt;<br>
<br>
When I install, I leave the s-attributes as default (since &quot;s&quot; is the only structural attribute I have, apart from &quot;text&quot;) and specify &quot;pos&quot; as the primary p-attribute.<br>
<br>
The corpus installs without problems, and I can use CQPWeb&#39;s frequency list functionality to see a list of different parts of speech, as well as word tokens. I can successfully run queries for words. However, any query that involves POS gives me no results (e.g. &quot;kien_VA&quot; where &quot;kien&quot; is a word and &quot;VA&quot; is a tag). <br>

<br>
I&#39;m not sure where the problem lies.<br>
<br>
thanks<br>
albert<br>
<br>
<br>
--<br>
-----------------------------------------------------------------<br>
Albert Gatt<br>
Institute of Linguistics <br>
Rm 22, Block A<br>
Car Park 6<br>
University of Malta<br>
Tal-Qroqq Msida MSD2080<br>
Malta<br>
 <br>
tel: <a href="tel:%28%2B356%29%202340%202150" value="+35623402150">(+356) 2340 2150</a><br>
<a href="http://staff.um.edu.mt/albert.gatt/" target="_blank">http://staff.um.edu.mt/albert.gatt/</a><br>
<br>
</div></div>_______________________________________________<br>
CWB mailing list<br>
<a href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a><br>
<a href="http://devel.sslmit.unibo.it/mailman/listinfo/cwb" target="_blank">http://devel.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
<br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br><div>-----------------------------------------------------------------</div>
<div>Albert Gatt</div>
<div>Institute of Linguistics </div>
<div>Rm 22, Block A</div><div>Car Park 6</div>
<div>University of Malta</div>
<div>Tal-Qroqq Msida MSD2080</div>
<div>Malta</div>
<div> </div>
<div>tel: (+356) 2340 2150<br></div>
<div><a href="http://staff.um.edu.mt/albert.gatt/" target="_blank">http://staff.um.edu.mt/albert.gatt/</a></div><br>
</div>