<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta name="Generator" content="Microsoft Word 12 (filtered medium)">
<!--[if !mso]><style>v\:* {behavior:url(#default#VML);}
o\:* {behavior:url(#default#VML);}
w\:* {behavior:url(#default#VML);}
.shape {behavior:url(#default#VML);}
</style><![endif]--><style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Verdana;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
@font-face
        {font-family:Webdings;
        panose-1:5 3 1 2 1 5 9 6 7 3;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
pre
        {mso-style-priority:99;
        mso-style-link:"HTML Preformatted Char";
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:10.0pt;
        font-family:"Courier New";}
p.errormessage, li.errormessage, div.errormessage
        {mso-style-name:errormessage;
        mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
span.HTMLPreformattedChar
        {mso-style-name:"HTML Preformatted Char";
        mso-style-priority:99;
        mso-style-link:"HTML Preformatted";
        font-family:Consolas;}
span.EmailStyle21
        {mso-style-type:personal-reply;
        font-family:"Verdana","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-GB" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">Well, if you choose the option &#8220;Use the default setup for P-attributes&#8221;, and you don&#8217;t *<b>have</b>* the default p-attributes, then you are likely to run into
 problems.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">Specify the p-attributes you actually have in the indexing screen.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">best<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">Andrew.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm">
<p class="MsoNormal"><b><span lang="EN-US" style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;">From:</span></b><span lang="EN-US" style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;"> cwb-bounces@sslmit.unibo.it [mailto:cwb-bounces@sslmit.unibo.it]
<b>On Behalf Of </b>Andres Chandia<br>
<b>Sent:</b> 17 May 2013 14:38<br>
<b>To:</b> cwb@sslmit.unibo.it<br>
<b>Subject:</b> [CWB] Problem indexing even tiny corpus<o:p></o:p></span></p>
</div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal" style="margin-bottom:12.0pt">Hi there,<br>
file prueba.txt&nbsp; (attached to this mail) put in ../cqp/uploads/<br>
chown www-data:bncweb ../cqp/uploads/prueba.txt<br>
<br>
then from the web interface:&nbsp; Install new corpus &gt; <br>
Specify the MySQL name of the corpus you wish to create: prueba&nbsp;&nbsp;&nbsp; <br>
Specify the CWB name of the corpus you wish to create: prueba<br>
Enter the full name of the corpus: Prueba<br>
Include? x prueba.txt<br>
Use default setup for S-attributes (only &lt;s&gt;)<br>
Use default setup for P-attributes (pos, hw, semtag, class, lemma)<br>
&gt; Install corpus with settings above &lt;<br>
<br>
and then I get this, I'm a little lost, what should I look for, what to fix?<o:p></o:p></p>
<p class="errormessage">CQPweb encountered an error and could not continue.<o:p></o:p></p>
<p class="errormessage">cwb-huffcode reported an error! Corpus indexing aborted. <o:p>
</o:p></p>
<pre>/usr/local/bin/cwb-encode -xsB -c utf8 -d /B_NFS_P/diposit/corpora/cwb/data/prueba -f<o:p></o:p></pre>
<pre>/B_NFS_P/diposit/corpora/cqp/uploads/prueba.txt -R<o:p></o:p></pre>
<pre>/B_NFS_P/diposit/corpora/cwb/registry/prueba&nbsp; -P pos -P hw -P semtag -P class -P lemma -S s -S<o:p></o:p></pre>
<pre>text:0&#43;id 2&gt;&amp;1 Undeclared element attribute&nbsp; ignored (file<o:p></o:p></pre>
<pre>/B_NFS_P/diposit/corpora/cqp/uploads/prueba.txt, line #1, warning issued only once).<o:p></o:p></pre>
<pre>Undeclared element attribute&nbsp; ignored (file /B_NFS_P/diposit/corpora/cqp/uploads/prueba.txt,<o:p></o:p></pre>
<pre>line #1, warning issued only once). /usr/local/bin/cwb-makeall -r<o:p></o:p></pre>
<pre>/B_NFS_P/diposit/corpora/cwb/registry -V PRUEBA 2&gt;&amp;1 === Makeall: processing corpus<o:p></o:p></pre>
<pre>PRUEBA === Registry directory: /B_NFS_P/diposit/corpora/cwb/registry ATTRIBUTE word&nbsp; &#43;<o:p></o:p></pre>
<pre>creating LEXSRT ... OK&nbsp; - lexicon&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; OK&nbsp; &#43; creating FREQS ... OK&nbsp; - frequencies&nbsp; OK&nbsp; - token<o:p></o:p></pre>
<pre>stream OK&nbsp; &#43; creating REVCIDX ... OK&nbsp; &#43; creating REVCORP ... OK&nbsp; ? validating REVCORP ... OK <o:p></o:p></pre>
<pre>- index&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;OK ATTRIBUTE pos&nbsp; &#43; creating LEXSRT ... OK&nbsp; - lexicon&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; OK&nbsp; &#43; creating FREQS<o:p></o:p></pre>
<pre>... OK&nbsp; - frequencies&nbsp; OK&nbsp; - token stream OK&nbsp; &#43; creating REVCIDX ... OK&nbsp; &#43; creating REVCORP<o:p></o:p></pre>
<pre>... OK&nbsp; ? validating REVCORP ... OK&nbsp; - index&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; OK ATTRIBUTE hw&nbsp; &#43; creating LEXSRT ... OK <o:p></o:p></pre>
<pre>- lexicon&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; OK&nbsp; &#43; creating FREQS ... OK&nbsp; - frequencies&nbsp; OK&nbsp; - token stream OK&nbsp; &#43; creating<o:p></o:p></pre>
<pre>REVCIDX ... OK&nbsp; &#43; creating REVCORP ... OK&nbsp; ? validating REVCORP ... OK&nbsp; - index&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; OK<o:p></o:p></pre>
<pre>ATTRIBUTE semtag&nbsp; &#43; creating LEXSRT ... OK&nbsp; - lexicon&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;OK&nbsp; &#43; creating FREQS ... OK&nbsp; -<o:p></o:p></pre>
<pre>frequencies&nbsp; OK&nbsp; - token stream OK&nbsp; &#43; creating REVCIDX ... OK&nbsp; &#43; creating REVCORP ... OK&nbsp; ?<o:p></o:p></pre>
<pre>validating REVCORP ... OK&nbsp; - index&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; OK ATTRIBUTE class&nbsp; &#43; creating LEXSRT ... OK&nbsp; -<o:p></o:p></pre>
<pre>lexicon&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; OK&nbsp; &#43; creating FREQS ... OK &nbsp;- frequencies&nbsp; OK&nbsp; - token stream OK&nbsp; &#43; creating<o:p></o:p></pre>
<pre>REVCIDX ... OK&nbsp; &#43; creating REVCORP ... OK&nbsp; ? validating REVCORP ... OK&nbsp; - index&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; OK<o:p></o:p></pre>
<pre>ATTRIBUTE lemma&nbsp; &#43; creating LEXSRT ... OK&nbsp; - lexicon&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; OK&nbsp; &#43; creating FREQS ... OK&nbsp; -<o:p></o:p></pre>
<pre>frequencies&nbsp; OK&nbsp; - token stream OK&nbsp; &#43; creating REVCIDX ... OK&nbsp; &#43; creating REVCORP ... OK&nbsp; ?<o:p></o:p></pre>
<pre>validating REVCORP ... OK&nbsp; - index&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; OK ========================================<o:p></o:p></pre>
<pre>/usr/local/bin/cwb-huffcode -r /B_NFS_P/diposit/corpora/cwb/registry -A PRUEBA 2&gt;&amp;1<o:p></o:p></pre>
<pre>Problem: No output generated -- no items? /B_NFS_P/diposit/corpora/cwb/data/prueba/semtag.hcd:<o:p></o:p></pre>
<pre>No such file or directory ERROR: reading /B_NFS_P/diposit/corpora/cwb/data/prueba/semtag.hcd<o:p></o:p></pre>
<pre>failed. Aborted. COMPRESSING TOKEN STREAM of PRUEBA.word - writing code descriptor block to<o:p></o:p></pre>
<pre>/B_NFS_P/diposit/corpora/cwb/data/prueba/word.hcd - writing compressed item sequence to<o:p></o:p></pre>
<pre>/B_NFS_P/diposit/corpora/cwb/data/prueba/word.huf - writing sync (every 128 tokens) to<o:p></o:p></pre>
<pre>/B_NFS_P/diposit/corpora/cwb/data/prueba/word.huf.syn VALIDATING PRUEBA.word - reading code<o:p></o:p></pre>
<pre>descriptor block from /B_NFS_P/diposit/corpora/cwb/data/prueba/word.hcd - reading compressed<o:p></o:p></pre>
<pre>item sequence from /B_NFS_P/diposit/corpora/cwb/data/prueba/word.huf - reading sync (mod 128)<o:p></o:p></pre>
<pre>from /B_NFS_P/diposit/corpora/cwb/data/prueba/word.huf.syn !! You can delete the file&nbsp; now.<o:p></o:p></pre>
<pre>COMPRESSING TOKEN STREAM of PRUEBA.pos - writing code descriptor block to<o:p></o:p></pre>
<pre>/B_NFS_P/diposit/corpora/cwb/data/prueba/pos.hcd - writing compressed item sequence to<o:p></o:p></pre>
<pre>/B_NFS_P/diposit/corpora/cwb/data/prueba/pos.huf - writing sync (every 128 tokens) to<o:p></o:p></pre>
<pre>/B_NFS_P/diposit/corpora/cwb/data/prueba/pos.huf.syn VALIDATING PRUEBA.pos - reading code<o:p></o:p></pre>
<pre>descriptor block from /B_NFS_P/diposit/corpora/cwb/data/prueba/pos.hcd - reading compressed<o:p></o:p></pre>
<pre>item sequence from /B_NFS_P/diposit/corpora/cwb/data/prueba/pos.huf - reading sync (mod 128)<o:p></o:p></pre>
<pre>from /B_NFS_P/diposit/corpora/cwb/data/prueba/pos.huf.syn !! You can delete the file&nbsp; now.<o:p></o:p></pre>
<pre>COMPRESSING TOKEN STREAM of PRUEBA.hw - writing code descriptor block to<o:p></o:p></pre>
<pre>/B_NFS_P/diposit/corpora/cwb/data/prueba/hw.hcd - writing compressed item sequence to<o:p></o:p></pre>
<pre>/B_NFS_P/diposit/corpora/cwb/data/prueba/hw.huf - writing sync (every 128 tokens) to<o:p></o:p></pre>
<pre>/B_NFS_P/diposit/corpora/cwb/data/prueba/hw.huf.syn VALIDATING PRUEBA.hw - reading code<o:p></o:p></pre>
<pre>descriptor block from /B_NFS_P/diposit/corpora/cwb/data/prueba/hw.hcd - reading compressed<o:p></o:p></pre>
<pre>item sequence from /B_NFS_P/diposit/corpora/cwb/data/prueba/hw.huf - reading sync (mod 128)<o:p></o:p></pre>
<pre>from /B_NFS_P/diposit/corpora/cwb/data/prueba/hw.huf.syn !! You can delete the file&nbsp; now.<o:p></o:p></pre>
<pre>COMPRESSING TOKEN STREAM of PRUEBA.semtag VALIDATING PRUEBA.semtag - reading code descriptor<o:p></o:p></pre>
<pre>block from /B_NFS_P/diposit/corpora/cwb/data/prueba/semtag.hcd<o:p></o:p></pre>
<p class="errormessage">... in file <strong>/srv/web/llocs/cqp/lib/admin-install.inc.php</strong> line
<strong>467</strong>.<o:p></o:p></p>
<p class="MsoNormal"><br>
Thanks......<br>
<br>
_______________________<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;andrés chandía<br>
<a href="http://www.chandia.net" target="_blank" title="This external link
will open in a new window"><span style="border:solid windowtext 1.0pt;padding:0cm;text-decoration:none"><img border="0" width="100" height="100" id="_x0000_i1025" src="cid:~WRD000.jpg" alt="Image removed by sender. chandia.net"></span></a><br>
<span style="font-size:18.0pt;font-family:Webdings;color:#4F6228">P </span><span style="font-size:10.0pt;color:#4F6228">No imprima innecesariamente. ¡Cuide el medio ambiente!</span><o:p></o:p></p>
</div>
</body>
</html>