<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 14 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Verdana;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.MsoAcetate, li.MsoAcetate, div.MsoAcetate
        {mso-style-priority:99;
        mso-style-link:"Balloon Text Char";
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:8.0pt;
        font-family:"Tahoma","sans-serif";}
span.hoenzb
        {mso-style-name:hoenzb;}
span.im
        {mso-style-name:im;}
span.BalloonTextChar
        {mso-style-name:"Balloon Text Char";
        mso-style-priority:99;
        mso-style-link:"Balloon Text";
        font-family:"Tahoma","sans-serif";
        mso-fareast-language:EN-GB;}
span.EmailStyle21
        {mso-style-type:personal-reply;
        font-family:"Verdana","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri","sans-serif";
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-GB" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">Re: CWB 2 and 3 – Yes, that’s exactly what it means. CWB 3.9 will only be able to work with CWB 3.9 indexes.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">My hope is to add a conversion tool to 3.9, however, if it is not too complex to do so. (Shouldn’t be – all it will involve is piping cwb-decode3.5 into cwb-encode3.9).<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">As for NoSkE – this is the first I’ve heard that you even
<i>could</i> use corpora compiled by Manatee with CWB! So I really have no clue there.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">In general, everyone should expect 3.9 to break more or less everything.
<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">There will be a stable branch 3.5 which we will maintain for some years, if you don’t want to upgrade to 3.9. I expect it will be quite a while until the bugs
 are shaken out of 3.9 enough that we become confident enough to release it as 4.0!<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">This will be a massive pain. However, the v2/3 binary format is now one of the main obstacles to us improving CWB in the ways that Stefan &amp; I have identified
 as priorities. So the pain is necessary in the long run…. <o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">Andrew.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><b><span lang="EN-US" style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;">From:</span></b><span lang="EN-US" style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;"> cwb-bounces@sslmit.unibo.it [mailto:cwb-bounces@sslmit.unibo.it]
<b>On Behalf Of </b>Yannick Versley<br>
<b>Sent:</b> 30 January 2015 20:00<br>
<b>To:</b> Open source development of the Corpus WorkBench<br>
<b>Subject:</b> Re: [CWB] A formal specification of CQL?<o:p></o:p></span></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<div>
<p class="MsoNormal">Does this mean that the binary corpus files made with CWB 2.x through 3.2 (and possibly<o:p></o:p></p>
<div>
<p class="MsoNormal">any corpora compiled with the NoSke tools) will stop working with CQP 3.9/4?<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
<div>
<p class="MsoNormal">Best wishes,<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">Yannick<o:p></o:p></p>
</div>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<div>
<p class="MsoNormal">On Fri, Jan 30, 2015 at 6:34 PM, Hardie, Andrew &lt;<a href="mailto:a.hardie@lancaster.ac.uk" target="_blank">a.hardie@lancaster.ac.uk</a>&gt; wrote:<o:p></o:p></p>
<p class="MsoNormal">I see!&nbsp; That ticket is now here (due to sourceforge changing the tracker software):<br>
<br>
<a href="http://sourceforge.net/p/cwb/feature-requests/46/" target="_blank">http://sourceforge.net/p/cwb/feature-requests/46/</a><br>
<br>
Actually, I'm going to close it as WONTFIX: there seems little point in spending a lot of time writing about file formats that we are going to chuck&nbsp; out in versions 3.9 and 4, and I will document the new file formats as I'm in the process of inventing them...<br>
<span style="color:#888888"><br>
<span class="hoenzb">Andrew.</span><br>
</span><br>
PS thanks for that parser state diagram. It confirms what I always suspected, to be frank.<br>
<br>
<br>
<span class="im">-----Original Message-----</span><br>
<span class="im">From: <a href="mailto:cwb-bounces@sslmit.unibo.it">cwb-bounces@sslmit.unibo.it</a> [mailto:<a href="mailto:cwb-bounces@sslmit.unibo.it">cwb-bounces@sslmit.unibo.it</a>] On Behalf Of Serge Heiden</span><o:p></o:p></p>
<div>
<div>
<p class="MsoNormal">Sent: 30 January 2015 15:25<br>
To: <a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a><br>
Subject: Re: [CWB] A formal specification of CQL?<br>
<br>
Thank you Andrew, I found it: it was the content of a ticket:<br>
<a href="http://devel.sslmit.unibo.it/pipermail/cwb/2012-July/001042.html" target="_blank">http://devel.sslmit.unibo.it/pipermail/cwb/2012-July/001042.html</a><br>
<br>
Best,<br>
Serge<br>
<br>
Le 30/01/2015 16:05, Hardie, Andrew a écrit :<br>
&gt; We generally call it &quot;CQP Syntax&quot; rather than &quot;Corpus Query Language&quot;, although lots of people working on other software have gravitated to the latter.<br>
&gt;<br>
&gt; The code of the parser is written as a Bison grammar, which *is* thus in effect a formal specification!<br>
&gt;<br>
&gt; It's in cqp/parser.y (see also parser.l).<br>
&gt;<br>
&gt; See:<br>
&gt;<br>
&gt; <a href="http://sourceforge.net/p/cwb/code/HEAD/tree/cwb/trunk/cqp/parser.y" target="_blank">
http://sourceforge.net/p/cwb/code/HEAD/tree/cwb/trunk/cqp/parser.y</a><br>
&gt;<br>
&gt; And to search the list, use<br>
&gt;<br>
&gt; site:<a href="http://devel.sslmit.unibo.it/pipermail/cwb" target="_blank">devel.sslmit.unibo.it/pipermail/cwb</a><br>
&gt;<br>
&gt; in a Google search.<br>
&gt;<br>
&gt; best<br>
&gt;<br>
&gt; Andrew.<br>
&gt;<br>
&gt;<br>
&gt; -----Original Message-----<br>
&gt; From: <a href="mailto:cwb-bounces@sslmit.unibo.it">cwb-bounces@sslmit.unibo.it</a> [mailto:<a href="mailto:cwb-bounces@sslmit.unibo.it">cwb-bounces@sslmit.unibo.it</a>]<br>
&gt; On Behalf Of Serge Heiden<br>
&gt; Sent: 30 January 2015 14:46<br>
&gt; To: <a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a><br>
&gt; Subject: Re: [CWB] A formal specification of CQL?<br>
&gt;<br>
&gt; Not to my knowledge.<br>
&gt;<br>
&gt; There's been a thread on a similar topic before.<br>
&gt; Is there any search engine available to search in all CWB mailing list<br>
&gt; archive at once? (I can't remember when it was).<br>
&gt;<br>
&gt; For fun, you can have a look at the network of the CQP parser states<br>
&gt; here:<br>
&gt; <a href="https://groupes.renater.fr/wiki/txm-info/_media/cqpsyntax.dot.jpeg" target="_blank">
https://groupes.renater.fr/wiki/txm-info/_media/cqpsyntax.dot.jpeg</a><br>
&gt;<br>
&gt; Serge H.<br>
&gt;<br>
&gt; Le 30/01/2015 14:36, Jörg Knappen a écrit :<br>
&gt;&gt; Is there a formal specification of the Corpus Query Language, e.g.,<br>
&gt;&gt; in EBNF format, available?<br>
&gt;&gt;<br>
&gt;&gt; --Jörg Knappen<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; CWB mailing list<br>
&gt;&gt; <a href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a><br>
&gt;&gt; <a href="http://devel.sslmit.unibo.it/mailman/listinfo/cwb" target="_blank">http://devel.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
<br>
--<br>
Dr. Serge Heiden, <a href="mailto:slh@ens-lyon.fr">slh@ens-lyon.fr</a>, <a href="http://textometrie.ens-lyon.fr" target="_blank">
http://textometrie.ens-lyon.fr</a> ENS de Lyon/CNRS - ICAR UMR5191, Institut de Linguistique Française 15, parvis René Descartes 69342 Lyon BP7000 Cedex, tél.
<a href="tel:%2B33%280%29622003883">&#43;33(0)622003883</a><br>
<br>
_______________________________________________<br>
CWB mailing list<br>
<a href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a><br>
<a href="http://devel.sslmit.unibo.it/mailman/listinfo/cwb" target="_blank">http://devel.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
_______________________________________________<br>
CWB mailing list<br>
<a href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a><br>
<a href="http://devel.sslmit.unibo.it/mailman/listinfo/cwb" target="_blank">http://devel.sslmit.unibo.it/mailman/listinfo/cwb</a><o:p></o:p></p>
</div>
</div>
</div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
</div>
</body>
</html>