<html>
  <head>
    <meta content="text/html; charset=windows-1252"
      http-equiv="Content-Type">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    <br>
    Great! Thanks Andrew. A simple change in the settings making lemmas
    the primary annotation easily gets me where I want to go. That's all
    I need and the whole solution is rather practical and easy to
    implement. Thanks again for your help, guys. <br>
    <br>
    JM<br>
    <blockquote
      cite="mid:28078EC3FBF1B940A3EF3D0D19BE351D32A43237@EX-0-MB1.lancs.local"
      type="cite">
      <meta http-equiv="Content-Type" content="text/html;
        charset=windows-1252">
      <meta name="Generator" content="Microsoft Word 14 (filtered
        medium)">
      <style><!--
/* Font Definitions */
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Verdana;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";
        color:black;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
pre
        {mso-style-priority:99;
        mso-style-link:"HTML Preformatted Char";
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:10.0pt;
        font-family:"Courier New";
        color:black;}
span.HTMLPreformattedChar
        {mso-style-name:"HTML Preformatted Char";
        mso-style-priority:99;
        mso-style-link:"HTML Preformatted";
        font-family:Consolas;
        color:black;}
span.EmailStyle19
        {mso-style-type:personal-reply;
        font-family:"Verdana","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
      <div class="WordSection1">
        <pre><span style="font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">&gt;&gt;</span><span style="font-size:12.0pt"> But what I really wanted to get was the frequencies for the lemmas not for the forms. I don't see any way of getting that. <o:p></o:p></span></pre>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p> </o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">not
            at present. Frequency breakdown works only with the words
            and the primary annotation. It does not allow access to the
            secondary annotation. It sounds like you have the lemma set
            as your 2ndary annotation. FO course, you could always set
            the lemma to primary and POS to secondary, then use<o:p></o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p> </o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">_haber
            {V*}<o:p></o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p> </o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">as
            your query.<o:p></o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p> </o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">I
            recall Stefan, I think, wanted me to make FB (and Sort, on
            which it is based) allow access to arbitrary p-attributes.
            This would take up rather a lot fo disk space, unless done
            selectively, as with collocation. So I’ve not done it yet.<o:p></o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p> </o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">&gt;&gt;
          </span>I tried to use the 'frequency list' option from the
          right column menu and selected 'lemma' in 'view a list based
          on ...' but this selection doesn't stay put when I go to the
          screen where I can introduce the query before the frequency
          breakdown<span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p></o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p> </o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">That’s
            because the “frequency list” system does what it says on the
            tin – gives you a list of items in the corpus, plus their
            frequencies. It does not act to add constrinsts on any other
            part of the system. <o:p></o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p> </o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">&gt;&gt;
          </span>MU queries are "more or less" undocumented<span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p></o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p> </o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">They
            are documented in some old versions of the CQP syntax
            tutorial, but in a way that may not be accurate and cannot
            be relied on (thus why Stefan says their semantics is
            deprecated – the documentation purposefully leaves out MU
            queries because their behaviour cannot be rigorously
            described). Otherwise, the best documentation is the code.
            They will be properly documented once we’ve got their
            semantics to behave properly, something which is on the list
            for  CWBv4.<o:p></o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p> </o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">best<o:p></o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p> </o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D">Andrew.<o:p></o:p></span></p>
        <p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,&quot;sans-serif&quot;;color:#1F497D"><o:p> </o:p></span></p>
        <div>
          <div style="border:none;border-top:solid #B5C4DF
            1.0pt;padding:3.0pt 0cm 0cm 0cm">
            <p class="MsoNormal"><b><span
style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;;color:windowtext"
                  lang="EN-US">From:</span></b><span
style="font-size:10.0pt;font-family:&quot;Tahoma&quot;,&quot;sans-serif&quot;;color:windowtext"
                lang="EN-US"> <a class="moz-txt-link-abbreviated" href="mailto:cwb-bounces@sslmit.unibo.it">cwb-bounces@sslmit.unibo.it</a>
                [<a class="moz-txt-link-freetext" href="mailto:cwb-bounces@sslmit.unibo.it">mailto:cwb-bounces@sslmit.unibo.it</a>] <b>On Behalf Of </b>Josep
                M. Fontana<br>
                <b>Sent:</b> 28 April 2015 12:12<br>
                <b>To:</b> <a class="moz-txt-link-abbreviated" href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a><br>
                <b>Subject:</b> Re: [CWB] What's possible via the CQPweb
                interface<o:p></o:p></span></p>
          </div>
        </div>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">Thanks a lot Stefan and Andrew. This will
          come in very handy.
          <br>
          <br>
          I have a little question about the query Stefan suggests.
          Suppose I want to find out the frequencies of lemmas for the
          non-finite forms of the verb that appear after the auxiliary
          'haber' in the following query:<br>
          <br>
          {haber} _V*<br>
          <br>
          If I do:<br>
          <br>
          <br>
          <o:p></o:p></p>
        <pre><span style="font-size:12.0pt">_V* &lt;&lt;1&lt;&lt; {haber}<o:p></o:p></span></pre>
        <pre><span style="font-size:12.0pt"><o:p> </o:p></span></pre>
        <pre><span style="font-size:12.0pt">this returns, as you said, the final token of the match. If I then apply the frequency breakdown, I can get the frequencies for the forms of _V* and that is already much better than what I could do before. But what I really wanted to get was the frequencies for the lemmas not for the forms. I don't see any way of getting that. <o:p></o:p></span></pre>
        <pre><span style="font-size:12.0pt"><o:p> </o:p></span></pre>
        <pre><span style="font-size:12.0pt">I tried to use the 'frequency list' option from the right column menu and selected 'lemma' in 'view a list based on ...' but this selection doesn't stay put when I go to the screen where I can introduce the query before the frequency breakdown.</span><o:p></o:p></pre>
        <p class="MsoNormal">You say MU queries are "more or less"
          undocumented which I take it to mean that they are somewhat
          documented. Is there any chance I can get my hands on some of
          these, incomplete as they may be, documents? I don't know
          whether such documents would provide answers to questions like
          the one I just asked but I could use this information to write
          a little mini-guide so that our students using CQPWeb know
          about the additional possibilities they have.<br>
          <br>
          <br>
          <br>
          JM<br>
          <br>
          <o:p></o:p></p>
        <blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
          <pre>What I was trying to obtain was the frequency of lemmas that are instantiations of 'POS Y' in a search string of the form 'lemma X POS Y'. In the command line I would have used:<o:p></o:p></pre>
          <pre><o:p> </o:p></pre>
          <pre>$ count Last by lemma %cd on matchend; <o:p></o:p></pre>
        </blockquote>
        <pre><o:p> </o:p></pre>
        <pre>In this simple case, you can get away with a trick that depends on the more or less undocumented MU queries and their deprecated semantics …<o:p></o:p></pre>
        <pre><o:p> </o:p></pre>
        <pre>If your original query is<o:p></o:p></pre>
        <pre><o:p> </o:p></pre>
        <pre>        [lemma = "LEM"] [pos = "POS"];<o:p></o:p></pre>
        <pre><o:p> </o:p></pre>
        <pre>the MU expression<o:p></o:p></pre>
        <pre><o:p> </o:p></pre>
        <pre>        MU(meet [pos="POS"] [lemma="LEM"] -1 -1)<o:p></o:p></pre>
        <pre><o:p> </o:p></pre>
        <pre>returns just the final token of each match, and you can apply frequency breakdown to do the counts.<o:p></o:p></pre>
        <pre><o:p> </o:p></pre>
        <pre>This is much nicer in CEQL query syntax:<o:p></o:p></pre>
        <pre><o:p> </o:p></pre>
        <pre>        _POS &lt;&lt;1&lt;&lt; {LEM}<o:p></o:p></pre>
        <pre><o:p> </o:p></pre>
        <pre>Unfortunately, this approach doesn't generalize if you want to count sequences of multiple words or if the original query contains repetition operators.<o:p></o:p></pre>
        <pre><o:p> </o:p></pre>
        <pre>Cheers,<o:p></o:p></pre>
        <pre>Stefan<o:p></o:p></pre>
        <pre>_______________________________________________<o:p></o:p></pre>
        <pre>CWB mailing list<o:p></o:p></pre>
        <pre><a moz-do-not-send="true" href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a><o:p></o:p></pre>
        <pre><a moz-do-not-send="true" href="http://devel.sslmit.unibo.it/mailman/listinfo/cwb">http://devel.sslmit.unibo.it/mailman/listinfo/cwb</a><o:p></o:p></pre>
        <p class="MsoNormal"><o:p> </o:p></p>
      </div>
      <br>
      <fieldset class="mimeAttachmentHeader"></fieldset>
      <br>
      <pre wrap="">_______________________________________________
CWB mailing list
<a class="moz-txt-link-abbreviated" href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a>
<a class="moz-txt-link-freetext" href="http://devel.sslmit.unibo.it/mailman/listinfo/cwb">http://devel.sslmit.unibo.it/mailman/listinfo/cwb</a>
</pre>
    </blockquote>
    <br>
  </body>
</html>