<html>
  <head>
    <meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    Dear Gabriele,<br>
    <br>
    Bastien Kindt is reputed to lemmatize, and probably pos tag, Old
    Greek texts (see contact below).<br>
    He may accept to send you back graciously the lemmatized version of
    the texts you would send him.<br>
    We redirected at least 3 different TXM users to him but I don't know
    the results.<br>
    Please get in touch if you would like to discuss about that, we are
    looking for a communautary<br>
    solution to this need.<br>
    <br>
    All the best,<br>
    Serge<br>
    <br>
    ---<br>
    Bastien KINDT<br>
    Projet de Recherche en Lexicologie Grecque<br>
    Institut orientaliste<br>
    Collège Érasme<br>
    Place Blaise Pascal, 1<br>
    B-1348 Louvain-la-Neuve<br>
    BELGIQUE<br>
    tel.: 00 32 10 47 44 16<br>
    <a class="moz-txt-link-abbreviated" href="mailto:bastien.kindt@student.uclouvain.be">bastien.kindt@student.uclouvain.be</a><br>
    <a class="moz-txt-link-abbreviated" href="mailto:bastien.kindt@brepols.net">bastien.kindt@brepols.net</a><br>
    <a class="moz-txt-link-freetext" href="http://tpg.fltr.ucl.ac.be">http://tpg.fltr.ucl.ac.be</a><br>
    ----<br>
    <br>
    <br>
    Le 11/03/2015 05:58, Gabriele Brandolini a écrit :<br>
    <span style="white-space: pre;">&gt; <br>
      &gt; Dear Ruprecht, Andrew and Stefan<br>
      &gt; <br>
      &gt; I followed your issue about encoding Old Greek texts.<br>
      &gt; <br>
      &gt; I also would like to cwb encode texts in this language
      expecially old<br>
      &gt; texts of the Fathers of the Church. But I've not yet got a
      PoS tagger<br>
      &gt; for such a language. We just planned to work on it to train<br>
      &gt; TreeTagger. But as I know it isn't ready yet.<br>
      &gt; <br>
      &gt; Do you, Ruprecht, know if there is any available?<br>
      &gt; <br>
      &gt; About your list of greek words in your email of 14 31 I
      noticed that<br>
      &gt; they are mostly uncorrect. As the initial letter (alfa or eta
      or<br>
      &gt; epsilon) were dropped out with its accent and spirit. I don't
      know if<br>
      &gt; this has something to do with the encoding error messages you
      get. <br>
      &gt; Just I wanted to point out it, maybe it can be of any help.<br>
      &gt; <br>
      &gt; Good work and good luck!<br>
      &gt; <br>
      &gt; Gabriele<br>
      &gt; <br>
      &gt; Il 10/mar/2015 14:31 "Ruprecht von Waldenfels"<br>
      &gt; &lt;<a class="moz-txt-link-abbreviated" href="mailto:ruprecht.waldenfels@gmx.net">ruprecht.waldenfels@gmx.net</a>
      <a class="moz-txt-link-rfc2396E" href="mailto:ruprecht.waldenfels@gmx.net">&lt;mailto:ruprecht.waldenfels@gmx.net&gt;</a>&gt; ha<br>
      &gt; scritto:<br>
      &gt; <br>
      &gt; Dear List, so my second problem, this time with Ancient
      Greek. I<br>
      &gt; cannot easily reproduce this with a 2-line corpus, because I
      don't<br>
      &gt; know where the culprit is. I am posting the CWB Output
      instead, maybe<br>
      &gt; this is already enough.<br>
      &gt; <br>
      &gt; What I am trying to do: I am trying to align three documents,
      one<br>
      &gt; Greek and two Slavic texts, using the aligVerse structural
      element.<br>
      &gt; The two Slavic ones align fine, the Greek gives me the
      following<br>
      &gt; error: rvw@rvw-Latitude-E6410:/data/PROIEL$<br>
      &gt; /opt/CWBUTF8/cwb/utils/cwb-align -r /data/PROIEL/Registry -S<br>
      &gt; aligVerse -o out.align NTESTAMENT_GR NTESTAMENT_MN aligVerse
      OPENING<br>
      &gt; NTESTAMENT_GR [147613 tokens, 7497 &lt;aligVerse&gt; regions]
      OPENING<br>
      &gt; NTESTAMENT_MN [71935 tokens, 7497 &lt;aligVerse&gt; regions]
      OPENING<br>
      &gt; prealignment [NTESTAMENT_GR.aligVerse: 7497 regions,<br>
      &gt; NTESTAMENT_MN.aligVerse: 7497 regions] LEXICON SIZE: 18085 /
      10132 <br>
      &gt; FEATURE: character count, weight=1 ... [1] FEATURE: Shared
      words,<br>
      &gt; threshold=40.0%, weight=50 ... [0] FEATURE: 3-grams, weight=3
      ... CL:<br>
      &gt; major error, invalid UTF8 string passed to
      cl_string_canonical... CL:<br>
      &gt; major error, invalid UTF8 string passed to
      cl_string_canonical... CL:<br>
      &gt; major error, invalid UTF8 string passed to
      cl_string_canonical... <br>
      &gt; [21952] FEATURE: 4-grams, weight=4 ... CL: major error,
      invalid UTF8<br>
      &gt; string passed to cl_string_canonical... CL: major error,
      invalid UTF8<br>
      &gt; string passed to cl_string_canonical... CL: major error,
      invalid UTF8<br>
      &gt; string passed to cl_string_canonical... CL: major error,
      invalid UTF8<br>
      &gt; string passed to cl_string_canonical... [614656] [636609
      features<br>
      &gt; allocated] [520402 entries in source text feature map]
      [246622<br>
      &gt; entries in target text feature map] PASS 2: Setting character
      count<br>
      &gt; weight. PASS 2: Processing shared words (th=40.0%). PASS 2:<br>
      &gt; Processing 3-grams. CL: major error, invalid UTF8 string
      passed to<br>
      &gt; cl_string_canonical... CL: major error, invalid UTF8 string
      passed to<br>
      &gt; cl_string_canonical... PASS 2: Processing 4-grams. CL: major
      error,<br>
      &gt; invalid UTF8 string passed to cl_string_canonical... CL:
      major error,<br>
      &gt; invalid UTF8 string passed to cl_string_canonical... PASS 2:
      Creating<br>
      &gt; character counts. [checking pointers] ERROR: fcount1[1387]=24<br>
      &gt; r-&gt;w2f1[1388]-r-&gt;w2f1[1387]=22 w=``ἥξουσιν'' ERROR:
      fcount1[1388]=50<br>
      &gt; r-&gt;w2f1[1389]-r-&gt;w2f1[1388]=52 w=``ἀνακλιθήσονται''
      ERROR:<br>
      &gt; fcount1[1783]=24 r-&gt;w2f1[1784]-r-&gt;w2f1[1783]=22
      w=``θάνατον'' ERROR:<br>
      &gt; fcount1[1784]=50 r-&gt;w2f1[1785]-r-&gt;w2f1[1784]=52
      w=``ἐπαναστήσονται'' <br>
      &gt; ERROR: fcount1[3037]=20 r-&gt;w2f1[3038]-r-&gt;w2f1[3037]=16
      w=``δυνατά'' <br>
      &gt; ERROR: fcount1[3039]=48 r-&gt;w2f1[3040]-r-&gt;w2f1[3039]=52<br>
      &gt; w=``ἀκολουθήσαντές'' ERROR: fcount1[3784]=20<br>
      &gt; r-&gt;w2f1[3785]-r-&gt;w2f1[3784]=18 w=``ἤλθατε'' ERROR:
      fcount1[3785]=50<br>
      &gt; r-&gt;w2f1[3786]-r-&gt;w2f1[3785]=52 w=``ἀποκριθήσονται''
      ERROR:<br>
      &gt; fcount1[4459]=32 r-&gt;w2f1[4460]-r-&gt;w2f1[4459]=30
      w=``ἐπιθυμίαι'' <br>
      &gt; ERROR: fcount1[4460]=50 r-&gt;w2f1[4461]-r-&gt;w2f1[4460]=52<br>
      &gt; w=``εἰσπορευόμεναι'' ERROR: fcount1[4998]=20<br>
      &gt; r-&gt;w2f1[4999]-r-&gt;w2f1[4998]=18 w=``Ἤρξατο'' ERROR:
      fcount1[4999]=46<br>
      &gt; r-&gt;w2f1[5000]-r-&gt;w2f1[4999]=48 w=``ἠκολουθήκαμέν''
      ERROR:<br>
      &gt; fcount1[5038]=36 r-&gt;w2f1[5039]-r-&gt;w2f1[5038]=34
      w=``ἐγγίζουσιν'' <br>
      &gt; ERROR: fcount1[5039]=50 r-&gt;w2f1[5040]-r-&gt;w2f1[5039]=52<br>
      &gt; w=``εἰσπορευόμενοι'' ERROR: fcount1[7009]=32<br>
      &gt; r-&gt;w2f1[7010]-r-&gt;w2f1[7009]=30 w=``πλουσίους'' ERROR:<br>
      &gt; fcount1[7010]=46 r-&gt;w2f1[7011]-r-&gt;w2f1[7010]=48
      w=``ἀντικαλέσωσίν'' <br>
      &gt; ERROR: fcount1[8582]=20 r-&gt;w2f1[8583]-r-&gt;w2f1[8582]=18
      w=``ἐξάγει'' <br>
      &gt; ERROR: fcount1[8583]=50 r-&gt;w2f1[8584]-r-&gt;w2f1[8583]=52<br>
      &gt; w=``ἀκολουθήσουσιν'' ERROR: fcount1[9942]=20<br>
      &gt; r-&gt;w2f1[9943]-r-&gt;w2f1[9942]=24 w=``ἅρματι'' ERROR:
      fcount1[9943]=56<br>
      &gt; r-&gt;w2f1[9944]-r-&gt;w2f1[9943]=52 w=``ἀναγινώσκοντος''
      ERROR:<br>
      &gt; fcount1[10119]=48 r-&gt;w2f1[10120]-r-&gt;w2f1[10119]=44<br>
      &gt; w=``μεταπέμψασθαί'' ERROR: fcount1[10120]=48<br>
      &gt; r-&gt;w2f1[10121]-r-&gt;w2f1[10120]=52 w=``εἰσκαλεσάμενος''
      ERROR:<br>
      &gt; fcount1[10553]=28 r-&gt;w2f1[10554]-r-&gt;w2f1[10553]=24
      w=``ἐτάραξαν'' <br>
      &gt; ERROR: fcount1[10554]=48
      r-&gt;w2f1[10555]-r-&gt;w2f1[10554]=52<br>
      &gt; w=``ἀνασκευάζοντες'' ERROR: fcount1[10622]=24<br>
      &gt; r-&gt;w2f1[10623]-r-&gt;w2f1[10622]=20 w=``Τρῳάδος'' ERROR:<br>
      &gt; fcount1[10623]=48 r-&gt;w2f1[10624]-r-&gt;w2f1[10623]=52<br>
      &gt; w=``εὐθυδρομήσαμεν'' ERROR: fcount1[11159]=48<br>
      &gt; r-&gt;w2f1[11160]-r-&gt;w2f1[11159]=44 w=``ἀποσπασθέντας''
      ERROR:<br>
      &gt; fcount1[11160]=52 r-&gt;w2f1[11161]-r-&gt;w2f1[11160]=56<br>
      &gt; w=``εὐθυδρομήσαντες'' ERROR: fcount1[12054]=20<br>
      &gt; r-&gt;w2f1[12055]-r-&gt;w2f1[12054]=18 w=``πλάνης'' ERROR:<br>
      &gt; fcount1[12055]=50 r-&gt;w2f1[12056]-r-&gt;w2f1[12055]=52<br>
      &gt; w=``ἀπολαμβάνοντες'' ERROR: fcount1[12422]=12<br>
      &gt; r-&gt;w2f1[12423]-r-&gt;w2f1[12422]=10 w=``νοός'' ERROR:
      fcount1[12423]=50<br>
      &gt; r-&gt;w2f1[12424]-r-&gt;w2f1[12423]=52 w=``αἰχμαλωτίζοντά''
      ERROR:<br>
      &gt; fcount1[14334]=40 r-&gt;w2f1[14335]-r-&gt;w2f1[14334]=38
      w=``ἐπαιρόμενον'' <br>
      &gt; ERROR: fcount1[14335]=54
      r-&gt;w2f1[14336]-r-&gt;w2f1[14335]=56<br>
      &gt; w=``αἰχμαλωτίζοντες'' ERROR: fcount1[14641]=40<br>
      &gt; r-&gt;w2f1[14642]-r-&gt;w2f1[14641]=38 w=``κεκυρωμένην''
      ERROR:<br>
      &gt; fcount1[14642]=50 r-&gt;w2f1[14643]-r-&gt;w2f1[14642]=52<br>
      &gt; w=``ἐπιδιατάσσεται'' ERROR: fcount1[14878]=32<br>
      &gt; r-&gt;w2f1[14879]-r-&gt;w2f1[14878]=34 w=``προέγραψα'' ERROR:<br>
      &gt; fcount1[14879]=54 r-&gt;w2f1[14880]-r-&gt;w2f1[14879]=52<br>
      &gt; w=``ἀναγινώσκοντες'' ERROR: fcount1[15698]=36<br>
      &gt; r-&gt;w2f1[15699]-r-&gt;w2f1[15698]=34 w=``ἐπιστεύθην''
      ERROR:<br>
      &gt; fcount1[15699]=46 r-&gt;w2f1[15700]-r-&gt;w2f1[15699]=48<br>
      &gt; w=``ἐνδυναμώσαντί'' ERROR: fcount1[16170]=32<br>
      &gt; r-&gt;w2f1[16171]-r-&gt;w2f1[16170]=30 w=``ἀνέξονται'' ERROR:<br>
      &gt; fcount1[16171]=50 r-&gt;w2f1[16172]-r-&gt;w2f1[16171]=52<br>
      &gt; w=``ἐπισωρεύσουσιν'' ERROR: fcount1[16815]=32<br>
      &gt; r-&gt;w2f1[16816]-r-&gt;w2f1[16815]=30 w=``ἐνυβρίσας'' ERROR:<br>
      &gt; fcount1[16816]=50 r-&gt;w2f1[16817]-r-&gt;w2f1[16816]=52<br>
      &gt; w=``Ἀναμιμνῄσκεσθε'' ERROR: fcount1[17621]=40<br>
      &gt; r-&gt;w2f1[17622]-r-&gt;w2f1[17621]=42 w=``ἀπεσταλμένα''
      ERROR:<br>
      &gt; fcount1[17622]=56 r-&gt;w2f1[17623]-r-&gt;w2f1[17622]=54
      w=``εἴκοσι<br>
      &gt; τέσσαρες'' ERROR: fcount1[17793]=28
      r-&gt;w2f1[17794]-r-&gt;w2f1[17793]=29<br>
      &gt; w=``μάρτυσίν'' ERROR: fcount1[17794]=93<br>
      &gt; r-&gt;w2f1[17795]-r-&gt;w2f1[17794]=92 w=``χιλίας διακοσίας
      ἑξήκοντα'' <br>
      &gt; ERROR: fcount1[17937]=24
      r-&gt;w2f1[17938]-r-&gt;w2f1[17937]=26<br>
      &gt; w=``χαλινῶν'' ERROR: fcount1[17938]=60<br>
      &gt; r-&gt;w2f1[17939]-r-&gt;w2f1[17938]=58 w=``χιλίων ἑξακοσίων''
      ERROR:<br>
      &gt; fcount1[17967]=36 r-&gt;w2f1[17968]-r-&gt;w2f1[17967]=34
      w=``καυματίσαι'' <br>
      &gt; ERROR: fcount1[17968]=50
      r-&gt;w2f1[17969]-r-&gt;w2f1[17968]=52<br>
      &gt; w=``ἐκαυματίσθησαν''<br>
      &gt; <br>
      &gt; <br>
      &gt; Again, I would be very thankful for help.<br>
      &gt; <br>
      &gt; Best! Ruprecht<br>
      &gt; <br>
      &gt; <br>
      &gt; <br>
      &gt; <br>
      &gt; <br>
      &gt; Am 10.03.2015 um 12:07 schrieb Ruprecht von Waldenfels:<br>
      &gt;&gt; Hi Andrew, YES! This does solve the problem. I was
      thinking this<br>
      &gt;&gt; setting would only concern tokens, not the lemma
      attribute, but now<br>
      &gt;&gt; I understand that this was a wrong assumption. Thank you!
      I will<br>
      &gt;&gt; now look at the other problem - because that, as it turns
      out, is<br>
      &gt;&gt; unrelated. Thanks A LOT! Ruprecht Am 10.03.2015 um 12:02
      schrieb<br>
      &gt;&gt; Hardie, Andrew:<br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; Is the context size measured in characters? If so,
      that would<br>
      &gt;&gt;&gt; explain the problem, since “characters” = bytes
      still.<br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; If changing the context width to a given number of
      words fixes<br>
      &gt;&gt;&gt; the issue, then that is the solution.<br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; I have been working on a patch to fix this, but have
      not<br>
      &gt;&gt;&gt; completed it yet.<br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; Andrew.<br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; *From:*cwb-bounces@sslmit.unibo.it<br>
      &gt;&gt;&gt; <a class="moz-txt-link-rfc2396E" href="mailto:cwb-bounces@sslmit.unibo.it">&lt;mailto:cwb-bounces@sslmit.unibo.it&gt;</a><br>
      &gt;&gt;&gt; [<a class="moz-txt-link-freetext" href="mailto:cwb-bounces@sslmit.unibo.it">mailto:cwb-bounces@sslmit.unibo.it</a>] *On Behalf Of
      *Ruprecht von<br>
      &gt;&gt;&gt; Waldenfels *Sent:* 10 March 2015 09:54 *To:*
      <a class="moz-txt-link-abbreviated" href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a><br>
      &gt;&gt;&gt; <a class="moz-txt-link-rfc2396E" href="mailto:cwb@sslmit.unibo.it">&lt;mailto:cwb@sslmit.unibo.it&gt;</a> *Subject:* [CWB]
      unicode problems<br>
      &gt;&gt;&gt; with Greek and OCS<br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; Dear List,<br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; I am using CWB 3.4.8 on 64 bit Ubuntu 14.10. After
      encoding a<br>
      &gt;&gt;&gt; text in Old Church Slavonic, I get invalid UTF-8
      character<br>
      &gt;&gt;&gt; errors; I seem to get them only in sgml mode (I also
      get them<br>
      &gt;&gt;&gt; during alignment with the Ancient Greek translation
      source, which<br>
      &gt;&gt;&gt; might be a related problem, but I am not sure.)<br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; In order to pinpoint the problem with the Old Church
      Slavonic<br>
      &gt;&gt;&gt; text, I have reduced the text in question to two
      bible verses.<br>
      &gt;&gt;&gt; The text can be found here:
      <a class="moz-txt-link-abbreviated" href="http://www.parasolcorpus.org/test.txt">www.parasolcorpus.org/test.txt</a><br>
      &gt;&gt;&gt; <a class="moz-txt-link-rfc2396E" href="http://www.parasolcorpus.org/test.txt">&lt;http://www.parasolcorpus.org/test.txt&gt;</a><br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; I encode the corpus with the following commands: <br>
      &gt;&gt;&gt; /opt/CWBUTF8/cwb/utils/cwb-encode -d
      Data/ntestament_tt -f<br>
      &gt;&gt;&gt; test.txt -R /data/PROIEL/Registry/ntestament_tt -c
      utf8 -xsB -P<br>
      &gt;&gt;&gt; lemma -P id -P alig -P pos -P tag -S aligVerse:0 <br>
      &gt;&gt;&gt; /opt/CWBUTF8/cwb/utils/cwb-makeall -r
      /data/PROIEL/Registry<br>
      &gt;&gt;&gt; NTESTAMENT_TT<br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; There is no problem in text mode:<br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; However, in sgml mode, some lemmas get truncated and
      do not<br>
      &gt;&gt;&gt; contain valid utf8 anymore. For example, the lemma of
      "с҃вщаѩи"<br>
      &gt;&gt;&gt; is such a token. This problem does NOT appear if I
      search for<br>
      &gt;&gt;&gt; this token itself, it ONLY and consistently appears
      if I search<br>
      &gt;&gt;&gt; for a different token and the problematic token is in
      the result<br>
      &gt;&gt;&gt; set:<br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; To sum up: I get the problem only if I search for a
      neighboring<br>
      &gt;&gt;&gt; token in sgml mode. I don't get it if I search for
      the token<br>
      &gt;&gt;&gt; itself, and I don't get it in text mode. I have
      reduced the<br>
      &gt;&gt;&gt; problem to w 50-token text, and the problem persists.<br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; Any help would be greatly appreciated! Best, Ruprecht<br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; <br>
      &gt;&gt;&gt; _______________________________________________ CWB
      mailing list <br>
      &gt;&gt;&gt; <a class="moz-txt-link-abbreviated" href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a>
      <a class="moz-txt-link-rfc2396E" href="mailto:CWB@sslmit.unibo.it">&lt;mailto:CWB@sslmit.unibo.it&gt;</a> <br>
      &gt;&gt;&gt; <a class="moz-txt-link-freetext" href="http://devel.sslmit.unibo.it/mailman/listinfo/cwb">http://devel.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
      &gt;&gt; <br>
      &gt;&gt; <br>
      &gt;&gt; <br>
      &gt;&gt; _______________________________________________ CWB
      mailing list <br>
      &gt;&gt; <a class="moz-txt-link-abbreviated" href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a> <a class="moz-txt-link-rfc2396E" href="mailto:CWB@sslmit.unibo.it">&lt;mailto:CWB@sslmit.unibo.it&gt;</a> <br>
      &gt;&gt; <a class="moz-txt-link-freetext" href="http://devel.sslmit.unibo.it/mailman/listinfo/cwb">http://devel.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
      &gt; <br>
      &gt; <br>
      &gt; _______________________________________________ CWB mailing
      list <br>
      &gt; <a class="moz-txt-link-abbreviated" href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a> <a class="moz-txt-link-rfc2396E" href="mailto:CWB@sslmit.unibo.it">&lt;mailto:CWB@sslmit.unibo.it&gt;</a> <br>
      &gt; <a class="moz-txt-link-freetext" href="http://devel.sslmit.unibo.it/mailman/listinfo/cwb">http://devel.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
      &gt; <br>
      &gt; <br>
      &gt; <br>
      &gt; _______________________________________________ CWB mailing
      list <br>
      &gt; <a class="moz-txt-link-abbreviated" href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a> <br>
      &gt; <a class="moz-txt-link-freetext" href="http://devel.sslmit.unibo.it/mailman/listinfo/cwb">http://devel.sslmit.unibo.it/mailman/listinfo/cwb</a></span><br>
    <br>
    <br>
    -- <br>
    Dr. Serge Heiden, <a class="moz-txt-link-abbreviated" href="mailto:slh@ens-lyon.fr">slh@ens-lyon.fr</a>, <a class="moz-txt-link-freetext" href="http://textometrie.ens-lyon.fr">http://textometrie.ens-lyon.fr</a><br>
    ENS de Lyon/CNRS - ICAR UMR5191, Institut de Linguistique Française<br>
    15, parvis René Descartes 69342 Lyon BP7000 Cedex, tél. +33622003883<br>
    <br>
  </body>
</html>