[CWB] N-grams
Simon Meier-Vieracker
simon.meier-vieracker at tu-dresden.de
Tue Apr 30 14:07:00 CEST 2024
Hi Graham.
you can use cwb-scan-corpus, please check the Encoding Manual (https://cwb.sourceforge.io/files/CWB_Encoding_Tutorial.pdf), p. 15:
E.g.
> $ cwb-scan-corpus VSS pos+0 pos+1 pos+2 | sort -nr -k 1 | head -20
for part-of-speech trigrams.
Best, Simon
> Am 30.04.2024 um 13:38 schrieb graham.ranger <graham.ranger at univ-avignon.fr>:
>
> This must have been asked already, and I see that it was once a feature request, but does anybody know if there is now a way to generate n-grams for a given corpus, via a cql query?
> Many thanks as always,
> Graham.
>
>
> Envoyé depuis mon appareil Galaxy
>
> _______________________________________________
> CWB mailing list
> CWB at sslmit.unibo.it
> http://liste.sslmit.unibo.it/mailman/listinfo/cwb
-------------- n�chster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://liste.sslmit.unibo.it/pipermail/cwb/attachments/20240430/bb4f1b06/attachment-0001.html>
-------------- n�chster Teil --------------
Ein Dateianhang mit Bin�rdaten wurde abgetrennt...
Dateiname : smime.p7s
Dateityp : application/pkcs7-signature
Dateigr��e : 5659 bytes
Beschreibung: nicht verf�gbar
URL : <http://liste.sslmit.unibo.it/pipermail/cwb/attachments/20240430/bb4f1b06/attachment-0001.p7s>
More information about the CWB
mailing list