[CWB] N-grams

Simon Meier-Vieracker simon.meier-vieracker at tu-dresden.de
Tue Apr 30 14:07:00 CEST 2024


Hi Graham.

you can use cwb-scan-corpus, please check the Encoding Manual (https://cwb.sourceforge.io/files/CWB_Encoding_Tutorial.pdf), p. 15:

E.g.

> $ cwb-scan-corpus VSS pos+0 pos+1 pos+2 | sort -nr -k 1 | head -20

for part-of-speech trigrams.

Best, Simon



> Am 30.04.2024 um 13:38 schrieb graham.ranger <graham.ranger at univ-avignon.fr>:
> 
> This must have been asked already, and I see that it was once a feature request, but does anybody know if there is now a way to generate n-grams for a given corpus, via a cql query?
> Many thanks as always, 
> Graham.
> 
> 
> Envoyé depuis mon appareil Galaxy
> 
> _______________________________________________
> CWB mailing list
> CWB at sslmit.unibo.it
> http://liste.sslmit.unibo.it/mailman/listinfo/cwb


-------------- n�chster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://liste.sslmit.unibo.it/pipermail/cwb/attachments/20240430/bb4f1b06/attachment-0001.html>
-------------- n�chster Teil --------------
Ein Dateianhang mit Bin�rdaten wurde abgetrennt...
Dateiname   : smime.p7s
Dateityp    : application/pkcs7-signature
Dateigr��e  : 5659 bytes
Beschreibung: nicht verf�gbar
URL         : <http://liste.sslmit.unibo.it/pipermail/cwb/attachments/20240430/bb4f1b06/attachment-0001.p7s>


More information about the CWB mailing list