[CWB] Getting [UNREADABLE] in cqpweb
Jörg Knappen
j.knappen at mx.uni-saarland.de
Wed Mar 16 15:08:40 CET 2022
Hi all,
I am getting a lot of "[UNREADABLE]" in cqpweb in a corpus I have. I
have traced some instances of it to tokens containing a no-break-space.
The input line from the vrt file looks like
Кыргыз Республикасынын Кыргыз Республикасы np_top_gen
and it goes well with cqp from the command line, e.g., in a query like
[word=".*Республикасы"] given results like
1367195: л алынып , анын алкагында <Кыргыз Республикасынын> « Насыялык
маалыма
However, in cqpweb I get for the query [word=".*Республикасынын"]
[word="«"] [word="Насыялык"]
жылдын 22 - июлундагы № 85 Мыйзамы [UNREADABLE] алынып , анын алкагында
[UNREADABLE] Республикасынын « Насыялык
маалымат алмашуу жөнүндө » Мыйзамына да өзгөртүүлөр киргизилген . -
Жогоруда көрсөтүлгөн
cqpweb is version CQPweb v3.2.42 © 2008-2020 (still, we update rather
infrequently).
What can I do here? Use something different from a no-break-space, like
an underscore? Or is this a bug in cqpweb?
Greetings from Saarbrücken,
Jörg Knappen
More information about the CWB
mailing list