[CWB] Getting [UNREADABLE] in cqpweb

Jörg Knappen j.knappen at mx.uni-saarland.de
Wed Mar 16 15:08:40 CET 2022


Hi all,

I am getting a lot of "[UNREADABLE]" in cqpweb in a corpus I have. I 
have traced some instances of it to tokens containing a no-break-space.

The input line from the vrt file looks like

Кыргыз Республикасынын	Кыргыз Республикасы	np_top_gen

and it goes well with cqp from the command line, e.g., in a query like 
[word=".*Республикасы"] given results like

   1367195: л алынып , анын алкагында <Кыргыз Республикасынын> « Насыялык 
маалыма

However, in cqpweb I get for the query [word=".*Республикасынын"] 
[word="«"] [word="Насыялык"]

жылдын 22 - июлундагы № 85 Мыйзамы [UNREADABLE] алынып , анын алкагында
	[UNREADABLE] Республикасынын « Насыялык
маалымат алмашуу жөнүндө » Мыйзамына да өзгөртүүлөр киргизилген . - 
Жогоруда көрсөтүлгөн

cqpweb is version CQPweb v3.2.42 © 2008-2020 (still, we update rather 
infrequently).

What can I do here? Use something different from a no-break-space, like 
an underscore? Or is this a bug in cqpweb?

Greetings from Saarbrücken,

Jörg Knappen


More information about the CWB mailing list