<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
<div class=""><br class="">
</div>
<div class="">My fault - it was my own script that collected all the space. Sorry.</div>
<div class=""><br class="">
</div>
<div apple-content-edited="true" class="">
<div class="">Jörg</div>
<div class=""><br class="">
</div>
<div class="">
<div apple-content-edited="true" class="">
<div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
<div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
<span style="orphans: 2; widows: 2;" class="">**********************************************************************************</span><br style="orphans: 2; widows: 2;" class="">
<span style="orphans: 2; widows: 2;" class="">Jörg Tiedemann</span><br style="orphans: 2; widows: 2;" class="">
<span style="orphans: 2; widows: 2;" class="">Department of Modern Languages &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;</span><a href="http://www.helsinki.fi/~tiedeman/" style="orphans: 2; widows: 2;" class="">http://www.helsinki.fi/~tiedeman/</a><br style="orphans: 2; widows: 2;" class="">
<div style="orphans: 2; widows: 2;" class="">University of Helsinki</div>
</div>
</div>
</div>
</div>
</div>
<br class="">
<div>
<blockquote type="cite" class="">
<div class="">On 08 Jan 2016, at 23:28, Stefan Evert &lt;<a href="mailto:stefanML@collocations.de" class="">stefanML@collocations.de</a>&gt; wrote:</div>
<br class="Apple-interchange-newline">
<div class=""><br class="">
<blockquote type="cite" class="">I have a large parallel corpus and I would like to add alignment information but cwb-align-encode seems to allocate a lot of memory and at some point it crashes. Is there any option to reduce memory consumption?
<br class="">
</blockquote>
<br class="">
That is weird: cwb-align-encode shouldn't use any substantial amount of memory. &nbsp;It reads corpus positions from the input file and writes them directly to the index files. &nbsp;The code is so simple that there's hardly any room for memory leaks.<br class="">
<br class="">
The situation is different if you use the cwb-align-import Perl script, which collects all alignment beads in memory (with considerable overhead from the Perl data structures).<br class="">
<br class="">
Which version of CWB are you running and how exactly did you call cwb-align-encode?<br class="">
<br class="">
Best,<br class="">
Stefan<br class="">
<br class="">
<br class="">
_______________________________________________<br class="">
CWB mailing list<br class="">
<a href="mailto:CWB@sslmit.unibo.it" class="">CWB@sslmit.unibo.it</a><br class="">
http://devel.sslmit.unibo.it/mailman/listinfo/cwb<br class="">
</div>
</blockquote>
</div>
<br class="">
</body>
</html>