<html>
<head>
<meta name="generator" content="Windows Mail 17.5.9600.20413">
<style data-externalstyle="true"><!--
p.MsoListParagraph, li.MsoListParagraph, div.MsoListParagraph {
margin-top:0in;
margin-right:0in;
margin-bottom:0in;
margin-left:.5in;
margin-bottom:.0001pt;
}
p.MsoNormal, li.MsoNormal, div.MsoNormal {
margin:0in;
margin-bottom:.0001pt;
}
p.MsoListParagraphCxSpFirst, li.MsoListParagraphCxSpFirst, div.MsoListParagraphCxSpFirst, 
p.MsoListParagraphCxSpMiddle, li.MsoListParagraphCxSpMiddle, div.MsoListParagraphCxSpMiddle, 
p.MsoListParagraphCxSpLast, li.MsoListParagraphCxSpLast, div.MsoListParagraphCxSpLast {
margin-top:0in;
margin-right:0in;
margin-bottom:0in;
margin-left:.5in;
margin-bottom:.0001pt;
line-height:115%;
}
--></style></head>
<body dir="ltr">
<div data-externalstyle="false" dir="ltr" style="font-family: 'Calibri', 'Segoe UI', 'Meiryo', 'Microsoft YaHei UI', 'Microsoft JhengHei UI', 'Malgun Gothic', 'sans-serif';font-size:12pt;"><div>Dear Chris, most of these questions can be answered using a three-line script with CWB::CL or cwb-python. Rcqp might also offer this if it offers low-level access to CQP’s corpus data.</div><div>Best wishes, Yannick<br></div><div data-signatureblock="true"><div><br></div></div><div style="padding-top: 5px; border-top-color: rgb(229, 229, 229); border-top-width: 1px; border-top-style: solid;"><div><font face=" 'Calibri', 'Segoe UI', 'Meiryo', 'Microsoft YaHei UI', 'Microsoft JhengHei UI', 'Malgun Gothic', 'sans-serif'" style='line-height: 15pt; letter-spacing: 0.02em; font-family: "Calibri", "Segoe UI", "Meiryo", "Microsoft YaHei UI", "Microsoft JhengHei UI", "Malgun Gothic", "sans-serif"; font-size: 12pt;'><b>Von:</b>&nbsp;<a href="mailto:misc.priv@gmail.com" target="_parent">Adhuc Militarent</a><br><b>Gesendet:</b>&nbsp;‎Sonntag‎, ‎23‎. ‎März‎ ‎2014 ‎10‎:‎55<br><b>An:</b>&nbsp;<a href="mailto:cwb@sslmit.unibo.it" target="_parent">cwb@sslmit.unibo.it</a></font></div></div><div><br></div><div dir=""><div dir="ltr">Dear all,<br><div class="gmail_quote"><div dir="ltr"><div><div><div><div><br></div>I was wondering if I had missed something when reading CWB documentation or there does not exist any trivial way to generate per text corpus statistics (eg. text_id, text_author, word_count, types_count etc.). I have already tried both external&nbsp; (cwb-scan-corpus) and internal (query = []; then tabulate) approach, but without major success. I have also started to analyse CQPWeb php scripts in order to see how it populates mysql tables with frequency data, but it is not precisely what I was looking for (I am still digging, though).<br>

</div>I would like only to add that apart from using proper CWB/CQPWeb, I also used to manipulate my corpora from within R (with rcqp) and it would be a great aid if this sort of information could be easily retrieved.<br>

<br></div>Thanks for any hint<br></div>Chris<br></div>
</div></div>
</div></div>
</body>
</html>