Logo Cal2Lab


Herzlich Willkommen im
Computer Assisted Legal Linguistics Laboratory (CAL²Lab)

Das CAL²Lab wurde implementiert zur evidenzbasierten Analyse juristischer Sprache und Semantik. Die Plattform bietet Zugriff auf statistische Daten und Auswertungen zu den 199 514 häufigsten Lemmata. Zur Berechnung wurde das juristische Referenzkorpus mit 379 802 Texten und ca. 1,2 Milliarden Token (das entspricht ca. 937 Mio. Wörtern ohne Satzzeichen und Zahlen) zugrunde gelegt.

Neben der Darstellung statistischer Grunddaten in Form von Kontextprofilen, werden Module zur Einschätzung der Bestimmtheit/Unbestimmtheit und der Ähnlichkeit von Lemmata bereitgestellt. Im CAL²Lab stehen folgende Module zur Begriffsanalyse bereit:

Eine Gesamtliste zu allen in CAL²Lab erfassten Lemmata können Sie hier im Plaintext-Format herunterladen (2x *.txt, als zip 4,4 MB) und unter einer Creative Commons Lizenz (CC BY-NC-SA 4.0) weiterverarbeiten.

Das Projekt wurde von 2017 bis 2019 von der Heidelberger Akademie der Wissenschaften finanziert und basiert auf dem vorbereitenden Projekt zum Aufbau des juristischen Referenzkorpus (JuReko). Die Entwicklung und Konzipierung erfolgt unter Leitung von Prof. Dr. Friedemann Vogel, Dr. Dr. Hanjo Hamann und Isabelle Gauer (M.A.). Ausführlichere Informationen finden Sie auf der Projekthomepage.

Das CAL²Lab ist seit März 2020 in der Version 1.0 online und wird von der Forschungsgruppe Sozio- und Diskurslinguistik an der Universität Siegen gehostet. Für die Weiterentwicklung freuen wir uns über Ihre Rückmeldung, über Wünsche und Fehlermitteilungen.

Zitiervorschlag: Vogel, Friedemann / Hamann, Hanjo / Gauer, Isabelle (2020): Computer Assisted Legal Linguistics Laboratory (CAL²Lab) - Eine rechtslinguistische Forschungs- und Experimentierplattform zur quantifizierenden Analyse juristischer Fachsprache und Begriffssystematik. Version 1.0. Online zugänglich unter: https://cal2lab.diskurslinguistik.net [Datum des Zugriffs].


Mehr zum Ansatz CAL² Ansatz und Publikationen zum Projekt (in Auswahl, weitere finden Sie im Publikationsverzeichnis):

  • Hamann, Hanjo; Friedemann, Vogel (2018): Evidence-Based Jurisprudence meets Legal Linguistics – Unlikely Blends Made in Germany. In: BYU L. Rev. 43 (2018), S. 1473–1501. (PDF)
  • Gauer, Isabelle; Vogel, Friedemann; Hamann, Hanjo (2017): Juristische Semantik messend verstehen. CAL²Lab – Eine computergestützte Forschungs- und Experimentierplattform als Beitrag zu einer datengestützten Rechtslinguistik. In: Friedemann Vogel (ed.), Recht ist kein Text: Studien zur Sprachlosigkeit im verfassten Rechtsstaat. Berlin: Duncker & Humblot.
  • Vogel, Friedemann; Hamann, Hanjo; Gauer, Isabelle (2017): Computer Assisted Legal Linguistics: Corpora and Empirical Methods As a New Instrument in the Legal Toolbox. In: Law & Social Inquiry. Journal of the American Bar Foundation (ABF) 43 (4), pp. 1340–1363. Doi: 10.1111/lsi.12305 (PDF)
  • Vogel, Friedemann (ed.) (2015): Zugänge zur Rechtssemantik. Interdisziplinäre Ansätze im Zeitalter der Mediatisierung zwischen Introspektion und Automaten. Berlin, New York: Walter De Gruyter (linguae & litterae 53).
  • Vogel, Friedemann; Christensen, Ralph; Pötters, Stephan (2015): Richterrecht der Arbeit – empirisch untersucht. Möglichkeiten und Grenzen computergestützter Textanalyse am Beispiel des Arbeitnehmerbegriffs. Berlin: Duncker & Humblot.
  • Hamann, Hanjo (2014): Die Fußnote, das unbekannte Wesen. Potential und Grenzen juristischer Zitationsanalyse. In: Rechtswissenschaft. Zeitschrift für rechtswissenschaftliche Forschung 5 (4), pp. 501–534. (PDF)
  • Vogel, Friedemann (2012): Das Recht im Text. Rechtssprachlicher Usus in korpuslinguistischer Perspektive. In Felder / Müller / Vogel (Eds.): Korpuspragmatik. Thematische Korpora als Basis diskurslinguistischer Analysen von Texten und Gesprächen, pp. 314-353. Berlin: de Gruyter. (PDF)