Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D

Wortwolke – Lemmata

Heyse, Paul; Kurz, Hermann: Einleitung. In: Deutscher Novellenschatz. Hrsg. von Paul Heyse und Hermann Kurz. Bd. 1. München, [1871], S. V–XXIV. In: Weitin, Thomas (Hrsg.): Volldigitalisiertes Korpus. Der Deutsche Novellenschatz. Darmstadt/Konstanz, 2016.

Diese Wortwolke basiert auf dem automatischen Lemmatisierungsverfahren historischer Texte (CAB), das im DTA für die Textsuche angewandt wird. Die Lemmatisierung fasst sowohl Transliterationen (also bspw. ſ → s) als auch grammatische Formen (Teil, Theil, Theile, Theiles, ...) zusammen. Die Wortidentifikation (Tokenisierung) erfolgt mittels DTA-Tokwrap. Die Fontgröße der einzelnen Lemmata in der Wortwolke ist proportional zu deren Frequenz im Dokument. Lemmata, die im Dokument weniger als dreimal vorkommen, werden nicht dargestellt.