Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D

Wortwolke – Lemmata

Scheffel, Joseph Victor von: Hugideo. In: Deutscher Novellenschatz. Hrsg. von Paul Heyse und Hermann Kurz. Bd. 19. 2. Aufl. Berlin, [1910], S. 237–254. In: Weitin, Thomas (Hrsg.): Volldigitalisiertes Korpus. Der Deutsche Novellenschatz. Darmstadt/Konstanz, 2016.

Diese Wortwolke basiert auf dem automatischen Lemmatisierungsverfahren historischer Texte (CAB), das im DTA für die Textsuche angewandt wird. Die Lemmatisierung fasst sowohl Transliterationen (also bspw. ſ → s) als auch grammatische Formen (Teil, Theil, Theile, Theiles, ...) zusammen. Die Wortidentifikation (Tokenisierung) erfolgt mittels DTA-Tokwrap. Die Fontgröße der einzelnen Lemmata in der Wortwolke ist proportional zu deren Frequenz im Dokument. Lemmata, die im Dokument weniger als dreimal vorkommen, werden nicht dargestellt.