Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D

Wortwolke – Lemmata

Humboldt, Alexander von: Albert Gallantins tabellarische Uebersicht der Indianerstämme in den vereinigten Staaten von Nordamerika, ostwärts von den Felsgebirgen (Stony Mountains), nach den Sprachen und Dialekten geordnet. In: Herta, Bd. 9 (1827), S. 328-334.

Diese Wortwolke basiert auf dem automatischen Lemmatisierungsverfahren historischer Texte (CAB), das im DTA für die Textsuche angewandt wird. Die Lemmatisierung fasst sowohl Transliterationen (also bspw. ſ → s) als auch grammatische Formen (Teil, Theil, Theile, Theiles, ...) zusammen. Die Wortidentifikation (Tokenisierung) erfolgt mittels DTA-Tokwrap. Die Fontgröße der einzelnen Lemmata in der Wortwolke ist proportional zu deren Frequenz im Dokument. Lemmata, die im Dokument weniger als dreimal vorkommen, werden nicht dargestellt.