Während der Laufzeit des Projekts werden im Deutsche Textarchiv kontinuierlich weitere Texte zugänglich gemacht. In der ersten Projektphase werden insgesamt 650 Werke aus dem Zeitraum von 1780-1900 online gestellt werden. In der zweiten Projektphase soll das Textarchiv um weitere ca. 1000 Titel erweitert werden. Zum einen wird dabei eine zeitliche Ausweitung des DTA auf den Zeitraum von 1650-1780 stattfinden, zum anderen soll der Zeitraum ab 1780 um wichtige, noch fehlende Werke ergänzt werden.
Hauptziel der vertieften linguistischen Erschließung ist es, die verschiedenen historischen orthographischen Varianten mit einer heute gebräuchlichen Wortform, einem sogenannten Metalemma, abfragbar zu machen. Hierzu wurde im Projekt ein Programm entwickelt, welches graphematische Ähnlichkeiten von Wortformen ermittelt und auf eine heutige Wortform abbildet. Diese Informationen werden durch die linguistische Suchmaschine DDC, die für das Projekt Digitales Wörterbuch der Deutschen Sprache entwickelt wurde, indiziert. Dabei werden die Texte tokenisiert und auf ihre Grundform zurückgeführt (lemmatisiert). Dadurch sind komplexe Suchanfragen sowie die Suche nach flektierten Formen möglich (die Suche nach "Haus" findet auch "Häuser").
Das Deutsche Textarchiv soll zu einem 'aktiven Archiv' entwickelt werden, das den Benutzern verschiedene Möglichkeiten eröffnet, online mit den Texten zu arbeiten und sie zu bearbeiten. Dazu gehören Funktionen wie die Zusammenstellung einer privaten Textauswahl (beispielsweise für Seminarapparate), das Setzen persistenter Lesezeichen auf Textpassagen und das Hinzufügen von Annotationen. Weiterhin wird die Möglichkeit geprüft, registrierten Nutzern die Berechtigung einzuräumen, eigenständig Texte in das DTA zu integrieren, sofern diese dem Erfassungszeitraum und den Qualitätsanforderungen des Projekts genügen.