In unserem Data-to-Content Framework haben wir ein individuelles Content-Migrationssystem entwickelt, das den gesamten Prozess automatisiert hat. Von der Extraktion über die Umstrukturierung bis hin zum CMS-Import.
Zu den wichtigsten Schritten gehörten:
- Automatisierte Extraktion - Ein eigens entwickelter Web-Scraper hat Inhalte von der alten Website abgerufen und in ein strukturiertes, maschinenlesbares Format konvertiert.
- Strukturierung und Transformation - GPT-4 hat den Inhalt verarbeitet und neu strukturiert, um ihn an das neue CMS-Layout anzupassen, und gleichzeitig Metadaten wie Kategorien, Daten und Autoreninformationen extrahiert.
- Mehrsprachige Verarbeitung - Bestehende Übersetzungen wurden automatisch auf Vollständigkeit überprüft und fehlende Übersetzungen wurden markiert und bei Bedarf per KI ergänzt.
- CMS-Import - Der bereinigte und formatierte Content wurde direkt in das neue System übertragen – ganz ohne manuelle Kopierarbeit.