Automatisierte Social Media Reports mit Python

Automatisierte Social Media Reports mit Python

Python – „Das ist der neue Hit in der IT.“ Das waren die Worte meines Informatiklehrers vor mittlerweile 8 Jahren. Er sollte mit seiner Aussage Recht behalten. In diesem Beitrag erläutern wir Ihnen, warum Python für Ihr datengetriebenes Marketing nützlich ist und welche diversen Vorteile eine Nutzung von Python mit sich bringt. 

Was ist Python genau? 

Python ist eine einfach zu erlernende Programmiersprache mit einer umfangreichen Standardbibliothek, welche für zahlreiche Anwendungsgebiete u.a. im Big-Data Kontext erweitert werden kann. Module wie Pandas, SQLAlchemy und pyodbc werden auch in Zukunft mit neuen Features versorgt, um den Entwicklern verschiedenste Implementierungswege zu erleichtern. Diese werden hier kurz erläutert: 

Pandas ist eine Software-Bibliothek, die für Python geschrieben wurde. Sie wird für die Daten-Manipulation und -Analyse verwendet und spielt auch im später erwähnten Projekt eine zentrale Rolle. Pandas stellt spezielle Funktionen und Datenstrukturen für die Manipulation von numerischen Tabellen- und Zeit-Serien zur Verfügung. Für Pandas ist NumPy, ein Modul zum wissenschaftlichen Rechnen, eine Voraussetzung für die Installation und Verwendung.

SQLAlchemy und pyodbc sind Module, welche die direkte Kommunikation von Python und SQL erlauben. Mit ihnen kann man beispielsweise direkt von Python aus Abfragen an eine SQL-Datenbank senden, um die Ergebnisse sofort wieder in das Python-Skript zu laden. Des Weiteren können bestehende Excel-Dateien in Sekundenschnelle in eine SQL-Datenbank übertragen werden, ohne den Umweg über das Skript zu nehmen. Stattdessen wird direkt das Terminal von SQL angesteuert.

Großes Potenzial für Ihren Social Media Report mit Python

Was ist nun das genaue Potenzial all dieser Funktionen? Mithilfe dieser Funktionen können monatliche Reports u.a. über Social-Media-Aktivitäten erstellt werden. Zu Beginn jedes Monats wird ein solcher Bericht mit neuen Daten gespeist. Dabei werden Datensätze aus verschiedenen externen Quellen wie YouTube, Facebook, Instagram und Twitter zu einem gegebenen Suchbegriff exportiert. Diese Datensätze liegen meist in Form großer Excel-Tabellen vor und enthalten häufig mehrere hunderttausend Zeilen. 

Für ein Social Media Reporting müssen aus diesen Daten aktuelle Key-Performance-Indicators (KPIs) berechnet werden, welche anschließend im Report visualisiert werden. Hierfür bietet das standardmäßige Excel-Format jedoch leider keine optimale Basis. Die KPIs müssen über Excel-interne Makros berechnet werden, welche bei großen Tabellen sehr langsam und instabil sind. Dies liegt daran, dass die Software schlichtweg nicht für diesen Zweck optimiert ist. Es können teilweise Stunden vergehen, bis die neuen KPIs nach gelegentlichen Abstürzen von Excel berechnet sind. Und hier kommt Python ins Spiel.

Python und die Vision von CURE Intelligence 

CURE hat für mehrere Kundenprojekte ein aufwendiges Skript mit Python entwickelt, welches alle Exporte aus externen Datenquellen einliest, alle Berechnungen selbst durchführt und dann die Ergebnisse mitsamt den KPIs in einer SQL-Datatable speichert. Die Reporte werden automatisch mit den neuen Performancewerten gespeist – alles mit einem einzigen Mausklick. Selbstverständlich ist dies auch aus betriebswirtschaftlicher Perspektive interessant. Mitarbeiter, welche früher viele Stunden mit der manuellen Erstellung solcher Reports beschäftigt waren, haben nun mehr zeitliche Ressourcen z.B. für qualitative Auswertungen. Dazu wird jegliches Potenzial für Fehler und lange Ladezeiten minimiert, da alle Berechnungen auf Python ausgelagert werden. SQL-Datenbanken sind genau zu diesem Zweck geeignet, große Datenmengen schnell auszulesen und nach bestimmten Werten zu filtern. Daher erlaubt SQL eine immens schnellere Datenbankstruktur im Vergleich zu Excel.

Holen sich Sie Inspiration für Ihren Social Media Report auf D²M.

Pandas – die Wundermaschine von Python? 

Sobald eine Tabelle von Pandas eingelesen wurde, erscheint sie als Tabelle bzw. sogenanntes Dataframe in der Programmier-Umgebung. Dieses Modul kann verschiedene Datei-Formate wie CSV, Excel-Dateien, JSON, SQL und mehr sowohl laden als auch bearbeiten. Pandas leitet sich vom Begriff „Panel Data“ ab – eine Bezeichnung für strukturierte, multidimensionale Daten. Pandas definiert spezielle Objekte, um die Daten zu verwalten, bearbeiten, manipulieren und auszuwerten. Eine sogenannte „Series“ ist im Allgemeinen eine Datenstruktur mit einer Zeile und beliebig vielen Spalten. Sie ist dazu geeignet, den Verlauf einer sich verändernden Größe (Bsp.: Die Abonnentenzahl Ihres Social Media Accounts) über einen gegebenen Zeitraum zu betrachten. „Dataframes“ sind zweidimensionale Datenstrukturen deren Reihen und Spalten einer simplen Tabelle gleichen. Ein Datapanel besteht aus Datensets in drei Dimensionen – also eine Tabelle, dessen Einträge wiederum Listen sind.  

Pandas stellt eine Vielzahl von kostenlosen Werkzeugen und Funktionalitäten zur Bearbeitung der Daten bereit, darunter: 

  • Datenindexierung 
  • Kompatibilität zu einigen Dateiformaten 
  • Werkzeuge zur Datenanpassung und -bereinigung 
  • Zerlegen großer Datenstrukturen 
  • Manipulation der Daten (etwa das Löschen oder Hinzufügen von Spalten) 
  • Aggregation, Transformation und Merging von Daten 
  • Anpassung der Zeitreihen 
  • Filtern der Daten anhand frei wählbarer Kriterien 

Fazit: Automatisierung spart Zeit und Geld 

Pandas, die Programmbibliothek für die Programmiersprache Python, ist weit verbreitet und findet in vielen Bereichen Anwendung. Typischerweise sind bei Finanzanalysen, Statistiken, Web-Analysen, Marketinganalysen, Big-Data und Business Intelligence die Verwaltung, Manipulation und Auswertung von Tabellendaten oder Zeitreihen gefragt. Mit dem Know-How bei CURE helfen wir auch Ihnen, einen besseren Überblick über Ihre Social-Media-Präsenz zu bekommen. Sollten Sie Fragen oder Anliegen haben, können Sie uns gerne direkt kontaktieren

Bleiben Sie mit unserem monatlichen D²M-Newsletter auf dem aktuellen Stand rund um Themen des datengetriebenen Marketings. Jetzt anmelden! 

Schreiben Sie einen Kommentar

nine − nine =

Close Menu