Real-Time Analytics Plattform

Mit unserer ,,Real-Time Analytics“ Plattform bieten wir Ihnen eine Lösung, mit der Sie Ihre Daten in Echtzeit als Streams empfangen, bearbeiten und analysieren können. Zusammen mit der IoT-Lösung von AWS kann unsere Plattform eine Mehrzahl an Streams von Sensorendaten,  Services , Social Media usw. abdecken.

In der Plattform haben wir führende Technologien wie Mesos, Kafka,  Cassandra und Spark-Streaming integriert, die auch aufeinander abgestimmt sind und bauen auf Industriestandards wie Java auf. Damit haben Sie auch Support und Entwicklungssicherheit und profitieren von den neuen Entwicklungen.

Da wir die Plattform in Ihrer ,,Private Cloud“ implementieren, haben Sie die vollständige Kontrolle über Ihre Daten und hohe Flexibilität über Ihre Prozesse. Dennoch nutzen Sie die Vorteile einer Cloud basierten Lösung wie geringe Investitionskosten, hohe Skalierbarkeit, maximale Mobilität und verbrauchsbasierten Gebühren.

Komponenten

Cassandra ist eine der führenden verteilten und hochverfügbaren No-SQL Datenbanken, die bei namhaften Unternehmen u.a. Cisco, Credit Suisse, Disney, Ebay, Hp uvm. im Betrieb ist.

Cassandra ist bekannt für Hochverfügbarkeit und Hochdurchsatz -Eigenschaften und sie ist in der Lage, enorme Schreiblasten zu handhaben und Cluster-Knoten Ausfälle zu überstehen. In Bezug auf das CAP-Theorem bietet Cassandra eine konfigurierbare Konsistenz und Verfügbarkeit für den Betrieb.

Im Hinblick auf die Datenverarbeitung ist Cassandra linear skalierbar (erhöhte Belastungen können durch Erhöhung der Anzahl der Knoten eines Clusters abgedeckt werden) und sie ist in der Lage, Cross-Rechenzentrum Replikation (XDCR) durchzuführen. XDCR bietet eine Reihe von interessanten Anwendungsfälle für:

  • geo-verteilte Rechenzentren: Daten, die spezifisch für die Region sind oder näher an den Kunden liegen.
  • Datenmigration in Rechenzentren: Wiederherstellung nach Ausfällen oder Verschieben von Daten auf einen neuen Datacenter.
  • getrennte Betriebs- und Analytik-Workloads: Es können getrennte Cluster für schreib-intensive und analyse-intensive Anwendungen aufgesetzt werden.

Cassandra unterliegt der Apache 2.0 Lizenz.

Real-Time Processing

Streaming-Daten sind Daten, die kontinuierlich und aus einer Vielzahl von Datenquellen generiert werden. Die Datenaufzeichnungen werden im Regelfall simultan und in kleinen Paketen (Kilobyte-Bereich) verschickt. Diese Daten müssen sequentiell und inkrementell auf Aufzeichnungsbasis oder in gleitenden Zeitfenstern verarbeitet werden. Beispiele für Streaming-Daten sind

  • Sensoren von Industrieanlagen und Maschinen senden Daten an eine Real-Time Anwendung zur Überwachung der Produktion.
  • Ein Finanzunternehmen überwacht die Finanztranskation in Echtzeit auf Anomalitäten und Betrugsfälle.
  • Auswertung der Börsenentwicklung und Aktienentwicklung anhand Extra Echtzeitdaten.
  • Online-Shop wertet die Besucheraktivität und die Anzahl der Clicks in Echtzeit aus.
  • Eine Mobilanwendung für Immobilien sendet den Anwendern, basierend auf ihrem Standort, Vorschläge für potentielle Objekte zur Besichtigung in der Nähe zu.

Anders als bei Batch-Verarbeitung, liegt die erforderliche Latenz bei Stream-Verarbeitung  im Bereich von Sekunden oder Millisekunden.  Diese stellt besondere Anforderung sowohl auf die Verarbeitung als auch auf die Speicherung der Daten.  Darüber hinaus muss das System ausfallsicher und skalierbar sein.

Unsere ,,Real-Time Analytics“ Plattform ist auf die Anforderungen ausgelegt und stellt sicher dass die Streaming-Daten in der erforderlichen Latenz bearbeitet werden.  Mit Kafka, Spark und Cassandra bauen wir auf Technologien, die sich in vielen anspruchsvollen Echtzeit-Anwendungen bereits bewährt haben.

This post is also available in: Englisch