DCC - Datawarehousing for Cloud Computing Metrics

![Default-aligned image](dcc_logo.png)

---

# Datawarehousing for Cloud

# Computing Metrics

---

## Inhalt

* Einleitung

* Vorstellung - Aktuelle Situation

* Management-Methoden

* Vorbereitung

* Realisierung

* Risiken und unerwartete Probleme

* Abschluss

---

## Einleitung

]

![Default-aligned image](cloud.jpg)

---

## Einleitung

]

![Default-aligned image](google-datacenter-tech-13.jpg)

---

## Vorstellung

]

![Default-aligned image](Puppet-Logo-Amber-Black-lg.png)

???

* Marktführer im Bereich Konfigurationsmanagment Lösung
  * Kernprodukt ist gleichnahmiges Produkt Puppet
  * Projekt Betreuer Agile Entwicklung und Testverfahren

---

## Marktlage

]

![Default-aligned image](ceilometer-architecture.png)

* Telemetry ist ein Teilprojekt von OpenStack

* Datenbank MongoDB getestet durch Kyle Kingsbury

* Hohe Hardwareanforderung

* Benötigt OpenStack Cloud Umgebung

---

## Management

### Scrum

]

* Arbeit in Sprints

* Review & Retrospective

* Beliebt unter Entwicklern

* Sehr starr

* Nicht geeignet für asynchrones Arbeiten

]

???

* Scrum am weitesten verbreitet in der Wirtschaft
* Anforderungen an Projektmanagementlösungen
  * Unvorhersehbar
  * Schnell wechselnde anforderungen
* Standups
* Darf man nur Scrum nennen wenn man alles genau so macht

---

## Management

### Scrum

### Agil

]

* Flexible Kombination aus Scrum und Kanban

* Nutzung von einzelnen Elementen

* Sprints

* R&R

* Decommissioning
]

???

* Pool aus Methoden die in Scrum und Kanban genutzt werden
* Man nutzt was am besten passt, lässt rest weg
* Puppet

---

## Management

### Scrum

### Agil

### Werkzeuge

]

* Code Management

* Git

* GitHub

* Continuous Integration: Travis

* Continuous Delivery: Jenkins

* Projekt Management

* Jira

* Confluence

* Telegram

* Tests

* Acceptance Tests: Beaker

* Unit Tests: RSpec

* Integration Tests: Spring

]

???

* SVN bei gruppe im vorjahr
* Puppet hat erfahrung mit allem
---

## Vorbereitung

]

* Absprache mit Auftraggeber bezüglich des Lösungsbildes

* Auswahl von Software zur Realisierung

* Aneignen von Git und Methoden

* Frühzeitig Meilenstein definieren

* Ersten Prototyp abliefern

]

???

* Lösungansätze
* Anforderungen an Teilbereichen stellen

---

## Realisierung

]

![Default-aligned image](messagebusv2_4.svg)

]

???

* collectd auf hypervisors sammelt metriken
* werden an beliebig viele logstash instanzen geschickt
  * cached eingehende daten, aufbereitung
* Postgresql tabelle mit json als bus
* Daten von dort per ETL prozess in finale tabellen
* API RESTFul schema angelehnt, CRUD support
* Alles mit Puppet

---

## Realisierung

### Datenerfassung

]

![Right-aligned image](logstash_2.svg)

]

???

* Input Plugin
  * Pro format ein plugin
  * Collectd kann ausgetauscht werden
* Filter plugin
  * Serialisierung
  * XML -> JSON
  * Einheitliches Datumsformat
* Outputplugin
  * Jedes Backend ansprechbar

---

## Realisierung

### Datenerfassung

### ETL

]

![Right-aligned image](etl_1.svg)

]

---

## Realisierung

### Datenerfassung

### ETL

### Partitioning

]

![Right-aligned image](partition_1.svg)

]

---
.left-column[

## Realisierung

### Datenerfassung

### ETL

### Partitioning

### API

]

* Bereistellung von Funktionen

* Datenverarbeitung muss nicht in SQL erfolgen

* Vorgabe der Daten durch die API

* Keine Notwendigkeit für direkte SQL Queries

* Zusätzliche Abstraktionsschicht

* Zusätzlicher Cache

* Datenbankaustausch ist transparent für Grafana

* Kleinere Angriffsfläche auf das Interface

* HTTP API vs SQL

* Einfacher zu testen

![Right-aligned image](api_1.svg)

]

---

## Realisierung

### Datenerfassung

### ETL

### Partitioning

### API

### Visualisierung

]

![Right-aligned image](stats_1.png)

![Right-aligned image](graph.png)

]

???

* Graph besteht aus 2 Vektoren (Knoten und Kante)

* Daten werden aus der API erhalten

* Threshold / Schwellenwert

---

## Realisierung

### Datenerfassung

### ETL

### Partitioning

### API

### Visualisierung

### Userstorys

]

* SSD Userstory

* CPU Userstory

* Memory Userstory

* Zeitdefinierte Analyse Userstory

* Webinterface Userstory

]

---

## Realisierung

### Datenerfassung

### ETL

### Partitioning

### API

### Visualisierung

### Userstorys

### Wireframe

]

![Default-aligned image](ssduserstory.png)

]

---

## Risiken

]

* Risk Register definieren

* Präventivmaßnahmen

* Post Mortem Maßnahmen

]

---

## Risiken

]

![Right-aligned image](dishwasher.jpg)

]

???

* Kaputte Spühlmaschine unvorhersehbar
* undicht, Auf raviolidosen damit das wasser auslaufen kann
* 1 tag arbeit
* mehrere tage psychische belastung

---

## Ausblick

]

* Alerting

* Benachrichtigung bei Schwellenwertüberschreitung

* Quality of Service

* Bevorzugen bestimmter Datentypen zur Live-Visualisierung

* Cache Invalidation

* Sicherstellung der kontinuierlichen Datenverarbeitung

* Trendgenerierung

* Extrapolation vorhandener Daten

]

???

* Cache Invalidation
  * Schwellenwert beim Cache sobald dieser zu groß wird.

* Trendgenerierung
  * Hochrechnung

---

## Fazit

### Solide und modulare Architektur

### Flexibler und einfacher als Telemetry

### Persönliche Fortbildung

???

* Viele Monate Arbeit, Gute Alternative zu Telemtry aus dem OpenStack Projekt
* Realisierung von allen Userstorys, passender Replacemant Algorithmus der API
  mehr Funktionen als Telemetry
* Ist Flexibel, da es auf Linux Hypervisor intgriert werden können
* Praktischer Wissenschatz, neue Wissensinhalte u. Arbeitsmethoden
* Belastbarkeit jedes einzelnen wurde erforscht.