Die Sendung mit der Metrik #dsmdm

#19: "Nimmt uns die künstliche Intelligenz die Analyse-Jobs weg?"

mit Tom Alby von Interone

by Maik Bruns

Die Sendung mit der Metrik #dsmdm

#19: "Nimmt uns die künstliche Intelligenz die Analyse-Jobs weg?"

mit Tom Alby von Interone

by Maik Bruns

by Maik Bruns

Was kann künstliche Intelligenz? Heute oder in Zukunft. Und vor allem in puncto Webanalyse. Wird sie die Analystenjobs auf Dauer überflüssig machen? Und was haben Durchschnitte damit zu tun? Das bespreche ich mit meinem Gast Tom Alby von Interone.

Die Folge sattelt ein stückweit auf der Folge mit Kerstin Clessienne auf (#13). Höre auch da gerne nochmal rein, wenn du dich zu Data Science schlau machen möchtest.

Abonniere auf Android Abonniere auf iTunes

In dieser Folge:

  1. Die Sendung
  2. Shownotes
  3. Die Folge zum Nachlesen


Hier hörst ob du deinen Analystenjob in ein paar Jahren noch hast oder ob die Maschinen das dann erledigen.


Lade die Folge runter (Rechtsklick und „Speichern unter“)

Meine Bitte: Wenn dir diese Folge gefallen hat, hinterlasse bitte eine 5-Sterne-Bewertung bei iTunes oder wo immer du abonniert hast, gerne ein Feedback im Blogpost oder bei Facebook und abonniere diesen Podcast. Zeitinvestition: Maximal ein bis zwei Minuten. Dadurch hilfst du mir den Podcast zu verbessern und die Inhalte zu liefern, die du gerne hören möchtest. Ich danke dir jetzt schon dafür. Oder hinterlasse auch gerne einfach einen Kommentar hier.

Wenn du das Ganze lieber lesen möchtest, unten gibt’s das komplette Interview in Textform.

Shownotes

Zwei Buchtipps von Tom

Tom Albys Profile im Netz

Allgemein

Das war die Folge „Nimmt uns die künstliche Intelligenz (KI) die Webanalyse-Jobs weg?“ mit Tom Alby von Interone

Hallo? „Die Sendung mit der Metrik“, der Webanalyse-Podcast mit Maik Bruns und seinen Gästen. Heute mit Tom Alby. Viel Spaß!

Maik Bruns: Hey Analyseheld, hier ist der Maik und herzlich willkommen zu dieser neuen Podcast-Folge. Die erste würde ich fast schon sagen Fortsetzungsfolge, die es in diesem Podcast gibt. Denn heute kümmere ich mich gemeinsam mit meinem Gast Tom Alby darum, wir bemühen uns um das Thema „Data Science“ und noch strenger sogar um das Thema „künstliche Intelligenz“ und ob sie den Analysten langfristig den Job wegnimmt oder vielleicht sogar mittelfristig oder vielleicht sogar kurzfristig. Das alles werden wir heute hier behandeln. Ich möchte euch gerne den Tom noch kurz vorstellen.

Der Tom ist dem einen oder anderen Hörer mit Sicherheit schon bekannt. Er ist eines dieser Urgesteine und sicherlich auch ein Pionier im Data Driven Marketing. Er hat schon eine der früheren Suchmaschinen mitentwickeln können. Das ist nämlich zum Beispiel Lycos gewesen oder auch Seekport. Hat auch bei Google einige Jahre verbracht und war da im Vertrieb von Google Analytics, insbesondere auf Konzernebene unterwegs, im deutschsprachigen Raum, aber auch Mittel- und Osteuropa gehörte so zu seiner Region. Seitdem tummelt er sich ein wenig bei Agenturen herum. Aktuell ist er bei Interone und ist dort als Director Data & Analytics und rollt da die Daten von Firmen BMW, O2, Payback und Konsorten so lange hin und her bis sie irgendwelche Erkenntnisse preisgeben.

Ich habe Tom kennengelernt als sehr präzisen Menschen, der auch sehr datengetrieben denkt und ist da mitunter sicherlich ein streitbarer Geist, was das Thema angeht. Deswegen finde ich es umso toller, dass er Lust hat hier in diesem Podcast zu kommen und mit mir darüber zu sprechen, ob die KI uns Analysten langfristig die Jobs abnimmt. Ich freue mich auf jeden Fall sehr. Tom, herzlich willkommen. #00:02:10.2#

Tom Alby: Hallo Maik. #00:02:12.0#

Maik Bruns: Tom, meine erste Frage an meine Gäste ist eigentlich immer: Wie kamst du zur Webanalyse? #00:02:18.7#

Tom Alby: Huh! Gleich so eine schwierige Frage. Ich bin schon ein bisschen älter und habe meine erste Webseite 1995 gebaut. (Maik Bruns: Ups!) Ja, das ist schon etwas länger her. Da war es eine Webseite für eine Diskothek, wo wir Ankündigungen für Konzerte, das war nicht nur eine Diskothek, sondern Konzerthalle, Ankündigungen im Internet vorbereiten wollten, auch ein bisschen Biografie zu den Künstlern. Das war eine der ersten Diskotheken, vielleicht sogar der erste Laden in Deutschland, der das gemacht hat. Natürlich stellt sich auch immer die Frage: Machen wir das nur, weil es gerade cool ist? Wobei das 1995 das noch gar nicht so cool war. Oder hat das auch irgendeinen Vorteil? Und dann fingst du halt an zu gucken, wie findet man heraus, wie viele Leute auf der Seite gewesen sind. Damals gab’s noch diese Site-Counter, so Pixel, die man da eingebunden hatte, so kleine Zähler. #00:03:12.7#

Maik Bruns: Die waren auch immer schön zu sehen. #00:03:14.8#

Tom Alby: Genau. Aber das wurde auch langweilig. Dann kam die Frage auf, wie kriegen wir es genauer hin? Dann ist man ziemlich schnell bei den Server-Logfiles gelandet. Sehr schnell bei Perl, also Perl ist so die Sprache, die ich wahrscheinlich mit am besten beherrsche, aber nur im Hacking, weil man wirklich ständig um die Ecke denken muss, wie man seine Daten bekommt. Das hat sich immer weiter fortgesetzt.  Natürlich, als ich dann anfing zu entwickeln, auch für Suchmaschinen, da ging es immer wieder um die Frage: Wie wird das genutzt und wie kann man das messen? Seit den 90er Jahren hänge ich in diesem Thema drin in verschiedenster Weise, weil es nicht nur Webanalyse ist, sondern auch viele andere Arten von Datenanalysen. #00:04:02.3#

Maik Bruns: Das ist auf jeden Fall ein extrem spannendes Umfeld, das du dir gesucht hast. Jetzt bist du bei Interone. Interone schreibt sehr groß auf seiner Website: „Proud to be digital“. Ich glaube, da bist du richtig oder? #00:04:15.3#

Tom Alby: Ja. Wobei als ich noch bei Google war, das war natürlich auch eine tolle Zeit, das war eine super spannende Geschichte. Was mir ein bisschen gefehlt hatte nachher, das direkte Arbeiten mit den Zahlen. Ich glaube, heute können wir nicht nur rein digital denken. Das ist so ein Missverständnis, dass man sagt, digital ist so wichtig, digital first, mobile first. Das stimmt so für viele Bereiche, dass es extrem wichtig ist, aber es ist auch nicht alles. Ich habe das erlebt während der Finanzkrise 2008/2009, da wurde einfach mal die Fernsehwerbung von einem großen Kunden eingestellt und dann wurde auch nicht nach diesem Kunden gesucht. Zwar machen sich alle darüber lustig, dass so viel Geld in die Fernsehwerbung läuft, aber für bestimmte Themen funktioniert das dummerweise noch. Der Heilige Gral der Analyse ist natürlich auch diese Multi-Attributions-Geschichten lösen zu können und zwar zu sagen, hey, wenn ich so viel Geld in diesen einen Kanal offline reinstecke, wieviel kommt da meinetwegen digital raus und umgekehrt? Welche Wechselwirkungen hat das? Das heißt proud tob e digital, das stimmt, aber das heißt nicht, dass wir uns nicht auch andere Datenquellen, die nicht digital sind, anschauen würden. #00:05:29.0#

Maik Bruns: Das trifft auch so das Gesamtthema digitale Transformation, wo das ein oder andere Unternehmen schadhaft versucht hat so einen disruptiven Ansatz zu fahren, wie du es gerade schon gesagt hast. Oder Unternehmen, die ein bisschen cleverer anstellen und versuchen beide Welten einfach miteinander zu verquicken, was einfach in der Regel zumindest, wenn man auch den Kern des Unternehmens nicht völlig vergessen möchte, meistens besser ist. Lass uns aufsatteln auf das, was ich mit Kerstin besprochen habe, mit Kerstin Clessienne in unserer Podcast-Folge und lass uns etwas mehr in die Tiefe gehen. Wir haben in der damaligen Folge ein bisschen mehr beschrieben, worum es bei Data Science ein bisschen geht und wieso vielleicht grundsätzlich so eine Arbeit aussehen kann. Aber wir hatten besprochen, das war noch nicht tief genug für den einen oder anderen. Wir haben auch so ein Thema gewählt heute, das ein bisschen provokant gewählt ist. Ich will nicht sagen, das hat schon AfD-Niveau, so: Nimmt uns die KI die Jobs weg? Aber wir wollen zumindest das, was der eine oder andere befürchten mag und andere vielleicht sogar hoffen, mal so ein bisschen auf den Prüfstand stellen und vielleicht auch die Angst einfach nehmen vor dem ganzen Thema. Lass uns doch erstmal nochmal abgrenzen. Wir reden jetzt schon KI, künstlicher Intelligenz. Vielleicht müssen wir es nochmal abgrenzen so untereinander zu Machine Learning oder auch zu Artificial Intelligence, wenn man es überhaupt abgrenzen kann. #00:06:55.9#

Tom Alby: Ich glaube, man kann es auf jeden Fall abgrenzen. Sozusagen Data Science ist auch jetzt kein Begriff, der irgendwie komplett genau definiert ist. Für mich ist es immer so eine Mischung aus Machine Learning, Statistik und Data-Mining. Ich muss irgendwie an die Daten rankommen, ich muss sie gut auswerten, versuche Programme drauf zu trainieren, selber etwas daraus zu lernen. Machine Learning ist für mich ein Ansatz aus der künstlichen Intelligenz. Wer das ein bisschen verfolgt hat mit der künstlichen Intelligenz, der weiß auch, dass es eine sehr traurige Phase gab, als man irgendwann festgestellt hat, naja ganz so einfach ist das nicht. Jetzt in den letzten Jahren merkt man, wow, wir haben viel mehr Datenpunkte als früher, wir haben viel schnellere Rechner. Also können wir da mehr anstellen. Machine Learning ist ein Teil davon. Ich wundere mich selber ehrlichgesagt wie stark das Thema momentan gerade draußen diskutiert wird, weil es auch kein komplett neues Thema ist. Ich erinnere mich noch, vor zehn 10, 11, an schon 12 Jahre bald, da hatten wir bei einer Suchmaschine angefangen mit Support Vector Machines den Algorithmus selber lernen zu lassen. Das heißt man hat ihm gute Ergebnisse gegeben, man hat ihm schlechte Ergebnisse gegeben. Die wurden von Menschen noch bewertet und dann hat der Algorithmus selber versucht herauszufinden wie er die verschiedenen Signale gewichten soll. Das hat super funktioniert damals, war eine sehr erfolgreiche Geschichte und etwas, was ein Mensch niemals hinbekommen hätte. Auch da schon sieht man, hey, das ist eine Geschichte, wo nicht unbedingt ein Arbeitsplatz wegfällt, aber die Arbeit sehr stark erleichtert wird. Diese Themen sind jetzt in den letzten Monaten oder schon ein, zwei, drei Jahren viel stärker rausgekommen, weil alle natürlich denken, wow, Daten sind das neue Öl und jetzt muss man unbedingt datengetriebene Geschäftsmodelle haben. Ja, das stimmt zum großen Teil wahrscheinlich auch, dass man sich da mehr Gedanken machen muss wie man die eigenen Daten verwenden kann. Da höchstwahrscheinlich auch Maschinen, maschinelles Lernen für verwenden kann. Heißt aber nicht, dass jetzt alle mit einer künstlichen Intelligenz arbeiten können. Sondern Machine Learning ist schon etwas, wo man gucken muss, welches Problem löse ich eigentlich? Das ist eigentlich die Gretchenfrage. Welches Problem löse ich? Ich kann mich den ganzen Tag mit Algorithmen beschäftigen. Ich programmiere zur Entspannung. Das klingt ein bisschen seltsam, aber ich schreibe ab und zu so Blogartikel darüber, was man Tolles machen kann mit dem Tag Manager, mit Google Analytics. Das sind alles Entspannungsgeschichten. Aber das heißt, ich könnte mich wirklich nur damit beschäftigen, aber viel spannender ist es natürlich, wenn ich da mit einem Kunden spreche, ihn zu fragen, hey, was ist das Problem, was ich mit Daten lösen kann und mit Machine Learning anstatt, dass jemand sagt, hey, ich habe hier Daten, kannst du bitte irgendwie herausfinden, ob ich damit Geld verdienen kann? Ist auch spannend. Natürlich so ein bisschen das Trüffelschwein, aber viel spannender ist es eher zu sagen, hey, wir haben hier ein Business-Problem und können wir das irgendwie mit Daten und maschinellem Lernen lösen? #00:10:05.4#

Maik Bruns: Braucht man denn, um maschinelles Lernen anzustoßen oder überhaupt KI zu nutzen, braucht man dafür dann gleich, ich haue mal das nächste Buzzword raus, Big Data oder tut es da auch schon ein Export aus den Google Analytics Daten? #00:10:22.2#

Tom Alby: Ach, Big Data ist so ein Hassbegriff für mich. #00:10:27.7#

Maik Bruns: Ich finde den auch völlig überbewertet. #00:10:30.2#

Tom Alby: Ich habe so den Eindruck, Big Data ist so ein Schlagwort, das die großen Maschinenhersteller erfunden haben, damit man wieder neue Rechner verkaufen kann. Ich habe ganz selten bisher Big Data erlebt. Big Data ist für mich, es muss A wirklich eine riesengroße Datenmenge sein, es muss in Echtzeit ausgewertet werden können. Es sind komplexe Daten. Das ist für mich Big Data. Das ist meinetwegen von einer Telefongesellschaft Echtzeitanalyse von Telefongesprächen. Das wäre wirklich Big Data für mich. Wenn jemand über Big Data sprechen möchte von Kunden, dann habe ich immer ein Beispiel. Wikipedia, die englische Version davon, die kann man runterladen. Sind glaube ich mittlerweile 50 Gigabyte. Ist das jetzt Big Data oder nicht? Es ist kein Big Data. Ich kann es auf meinem MacBook Air, was auch schon ein älteres Baujahr ist, locker flockig hier durchprozessieren. Da kann man schon jetzt coole Sachen mit machen. Die Datenmengen sind manchmal eine Herausforderung, aber heutzutage selten etwas, was man nicht lösen könnte. Außer man hat diese Echtzeitanwendungen und die sind zum Glück relativ selten oder vielleicht auch nicht zum Glück. Das ist natürlich auch eine spannende Geschichte. Aber die Frage ist nie, ob ich viel Daten habe, sondern eher die Frage, habe ich die richtigen Daten? Wenn es die richtigen Daten sind, sind sie auch korrekt erhoben worden? Wir wissen das selber, gerade in der Webanalyse, dann gibt es ganz viele Missverständnisse. Beispiel: Die durchschnittliche Sitzungspause, da wissen 99,7 Prozent der Nutzer nicht, dass diese Zahl Quatsch ist. Dass sie nicht stimmt. Die verlassen sich aber darauf. Sie treffen Entscheidungen basierend auf solchen Zahlen. Das ist so glaube ich die größte Arbeit, die man da hat. Nicht Big Data zu bearbeiten, sondern das Verständnis dafür zu schaffen, dass man die richtigen Daten braucht und dass man ein tolles Tool hat, das nicht bedeutet, dass man mit diesem Tool aus Wasser Wein machen kann, wenn man keine Ahnung hat wie das tun funktioniert. #00:12:39.9#

Maik Bruns: Ganz genau. Ich bin auch eher der Meinung, den Leuten erstmal grundsätzlich den Umgang mit Daten beizubringen oder sie zu lesen, sie zu verstehen. Vor allen Dingen, das finde ich noch viel entscheidender, etwas mit diesen Daten anzufangen als sie einfach nur zu haben. Da kommt dann auch irgendwann mal so das Thema KI dann ins Spiel, wie man dann nämlich mit so Fragen mehr aus den Daten rausquetschen kann. Aber vielleicht nochmal zurück zu diesem Thema Fragen. Wie sieht denn so eine konkrete oder wie sieht denn so eine richtige Frage aus, die man an Daten stellen kann? #00:13:12.2#

Tom Alby: Das ist eine sehr gute Frage. Das häufigste, was passiert oder es gibt so zwei Fälle eigentlich. Der eine Fall ist, jemand kommt zu mir und sagt, hier hast du Daten, finde mal was raus. Das ist der eine Fall und der andere Fall ist, hier hast du Daten, ich hätte gerne, dass das und das rauskommt. Auch nicht schlecht. Aber meistens hat man so einen Hintergrund, ich versuche einen Hintergrund herauszufahren. Ein ganz großes Thema bei vielen Unternehmen ist zum Beispiel die Frage: Wie kann ich die User Experience personalisieren? Wie kann ich sowas machen wie Amazon oder Google oder Spotify das tun? Das ist eine Frage, die höre ich bestimmt dreimal am Tag. Dann frage ich immer: Okay, was ist das Ziel davon? Was soll passieren? Bei einem Amazon geht es darum, mehr Geld zu machen. Aber nicht jeder Kunde hat so ein Produktportfolio, wo das genau funktionieren kann. Wir haben zum Beispiel ein Auto-Kunde, da ist es so, dass man nicht ständig ein Auto kauft und dann auf Basis der gekauften Autos dann einen Vorschlag erarbeiten könnte. So einfach ist es nicht und das gilt für ganz viele Themen. Sei es jetzt Stromanschlüsse, egal was. Was man sich überlegt, ist eher, wie kann ich den Nutzer unterstützen bei dem, was er vorhat, also was ist seine Intention? Dann geht es um die Frage: Was könnte die Intention sein? Dann kommt KI ins Spiel. Nicht unbedingt KI, sondern erstmal Machine Learning, dass man versucht das herauszufinden. Denn da kommen wir eigentlich schon auch an die Wurzel des Ganzen. Wir Menschen können zwar vielleicht die Semantik besser verstehen, aber diese vielen Daten, da diese Nadel im Heuhaufen zu finden, das ist halt schwierig. Wenn man sich jetzt Googeln Analytics anschaut, vor allem die Apps, die es dazu gibt, die machen mittlerweile schon Vorschläge. Die sagen, hey, letzte Woche war die Bounce Rate bei Nutzern auf dem Safari-Browser höher. Ist sie sowieso aus anderen Gründen. Das ist so mein Lieblingsbeispiel. Aber das ist super. Weil ansonsten muss ich immer gucken, was finde ich denn da? Genau da kommen halt diese maschinellen Verfahren zum Einsatz, wo man sagt, hey, lass doch bitte die Maschinen rausfinden, was sind denn die Cluster? Wir sprechen hier nicht mehr von Segmenten, sondern von Clustern. Was sind die Cluster, die ein anderes Verhalten haben? Denn ich könnte natürlich jetzt sagen, ich schaue erstmal Mobile User an, ich schaue mir alle iPhone versus Samsung 7 versus keine Ahnung, was es da für Marken gibt, an. Dann schaue ich mir Nutzer aus München an und dann die aus Hamburg und dann die bei gutem Wetter, die bei schlechtem Wetter. Dann kombiniere ich das und dann merken wir schnell, dass kriegt ein Mensch nicht mehr hin. Und darum lasse ich die Maschine da rauf und versuche dann rausfinden zu lassen, was sind die spannenden Cluster da drin? #00:16:11.4#

Maik Bruns: Das ist wirklich schon hochspannend. Auch was zum Beispiel, hast du angesprochen, die Google Analytics App mittlerweile versucht, nämlich dem Nutzer schon mal ein paar Brocken hinzuwerfen, wo man dann zumindest mal nachschauen könnte, weil ungewöhnliche Dinge passiert sind. Dieses große Thema Anomalien suchen, da sind Maschinen eigentlich immer stärker als wir Menschen. Ich meine, die Intention dahinter, hast du auch gesagt, verstehen die Maschinen vielleicht nicht unbedingt und das Warum dahinter erst recht nicht, aber sie können erstmal helfen dabei zu erkennen, dass es irgendwas Besonderes gibt, auf das man sich vielleicht in der Analyse stürzen könnte. Das finde ich erstmal einen interessanten Ansatz. Je besser die Frage, desto besser auch am Ende die Antworten. Wenn du jetzt sagst irgendwie, wie kann ich mehr Geld machen und das in eine Maschine steckst, würdest du dir, ich weiß nicht, ob sie dir direkt ein korrektes Attributionsmodell auswerfen kann? Aber in die Richtung wird es wahrscheinlich irgendwann mal gehen sollen nehme ich an. #00:17:06.6#

Tom Alby: Ja, das wäre nicht schlecht, aber ich glaub, wir müssen uns eher damit anfreunden, dass so ein paar Schritte davor noch sind. Zwischen der Frage und nachher der Analyse haben wir immer den Teil der Datenakquise. Wo wir prüfen müssen, haben wir die Daten überhaupt zur Fragestellung? Manchmal ist es eher so, dass wir sagen, hier habe ich Daten, mache was draus. Aber das sind gar nicht die richtigen Daten. Dann kommen irgendwie Facebook-Likes oder Shares. Fragt mich, okay, was machen wir jetzt damit? Ist doch egal, ist doch mehr geworden, ist doch toll. Nee, ist es nicht. Das wissen wir halt nicht. Ganz schlimmes Thema, lieber nicht darauf einsteigen. Aber dann schaut man in die Daten rein und dann sieht man plötzlich, ups, da passt was nicht. Da haben wir da irgendwelche Ausreißer und die Daten müssen bereinigt werden. Ich habe gerade einen Fall gehabt, wo ein Nutzer 852 Mal in einem Monat auf einer Webseite gewesen ist. Es war kein interner Nutzer, es war kein Bot. Wir konnten sehen, das ist ein Mensch.

Das schlimmste Konzept für mich ist der Durchschnitt, das arithmetische Mittel. Ist sage allen meinen Studierenden immer, ist der größte Feind der Statistik. Weil zum Beispiel in Google Analytics, da sehen wir immer einen Durchschnitt. Der wird sehr schnell verzerrt dadurch, dass solche Ausreißer da drin sind. Das sind Geschichten, wo ich mir wünschen würde zum Beispiel, dass die Maschinen das noch besser verstünden. Wo wir uns auch gerade mit beschäftigen hier, zu gucken, wie können wir sowas automatisiert erkennen, solche Ausreißer, die da nicht reingehören und dann erst mit der Datenanalyse anzufangen. Dann dieses Clustering zu bauen. Da ist momentan sehr viel Mensch drin und ich kann mir gut vorstellen, es gibt von Gartner diese Aussage, dass 80 Prozent der Analysten-Jobs wegfallen werden. Das wäre die Voraussetzung dafür, dass erstmal diese Daten viel sauberer sind. Was wahrscheinlich nie herausfallen wird, ist genau die Frage, wurden die Daten richtig erhoben? Weil da muss man wirklich nachdenken. Wir kennen das von unserer wunderbaren Facebook-Gruppe, die du gegründet hast, dass ganz offene Fragen sind, hey, welches Event wird wann getriggert und was messe ich damit eigentlich? Da gibt‘s noch so viele Fehlerquellen, dass wir glaube ich da noch gut Jobs haben werden. Aber wo es dann irgendwann hingehen wird, ist definitiv, dass mehr von diesen Ausreißern identifiziert werden und dann diese Cluster automatisch identifiziert werden können. #00:19:40.0#

Maik Bruns: Ich persönlich glaube, dass wir durch die KI sogar mehr Analyse-Jobs haben werden am Ende. Sicherlich fallen so Dinge weg wie das stumpfe Daten graben. So einfach mal nach Anomalien schauen, solche Dinge werden wegfallen. Aber ich glaube, dass der Business Impact viel größer wird auf Dauer, weil einfach die Analysen viel präziser sind. Weil das, was die KI vorbereiten kann am Ende, das wird einfach viel mehr sein. Du brauchst am Ende wahrscheinlich mehr Analysten, um mehr testen zu können auf der Seite, ob die Dinge richtig sind oder das Warum zu klären und so weiter. Deswegen glaube ich sogar, dass am Ende mehr Jobs sogar dabei rausspringen oder zumindest nur ein Teil der Analysten-Jobs wegfallen, die dann vielleicht eher so Reporting Monkey sind oder sowas. #00:20:24.7#

Tom Alby: Das weiß ich nicht. Ich bin nicht ganz sicher. Ich glaube, wir haben zwei Herausforderungen. Die erste Herausforderung: Es werden die richtigen Fragen gestellt. Wie kriege ich es hin, dass man zu einer Frage kommt, die man auch nachher bearbeiten kann? Da ist glaube ich die größte Herausforderung, ich sage meinen Studierenden immer, es gibt so eine Trilogie der Daten, nämlich Dateninformation und -Aktion. Sage denen immer, sie sollen es sich bitte auf den rechten Unterarm tätowieren. Falls du mal irgendwann Studierende von mir siehst mit so einem Tatttoo. Denn, wenn du die Aktion nicht weißt, was du mit der Information machst, dann brauchst du die Daten auch nicht. Das ist diese Kernfrage, die zuerst kommen muss. Wenn das gelöst ist, dann ist es auch viel einfacher dann eine Frage zu stellen. Ich glaube fest daran, dass wir in zwei, drei Jahren spätestens mit Analytics sprechen werden und dann einfach diese Fragen stellen können und im Hintergrund diese maschinellen Verfahren kommen werden. Dass es dann eher eine Frage ist, dass man für neue Applikationen dann halt diese Daten richtig bereitstellt. Aber wenn irgendwann ein Framework drüber sitzt, das tatsächlich die Semantik der Frage versteht und dann übersetzen kann in Intents und in Slots, wie es so schön heißt im Voice Processing und dann diese Analysen, Analyseergebnisse rausspuckt. Also interaktiv, du sprichst mit der KI, ich glaube, dass das schon kommen wird und nicht mehr so lange dauern wird. #00:21:48.4#

Maik Bruns: Du bist Computerlinguistik und du verstehst also Computer quasi. Das ist sicherlich besser als der allergrößte Teil der Menschen in Deutschland. Was kann denn so eine KI heute schon? Du hast jetzt ein-, zwei Mal schon die App erwähnt von Analytics. Ist die schon gut oder ist das im Moment noch Käse? #00:22:07.7#

Tom Alby: Puh! Ich spreche da lieber von Machine Learning als von KI, weil für mich KI noch ein bisschen dahinter ist. Bei Machine Learning sind wir schon glaube ich relativ weit und können es auch schon auf sehr viele Fälle anwenden. Ich bin immer so ein bisschen enttäuscht, wenn man so AI- oder KI-Events, Konferenzen, wir hatten letzte Woche eine hier in Hamburg. Dann fragte mich einer der Studierenden hinterher: Wo war eigentlich die KI in diesem Event? Es war trotzdem natürlich spannend, es war über Sparse Data und unser CTO hat was erzählt. War schon alles cool. Die Dinge, die wir momentan mit Machine Learning machen, sind vor allem die Geschichten, wo wir versuchen, diese Nutzerverhalten zu clustern mit Machine Cluster Verfahren oder vorherzusagen, was ein Nutzer tun wird oder ein Kunde tun wird. Ein Beispiel: Anhand der Historie in einem CRM kann vorhergesagt werden, ob der Kunde nochmal das kaufen wird. Wie groß ist seine Wahrscheinlichkeit, dass er kündigen wird? Das sind Geschichten, die immer einfacher werden, die auch viel schneller durchgearbeitet werden können. Wo die Hauptfrage mittlerweile nuir noch ist: Wie schnell komme ich an diese CRM-Daten ran? Wie stark müssen die bereinigt werden? Dann kriegt man auch echt relativ schnell schon eine Antwort. Das funktioniert super. Da haben wir auch in der Regel ganz gute Ergebnisse. Spannend wird es, wenn man halt tiefer gehen will in psychologische Eigenschaften. Ich habe gerade gestern ein ganz tolles Paper gelesen, da ging es darum, ob man anhand von Facebook-Posts die Persönlichkeit nach Myer-Briggs-Typen identifizieren kann? Das wäre natürlich phänomenal, wenn das ginge. Vorausgesetzt man glaubt an diese Personalitäten, die da identifizierbar definiert worden sind. Aber wenn das geht und das auch mit wenig Daten geht, dann wäre das schon phänomenal. Ich glaube, die Frage ist weniger, wieviel können wir mit Machine Learning tun? Die Frage ist eher, wie kriegen wir die Daten so hin, dass Machine Learning was mit anfangen kann. Denn gestern Abend zum Beispiel habe ich zwei Stunden daran gesessen, Daten, die super aussahen, so zu transformieren, dass ich sie in einen Algorithmus reinwerfen konnte. Ein Beispiel, man hat jetzt irgendwelche Daten, kategorische Daten und du brauchst aber numerische Daten und musst übersetzen, dass halt dann irgendein k-Means-Algorithmus damit was anfangen kann. Das sind so die Hauptfragen, die man sich dann stellt und nicht mehr eigentlich, ob der Machine Learning Algorithmus funktionieren wird, weil das tut er immer häufiger, wenn man ein bisschen Erfahrung hat. #00:24:58.0#

Maik Bruns: Verstehen wir das dann irgendwann alles noch? Nein, irgendwann sind wir raus oder? #00:25:02.5#

Tom Alby: Ich weiß noch, als wir das bei arefs.com gemacht hatten mit den Support Vector Machines. Man hat dann nicht mehr verstehen können, was der Algorithmus da gemacht hat. Man sieht dann noch irgendwie, er hat da und da das ein bisschen mehr gewichtet, aber gerade so bei einem Suchmaschinen Ranking, da sind so viele Faktoren drin, bei Google heutzutage über 200. Aber damals hatten wir auch schon, ich weiß nicht wie viele Faktoren drin und das schafft ein Mensch natürlich dann schon gar nicht mehr. #00:25:28.9#

Maik Bruns: In der Komplexität schon nicht und dann vor allen Dingen auch, wenn es dann dahin geht, dass sich KI selber programmiert irgendwann. Gibt’s jetzt schon die Aussagen von Google, dass das in Teilen schon nicht mehr so ganz verstanden wird, was da gemacht wird. #00:25:42.9#

Tom Alby: Ja. Die Frage ist dann wirklich: Wie kriegt man es hin, dass die Maschinen dann abgeschaltet werden können. Weil, wenn sie intelligenter sind als wir, dann werden sie irgendwas tun, damit das halt nicht passiert. #00:25:54.3#

Maik Bruns: Das stimmt, ja. Diesen großen roten Knopf, den man drücken muss. Hoffentlich gibt’s es den dann, wenn es mal so weit kommen sollte. Dann ist ehe egal, ob wir Analysten sind oder was auch immer. Mit welchem Programm baust du denn solche Machine Learning Sachen? #00:26:10.8#

Tom Alby: Wir arbeiten hier sehr viel mit R, das ist so die statistische Programmiersprache, auch eine Umgehung gleichzeitig. Zum Teil auch mit Python. Wir haben jetzt ein Projekt, wo Kollegen sagen, sie würden Scala ausprobieren. Wir haben einen Mitarbeiter, der Erfahrung mit so Mathlab hat und der Vorteil von R ist einfach, dass es sehr gute Bibliotheken dafür gibt, dass es Open Source. Es gibt mittlerweile auch genug andere Leute, die damit arbeiten, so dass man auch mal schnell jemand fragen kann. Früher war es schwierig, das war alles auf SPSS. Da habe ich meine Liebe zur Statistik nicht finden können. Es lag dann wirklich an dem Werkzeug mehr als an allem anderen. R ist etwas, was absolut mein Ding ist. Mancher unserer Entwicklerkollegen sagen immer, wie kann man nur so nahe an den Daten arbeiten. Aber das ist genau, was R ausmacht. Es gibt wunderbare Bibliotheken, zum Beispiel zu Google Analytics, zu Adobe Analytics. Es gibt Bibliotheken für Machine Learning, für Text Mining. Eigentlich gibt es fast nichts, was es nicht gibt. Ich hatte neulich etwas gehabt, wie hießt das normal? Inter-rater Reliabilty. Da musste ein Fragebogen ausgewertet werden und dann musste geschaut werden, wie weit die Beantwortenden auf einer Leiterskala auseinander sind? Wie stark sie sich einig waren? Da gab’s eine wunderbare Bibliothek. Einmal kurz gegoogelt und 3 Minuten später hatte man schon Ergebnisse, weil schon so viele Leute irgendwas mit R gemacht haben, egal in welcher esoterischen Ecke der Statistik. #00:27:57.1#

Maik Bruns: Esoterik ist ein gutes Stichwort. Einige halten Programmieren grundsätzlich für Esoterik. Man muss es irgendwie beherrschen. Ich frag mich manchmal, ich selber bin jetzt niemand, der R beherrscht, aber muss man es langfristig können, wenn man ein guter Webanalyst sein will oder ist das eher eine Ausprägung innerhalb der Webanalyse zum Beispiel? #00:28:20.7#

Tom Alby: Ich glaube, dass man manche Fragen nur damit beantworten kann, indem man irgendeine Sprache beherrscht, mit der man solche Auswertungen erstellen kann. Eine Frage, die mich häufig interessiert, sind zum Beispiel Nutzerpfade und gucken, vorhersagen, ob ein bestimmter Nutzerpfad zu Conversion führen könnte. Eine Conversion könnte sein, dass jemand einen Newsletter abonniert. Weil dann davon viele andere Dinge abhängen. Das finde ich schwer hinzukriegen in der Analytics-Oberfläche. Ich wüsste jetzt nicht, wie ich das tue. Ich hatte neulich mal so ein Thema gehabt, wo ich auswerten wollte, ob Nutzer mobil meine Texte mehr lesen auf dem Blog als Nutzer auf dem Desktop. Das war für mich einfacher, das kurz in R runter zu schreiben als das irgendwie zusammenzubauen in Data Studio oder mit irgendwelchen eigenen Dashboards in Analytics. Ich habe es ehrlichgesagt gar nicht hingekriegt aus den Segmenten. Das sah aber doof aus. Ich glaube, manche Fragestellung kriegt man halt nicht so einfach beantwortet. Immer vorausgesetzt, dass man die Rohdaten hat. Mit aggregierten Daten kann man eh meist nicht so viel anfangen finde ich. #00:29:35.6#

Maik Bruns: Gibt’s denn viele Menschen, die das deiner Meinung nach schon beherrschen so wie du das jetzt machst? #00:29:41.5#

Tom Alby: Witzigerweise gibt es schon Bibliotheken für solche Themen. Es gibt jemanden, der hat sich tatsächlich hingesetzt und hat eine Bibliothek geschrieben für Google Analytics. Der hat dann auch gleichzeitig geschrieben für die Webmaster Konsole von Google. Wir haben jetzt nicht so viele Leute glaube ich im Umkreis, die sich genau mit den Themen beschäftigen, wo wir uns hier gerade beschäftigen, aber ich glaube, dass es mehr werden wird. Ich glaube auch, dass die Statistik oder die statistischen Methoden einen viel höheren Stellenwert spielen sollten in der Webanalyse. Das ist nicht einfach. Du hast am Anfang mal gesagt, es geht darum die Menschen für Daten zu begeistern. Ist schwierig, denn eins habe ich gelernt hier und das war eine schmerzhafte Erfahrung. Dass manche Menschen einfach schreiend aus dem Raum rauslaufen, sobald ich eine Folie an die Wand werfe, wo Zahlen und Formeln drin sein. Weil die einfach so schlechte Erfahrungen in Mathe gemacht habe in der Schule, dass sie da eine Allergie haben. Ich war mal auf einer Party, da war auch Data Scientist und auch solche Menschen haben soziale Events. Der sagte zu mir: Tom ich mache das so, 80 Prozent Story 20 Prozent Daten. Da hat er vollkommen recht und ich merke halt, indem ich versuche da so ein bisschen mehr den Menschen entgegenzukommen und dass die dann auch eine höhere Bereitschaft zeigen sich auf das einzulassen. Aber ich merke auch zum Beispiel, wenn es komplex wird, bin ich vielleicht auch nicht mehr so der beste Erklärbär. Wir hatten zum Beispiel eine Geschichte gehabt mit so einem A/B-Test diese Woche, wo ich richtig nachdenken musste, welche Test-Statistiken wir da wählen und ob die Effekte genau isoliert worden sind. Da merkt man schnell, dass das, wenn du da nicht drauf geschult bist, hast du auch nicht so richtig Bock auf diese Komplexitäten. Dafür ist auch okay, dafür werde ich bezahlt. Aber ich glaube wirklich, dass es tatsächlich notwendig ist, da professioneller zu werden und sich nicht nur irgendwelche Werte anzuschauen. Ich nenne dir ein Beispiel, das ist für mich das Paradebeispiel. Es wird gerne mal geschaut, wie lange wird ein Video geschaut im Durchschnitt. Wenn man sich das mal genauer anschaut, dann sieht man ganz häufig, dass viele Menschen sich ein Video nur ganz kurz anschauen, die ersten paar Sekunden und dann etwas weniger Menschen sich ein Video bis zum Ende anschauen. Was sieht man in Analytics? Man sieht den Durchschnitt. Der ist irgendwo so kurz vor der Mitte. Was mache ich damit? Das ist etwas, wo ich denke, hm, Moment, da gibt es schon seit Ewigkeiten halt andere Ansätze, um sofort zu zeigen, hey, hier haben wir nicht irgendwie eine Normalverteilung, sondern eine andere Verteilung. Zum Beispiel wir haben den Median, wo wir sehen können, was die Mitte von den Werten. Oder den Modus, der Modus ist so ein Ansatz, wo ich jedes Mal eine Gänsehaut kriege, weil er so toll ist. Wo ich dann auch mehrere Hügel sehen kann. Das fehlt uns zum Beispiel in Google Analytics und da hatten wir auch die Diskussion gehabt, also in der Gruppe. Da sagten einige, hey, das ist zu komplex, dass würde mich nur abschrecken. Ja, das ist richtig. Aber auf der anderen Seite, wenn wir das nicht drin haben, dann ist es auch so, dass wir Werte kriegen, die halt nicht die Realität widerspiegeln. Wir fahren hier extrem gut damit, dass wir da uns die Rohdaten nehmen und dann selber nochmal statistische Analysen drauf fahre, um meinetwegen Standardabweichungen zu berechnen und zu gucken, ist das noch ein normales Verhalten oder nicht? #00:33:19.3#

Maik Bruns: Glaubst du denn, dass das, was wir mit diesen Machine Learning Möglichkeiten herauskitzeln können aus den Daten, sich am Ende oder auf welche Bereiche wirkt sich das am Ende alles aus? Was ist so deine Meinung? Bleibt das bei der Webanalyse, wird das immer tiefergehen oder …? #00:33:39.6#

Tom Alby: Webanalyse ist nur ein Teil von dem, was wir hier machen. Das ist zwar ein Teil, der sehr viel Spaß macht, aber wir arbeiten auch in anderen Bereichen. Sei es jetzt in dem Bereich, dass wir versuchen einer Maschine Wissen über ein Thema beizubringen, so dass diese Maschine selber Fragen beantworten kann. Ich darf jetzt nicht spezifischer werden, weil das sind Dinge, woran wir gerade arbeiten. Das ist nur eines von mehreren Themen. Am Ende des Tages geht es auch immer darum, wir haben irgendwelche Daten oder wir haben ein Problem und müssen dieses Problem mathematisch beantworten können, ohne dass jemand merkt, dass Mathematik dahintersteckt. #00:34:19.2#

Maik Bruns: Das ist Data Storytelling am Ende. #00:34:22.1#

Tom Alby: Genau. Das sind ganz viele verschiedene Bereiche. Es kann halt die Webanalyse sein, es kann sein, dass es um eine Mini KI geht in einem Bereich Es kann darum gehen, dass man ein neues Produkt erstellt, was basiert auf Machine Learning. #00:34:35.5#

Maik Bruns: Das ist sehr spannend. Ich finde, es gab immer Fortschritt im Leben der Menschen. Es wurde nicht jeder Fortschritt immer sofort willkommen geheißen. Denkt man so zurück an Kutschen, Autos, Telefon, Internet, E-Mail und jetzt halten wir alle so ein Gerät in der Hand, diese Smartphones. Es gibt heute noch Leute, die sie einfach komplett verteufeln sogar und nie eines brauchen. Die werden dann irgendwann vor den selbstfahrenden Autos stehen und nicht einsteigen wollen. Ich finde, es gibt einfach so unglaublich viele Möglichkeiten, die sich durch diese Machine Learning Entwicklungen ergeben. Jetzt mal auch außerhalb unserer Marketing-Welt vielleicht mal so den Bereich Medizin. Ich habe neulich auch was Schönes gelesen, ist jetzt vielleicht ein bisschen off topic, aber schön gelesen, dass z.B. bestimmte Hautkrebsarten von Maschinen einfach wesentlich effizienter schon anhand eines Bildes erkannt werden können. Da muss ich sich dann möglicherweise nur mal jemand, wenn er eine Diagnostik braucht, einfach ein Smartphone in die Hand nehmen, ein Foto von seiner Haut machen von der betroffenen Stelle, die an so eine KI schicken oder an einen Machine Learning Algorithmus schicken und eine Minute später weiß er, ob alles okay ist oder nicht. Während man sonst bei einem Dermatologen irgendwie wochenlang auf einen Termin warten muss. Ich glaube, solche Dinge da kann man glaube ich eine ganze Menge rausziehen, wenn man die Algorithmen entsprechend kompatibel hinbekommt zu den Daten einfach. Sodass am Ende jeder Idiot mit sowas dann auch umgehen kann. Also in so eine App reinsprechen, seine Frage stellen und dann daraus am Ende eine vernünftige Antwort bekommen, mit der man Business Impact erzeugen kann. Das ist so mein Traum dahinter auch. Auch wenn ich nicht alles verstehe. #00:36:16.6#

Tom Alby: Ja witzig, dass du das Hautkrebs-Beispiel bringst, weil meine Frau ist Hautärztin und wir haben genau das Thema auch schon öfter besprochen am Abendbrottisch. Es gibt da schon diese Ansätze, leider ist in Deutschland das so nicht erlaubt. Sonst würde das wahrscheinlich schon längst da sein. Weil natürlich ist es vollkommen richtig, wann suche die Leute nach Hautkrebs? Vor allem nach dem Sommerurlaub. Dann haben sie alle Angst, dann sind auch die Medien voll davon. Hey, creme dich ein, sonst stirbst du. Dann sind die Wartezeiten lang und klar wäre es dann toll, wenn man sagen könnte, ich schaue mit einer App da drauf und du hast die False- Negatives und die False-Positives und so weiter und so fort und das kannst du eigentlich so nur nachher herausfinden, wenn es rausgeschnitten worden ist und untersucht worden. Also selbst ein Hautarzt kann sich nicht hundertprozentig sicher sein und so kann es die Maschine auch nicht sein, weil das normal untersucht werden muss. Dann stellen wir uns so vor, es passiert, dass jemand so eine App nutzt und es kam raus, ist nichts und in Wirklichkeit ist es doch was und der Mensch verklagt dann die Firma, die das …. Von daher glaube ich, ja, es ist möglich und ich glaube auch, dass es als Unterstützung sehr gut ist. Angenommen jeder Arzt müsste seine Hautkrebsbilder und Nicht-Hautkrebsbilder einschicken, die haben alle schon einen Fotofinder, man würde hinterher das abgleichen mit der wie hießt das nochmal, dieser Begriff, wo die halt das rausgeschnitten haben und untersuchen und Biopsie? Ich weiß nicht, wie es hieß, und man hätte dann eine Datenbank, hier, das sind die Bilder und das ist es gewesen oder nicht und es würden alle Ärzte machen. Was das für ein Wissen wäre und wofür man es verwenden könnte, aber da haben wir so viele Datenschutzprobleme und noch so viele andere Silodenken-Probleme, dass das so schnell nicht kommen wird. Aber man sieht auf der anderen Seite auch, dass so viele medizinische Neuerungen kommen, dass ein Arzt das gar nicht mehr bewältigen kann. Ich habe mal irgendwann gehört, von meiner Frau glaube ich, dass es von der wissenschaftlichen Forschung bis in die Arztpraxis 10 Jahre dauern kann. Jetzt stellen wir uns mal vor, wir hätten in jeder Arztpraxis so einen Watson und der würde mithören können und könnte auf dem Screen zeigen, hey hör mal, ich glaube, da gab’s vor drei Jahren irgendwie so eine Untersuchung dort und dort, das wäre nicht schlecht. Wir wissen aber auch, dass das Bild von Watson in den Medien ein anderes ist als es das bei Watson tatsächlich in der Realität manchmal zu leisten imstande ist. #00:38:54.5#

Maik Bruns: Ich glaube, das ist auch der große Punkt, den wir vielleicht noch besprechen sollten. Nämlich wie können Menschen und Maschinen an der Stelle einfach Hand in Hand gehen. Ich glaube, zum Beispiel, klar, Maschinen können vieles gut vorbereiten, weil sie Daten extrem effizient zum Beispiel durchforsten können, das ist ihr Job eigentlich. Aber auf der anderen Seite braucht es Menschen, die entscheiden, was machen wir jetzt mit diesem neuen Wissen, das wir dahaben? Wie verändern wir jetzt Dinge zu unseren Gunsten? Oder was machen wir daraus? Kurzum, was meinst du, wie können so Machine Learning und Webanalysten Hand in Hand gehen? #00:39:29.7#

Tom Alby: Wir hatten vorhin schon den Punkt gehabt, dass die Frage am Anfang die wichtigste ist. Wenn du dich an das Tattoo erinnerst, dass ich meine Studierenden versuche zu überreden, dass sie … #00:39:40.3#

Maik Bruns: Daten, Information, Aktion. Habe ich schon eintätowiert. #00:39:44.0#

Tom Alby: Sehr gut. Rechter Unterarm war das, linker Unterarm war Segmente. Das ist cool, die Studierenden erinnern sich daran. Durch dieses komische Bild erinnern sie sich daran. Aber wenn man das ernstnimmt, dann merkt man schnell, naja es kommt am Ende des Tages nur auf diese Fragen an, dass diese Fragen gestellt werden. Ich glaube, das ist der Part, den man jetzt nicht so schnell hinkriegen kann in der KI. Das fände ich auch ein bisschen gruselig, wenn ich ganz ehrlich bin. #00:40:15.1#

Maik Bruns: Das hat schon philosophische Ansätze. #00:40:17.2#

Tom Alby: Definitiv. Lohnt es sich die Menschheit am Leben zu erhalten? Ich weiß es nicht. Nein. (Maik Bruns: Ja, nein, vielleicht.) Vielleicht, aber das andere wird definitiv kommen, dass die Maschinen diese Fragen beantworten können basierend auf einer natürlich gesprochenen Sprache, keine Expertengeschichte. Das wird passieren und am Ende wird der gewinnen, der die besten Fragen stellt. Das ist eigentlich heute schon der Fall. Heute ist es schon der Fall. Nur dass die Menschen das irgendwie abarbeiten müssen und dass es zu wenig von diesen Menschen gibt. Das ist das Hauptproblem heute. Es werden die falschen Fragen stellt. Wir haben nicht genug Leute, die diese Daten auswerten können. #00:40:54.1#

Maik Bruns: Wo können die Leute denn herkommen? #00:40:55.4#

Tom Alby: Wir machen das so, dass wir tatsächlich, ich habe ein Lehrauftrag an der HW hier in Hamburg und ich bilde selber Leute aus. Das ist eigentlich ein sehr gutes Modell, weil ich A erstmal im Seminar merke, wer ist hier jemand, der auch wirklich Bock auf das Thema hat. Dann weißt du auch genau, was die Leute können. Denn jeden Tag ruft hier ein Headhunter an und sagt, ich habe hier einen ganz tollen Typen, der sieht schon von vornherein was in Daten das Problem ist und kann jede Sprache. Und in Interviews von so Menschen und dann merkst du, er hat irgendwie R Studio in sein CV geschrieben, weil er es einmal installiert hat, hat es aber nie benutzt. Aber da steht dann plötzlich irgendwie, Professional Level of R. Es ist total schwer Leute zu kriegen, die genau das machen, was wir brauchen und was die meisten brauchen. Ich habe auch gemerkt, dass du unterschiedliche Schwerpunkte setzen musst. Ich bin eher so von allem etwas und nichts richtig. Dann hast du aber Menschen, die können total gut mit Machine Learning Themen umgehen. Die verstehen auch, welcher Algorithmus muss wo verwendet werden oder sollte mal ausprobiert werden. In der Regel hast du mehrere Algorithmen, die du ausprobierst. Die können aber nicht so gut diese Daten irgendwie akquirieren. Ich kann nicht hier meinen Leuten sagen, setzt doch mal ein Tracking Konzept auf und implementiert das mit Tag Manager und mit Events und JavaScript. Das macht keiner bei uns hier. Oder eine Person kann das hier. Aber es ist nicht der Hauptjob der Leute, die diese Daten analysieren. Dann haben wir andere Themen wie zum Beispiel, das wird oft vernachlässigt, wir haben auch so qualitative Umfragen hier, so Fragebögen. Wie muss eine Frage gestellt werden? Wie muss der Fragebogen ausgewertet werden? Oder wie wird so ein Sample für die Befragung ausgewählt? Auch das ist ein Thema, war wir hier mitmachen in diesem Daten- und Analyse-Teil. Das sind unterschiedliche Qualifikationen und die wirst du alle nicht in einer Person kriegen. Wenn es um Themen geht wie, was wir auch öfter haben. Du hast eine riesengroße Datenmenge von 50 Gigabyte und die muss schnell prozessiert werden, dann musst du auch jemand haben, der sich mal kurz damit auseinandersetzt wie auf AWS oder in der Google Cloud Plattform mal ein Cluster erstellt wird, zusammengebaut wird, auf dem wir mal R für eine Stunde laufen lassen können, um diese Daten zu prozessieren. Das sind alles ganz viele verschiedene Qualifikationen, die nötig werden und das ist genau die Herausforderung, dass wir am Anfang stehen von Data Science und dementsprechend viel von allem versuchen zu können, aber sich weiter spezialisieren wird. Dass wir einen Data Engineer haben, der dieses AWS-Gedöns macht, dann haben wir jemanden, der genau weiß, wie diese Daten akquiriert werden können und wir haben nachher denjenigen, der diese Machine Learning Modelle anwenden kann. Ich glaube, darauf wird es dann in den nächsten drei, vier, fünf Jahren hinauslaufen. #00:43:51.1#

Maik Bruns: Kannst du dir langfristig eigentlich keine Analyse mehr ohne Machine Learning vorstellen? #00:43:56.4#

Tom Alby: Ja. #00:43:56.9#

Maik Bruns: Höre ich das so richtig raus? #00:43:58.2#

Tom Alby: So kleine Analysen natürlich schon, also wie so ein Fragebogen ausgewertet wird und das kannst du natürlich ohne machen. Wenn es so kleinere Geschichten sind. Aber sobald das ein bisschen komplexer wird, kann ich mir das nicht mehr ohne Machine Learning vorstellen. #00:44:11.4#

Maik Bruns: Das ist ein starkes Statement finde ich. #00:44:13.4#

Tom Alby: Mein Traum ist eigentlich, dass ich einer Maschine Daten gebe und sie hat dann 10 Minuten Zeit erstmal alle grundsätzlichen Muster der Daten zu identifizieren. Die mir dann hinterher sagt, hey, das sind die Ansatzpunkte, in die du bitte reingehst. Das ist genauso mein Traum eigentlich, weil mich das am meisten Zeit kostet. #00:44:35.4#

Maik Bruns: 10 Jahre oder 15 Jahre, wie lang gibst du dem Traum? #00:44:39.2#

Tom Alby: Weniger, so zwei, drei Jahre. #00:44:40.8#

Maik Bruns: Weniger, zwei, drei Jahre. Dann bin ich gespannt. Dann sprechen wir uns einfach nochmal, dann machen wir die nächste Folge. Du findest das dann alles in der Zwischenzeit schon mal raus für uns. Das finde ich super. Tom, ich würde gerne von dir gleich noch 3 Tipps hören, mit welchen du den Webanalysten in dieser Richtung helfen würdest? Was wäre das? #00:45:07.0#

Drei Tipps von Tom Alby für Webanalysten zum Thema Machine Learning, Statistik

Tom Alby: Also in dieser Richtung, Richtung Machine Learning, Statistik? #00:45:10.6#

Maik Bruns: Genau, richtig genau. #00:45:12.4#

Tom Alby: Okay. Huh! #00:45:18.7#

Maik Bruns: Können auch 4 sein. #00:45:20.0#

Tom Alby: Ich habe jetzt gerade über Weihnachten oder nach Weihnachten ein wunderbares Buch gelesen. Jetzt muss ich mal gerade schauen nebenbei, wie das hieß. Es war ich glaube „Adventure in Statistics“. Das ist so eine Art Roman, in dem der Protagonist nach und nach immer mehr über Statistik lernt, um seine Traumfrau wiederzufinden oder seine Frau, die irgendwie verschwunden ist, wieder zu finden. Ich habe das Buch verschlungen. Es war phänomenal. Klar, das meiste wusste ich natürlich schon. Aber zu sehen, wie kriegt der das hin zu vermitteln. Da habe ich mir viel abgeschaut für das Sommersemester, weil ich dann wieder Datenanalyse unterrichte an der HW. Phänomenal, wie er das hingekriegt hat. Nicht alles wird man brauchen, aber so ein Paar Konzepte. Ein Beispiel, ein wunderbares Beispiel. Die meisten wissen glaube ich nicht, wie Google Optimize zum Beispiel berechnet, wer der Gewinner in einem A/B-Test ist. Die meisten Tools machen das so, dass sie mit so Nullhypothesen arbeiten und dann dieses Null Hyperthesis Significance Testing. Das macht Google nicht. Die nehmen Bayes Inference. Er beschreibt das in diesem Buch anhand von zwei Geheimbünden. Der eine Geheimbund, der an diese Null Hyperthesis Significance Testing glaubt. Der andere Bund, der an Bayes glaubt. Phänomenal. Wirklich ganz toll beschrieben. Es werden die Vor- und Nachteile da erläutert. Du merkst auch sofort die Relevanz für unser Thema. Wenn du Adobe Analytics verwendest, dann hast du zum Beispiel eine ganz andere Teststatistik dahinter, die eventuell nicht so stark ist wie das Bayes-Verfahren, was also bei Google Optimize verwendet wird. Aber auch nicht bei jeder Fragestellung. Aber das verstehst du auf jeden Fall nach diesem Buch.

Dann habe ich auf der Literaturliste für die Studierenden ein Buch. Ich glaube es hießt Data Science for Business. Muss ich nochmal schauen wie es genau hieß. Das war sehr gut, weil es. auf einer Ebene von ganz oben, also was ist das Business Problem, runter zu den ersten Algorithmen, ohne jetzt Programmiercode drin zu haben, erklärt, wie kriegt man diese beiden Dinge zusammen? Er erklärte dann Supervised Learning, Unsupervised Learning, die verschiedenen Clustering Verfahren. Es ist eine wunderbare Einführung in das ganze Thema Data Science und wie man die richtigen Fragen stellt. Das wären 2 Tipps, die ich habe.

Der Andy Field, nein das machen wir anders. Es gibt eine wunderbare R Einführung, die kostenlos ist und die hieß, die ist im O’Reilly Verlag erschienen. Die heißt R for Data Science. Der Autor hat den ganzen Text auf einer Webseite drauf, irgendwo in Neuseeland. Ich schicke dir den Link hinterher, dann kannst du den auch verlinken für die Podcast-Zuhörer. (Maik Bruns: Ja, mache ich.) Heißt, wir hätten das Thema Statistik, wir hätten das Thema Machine Learning und das Thema R. Also 3 Tipps, wie man mit diesem Thema weiterkommen kann. #00:48:28.1#

Maik Bruns: Cool. Super. Das ist cool. Ich glaube da wird der ein oder andere, ich habe mir alles unterstrichen, da wird der eine oder andere sich sicherlich wiederfinden und die Bücher verlinke ich auf jeden Fall und auch die Webseite, wo das R aufgeführt ist auf jeden Fall auch. Supercool. Das ist perfekt. Sehr schön. Ein hervorragender toller Abschluss, wie ich finde. Ich glaube Tom, du hast die Geschichte den Leuten wirklich sehr viel näher bringen können nochmal und auch mal so ein bisschen vielleicht auch erklärt, wo in Zukunft Analysen oder Analysten-Jobs vielleicht nicht mehr so nötig sind oder vielleicht doch noch nötig sind. Ich glaube, da haben wir heute ein ganz interessantes Gespräch gehabt. #00:49:08.0#

Tom Alby: Das freut mich. #00:49:09.3#

Maik Bruns: Mich freut es erst recht. Ich danke dir vielmals dafür und sage allen Hörern auf jeden Fall mal: Toll, dass ihr dabei ward, auch bis jetzt. Wir haben immerhin schon wieder knapp 50 Minuten rum. Aber super. Ich glaube das lohnt sich sowas zu hören und sich mit dem Thema auseinanderzusetzen. Weil dann wisst ihr, ob euer Job weg ist nicht oder nicht irgendwann. Oder was ihr in Zukunft machen sollt. Ich würde sagen, bleibt einfach weiter dran und kommt einfach zur nächsten Folge wieder. Tom, du hast das letzte Wort und macht es gut. Bis dahin. #00:49:37.1#

Tom Alby: Vielen Dank fürs Zuhören. #00:49:38.5#

 


Abonniere auf Android Abonniere auf iTunes

Maik Bruns

Gründer und Inhaber bei Metrika e. K.
Seit Jahren ist er der Webanalyse mit Google Analytics und dem Google Tag Manager stark verbunden - und er vermittelt jederzeit den Spaß daran an alle, die ihn kennenlernen.

Er schreibt und bloggt zu diesen Themen, wenn er nicht gerade unterwegs oder bei seiner Familie ist. Ferner ist er in verschiedenen sozialen Netzwerken zu finden, um dort das Wissen über Webanalyse weiterzugeben.

Er hostet den Podcast "Die Sendung mit der Metrik", spricht zu Webanalyse-Themen auf Konferenzen und gibt Seminare/Workshops vor allem zu Google Analytics, Google Tag Manager und Google Data Studio.

Nebenbei fotografiert er leidenschaftlich gerne und hat mit Freeletics einen Sportnachfolger für Volleyball gefunden.

Twitter Facebook Instagram Google+ LinkedIn   XING

Maik Bruns ist seit Jahren der Webanalyse mit Google Analytics und dem Google Tag Manager stark verbunden. Er schreibt und bloggt zu diesen Themen, wenn er nicht gerade unterwegs oder bei seiner Familie ist und ist in verschiedenen sozialen Netzwerken zu finden. Er spricht außerdem zu Webanalyse- und SEO-Themen auf Konferenzen und gibt Seminare/Workshops zum Thema Google Analytics und Google Tag Manager. Nebenbei fotografiert er leidenschaftlich gerne und hat mit Freeletics einen Sportnachfolger für Volleyball gefunden. Twitter Google+ LinkedIn XING

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Top