Oura vs. Whoop vs. Apple Watch: Der „Quantified Scientist“ über die Aussagekraft der Genauigkeitsdaten

Geschrieben von 16 Minuten Lesezeit
Oura vs. Whoop vs. Apple Watch: Der „Quantified Scientist“ über die Aussagekraft der Genauigkeitsdaten

Rob ter Horst beobachtet seinen eigenen Körper bis ins kleinste Detail. Seit 2018 lässt er jede Woche eine MRT-Untersuchung seines Gehirns durchführen – insgesamt zwischen 250 und 300 Scans –, weshalb er vermutet, dass sein Gehirn das am häufigsten gescannte der Welt sein könnte. Jede Nacht schläft er mit einem EEG am Kopf. Er hat rund 250 seiner eigenen Darmmikrobiom-Proben analysiert. Mehrere Jahre lang nahm das Messen mehr als elf Stunden pro Woche in Anspruch. Als „The Quantified Scientist“ hat er sich eine Fangemeinde aufgebaut, indem er Wearables nicht anhand ihrer Funktionen testete, sondern daran, ob ihre Messwerte mit Referenzgeräten in Laborqualität mithalten können.

Was seine Gesundheit am meisten verändert hat, war kein Gehirnscan. Es war ein einfaches Fitbit vor Jahren, das ihm zeigte, dass er weniger als sechs Stunden pro Nacht schlief, ohne es zu merken. Diese Spannung zieht sich durch alles, was er hier sagt: der Unterschied zwischen Daten, die dir wirklich helfen, und Daten, die dich nur verunsichern oder schlechter dran machen. Wir stellten ihm die Frage, die unsere Community am häufigsten stellt: Oura versus Whoop versus Apple Watch – und gingen dann noch weiter: Welchen Schlafdaten kann man vertrauen und welche sollte man ignorieren? Wann bringt das Tracken mehr Schaden als Nutzen? Lohnt sich ein kontinuierliches Blutzuckermessgerät? Und welche zwei oder drei Werte sollte ein vielbeschäftigter Mensch eigentlich im Auge behalten?

Auffällig ist, wie oft er dir rät, weniger statt mehr zu tracken und den einfachen Signalen mehr zu vertrauen als den proprietären Werten.

Hier ist unser Gespräch.

1. Dein eigenes Tracking-Setup ist auf einem ganz anderen Niveau: mehr als elf Stunden Messungen pro Woche, eine wöchentliche MRT des Gehirns, ein Schlaf-EEG, sogar Probenahmen des Darmmikrobioms. Wie kam es dazu, und was ist das Überraschendste, das du über deinen eigenen Körper gelernt hast?

Es begann während meiner Promotion, die sich mit der Analyse biologischer Daten befasste. Damals war ich auch viel in der Wissenschaftskommunikation tätig und stellte fest, dass der Teil der Datenanalyse schwer zu erklären war, besonders wenn die Daten komplex waren. Also wollte ich Daten, mit denen es Spaß machte, zu arbeiten. Ich kaufte mir ein Wearable, zeichnete mein Musikhörverhalten auf und stellte einen Zusammenhang zwischen verschiedenen Künstlern und meiner Herzfrequenz her, während ich ihre Musik hörte – rein als spielerische Übung in der Datenwissenschaft. Das brachte mich auf die Idee, noch ein bisschen mehr zu erfassen und zu sehen, was ich daraus lernen könnte – teils als Lehrbeispiel für Datenwissenschaft, teils als persönliches wissenschaftliches Projekt, das sich über mehrere Jahre erstrecken sollte. Dann geriet das Ganze etwas außer Kontrolle. Seit 2018 lasse ich wöchentlich ein MRT meines Gehirns machen, und ich vermute, dass mein Gehirn mit etwa 250 bis 300 Scans das am häufigsten gescannte der Welt ist. Ich schlafe jede Nacht mit einem EEG. Außerdem habe ich etwa 250 Darmmikrobiom-Proben genommen, bevor ich damit aufgehört habe – hauptsächlich wegen der Kosten. Das „Eleven Hours“-Projekt lief mehrere Jahre lang, und ich habe es seitdem gestrafft, indem ich die zeitaufwendigsten Teile gestrichen habe, wie zum Beispiel detaillierte tägliche Fragebögen und morgendliche Reaktionsgeschwindigkeitstests.

Das Überraschendste kam von dem einfachsten Gerät. Schon früh hatte ich ein Fitbit Charge 2, nur um meinen Schlaf zu tracken. Mir war gar nicht bewusst, dass ich im Durchschnitt weniger als sechs Stunden pro Nacht schlief, weil ich so viele Dinge gleichzeitig erledigte. Diese Zahl vor mir zu sehen und festzustellen, dass sie immer weiter gesunken war, hat mein Verhalten am stärksten verändert. Etwas vage im Hinterkopf zu wissen, ist etwas ganz anderes, als es als Daten vor sich zu sehen.

2. Wie kam es dazu, dass aus dem persönlichen Tracking das Testen von Geräten für ein Publikum wurde?

Als ich mich erst einmal intensiv mit dem Tracking beschäftigt hatte, wollte ich die besten Wearables finden, aber die Testberichte, die ich finden konnte, gingen bei den meisten Messwerten nur sehr oberflächlich ins Detail – mit der möglichen Ausnahme von Herzfrequenz und, bis zu einem gewissen Grad, GPS. Also schwebte mir diese Idee eine Weile im Hinterkopf herum. Es war eigentlich mein Friseur, der mir vorschlug, die Geräte selbst zu testen. Zuerst hatte ich keine Zeit, weil ich gerade ein Postdoc-Stipendium antrat, aber dann kam die Pandemie und ich startete meinen YouTube-Kanal mit den Daten, die ich bereits von meinem Fitbit und dem Oura-Ring hatte, den ich trug. Von da an wuchs das Ganze ganz organisch.

Kostenloser Guide: Pro Langlebigkeit Dashboard

Füge 20+ gesunde Jahre zu Deinem Leben hinzu

(Auch mit wenig Zeit und Wissen)

Mit der Anmeldung wirst du auch für den New Zapiens Newsletter registriert

25.000+ Downloads • 100 % kostenlos

Pro Langlebigkeit Dashboard

3. Die Frage, die unsere Community am häufigsten stellt, ist: Oura versus Whoop versus Apple Watch. Wenn man sich eher an deinen Genauigkeitsdaten als am Marketing orientiert – wie schneiden sie tatsächlich im Vergleich ab, und ändert sich die Antwort je nachdem, was jemand tracken möchte?

Ja, die Antwort hängt davon ab, denn diese Geräte richten sich sowohl hinsichtlich ihrer Funktionen als auch ihrer Genauigkeit an unterschiedliche Zielgruppen. Einfach ausgedrückt: Wenn du nur Rohdaten willst, liefert die Apple Watch qualitativ gute Werte für Schlaf und Herzfrequenz, bietet aber keine Auswertung und die Visualisierung ist schwach. Um die Daten zu verstehen, bräuchtest du eine „Übersetzungsebene“, also eine zusätzliche App wie Bevel oder Athlytic – ich habe diese allerdings nicht speziell getestet, da sie selbst keine neuen Daten generieren. Oura und Whoop schneiden beide gut ab und präsentieren die Daten weitaus besser. Oura ist beim Schlaf etwas besser, Whoop beim Sport etwas besser, und die Apple Watch ist in beiden Bereichen solide. Whoop richtet sich eher an Sportler, Oura eher an Schlafdaten, und die Herzfrequenzmessung von Oura beim Sport ist nicht besonders zuverlässig. Mittlerweile gibt es auch neuere Konkurrenten wie das Google Fitbit, das zumindest bei mir recht gut funktioniert.

4. Du hast gesagt, es gibt kein einziges bestes Gerät, sondern nur die richtige Kombination für die jeweilige Person. Wie sollte sich jemand entscheiden, der einfach nur ein Gerät kaufen und dann weitermachen will?

Entscheide zunächst, worauf du dich eigentlich konzentrieren möchtest: Schlaf, Sport, allgemeine Gesundheit oder alles zusammen – und wie wichtig dir die App-Erfahrung ist. Von da an wird die Wahl klarer. Wenn du GPS willst, ist Garmin eines der besten Geräte, und Coros schneidet ebenfalls gut ab. Wenn dir vor allem der Schlaf wichtig ist und du etwas Kleines suchst, ist der Oura Ring sehr gut. Wenn du etwas ohne Bildschirm suchst, eher so ein Armband, ist das Google Fitbit ein gutes Einsteigergerät. Wenn du sehr aktiv bist, ist die Whoop-App immer noch etwas besser als die von Fitbit, aber es gibt einen großen Preisunterschied, daher musst du dir sicher sein, dass du sie wirklich brauchst. Interessanterweise war die Datenqualität bei mir persönlich beim Google Fitbit besser als beim Whoop-Armband, obwohl Whoop immer noch zu den besseren Geräten gehört. Und wenn du auch ein richtiges Smartwatch-Erlebnis willst, sind die Apple Watch oder die Google Pixel Watch gute Wahlmöglichkeiten. Es kommt wirklich darauf an, was du damit machen willst, welche eigenen Einschränkungen du hast und wie die Akkulaufzeit ist – die bei Smartwatches ziemlich schlecht ist.

5. Du testest diese Geräte anhand geeigneter Referenzgeräte. Welche gängigen Messwerte halten gut stand, welche sind weitaus unzuverlässiger, als man annimmt, und gibt es eine Funktion, die sich im Marketing brillant präsentiert, aber im Test völlig versagt?

Meine Referenzgeräte reichen von großartig bis gut. Meine Schlafüberwachung zum Beispiel ist gut genug, um ein Urteil zu fällen, auch wenn sie nicht perfekt ist. Die Herzfrequenz schneidet sehr gut ab. Sie ist klar definiert, manche Geräte messen sie wirklich genau, und sie lässt sich leicht bei mehreren Personen testen, sodass wir mit Sicherheit sagen können, dass ein bestimmtes Gerät für die meisten Nutzer gut funktioniert. Ähnlich verhält es sich mit der Herzfrequenzvariabilität während der Nacht.

Die Schlafphasen sind weitaus unzuverlässiger, als man annimmt. Sie weisen immer eine relativ hohe Fehlerquote auf, denn selbst mit den besten Goldstandard-Geräten der Welt stimmen zwei unabhängige Personen, die dieselben Daten analysieren, nur in etwa neunzig Prozent der Fälle überein. Das liegt zum Teil an den Definitionen. Wir behandeln Tiefschlaf und REM-Schlaf als getrennte Phasen, aber in Wirklichkeit gibt es Übergangsphasen, nicht jeder Tief- oder REM-Schlaf ist gleich, und es gibt sogar REM-Schlaf ohne Augenbewegungen, obwohl REM für „Rapid Eye Movement“ steht. Die Definitionen selbst sind unübersichtlich.

Was eine Funktion angeht, die zunächst brillant vermarktet wird und dann scheitert, würde ich keine bestimmte hervorheben. Was ich stattdessen sehe, ist eine Menge allgemeiner Übertreibung. Ein Unternehmen behauptet, es könne Schlafphasen hervorragend erfassen, bringt dann ein Jahr später eine verbesserte Version heraus, was stillschweigend andeutet, dass die erste Behauptung übertrieben war. Es geht weniger um eine einzelne gescheiterte Funktion als vielmehr um ein Muster der generellen Übertreibung bei der Qualitätsdarstellung.

6. Was braucht es eigentlich, um ein Gerät ordentlich zu testen, und welcher Teil des Prozesses würde die Leute überraschen?

Ich schlafe jede Nacht mit einem EEG auf dem Kopf. Es ist keine vollständige Polysomnographie, aber es sind mehrere Elektroden in einem ziemlich schlanken Gehäuse. Die Analyse der Daten erfordert Programmierkenntnisse oder zumindest ein Data-Science-Setup, das die meisten Leute nicht selbst hinbekommen würden. Alle sieben Tage nehme ich die SD-Karte heraus, analysiere die Daten und stecke sie wieder rein. Es ist also viel manuelle Arbeit damit verbunden. Der Teil, der die Leute wahrscheinlich am meisten überrascht, ist die menschliche Seite der Sache. Das Gerät hat blinkende Lichter, die ich nachts meistens ausschalte, aber wer schon mal mit mir im Bett gelegen hat, fand das vielleicht nicht gerade besonders attraktiv.

7. Schlafüberwachung ist mittlerweile allgegenwärtig. Wie genau können Verbrauchergeräte deine Schlafphasen mittlerweile erfassen, und wie sehr sollte man diesem nächtlichen Schlaf-Score vertrauen?

Das sind zwei verschiedene Dinge. Schlafphasen sind eine Sache, der Schlaf-Score eine andere. Während der Nacht lohnt es sich, mehrere Signale zusammen zu erfassen – nicht nur die Schlafphasen, sondern auch die Herzfrequenz, die Herzfrequenzvariabilität und wie sich diese Muster im Laufe der Nacht verändern. Wenn deine Herzfrequenz zum Beispiel im Vergleich zum Normalwert langsam absinkt, könnte das darauf hindeuten, dass du zu viel gegessen oder zu spät vor dem Schlafengehen trainiert hast. Der Schlaf-Score fasst dann mehrere dieser Signale zusammen, aber diese Werte sind proprietär, lassen sich nicht geräteübergreifend vergleichen, und manchmal wissen wir nicht einmal, wie sie berechnet werden, was ihre Interpretation erschwert.

Was die Schlafphasen selbst angeht, werden die Geräte für Endverbraucher immer besser, und dank KI und Grundmodellen gehe ich davon aus, dass sie sich weiter verbessern werden – möglicherweise erreichen sie schon bald das Niveau eines sehr guten EEGs, nahe an der Polysomnographie, auch wenn sie diese nicht ganz erreichen. Einige Geräte sind bereits recht gut. Mein Rat ist, Muster über einen längeren Zeitraum zu betrachten, anstatt sich auf einzelne Nächte zu versteifen. Tage mit großen Ausreißern sind besonders interessant und liefern das zuverlässigere Signal. Bei subtilen Veränderungen wäre ich vorsichtiger, es sei denn, sie halten über einen längeren Zeitraum an.

8. Manche Leute checken ihren Erholungswert, noch bevor sie überhaupt aus dem Bett steigen. Wann verbessert das Tracking tatsächlich die Gesundheit, und wann schadet es mehr, als es nützt?

Das ist sehr individuell und schwer vollständig zu beantworten. Es gibt Studien, die zeigen, dass das Tracking bei manchen Menschen wahrscheinlich mehr schadet als nützt, während es bei anderen neutral oder positiv wirkt. Manche Menschen reagieren empfindlich darauf: Wenn der Tracker eine schlechte Nacht anzeigt, ignorieren sie, wie sie sich tatsächlich fühlen, und lassen sich so sehr von der Zahl beeinflussen, dass ihre Schlafqualität tatsächlich darunter leidet. Hoffentlich kann Coaching – das bereits bis zu einem gewissen Grad durch KI erfolgt und noch besser werden wird – dabei helfen, die Daten schonender zu interpretieren. Schädlich wird es, wenn eine Kennzahl zu einem zu starren Ziel wird, wie zum Beispiel das Bedürfnis, jeden Tag einen Schlafwert über einer bestimmten Zahl zu erreichen, oder das Beharren auf einem festen Prozentsatz an Tiefschlaf. Richtig genutzt, dienen die Daten als Orientierungshilfe neben deinen subjektiven Empfindungen und dem, was in deinem Leben wirklich zählt. Wenn ein Freund heiratet, lohnt es sich wahrscheinlich, etwas Schlaf zu opfern, um dabei zu sein und diese Erinnerung zu schaffen. Auf TikTok zu scrollen, wahrscheinlich nicht. Diese Dinge sind selten schwarz-weiß.

9. Auf welche zwei oder drei Zahlen sollte ein vielbeschäftigter Mensch, der neugierig ist, sich aber nicht darauf versteifen will, tatsächlich achten?

Auch das hängt von deinem Ziel ab. Wenn du fitter werden willst, behalte deine Ruheherzfrequenz während der Nacht im Auge und betrachte einen sinkenden Wert als Zeichen dafür, dass sich deine Fitness verbessert. Darüber hinaus solltest du auf große Ausreißer bei der Herzfrequenzvariabilität und der Temperatur achten. Wenn diese stark abweichen, kann das auf Übertraining oder Stress hindeuten – wobei die Herzfrequenzvariabilität besonders hilfreich ist, um Übertraining zu erkennen – oder einfach darauf, dass du mehr Erholung brauchst. Wenn viele Werte gleichzeitig aus dem Ruder laufen, kann das bedeuten, dass du krank wirst – was eher eine unmittelbare Auswirkung ist und möglicherweise beeinflusst, ob du an diesem Tag trainierst. Ich persönlich nutze die Herzfrequenz auch, um in bestimmten Zonen zu trainieren, sowohl mit hoher als auch mit niedriger Intensität, aber dafür brauchst du nicht unbedingt ein Gerät. Ein Tempo, bei dem du dich noch recht bequem unterhalten kannst, sagt dir bereits viel. Die Aufzeichnung macht es nur ein bisschen einfacher. Und es lohnt sich, daran zu denken, dass die meisten dieser Zahlen nur Anhaltspunkte dafür sind, was du eigentlich erreichen willst.

11. Kontinuierliche Glukosemessgeräte werden mittlerweile an gesunde Menschen vermarktet, die ihre Energie und ihren Stoffwechsel optimieren wollen. Wer profitiert den wissenschaftlichen Erkenntnissen zufolge tatsächlich davon, eines zu tragen, und wer bezahlt hauptsächlich für eine teure Spielerei?

Ich sollte gleich vorwegnehmen, dass das nicht mein Fachgebiet ist. Ich habe sie zwar schon benutzt, mich aber nicht eingehend damit beschäftigt – betrachte das also als eine eher uninformierte Meinung. Ich gehe davon aus, dass der größte Nutzen auf Bevölkerungsebene liegen würde. Wenn ein großer Teil der Menschen gelegentlich ein CGM nutzen würde, könnten wir viele Menschen mit Diabetes oder Prädiabetes entdecken, die noch nicht wissen, dass sie daran leiden, und diese könnten sich behandeln lassen und im Idealfall ihren Lebensstil ändern. Für Menschen, die einfach nur ihre Energie und ihren Stoffwechsel optimieren wollen, kann es interessant sein, zu testen, welche Lebensmittel Blutzuckerspitzen verursachen – und die oft darauf folgenden Tiefpunkte –, und diese Schwankungen dann zu reduzieren, wenn man feststellt, dass sie die Energie beeinträchtigen. Das lohnt sich für eine Weile. Ich glaube aber nicht, dass es sich lohnt, ein solches Gerät ständig zu tragen. Sie sind teuer und nicht wiederverwendbar, und für fast jeden außer einem Diabetiker, der seine Nahrungsaufnahme und sein Insulin verwaltet, macht das keinen Sinn. Für die allgemeine Bevölkerung ist es also meist nur eine teure Kuriosität. Wenn sie jedoch deutlich billiger würden, könnte allein schon der Screening-Wert – also das Erkennen von Menschen, die prädiabetisch oder diabetisch sind, ohne es zu wissen – ihre Gesundheitsspanne wirklich verlängern.

12. All diese Geräte erfassen rund um die Uhr intime Gesundheitsdaten. Wie sehr sollten sich die Menschen Gedanken darüber machen, wohin diese Daten fließen, und berücksichtigst du den Datenschutz bei deinen Empfehlungen?

Ich habe mich damit noch nicht eingehend beschäftigt, daher kann ich dazu nicht viel sagen. Die Daten können sicherlich für Marketingzwecke genutzt werden, und theoretisch könnten Versicherungsgesellschaften sie nutzen, um Ansprüche abzulehnen oder Vorerkrankungen geltend zu machen. Ich glaube nicht, dass das bisher passiert ist, aber es ist schwer zu sagen, was die Zukunft bringt. Bisher habe ich den Datenschutz in meinen Empfehlungen nicht berücksichtigt. Es wäre gut, wenn die Unternehmen zumindest versprechen würden, die Daten nicht zu verkaufen, und ich bezweifle, dass das alle tun. Apple Health gehört zu den eher lokalen Plattformen, die für Außenstehende weniger zugänglich sind, während die meisten Plattformen Daten in der Cloud speichern, wo der Hersteller darauf zugreifen kann. Selbst ein Versprechen, die Daten nicht zu verkaufen, kann durch einen Hackerangriff zunichte gemacht werden – die Daten sind also immer noch da draußen. Wie sehr dich das beunruhigen sollte, hängt davon ab, wie groß deine Sorge ist, dass sie auf eine Weise genutzt werden könnten, die sich zu deinem Nachteil auswirkt.

13. Wohin geht die Entwicklung bei Wearables wirklich als Nächstes – Dinge wie Blutdruckmessung am Handgelenk oder nadelfreie Sensorik – und worauf freust du dich am meisten bzw. wovon bist du am skeptischsten?

Ich glaube, wir werden immer mehr aus den Sensoren ableiten können, die wir bereits haben. Wir versuchen schon jetzt, das Risiko für Bluthochdruck anhand bestehender Wearable-Sensoren abzuschätzen, ohne neue Hardware hinzuzufügen, und das wird sich mit Foundation-Modellen und Möglichkeiten zur Integration von KI in das Ökosystem weiter verbessern. Ich bin ziemlich skeptisch gegenüber dem Drang, KI in alles einzubauen. Für manche Dinge in diesem Bereich macht das wirklich Sinn, aber Chatbots einfach auf alles draufzupflanzen, ist in manchen Fällen ein bisschen lächerlich. Personalisierte Nahrungsergänzungsmittel zum Beispiel werden im Moment überbewertet. Es gibt viele allgemeine Muster, und obwohl es sicherlich individuelle Reaktionen gibt, sind wir nicht gut darin, diese anhand der Daten, die wir derzeit haben, vorherzusagen – es sei denn, die Leute probieren sie einfach aus und schauen, was funktioniert. Allerdings halte ich das auch nicht für mein Fachgebiet.

Was mich wirklich interessiert, ist die aktuelle Google-Studie, in der ein Sensor-Grundmodell vorgestellt wird – das erscheint mir als solide, seriöse Arbeit. Verantwortungsvoll integriert könnte es helfen, Hinweise auf das Risiko bestimmter Krankheiten zu geben und Menschen in die richtige Richtung zu lenken. Und was mich am meisten begeistert, ist die zuverlässige Blutdruckmessung am Handgelenk, um Menschen vor Bluthochdruck zu warnen – mit dem Vorbehalt, dass wir oft überschätzen, inwieweit der Durchschnittsmensch seinen Lebensstil tatsächlich ändert. Daneben könnte die nadelfreie, kontinuierliche Blutzuckermessung am Handgelenk – ohne den Kauf von Einwegsensoren – viele Menschen mit Prädiabetes diagnostizieren, die dann ärztliche Hilfe in Anspruch nehmen könnten. Das sind die beiden Entwicklungen, auf die ich mich am meisten freuen würde.

0 likes
Published: June 23rd, 2026 · Updated: June 23rd, 2026
Dieser Artikel wurde vom New Zapiens Redaktionsteam erstellt und geprüft – gemäß unseren redaktionellen Richtlinien.

Kostenloser Wochennewsletter

Dein Wochenbrief für
ein längeres Leben – ohne
deinen Alltag umzukrempeln

10.000+ Leser werden jeden Donnerstag schlauer über ihre Gesundheit. Sei dabei.

  • Wissenschaft verständlich für den Alltag
  • Tägliche Health-Routines von führenden Experten
  • Kostenlose Health-Guides & Tools jede Woche

Kein Spam. Jederzeit abmelden.

Gelesen von 10.000+ gesundheitsbewussten Lesern.

Author:

Ich betreibe den YouTube-Kanal „The Quantified Scientist“