
Une nouvelle étude soutenue par Apple met en lumière l’importance des données comportementales (activité physique, sommeil, exercice, etc.) comme indicateurs de santé souvent plus fiables que les mesures biométriques traditionnelles telles que le rythme cardiaque ou le taux d’oxygène dans le sang. Pour l’illustrer, les chercheurs ont développé un modèle fondamental entraîné sur des données comportementales collectées à partir de dispositifs portables, et les résultats sont étonnants.
Ce document préliminaire, intitulé Beyond Sensor Data: Foundation Models of Behavioral Data from Wearables Improve Health Predictions, résulte de l’étude Apple Heart and Movement Study (AHMS). Ils ont entraîné ce nouveau modèle sur plus de 2,5 milliards d’heures de données d’appareils portables, montrant qu’il peut égaler, voire surpasser, les modèles existants basés sur des données de capteurs basiques.
Ce modèle, désigné sous le nom de WBM, pour Wearable Behavior Model, diffère des modèles de santé précédents qui reposaient principalement sur des flux de capteurs bruts comme le capteur de fréquence cardiaque de l’Apple Watch (PPG) ou son électrocardiogramme (ECG). WBM apprend directement à partir de métriques comportementales de niveau supérieur : nombre de pas, stabilité de la démarche, mobilité, VO₂ max, etc., toutes produites en abondance par l’Apple Watch.
Mais alors, si l’Apple Watch est équipée de ces capteurs, quel est l’intérêt de ce nouveau modèle ?
La réponse réside dans l’étude : « Les appareils portables grand public, tels que les smartwatches et les trackers d’activité, fournissent des informations riches à travers divers domaines de la santé (…) Un aspect important de la surveillance de la santé est la détection d’un état de santé statique – par exemple, si quelqu’un a des antécédents de tabagisme, une hypertension ou prend un bêta-bloquant. Une autre problématique cruciale est la détection d’un état de santé transitoire, tel que la qualité du sommeil ou si une personne est actuellement enceinte. Une propriété clé des données nécessaires pour ces prédictions est leur résolution temporelle, qui correspond souvent à celle du comportement humain (par exemple, jours et semaines) plutôt qu’à des échelles temporelles plus basses (par exemple, secondes) observées dans les données de capteurs bruts.
Bien que la majorité des travaux précédents aient considéré la modélisation des données de capteurs basiques (ou des caractéristiques simples de celles-ci), les données comportementales de niveau supérieur issues des appareils portables, telles que l’activité physique, la forme cardiovasculaire et les métriques de mobilité, sont le type de données naturel pour aider à résoudre ces tâches de détection. Contrairement aux capteurs bruts, ces métriques comportementales de niveau supérieur sont calculées à l’aide d’algorithmes soigneusement validés dérivés des capteurs bruts.
En d’autres termes, alors que l’Apple Watch collecte des données de capteurs bruts, ces données peuvent être bruyantes, envahissantes et pas toujours alignées avec des événements de santé significatifs. Les métriques utilisées par WBM s’appuient sur ces données de capteur, mais elles sont affinées pour mettre en évidence des comportements réels et des tendances de santé pertinentes. Elles sont plus stables, plus faciles à interpréter et mieux structurées pour modéliser les tendances de santé à long terme. En pratique, WBM apprend à partir des motifs trouvés dans les données comportementales traitées, plutôt que de s’appuyer directement sur les signaux des capteurs bruts.
En ce qui concerne les détails techniques, WBM a été entraîné sur les données d’Apple Watch et d’iPhone provenant de 161 855 participants de l’AHMS. Au lieu de flux bruts, le modèle a été nourri avec 27 métriques comportementales compréhensibles par l’homme, telles que l’énergie active, le rythme de marche, la variabilité de la fréquence cardiaque, le taux respiratoire et la durée du sommeil. Les données ont été décomposées en blocs hebdomadaires et transmises à une nouvelle architecture basée sur Mamba-2, qui fonctionne mieux que les Transformers traditionnels pour cette utilisation.
Lorsqu’il a été évalué sur 57 tâches liées à la santé, WBM a surpassé un modèle basé sur PPG solide dans 18 des 47 tâches de prédiction de santé statiques (comme déterminer si quelqu’un prend des bêta-bloquants) et dans presque toutes les tâches dynamiques (comme détecter une grossesse, la qualité du sommeil ou une infection respiratoire). L’exception était le diabète, pour lequel PPG a eu l’avantage.
Mieux encore, combiner les représentations de données WBM et PPG a produit les résultats les plus précis au total. Le modèle hybride a atteint une précision spectaculaire de 92 % pour la détection de grossesse, avec des gains constants dans la qualité du sommeil, les infections, les blessures et les tâches liées à la santé cardiovasculaire telles que la détection de l’Afib.
En fin de compte, l’étude ne vise pas à remplacer les données de capteurs par WBM, mais à les compléter. Les modèles comme WBM capturent des signaux comportementaux à long terme, tandis que PPG détecte des changements physiologiques à court terme. Ensemble, ils sont plus efficaces pour détecter précocement des changements de santé significatifs.