Les chercheurs ont démontré une nouvelle attaque acoustique par canal latéral sur les claviers qui peut déduire les entrées des utilisateurs en fonction de leurs habitudes de frappe, même dans de mauvaises conditions, telles que des environnements bruyants.
Bien que la méthode atteigne un taux de réussite moyen de 43%, ce qui est nettement inférieur aux autres méthodes présentées dans le passé, elle ne nécessite pas de conditions d’enregistrement contrôlées ni de plate-forme de frappe spécifique.
Cela le rend plus applicable dans les attaques réelles, et en fonction de certains paramètres spécifiques à la cible, il peut produire suffisamment de données fiables pour déchiffrer l’entrée globale de la cible avec une analyse post-capture.
L’attaque acoustique
Les chercheurs Alireza Taheritajar et Reza Rahaeimehr de l’Université Augusta aux États-Unis ont publié un article technique présentant les détails de leur méthode unique de canal latéral acoustique.
L’attaque exploite les émissions sonores distinctives de différentes frappes au clavier et le modèle de frappe des utilisateurs capturés par un logiciel spécialisé pour rassembler un ensemble de données.
Il est crucial de rassembler des échantillons de frappe de la cible afin que des frappes et des mots spécifiques puissent être corrélés avec des ondes sonores.
Le document fournit des méthodes possibles pour capturer du texte, mais cela peut être via des logiciels malveillants, des sites Web malveillants ou des extensions de navigateur, des applications compromises, des scripts intersites ou des claviers USB compromis.
La frappe de la cible peut être enregistrée en utilisant un microphone dissimulé à proximité ou à distance en utilisant des appareils compromis à proximité, tels que des smartphones, des ordinateurs portables ou des haut-parleurs intelligents.
L’ensemble de données capturé comprend des échantillons de frappe dans diverses conditions, de sorte que plusieurs sessions de frappe doivent être enregistrées, ce qui est crucial pour le succès de l’attaque. Cependant, les chercheurs disent que l’ensemble de données n’a pas besoin d’être particulièrement volumineux.
L’ensemble de données est ensuite utilisé pour entraîner un modèle statistique qui produit un profil complet des modèles de frappe individuels de la cible en fonction des intervalles de temps entre les frappes.
Les chercheurs ont découvert qu’il était crucial d’accepter un écart de 5% pour le modèle statistique, car le comportement de frappe varie légèrement même lorsqu’une personne tape deux fois le même mot.
Par exemple, tout intervalle enregistré entre A et B compris entre 95 millisecondes (100 – 5%) et 105 millisecondes (100 + 5%) pourrait être considéré comme une correspondance.
L’écart permet également d’atténuer l’impact des erreurs ou du bruit dans l’enregistrement, en veillant à ce que des écarts mineurs ne conduisent pas à une discordance.
La méthode prédit le texte tapé en analysant les enregistrements audio de l’activité du clavier, la précision étant améliorée en filtrant les prédictions via un dictionnaire anglais.
Ce qui rend l’attaque différente des autres approches, c’est qu’elle peut atteindre une précision de prédiction de frappe de 43% (en moyenne) même lorsque:
- les enregistrements contiennent du bruit ambiant
- les sessions de frappe enregistrées pour la même cible ont eu lieu sur différents modèles de clavier
- les enregistrements ont été réalisés à l’aide d’un microphone de mauvaise qualité
- la cible est libre d’utiliser n’importe quel style de frappe
D’autre part, la méthode a des limites qui rendent parfois l’attaque inefficace.
Par exemple, les personnes qui utilisent rarement un ordinateur et n’ont pas développé un modèle de frappe cohérent, ou les dactylographes professionnels qui tapent très vite, peuvent être difficiles à profiler.
Les résultats des tests pour 20 sujets de test ont produit un large éventail de succès, de 15% à 85%, ce qui rend certains sujets beaucoup plus prévisibles et sensibles que d’autres.
Les chercheurs ont également noté que l’amplitude de la forme d’onde produite est moins accentuée lors de l’utilisation de claviers silencieux (interrupteurs à membrane ou mécaniques avec amortisseur de bruit), ce qui peut nuire à l’efficacité de l’entraînement du modèle de prédiction et réduire les taux de détection des frappes.