US-amerikanische Wissenschaftlerinnen haben eine Methode entwickelt, um Programmcode dem jeweiligen Autoren zuzuordnen. Wie "Wired"
berichtet, haben Rachel Greenstadt, Professorin für Informatik an der Drexel University, und Aylin Caliskan, eine ehemalige Doktorandin von Greenstadt, die heute als Assistenzprofessorin an der George Washington University lehrt, herausgefunden, dass jeder Programmierer einen eigenen Programmierstil hat, der sich wie eine persönliche Handschrift im Quellcode widerspiegelt.
Im Rahmen der Hacker-Konferenz Def Con wollen die beiden Forscherinnen erläutern, wie Machine-Learning-Algorithmen in der Lage sind, den individuellen Stil eines Programmierers zu erkennen und diesem zuzuordnen, selbst wenn der Programmcode kompiliert ist. An rund 50 Merkmalen im Quellcode und an dessen Struktur lässt sich laut Greenstadt und Caliskan erkennen, wer diesen verfasst hat. Damit der Algorithmus den Stil erkennen kann, braucht er jedoch eine Probe des Programmierers, weshalb sich gänzlich unbekannte Autoren nicht ausfindig machen lassen. Die Methode scheint sehr gut zu funktionieren, war der Algorithmus doch in der Lage, 96 von 100 Programmierern zu identifizieren, während bei einer Versuchsreihe mit 600 Autoren immerhin noch 83 Prozent von ihnen korrekt zugeordnet wurden.
Die Methode der beiden Forscherinnen könnte verwendet werden, um Plagiate aufzudecken, jedoch auch, um anonym bleiben wollende Entwickler zu enttarnen, was wiederum problematisch sein könnte aufgrund der möglichen Verletzung ihrer Privatsphäre.
(luc)