Laurent Hubert. Foundations and Implementation of a Tool Bench for Static Analysis of Java Bytecode Programs

(1)

No _{d’ordre : 4243} _ANN´_{EE 2010}

TH`

ESE / UNIVERSIT´

E DE RENNES 1

sous le sceau de l’Universit´

e Europ´

eenne de Bretagne

pour le grade de

DOCTEUR DE L’UNIVERSIT´

E DE RENNES 1

Mention : Informatique

´

Ecole doctorale Matisse

pr´

esent´

ee par

Laurent Hubert

pr´

epar´

ee au sein de l’´

equipe Celtique `

a l’IRISA (UMR 6074)

Institut de Recherche en Informatique et Syst`

emes Al´

eatoires

UFR Informatique et Electronique (ISTIC)

Foundations and

Implementation of a

Tool Bench for

Static Analysis of

Java Bytecode

Programs

Th`ese soutenue `a Rennes

le 17 d´ecembre 2010

devant le jury compos´e de :

Jean-Marc JEZEQUEL

Professeur à l’Université de Rennes 1 / président

Erik POLL

Associate Professor `a Radboud University Nijmegen / rapporteur

Anindya BANERJEE

Research Professor `a IMDEA Software / examinateur

Mario S ¨

UDHOLT

Professeur `a l’ ´Ecole des Mines de Nantes / examina-teur

Thomas JENSEN

Directeur de recherche `a l’INRIA / directeur de th`ese

David PICHARDIE

(2)

(3)

Remerciements

Je souhaite tout d’abord remercier chaleureusement le jury, pour l’intérêt qu’il a porté à mon travail et à ma présentation, et pour le rapport qu’il a rédigé. Je souhaite particulièrement remercier Pierre- Étienne Moreau et Erik Poll d’avoir accepté d’évaluer mon rapport de thèse et d’avoir présenté autant d’intérêt pour ce document, avec une mention spéciale pour Erik qui a en plus dû venir des Pays-Bas pour évaluer la soutenance. Merci aussi à Anindya Banerjee, qui a accepté d’être examinateur à ma soutenance et donc de venir de Madrid pour l’occasion. Merci ensuite à Mario Südholt d’avoir lui aussi accepté d’être examinateur à ma soutenance. Enfin, merci à Jean-Marc Jézequel qui a accepté de présider ce jury.

Je n’aurai probablement pas fait un doctorat si un certain nombre de personnes ne m’avait pas incité à faire ce choix, et je tiens à les en remercier car cela a été une expérience très riche. J’aurai ainsi pu ne pas faire de Master de recherche pour pouvoir faire un stage en Espagne. Je tiens donc à remercier Mireille Ducassé qui, en me proposant un stage de recherche à l’UPM, m’a permis de faire un Master de Recherche avec un stage à Madrid. Je tiens aussi à remercier le groupe de recherche CLIP, qui m’a accueilli à l’UPM et qui a largement contribuer à mon orientation vers le doctorat, et en particulier Manuel Hermenegildo, Germán Puebla, Elivra Albert, Astrid Beascoa et Samir Genaim. Enfin, David et Thomas ont aussi pris de leur temps pour me convaincre, et je les en remercie.

Ces trois années de doctorat ont été intenses mais plaisantes. Le travail a été intéressant, et je tiens à remercier mes deux directeurs de thèse pour les directions qu’ils m’ont indiquées. J’ai aussi apprécié travailler en équipe et je les remercie me l’avoir permis, que ce soit directement avec David, ou en encadrant des stagiaires et ingénieurs. Merci d’ailleurs à ces deux ingénieurs, Nicolas et Vincent, avec qui il a été agréable de travailler. Ces trois années n’auraient pas non plus été les mêmes sans leurs voyages. Merci à David et Thomas de m’avoir permis de partir, mais aussi à Lydie et Christiane pour le support. Ensuite, il n’y a pas que le travail qui a été intéressant, la bonne ambiance dans l’équipe Lande/Celtique a aussi largement contribué `

a rendre ces années plaisantes. Merci à tous, avec une mention particulière à Florence et Pierre-Emmanuel, deux “co-bureau” bien sympathiques, et à Benoˆıt, qui, en soutenant sa thèse en même temps que moi, m’a permis de me sentir moins seul face à la rédaction et à l’administration.

Je souhaite également remercier ceux qui étaient présent lors de ma soutenance. Je ne me risquerai pas à une liste se voulant exhaustive de peur d’oublier quelqu’un, mais je tiens tout particulièrement à remercier mes parents, mon oncle et ma tante d’être venu de Nantes pour me soutenir.

Enfin, merci à Charlotte pour sa présence et son soutient durant ces années et tout par-ticulièrement à l’approche de la soutenance.

(4)

(5)

Abstract

In this thesis we study the static analysis of Java bytecode and its semantics foundations. The initialization of an information system is a delicate operation where security properties are enforced and invariants installed. Initialization of fields, objects and classes in Java are difficult operations. These difficulties may lead to security breaches and to bugs, and make the static verification of software more difficult. This thesis proposes static analyses to better master initialization in Java. Hence, we propose a null pointer analysis that finely tracks initialization of fields. It allows proving the absence of dereferencing of null pointers (NullPointerException) and refining the intra-procedural control flow graph. We present another analysis to refine the inter-procedural control flow due to class initialization. This analysis directly allows inferring more precise information about static fields. Finally, we propose a type system that allows enforcer secure object initialization, hence offering a sound and automatic solution to a known security issue. We formalize these analyses, their semantic foundations, and prove their soundness. Furthermore, we also provide implementations. We developed several tools from our analyses, with a strong focus at having sound but also efficient tools. To ease the adaptation of such analyses, which have been formalized on idealized languages, to the full-featured Java bytecode, we have developed a library that has been made available to the community and is now used in other research labs across Europe.

(6)

(7)

R´

esum´

e

Dans cette thèse, nous nous intéressons à l’analyse statique du bytecode Java. L’initiali-sation d’un système d’information est une phase délicate où des propriétés de sécurité sont vérifiées et des invariants installés. L’initialisation en Java pose des difficultés, que ce soit pour les champs, les objets ou les classes. De ces difficultés peuvent résulter des failles de sécurité, des erreurs d’exécution (bugs), ou une plus grande difficulté à valider statiquement ces logi-ciels. Cette thèse propose des analyses statiques répondant aux problèmes d’initialisation de champs, d’objets et de classes. Ainsi, nous décrivons une analyse de pointeurs nuls qui suit finement l’initialisation des champs et permet de prouver l’absence d’exception de pointeurs nuls (NullPointerException) et de raffiner le graphe de flot de contrôle intra-procédural. Nous proposons aussi une analyse pour raffiner le graphe de flot de contrôle inter-procédural liée à l’initialisation de classe et permettant de modéliser plus finement le contenu des champs statiques. Enfin, nous proposons un système de type permettant de garantir que les objets manipulés sont complètement initialisés, et offrant ainsi une solution formelle et automatique `

a un problème de sécurité connu. Les fondations sémantiques de ces analyses sont données. Les analyses sont décrites formellement et prouvées correctes. Pour pouvoir adapter ces analyses, formalisées sur de petits langages, au bytecode, nous avons développé une bibliothèque logi-cielle. Elle nous a permis de produire des prototypes efficaces gérant l’intégralité du bytecode Java.

(8)

(9)

R´

esum´

e ´

etendu

Introduction

Les fautes, ou bugs, sont fréquentes dans le logiciel, si fréquentes que les développeurs et éditeurs de logiciel ne souhaitent pas être tenus pour responsables. Ainsi, les licences de logiciels comportent généralement des clauses visant à limiter les garanties fournies et leurs responsabilités. L’extrait suivant provient de la licence CeCILL.

La responsabilité du Concédant [...] ne saurait être engagée en raison notam-ment : (i) [...], (ii) des dommages directs ou indirects découlant de l’utilisation ou des performances du Logiciel subis par le Licencié et (iii) plus généralement d’un quelconque dommage indirect. En particulier, les Parties conviennent ex-pressément que tout préjudice financier ou commercial (par exemple perte de données, perte de bénéfices, perte d’exploitation, perte de clientèle ou de com-mandes, manque à gagner, trouble commercial quelconque) ou toute action dirigée contre le Licencié par un tiers, constitue un dommage indirect et n’ouvre pas droit `

a r´eparation par le Conc´edant.

Le logiciel peut donc causer des pertes financières ou commerciales pour l’utilisateur sans que le distributeur du logiciel ne soit inquiété.

En dépit de ces clauses, les fautes logicielles coûtent généralement quand même aux développeurs et distributeurs de logiciels. En effet, la faible qualité d’un logiciel peut coûter en réputation au distributeur. Certains logiciels sont distribués avec des licences qui offrent plus de garanties à l’utilisateur et l’autorisent, par exemple, à demander le remboursement du logiciel. Le coût peut aussi être en termes de ressources quand le développeur doit corriger l’erreur et distribuer un correctif. Dans le cas de logiciel où le correctif doit être installé sur du matériel très déployé et non connecté (des voitures ou des chaˆınes hi-fi par exemple), ce coût peut être très élevé. Enfin, le développeur peut être aussi l’utilisateur, auquel cas toutes les conséquences du mauvais fonctionnement du logiciel sont supportées directement par lui. Dans ce dernier cas, la fameuse phrase “ce n’est pas moi, c’est l’informatique” permet quand même de se dédouaner quelque peu. Pour toutes ces raisons, et malgré les clauses limitant les risques encourus par les distributeurs, la plupart des entreprises développant du logiciel investissent temps et argent dans la qualité logicielle.

Am´eliorer la qualit´e logicielle

Il existe plusieurs outils pour améliorer la qualité des logiciels. Celui dans lequel les en-treprises investissent le plus est très certainement le test. Tester un programme consiste à l’exécuter sur un jeu de test, c’est-à-dire un ensemble d’entrées, et contrôler la sortie du pro-gramme avec un oracle (qui peut être un humain, une version précédente du programme, un

(10)

x R ÉSUM É ÉTENDU

modèle du programme, etc.). Le test n’est pas exhaustif : il n’est pas possible de prouver l’absence d’erreur par le test car il n’est pas possible de tester un programme sur toutes ses entrées. Par conséquent, tester un programme permet de gagner en confiance dans la correc-tion du programme, mais desbugs peuvent toujours être présents. Une autre approche est de prouver entièrement la correction fonctionnelle de la spécification formelle d’un logiciel, et de générer le code à partir de la spécification.1 Elle a été utilisée dans l’industrie avec l’Atelier B et la Méthode B [Abr96], et dans des recherches plus académiques avec des assistants à la preuve tels que Coq [Coq] ou Isabelle/HOL [NPW02]. Cette technique requiert un haut niveau d’expertise et est habituellement très coûteuse en temps. Dans l’industrie, elle est seulement utilisée dans les cas où le coût d’une erreur peut être prohibitif, tels que dans les transports où unbug peut causer la perte de centaines de personnes. Enfin, la technique qui est sans doute la plus utilisée, bien que cela soit relativement discret, est l’analyse statique (AS). En effet, la majorité des développements sont faits dans des langages intégrant des systèmes de types tels C, C]ou Java, et les systèmes de types sont des AS.2 Une analyse d’un logiciel est statique si elle se fait sans exécuter le logiciel. C’est une technique puissante qui permet de vérifier automatiquement que des programmes respectent des propriétés variées pouvant porter aussi bien sur des consommations de ressources, des types de données ou la confidentialité de données.

Contrairement au test, l’AS peut être exhaustive : elle peut donner des informations sur le logiciel valides pour toutes les exécutions du programme, quelles que soient les entrées. Un avantage de l’AS sur la preuve de correction manuelle est que les AS sont généralement entièrement automatiques. Néanmoins, cet automatisme vient au prix de l’indécidabilité dans le cas général : un analyseur statique ne pourra prouver correct certains programmes pourtant corrects (dans le sens où ceux-ci respectent la propriété attendue).

Un analyseur statique vérifie qu’un code (source ou machine, une méthode ou un pro-gramme complet, etc.) respecte une propriété. Si l’analyseur trouve un point du code qui viole cette propriété, alors il lève une alarme appelée positif. Un analyseur peut lever de nombreux positifs pour un morceau de code analysé, par exemple, toutes les lignes du code source qui appellent une certaine méthode. A cause de l’indécidabilité de la plupart des pro-priétés, les analyseurs ne peuvent trouver l’ensemble exact des points du code violant la propriété. Il lève donc des faux positifs ou des faux négatifs. Un faux positif est une alarme qui est levée alors que le code respecte la propriété mais que l’analyseur n’a pas réussi à le prouver. Un faux négatif est une alarme qui n’a pas été levée alors que le code ne respecte pas la propriété. Une analyse correcte n’a aucun faux négatif. Une analyse complète n’a aucun faux positif.

Plusieurs méthodes sont utilisées pour faire face au problème de l’indécidabilité.

– Une première approche pragmatique est différencier les alarmes qui sontprobablement correctes de celles qui sont probablement incorrectes. Cela peut se faire en utilisant des heuristiques ou des annotations de l’utilisateur auxquelles l’analyse fait confiance. Seules les alarmes probablement correctes sont ensuite levées. Bien que cette approche soit incorrecte (puisque cela introduit des faux négatifs), cela permet aux développeurs de se concentrer sur les alarmes qui correspondent plus probablement à desbugs réels. Ces outils sont connus sous le nom de trouveur d’erreurs ou bug finders. Un exemple

1_{Une approche similaire est de prouver directement la correction fonctionnelle du code, par exemple dans}

le cadre de JML, mais cela peut être vu comme un cas particulier où la spécification est le code.

2_{L’analyse statique est aussi tr`}_{es utilis´}_{ee dans les compilateurs pour un autre objectif que l’absence}

(11)

xi

notable est FindBugs [HSP06].

– Une autre approche consiste à utiliser des annotations sans leur faire confiance. Vérifier une preuve est plus facile que de la faire, et les annotations peuvent être vues comme des preuves partielles que l’analyse peut vérifier au lieu de les prouver. Ces annotations peuvent aussi être vues comme des indices réduisant l’espace de recherche de l’analyse et permettant ainsi des analyses plus précises. Par exemple, le compilateur Java nécessite que l’utilisateur annote chaque variable avec son type. Cette approche permet de réduire le nombre de faux positifs.

– Les AS peuvent aussi s’appliquer sur des langages sur lesquels il est plus facile de rai-sonner. Par exemple, les données sont sans doute plus simples à suivre dans un langage fonctionnel où, par défaut, il n’y a pas de références et les définitions associent directe-ment une valeur à un nom. En dépit d’un système de types riche (qui rend l’espace de recherche plus important), il est possible d’inférer les types pour les programmes écrits en ML. Inversement, en Java, toutes les variables sont mutables (même les champsfinal

au niveau du bytecode), leur déclaration est séparée de leur initialisation, et l’initiali-sation des champs, objets et classes en Java est particulièrement difficile comme nous le montrons dans cette thèse.

– Enfin, l’AS permet d’inférer des invariants qui peuvent être utilisés pour aider le développement (refactoring,reverse engineering), une preuve de correction assistée ou une autre AS.

Comme cette thèse le montre, Java (ou le bytecode Java) n’est pas un langage sur lequel il est facile de raisonner. C’est un langage incluant de nombreuses fonctionnalités, indus-triellement utilisé, et utilisant des schémas d’initialisation complexes. Concevoir des analyses `

a la fois correctes et précises pour Java n’est donc pas une chose facile. Cette thèse pro-pose des analyses dont la correction est formellement prouvée et des outils pour aider au développement d’analyses correctes pour le bytecode Java. Ces contributions peuvent être utilisées directement pour assurer des propriétés de sécurité (telle que présenté Chapitre 7), ou comme fondation pour rendre les analyses plus précises et plus simples à développer.

Java et bytecode Java

Java [GJSB05] est un langage source. Il est généralement compilé vers du code objet, ou

bytecode, qui est le langage de bas niveau interprété par la machine virtuel Java (JVM) [MD97]. Java possède de nombreuses constructions aux effets similaires mais qui peuvent être plus où moins faciles à lire selon les situations. Java est aussi un langage qui évolue et de nouvelles fonctionnalités sont régulièrement ajoutées au langage. À l’inverse, le bytecode Java propose beaucoup moins de constructions syntaxiques et évolue beaucoup moins, les nouvelles fonc-tionnalités de Java étant compilées en utilisant des fonctionnalités préexistantes du bytecode. De plus, on peut souhaiter analyser un programme sans en avoir le code source ; c’est par exemple le cas du vérificateur de bytecode (BCV) qui vérifie au chargement des classes par la JVM que celles-ci respectent le système de types de la JVM. C’est pour ces raisons que nous nous intéressons dans cette thèse au bytecode et non au code source.

Analyse de pointeurs nuls et initialisation des champs

Les déréférencements de pointeurs nuls en Java sont une source d’erreurs importante. Prouver leur absence apparaˆıt donc intéressant. De plus, la précision des analyses statiques

(12)

xii R ÉSUM É ÉTENDU

dépend de la précision du graphe de flot de contrôle (CFG). Or, en Java, les déréférencements de pointeurs nuls génèrent des exceptions qui sont la cause de branchements supplémentaires, soit des arc supplémentaires dans le CFG intra-procédural. Ces arcs sont présents entre chaque instruction pouvant lever une exception et le gestionnaire d’exceptions correspondant ( hand-ler), ou la fin de la méthode ou du programme s’il n’y a pas de gestionnaire d’exceptions. Bien que la plupart des instructions puissent lever des exceptions, la plupart sont généralement sûres. Par exemple, en Java, chaque instruction du typeo.fpeut lever une exception sioest nul. Si une analyse peut prouver que o est toujours différent de nul, il est alors possible de retirer un arc du CFG et ainsi d’améliorer la précision des analyses reposant sur la précision du CFG intra-procédural.

L’une des difficultés dans la conception d’une analyse de pointeurs nuls pour le bytecode Java est l’initialisation des champs. Ainsi, n’écrire que des valeurs non nulles dans un champ ne permet pas d’assurer que seulement des valeurs non nulles ne puissent être lues de ce champ. En effet, les champs sont tous nuls par défaut ; une analyse un peu simple inférerait donc que tous les champs peuvent être nuls sans plus de précision.

L’une des idées clé à la base de cette analyse d’inférence est de suivre finement l’initia-lisation des champs dans les constructeurs et méthodes appelées à partir des constructeurs.

`

A la fin d’un constructeur, tous les champs définis dans la classe courante qui n’ont peut être pas été explicitement initialisés sont annotés@Nullable, les autres champs étant annotés conformément à la valeur avec laquelle ils ont été initialisés (par exemple,@NonNulls’ils ont été initialisés avec la référence d’un objet).

Pour la conception de notre analyse, nous avons d´efini undomaine abstrait State] et une

sp´ecification `a base de contraintes qui contraint S] ∈State] en fonction d’un programme P

(´ecrit S] |= P). Une valeur du domaine abstrait S] ∈ State] abstrait l’ensemble des ´etats atteignables deP. Un composant essentiel de State] est le domaine des valeurs Val].

Val]={MayBeNull,NotNull,Raw} ∪ {Raw(C)|C∈Classes} ∀C₁, C2, C1 C2 =⇒ NotNull vRaw(C1)vRaw(C2)vRaw vMayBeNull

Le relation est la relation de sous-typage sur les classes :C1 C2 siC2 est un parent (une

super classe) de C1. Raw abstrait les r´ef´erences non nulles vers des objets possiblement en

cours d’initialisation.NotNull abstrait les références non nulles vers des objets ayant terminé leurs constructeurs. MayBeNull désigne une référence quelconque ou la constante null, c’est le maximum (>) de notre treillis. Raw(C) abstrait les références non nulles vers les objets ayant terminé un constructeur de la classeC (et donc aussi un constructeur de chaque parent de C). Lors de la lecture d’un champ par une instruction o.f, si la variable o est de type

Raw(C) (ou d’un sous-type) et que le champfest déclaré dans la classeC, alors l’abstraction du champ f est utilisée car l’objet est suffisamment initialisé. Sinon, l’objet n’est peut-être pas suffisamment initialisé et le champfest considéré comme pouvant être nul, donc abstrait par MayBeNull.

Pour prouver la correction de notre analyse, nous avons proc´ed´e comme suit.

– Nous avons d´efini un langage, proche du bytecode Java mais sans pile, avec une

s´emantique exprim´ee sur undomaine concret State.

– Nous avons donn´e l’interpr´etation du domaine abstraitState] dans le domaine concret avec une relation ∼∈State]×State.

– Nous avons défini la propriétésafe(_JP_K) qui est vérifiée lorsque tous les états accessibles du programme P sont sûrs (c’est-à-dire qu’il ne peut y avoir d’exception de pointeur nul). Bien sûr, JPKn’est pas calculable en général.

(13)

xiii

– Nous avons défini la propriétésafe](S]) qui est vérifiée siS] permet d’assurersafe(JPK)

´

etant donné que S] est une sur-approximation des états de _JP_K, c’est-à-dire que pour tout S∈_JP_K,S]∼S est vérifié.

– Nous avons prouvé la correction de l’analyse, c’est-à-dire que si S] est une solution du système de contraintes pour le programme P (S]|=P) et sisafe](S]) est vérifié, alors

safe(_JP_K) est v´erifi´e (safe](S])∧S]|=P =⇒ safe(_JP_K)).

Notre analyse ne nécessite aucune annotation de la part de l’utilisateur, on peut cependant la comparer au système de types proposé par Fähndrich et Leino[FL03]. Nous avons montré que pour tout programme correct vis-à-vis de leur système de types, notre analyse peut inférer des annotations S] |= P telles que safe](S]) et donc montrer que le programme est sûrsafe(_JP_K). Comme de plus notre analyse est prouvée correcte, cela prouve indirectement la correction de leur système de types (ou plutôt de la formalisation que nous proposons de leur système de types).

Ces travaux ont principalement été réalisés avec David Pichardie et publiés dans la conférence internationale Formal Methods for Open Object-based Distributed Systems (FMOODS) [HJP08a].

Nit : un outil d’inf´

erence d’annotations de nullit´

e pour le

byte-code Java

Nous présentons maintenant Nit (Nullability Inference Tool), une implémentation de notre analyse de pointeurs nuls présentée précédemment. Cette analyse a été formellement définie sur un petit langage idéalisé, relativement haut niveau et abstrayant de nombreux détails du bytecode Java. Présenter l’analyse à ce niveau est important pour avoir une présentation concise, centrée sur l’essentiel, et facilitant la preuve de correction. Néanmoins, l’implantation ne peut se faire à ce niveau et, comme expliqué dans précédemment, l’outil analysera du bytecode Java.

Analyse d’alias

L’une des particularités du langage haut niveau utilisé pour la spécification de l’analyse était l’absence de pile. Le bytecode est quant à lui un langage à pile. Il inclut aussi des instructions qui permettent d’obtenir des informations sur la nullité de référence. Par exemple, l’instructionifnull jmpdépile un élément de la pile et sautenoctet d’instruction si l’élément dépilé est nul. Pour tester la nullité d’une variable localex, on empile le contenu dex(load x), puis l’instruction ifnull n permet de tester le contenu du sommet de pile. L’analyse peut donc inférer que si le test échoue, alors l’élément dépilé est non nul. En revanche, sans information supplémentaire, elle n’a aucune information sur x. Nous proposons donc une analyse qui infère des égalités entre variables locales et éléments de pile.

Une nouvelle valeur abstraite

Nous supposons avoir deux fonctions, une fonction d’abstraction α∈2Val → Val] et une fonction de concrétisation γ ∈ Val] → 2Val où Val est le domaine concret des références (incluant la constante null) et où Val] est le domaine abstrait. Si une variable peut soit contenir une référence de type NotNull soit la constante null, elle est alors abstraite par

(14)

xiv R ÉSUM É ÉTENDU

l’information maisMayBeNull abstrait aussi les objets en cours d’initialisation, la meilleure abstraction que l’on puisse retrouver est donc α(γ(MayBeNull) \ {null}) = Raw. Cette configuration se produit fr´equemment dans les programmes et nous avons donc introduit une nouvelle valeur abstraite,MayBeNullInit qui permet de manipuler des valeurs pouvant ˆetre nulles sans introduire de valeurRaw.

Analyse des instructions instanceof

Le bytecode Java possède l’instructioninstanceof qui met 1 sur la pile si le sommet de pile est une instance de C (et n’est donc pas nul), ou 0 sinon. Bien que cette instruction semble donner une information sur la nullité d’une variable, cette information n’est pas directe : on ne peut rien déduire tant qu’un test n’est pas effectué sur le sommet de pile. Or, l’analyse ne modélise pas les entiers (ni les booléens). Nous avons donc ajouté une analyse supplémentaire qui calcule une abstraction de la pile telle que, pour chaque variable de pile, l’abstraction contient une sous-approximation de l’ensemble des variables locales qui doivent être non nulles si la variable de pile correspondante est égale à 1.

Conclusion

L’analyse globale est une analyse en trois étapes (analyse intra-procédurale d’alias, analyse intra-procédurale des instanceof, et analyse inter-procédurale de pointeurs nuls) exécutée sur un programme complet. Pour passer à l’échelle, de nombreuses optimisations ont été faites. Il est maintenant possible d’analyser des programmes conséquents (3.400 classes ou 26.000 méthodes) en 2 minutes. L’analyse permet d’inférer que près de 53% des champs sont non nuls. L’objectif n’étant pas 100% (car des champs sont effectivement nuls), il n’est pas simple d’évaluer la précision de ces 53%. En revanche, avec les annotations inférées, il est possible de prouver que 80% des déréférencements sont sûrs. En comparaison, sans les adaptations présentées dans cette section, l’analyse permet de prouver 69% des déréférencement sûrs. Bien que ces résultats soit insuffisants pour trouver des erreurs (bugs), ils permettent d’améliorer la précision du CFG et sont utiles pour de la documentation ou dureverse engineering. Nous avons développé pour cet outil un greffon (plug-in) pour pouvoir l’utiliser à partir d’Eclipse. Ce greffon propose des options pour réduire le nombre de positifs et faciliter son utilisation pour trouver des bugs. Nit et le greffon ont été présentés à la conférence JavaOne et sont disponibles sous licence GPL àhttp://nit.gforge.inria.fr.

Ce travail à été publié à l’atelier ACMProgram Analyis for Software Tools and Engineering (PASTE) [Hub08].

Sawja : atelier d’analyse statique pour Java

Lors du développement de Nit, une grande partie du code écrit n’était pas propre à l’analyse développée mais bien plus générale. Ce code permettait de fournir une représentation OCaml des fichiers binaires.classcontenant le bytecode Java, de naviguer facilement dans la hiérarchie de classe et dans le graphe de flot de contrôle, etc. Une partie importante de l’effort de développement de Nit a été sur l’efficacité du code produit, et donc aussi sur ces couches les plus basses. Pour faciliter le développement d’analyseurs statiques correctes et efficaces, nous avons donc décidé de développer Sawja. Sawja est une bibliothèque logicielle développée en OCaml à partir du code de Nit et de l’expérience acquise lors de ce développement.

(15)

xv

Repr´esentation des classes de haut niveau

L’utilisation du langage OCaml permet l’utilisation du typage pour exprimer des contraintes structurelles. Par exemple, classe et interface, bien que simplement différenciées par un drapeau au niveau binaire, utilisent deux structures différentes au niveau OCaml. Quand on veut les manipuler indifféremment, cela reste possible car des fonctions sont four-nies qui permettent d’accéder à leurs champs communs. Exprimer les contraintes structurelles facilite l’écriture de code car il n’est plus nécessaire de se protéger de nombreux cas impos-sibles. Par exemple, il n’est plus utile de gérer le cas d’une interface non abstraite.

Afin d’éviter une trop forte duplication du code, nous avons utilisé les variants disponibles en OCaml. Les variants sont un type d’énumération permettant le partage des constructeurs. Par exemple, lorsqu’une valeur de typejvm typeoujava basic typeest attendue, un même constructeur peut être utilisé pour le type entier 64 bits (‘Long) dans les deux cas.

Afin d’éviter l’analyse syntaxique des méthodes non accessibles, leparsing est paresseux. Le partage des constantes au sein d’une classe est assuré au niveau bytecode grâce à une table (constant pool). Les instructions contiennent alors des indices de cette table au lieu des données. Sawja garde ce partage en mémoire mais cache l’indirection en maintenant un nouvel indi¸cage. De plus, le partage est étendu à toutes les classes chargées : cela permet ainsi d’utiliser des tests d’égalité physique là où des égalités structurelles auraient été nécessaires et l’indi¸cage permet d’utiliser des structures de données efficaces sur les entiers comme les arbres de Patricia [Mor68] ou les BDDs [Bry92].

Repr´esentation interm´ediaire

Le bytecode Java est un langage à pile et l’utilisation intensive de la pile d’opérandes rend difficile l’adaptation des analyses statiques classiques qui ont été définies sur un lan-gage à variables et expressions. Ainsi, plusieurs outils d’analyse et d’optimisation de by-tecode Java travaillent en fait sur une représentation intermédiaire, rendant l’analyse plus simple [BCF+99, VRCG+99]. Étonnamment, la correction des transformations du bytecode Java vers ces représentations intermédiaires ne semble pas avoir été étudiée formellement. Demange et Pichardie ont étudié les fondations sémantiques de ces transformations et ont proposé un langage intermédiaire avec une transformation pour laquelle ils ont prouvé un théorème de préservation sémantique. Le langage proposé est sans pile, avec des expressions sans effets de bords (des variables supplémentaires peuvent donc être nécessaires). La création d’objets, qui est souvent une opération délicate pour les analyses statiques, se fait en deux étapes au niveau du bytecode Java. Elle est ramenée à une unique opération au niveau de la représentation intermédiaire, comme au niveau Java, ce qui facilite, là aussi, l’implantation des analyses. Une validation expérimentale de la transformation a aussi été réalisée et montre qu’elle est 10 fois plus rapide que Soot, le principal concurrent, et comparable en nombre de variables introduites.

Programmes complets

Un programme complet désigne l’ensemble du code accessible à partir des points d’entrées du programme. Quand on analyse une méthode, par exemple, il est souvent nécessaire d’avoir une abstraction des entrées. Certaines analyses utilisent pour cela des annotations de l’utili-sateur (types, invariants, pré- ou post-conditions), mais il est aussi possible de calculer cette

(16)

xvi R ÉSUM É ÉTENDU

information à partir des différents contextes d’appel possibles, récursivement. Avoir un pro-gramme complet permet de fournir une sur-approximation de l’ensemble des contextes d’ap-pel. Sawja propose une représentation des programmes complets avec une API permettant de naviguer dans le CFG du programme. Sawja propose aussi plusieurs analyses permettant de construire des programmes complets, entre autre, CRA, RTA et XTA.

Nous avons con¸cu CRA (Class Reachability Analysis) pour charger très rapidement des programmes pouvant être conséquents en tirant partie du caractère paresseux du chargement des méthodes. CRA utilise en effet les informations contenues dans les tables des constantes des classes pour calculer une sur-approximation du code accessible.

RTA [BS96] est une analyse connue et efficace qui nous permet de comparer la performance de Sawja `a celle de Wala : Wala prend trois fois plus de temps et consomme 75% de m´emoire en plus.

Conclusion

Sawja est la première bibliothèque proposant des outils pour le développement d’analyseur statique pour le Java bytecode. Elle représente un effort de codage de 1,5 homme-an et environ 22.000 lignes de code OCaml (commentaires inclus), dont 4.500 pour les interfaces. Forts de notre expérience sur Nit, nous avons con¸cu Sawja comme une bibliothèque générique permettant à tout nouvel analyseur statique de bénéficier des mêmes composants efficaces. Sawja a déjà été utilisée dans deux prototypes pour l’ANSSI (Agence nationale de la sécurité des systèmes d’information) dont l’un est l’implantation du système de types garantissant l’initialisation des objets présentée ci-après. Nit a aussi été porté sur la version actuelle de Sawja, ce qui, d’après nos premiers essais, a permis d’améliorer ses performances de 30%. Sawja est disponible sous licence GPL à http://sawja.inria.fr/.

Ces travaux ont été publiés dans les actes de la conférence internationale Formal Verifi-cation of Object-Oriented Software (FoVeOOS) [HBB+10]. La couche la plus basse de Sawja (analyse syntaxique) a été initialement développée par Nicolas Cannasse, la représentation intermédiaire est une contribution de Delphine Demange et David Pichardie, l’implantation de RTA est une contribution de Nicolas Barré, l’utilisation de variant OCaml pour la facto-risation des types est une contribution de Tiphaine Turpin, et enfin d’autres personnes ont contribué avec de plus petits développements, des correctifs et des discussions sur la concep-tion de la bibliothèque : Étienne André, Frédéric Besson, Florent Kirchner et Vincent Monfort. En dépit de ces nombreuses contributions, je suis le développeur principal de la bibliothèque et ma contribution représente environ 40% du code de la bibliothèque.

Initialisation de classes

En Java, l’initialisation des classes, et donc des champs statiques, est implicite et pares-seuse. Généralement, pour un programme, un grand nombre d’instructions est susceptible de déclencher l’initialisation d’une classe. Cela rend le flot de contrôle très peu intuitif pour un développeur et très imprécis et très dense (car c’est une sur-approximation qui est considérée) pour une analyse statique. Nous proposons ici une solution pour améliorer la précision du graphe de flot de contrôle tenant compte de l’initialisation des classes. Elle permet aussi une analyse plus fine des champs statiques et en particulier de détecter des utilisations de champs statiques avant leur initialisation.

(17)

xvii

Les contributions de ces travaux sont les suivantes. (i) Nous rappelons que l’initialisation implicite et paresseuse rend le CFG difficile à calculer. (ii) Nous identifions des exemples de code que l’on souhaite pouvoir rejeter et d’autre que l’on souhaite pouvoir accepter. (iii) Nous proposons un langage pour l’étude de l’initialisation des classes et des champs statiques. Ce langage abstrait de nombreux détails du bytecode Java et rend explicite l’initialisation de classes en introduisant une instruction initialize(C) qui a pour effet de déclencher l’initialisation de la classe C si celle-ci n’a pas déjà été commencée. (iv) Nous proposons une analyse prouvée correcte pour améliorer la précision du CFG et calculer l’ensemble des champs statiques initialisés à chaque point de programme. (v) Cette analyse n’étant pas suffisamment précise, nous proposons une autre analyse plus précise, sensible au contexte. (vi) Nous détaillons quelques pistes pour une implantation efficace de cette seconde analyse.

Graphe de flot de contrˆole peu intuitif

L’initialisation des classes est faite par des méthodes spécifiques qui ne peuvent être appelées que par la JVM. Ces méthodes contiennent du code arbitraire et peuvent donc déclencher l’initialisation d’autres classes. Les seules instructions pouvant déclencher l’initia-lisation d’une classe sont la lecture et l’écriture d’un champ statique, l’appel d’une méthode statique et la création d’une instance d’une classe. L’initialisation d’une classe est déclenchée lorsqu’une telle instruction est rencontrée et si la classe n’a pas déjà été initialisée. Le flot de contrôle lié à l’initialisation de classes, ne dépend donc pas de la syntaxe (comme les appels de méthodes statiques) ni des données (comme les appels de méthodes virtuelles), mais de l’historique des classes initialisées.

Analyse de l’´etat d’initialisation des classes

La seconde analyse est fondée sur une abstraction de l’état d’initialisation de chaque classe. Chaque classe peut être dans l’un des trois états suivants. Une classe peut ne pas avoir débuter son initialisation (état α). C’est l’état de toutes les classes au début du programme. Une classe peut être en cours d’initialisation (étatβ). Une classe est vue dans cet état par tout le code accessible depuis l’initialiseur de la classe. Enfin, une classe peut être complètement initialisée (état γ). À l’exécution, une classe ne peut être que dans un seul état à un instant donné. L’analyse abstrait cette information en calculant des états d’initialisation abstraits du programme (IS]).

IS] =P(Classes× {α, β, γ})

Un état d’initialisation associe à chaque classe les états d’initialisation dans lesquelles la classe peut se trouver. L’analyse proposée est une analyse de flot de données, sensible au contexte, utilisant cette abstraction. La fonction de transfert essentielle est celle de l’instruction d’ini-tialisation initialize(C). Le flot de données peut être propagé à l’initialiseur si la classe peut être dans l’état α d’après l’abstraction de l’état d’initialisation courantIS ∈IS]. Dans ce cas,γ est ajouté à l’état d’initialisation au point de programme suivant et la post-condition calculée pour l’initialiseur de classe peut être utilisée (assumée).

Conclusion

L’initialisation de classes, et donc aussi des champs statiques, est donc plus complexe qu’il peut y paraˆıtre `a un premier abord. Ainsi, bien que dans la plupart des cas le comportement

(18)

xviii R ÉSUM É ÉTENDU

réel correspond au comportement attendu, ce n’est pas toujours le cas, et une analyse statique correcte ne peut se contenter de supposer que l’initialisation d’une classe a toujours lieu avant son utilisation. Nous avons donc proposé un langage pour l’étude de ce problème qui permet de s’abstraire du bytecode Java en conservant le mécanisme d’initialisation de classes ainsi qu’une analyse qui permet d’inférer, pour chaque point de programme, l’ensemble des états d’initialisation des classes et l’ensemble des champs statiques qui ont déjà été initialisés. Une telle analyse peut être utilisée directement pour vérifier que les champs statiques sont initialisés avant leur première lecture. Elle peut aussi être utilisée pour améliorer l’analyse de pointeurs nuls présentée précédemment sachant que si un champ est initialisé avant une lecture, alors l’abstraction du champ peut être l’union de l’ensemble des valeurs écrites dans le champ.

Une partie de ces travaux a été réalisée avec David Pichardie et publiée à Bytecode Se-mantics, Verification, Analysis and Transformation (ByteCode) [HP09].

Garantir l’initialisation des objets

L’initialisation d’un système d’information est une phase délicate où des propriétés de sécurité sont vérifiées et des invariants installés. Il est donc important de garantir que seule-ment des objets entièrement initialisés puissent être librement manipuler par le programme et que les objets partiellement initialisés sont précisément suivis. Plusieurs failles de sécurité im-portantes du JRE (Java Runtime Environment) avaient pour cause des objets partiellement initialisés. Nous proposons ici un système de types fondé sur l’idée proposée par Fähndrich et Leino pour leur système de types de pointeurs nuls que nous avons déjà aussi utilisé pour notre analyse de pointeurs nuls : le suivi des objets en cours d’initialisation avec le type

Raw(C). Ce système de types permet à un développeur d’exprimer unepolitique d’initialisa-tion : quelles variables peuvent référencer des objets en cours d’initialisation. Exprimer cette politique sous forme d’un système de types offre l’avantage qu’il devient possible de vérifier automatiquement la politique.

L’exemple suivant montre une classe qui durant l’exécution de son constructeur s’as-sure que (i) l’utilisateur à la permission d’écrire dans le dossier /tmp (sinon la méthode

checkPermission lève une exception) et (ii) initialise un champ non null field par l’in-termédiaire de la méthodeinits.

class S e n s i t i v e C l a s s { private O b j e c t n o n _ n u l l _ f i e l d ; S e n s i t i v e C l a s s (){ i n i t s (); S e c u r i t y M a n a g e r sm = S y s t e m . g e t S e c u r i t y M a n a g e r (); if( sm !=null){ sm . c h e c k P e r m i s s i o n (new j a v a . io . F i l e P e r m i s s i o n ( " / tmp / - " , " w r i t e " )); } }

protected void i n i t s (){this. n o n _ n u l l _ f i e l d = new O b j e c t ( ) ; } public void s e n s i t i v e M e t h o d ( ) { . . . }

}

Cette classe possède plusieurs défauts de conception qui peuvent ne pas être évidents à voir au premier abord : elle possède au moins deux failles permettant d’appeler la méthode

(19)

xix

classeAttacker exploitant ces deux vulnérabilités. La première vulnérabilité est liée à l’uti-lisation d’une méthode virtuelle pour initialiser le champnon null field : il est possible de surcharger cette méthode et donc d’appeler la méthode sensible avant que les permissions soient vérifiées. La seconde vulnérabilité est liée à la méthode finalizequi est appelée par le ramasse-miette (garbage collector) avant la libération mémoire d’un objet. En effet, lorsque l’utilisateur n’a pas la permission d’écrire dans /tmp, la méthode checkPermissionéchoue, interrompant la construction de l’objet et le rendant normalement inaccessible, pouvant donc être collecté par le ramasse miette. Lorsque la méthodefinalizeest appelée sur l’objet, elle peut appeler la méthodesensitiveMethod.

class A t t a c k e r extends S e n s i t i v e C l a s s { protected void i n i t s (){

this. s e n s i t i v e M e t h o d (); }

void f i n a l i z e (){this. s e n s i t i v e M e t h o d ( ) ; } public static void m a i n ( S t r i n g a r g s [ ] ) {

try{ A t t a c k e r o = new A t t a c k e r ( ) ; } catch( T h r o w a b l e e ) { . . . }

} }

Le problème est connu et a été à l’origine de plusieurs failles de sécurité, mais aucune solution statique n’a été proposée pour résoudre ce problème. Nous proposons un jeu d’an-notations Java 5 pour que le développeur puisse annoter son code pour spécifier la politique qu’il souhaite voir assurée.

V ANNOT ::= @Init | @Raw | @Raw(CLASS) R ANNOT ::= @Pre(V ANNOT) | @Post(V ANNOT)

Une annotation produite par la règleV ANNOTpeut être utilisée pour les champs, les valeurs de retour et les paramètres des méthodes. Les receveurs des méthodes virtuelles peuvent avoir une annotation différente au début et à la fin de la méthode, d’où la règle de production

R ANNOT. Dans l’exemple précédent, il suffirait d’annoter la méthode sensitiveMethod avec

@Pre(@Init).

Nous avons formalisé la vérification statique de la cohérence des annotations sous forme d’un système de types. Cela permet de rejeter les classes qui, comme la classe Attacker

dans l’exemple précédent, pourraient essayer d’accéder à une méthode nécessitant un objet initialisé alors que l’objet possédé est partiellement initialisé.

Un tel système est modulaire : les classes peuvent être vérifiées une à une et, quand une classe ne respecte pas la politique, le programme peut être arrêté sans que la vulnérabilité détectée n’ait pu être utilisée. Cependant, pour être correcte, l’analyse doit être exécutée sur le programme complet, par exemple au fur et à mesure du chargement par la JVM. Nous avons évalué expérimentalement le nombre d’annotations nécessaires pour vérifier des classes existantes de la bibliothèque Java. D’après nos expériences, pour vérifier 380 classes des 381 classes des paquetsjava.lang,java.securityetjavax.security, seulement 43 annotations ont été ajoutées sur les 131.486 lignes de code source Java. Une classe n’a pas pu être vérifiée `

a cause d’une limitation de notre syst`eme de types sur les tableaux : il est en effet impossible actuellement de stocker un objet partiellement initialis´e dans un tableau.

Ces travaux ont été réalisés avec Thomas Jensen, Vincent Monfort et David Pichardie, et publiés dans les actes de la conférence internationaleEuropean Symposium on Research in

(20)

xx R ÉSUM É ÉTENDU Computer Security (ESORICS) [HJMP10]

Conclusion

Cette thèse présente des travaux allant de la formalisation de nouvelles analyses ou d’ana-lyse d’inférence pour des systèmes de types préexistant, à l’implantation de ces analyses pour l’ensemble du bytecode Java et à leurs évaluations expérimentales.

Fähndrich et Leino proposent une analyse de pointeurs nuls qui modélise finement l’ini-tialisation d’objets en étiquetant les objets en cours d’initialisation commebrut (Raw). Une contribution de cette thèse est de donner une fondation sémantique à cette idée en donnant une sémantique au langage et à ces annotations. Cela nous permet de prouver que notre analyse d’inférence et leur système de types sont corrects. Une autre contribution de cette thèse est d’avoir identifié cette propriété comme solution pour rendre plus sûre l’initialisation d’objets. Cette analyse peut être utilisée pour améliorer les garanties de sécurité que four-nit le vérificateur de bytecode (BCV). Avoir des fondations sémantiques et formelles est une motivation importante de nos travaux, mais nous ne fournissons pas seulement des analyses correctes, nous fournissons aussi des implantations.

`

A partir de nos spécifications formelles, qui abstraient de nombreux détails du bytecode Java, nous avons produit plusieurs logiciels avec succès.

– Nit est l’implantation de notre analyse de pointeurs nuls. Elle est disponible en licence GPL et a été téléchargée plus de 930 fois. Rendre cette implantation efficace a été une partie importante du travail. En tant qu’analyseur de programme complet, elle a besoin d’une abstraction du flot de contrôle, mais même une simple analyse de hiérarchie de classes (CHA) [DGC95] n’est pas si facile à implanter sur le bytecode car il y a 5 types d’appels de méthode différents. Nit a été une importante source d’amélioration pour Sawja.

– Nit/Eclipse, le greffon (ou plug-in) pour utiliser Nit à partir d’Eclipse, a été présenté `

a JavaOne, qui est une conférence organisée par Sun/Oracle pour les utilisateurs de la technologie Java. Nit a re¸cu des retours positifs de la part des utilisateurs et s’est révélé bien pratique pour faire la démonstration d’un analyseur statique. Vincent Monfort, ingénieur dans l’équipe Celtique, travaille à rendre le greffon indépendant de Nit pour qu’il puisse être utilisé par d’autre analyseur statique. Il pourrait ainsi être intégré à Sawja.

– Sawja est notre bibliothèque de développement d’analyseur statique pour le bytecode Java. Avec Javalib, son prédécesseur et maintenant composant, ils sont disponibles en licence LGPL et ont été téléchargés plus d’un millier de fois. Pour une bibliothèque gérant du bytecode Java à partir d’OCaml, ce résultat nous semble plutôt encourageant. Sawja est maintenant utilisée pour développer d’autre analyseur statique dans notre laboratoire, mais aussi par Julien Signoles et Philippe Hermann au CEA (Commissariat `

a l’ Énergie Atomique) et par Afshin Amighi et Dilian Gurov à l’Institut Royal de Technologie (KTH) à Stockholm.

– Notre analyse de sûreté d’initialisation d’objets a donné lieu à un prototype pour l’ANSSI (Agence Nationale de la Sécurité des Systèmes d’Information) qui est aussi dis-ponible sous forme d’un démonstrateur Web (http://www.irisa.fr/celtique/ext/ rawtypes/). Il a été intégré à une version de la machine virtuelle JamVM [Lou]. En ciblant nos analyses vers le bytecode Java, nous avons découvert à quel point le langage

(21)

xxi

est compliqué. Par exemple, nous avons réalisé la complexité de l’initialisation de classes durant le développement de Nit. Au départ, nous pensions qu’un initialiseur était similaire à un constructeur et que l’analyse de pointeurs nuls pourrait être aisément étendue aux champs statiques. Ce n’était définitivement pas le cas.

Une autre surprise a été la taille des programmes. Nos analyses de pointeurs nuls et d’initialisation de classes travaillent sur des programmes complets. Une telle analyse sur des programmes Java révèle des défis insoup¸connés. Par exemple, un simple programme hello worlden Java utilise en fait des milliers de méthodes dans la bibliothèque (runtime). Analyser même un petit programme requiert donc des outils performants. Nous avons apporté des solutions à ce problème en développant Nit puis Sawja.

L’objectif principal de l’analyse statique est d’améliorer la qualité du logiciel. Cet objectif est vain tant que l’analyse statique n’est pas plus largement adoptée que pour des systèmes de types à minima.

Une piste intéressante pour développer l’adoption des analyses statiques est probablement (et paradoxalement) les analyses incorrectes. Grâce à leur faible taux de faux positifs, le coût nécessaire pour corriger l’ensemble des problèmes relevés par l’outil est relativement bas. Cela peut rendre ces outils relativement efficaces et devrait aider à convaincre les décideurs que les analyseurs statiques peuvent avoir un ROI (Return On Investment) suffisant pour être plus largement utilisé.

Une autre difficulté pour l’adoption des analyseurs statiques est qu’ils semblent généralement être évalués relativement tard dans le processus de développement. Les ana-lyses statiques ont des difficultés à gérer précisément certains motifs de code (patterns), qui peuvent dépendre de l’analyse. Par exemple, Nit fonctionne mieux si un champ est initia-lisé dans son constructeur, mais certains développeurs ont tendance à initialiser les champs d’un objet juste après leur création. Un autre exemple est la manipulation des champs. Si une méthode teste qu’un champ est différent de nul avant de l’utiliser, il vaut mieux copier d’abord le champ dans une variable locale : cela évite à l’analyse de devoir prouver qu’un autre processus (ou thread) ne peut modifier le champ entre son test et son utilisation. Si l’analyseur statique est utilisé dès le début du développement, ces patterns difficiles seront plus naturellement évités par les développeurs.

Une fois que les erreurs simples seront corrigées, une fois que les développeurs auront pris l’habitude d’utiliser les analyseurs statiques et connaˆıtront les patterns à éviter pour faciliter le travail de ces outils, alors des analyses plus correctes (trouvant plus d’erreurs) seront nécessaires. Une autre approche est donc probablement de développer dès maintenant des analyses correctes, mais où des options permettent d’activer des suppositions incorrectes et où des priorités sont associées aux alarmes. Par exemple, nous avons introduit dans Nit des options permettant de supposer que les tableaux ne contiennent que des valeurs non nulles. Une autre solution pourrait être de différencier les valeurs nulles provenant des tableaux de celles provenant des champs. Ensuite, déréférencer une valeur nulle de tableau déclencherait une alarme de priorité plus faible qu’un déréférencement d’une valeur nulle de champ.

Un autre axe qui peut être étudié est l’information donnée sur la cause d’une alarme. En effet, lorsqu’une alarme est levée, le développeur a besoin d’informations pour trouver l’origine de l’alarme (et éventuellement l’erreur). Par exemple, en montrant les annotations que Nit a trouvées, il est plus simple de comprendre pourquoi il peut reporter à un certain point de programme une erreur. Cependant, comprendre pourquoi Nit a inféré une annotation peut être fastidieux.

(22)

(23)

3.1 Introduction . . . 17 3.2 Related Work . . . 19 3.2.1 Type Systems . . . 19 3.2.2 Type Inference . . . 19 3.3 Non-Null Annotations . . . 20 3.4 Syntax and Semantics . . . 21 3.5 Null-Pointer Analysis . . . 22 3.5.1 Modular Type Checking . . . 22 3.5.2 Abstract Domains . . . 23 3.5.3 Inference Rules . . . 24 3.5.4 Example . . . 27 3.6 Correctness . . . 29 3.7 F¨ahndrich and Leino’s Type System . . . 31 3.8 Conclusions . . . 35

(24)

xxiv CONTENTS

4 A Non-Null Annotation Inferencer for Java Bytecode 37

4.1 Towards a Bytecode Analysis . . . 37 4.1.1 Alias Analysis . . . 37 4.1.2 A New Abstract Value . . . 38 4.1.3 Analysis of instanceofInstructions . . . 39 4.2 Implementation . . . 40 4.3 The Nit/Eclipse Plug-in . . . 41 4.4 Empirical Results . . . 42 4.5 Related Work . . . 45 4.6 Conclusion . . . 45

5 Sawja: Static Analysis Workshop for Java 47

5.1 Introduction . . . 47 5.2 Existing Libraries for ManipulatingJava Bytecode . . . 48

5.3 High-level Representation of Classes . . . 50 5.4 Intermediate Representation . . . 52 5.5 Complete Programs . . . 53 5.5.1 API of Complete Programs . . . 53 5.5.2 Construction of Complete Programs . . . 54 5.6 Conclusion . . . 57

6 Static Initialization 59

6.1 Introduction . . . 59 6.2 Why Static Analysis of Static Fields is Difficult? . . . 60 6.3 The Language . . . 62 6.3.1 Syntax . . . 62 6.3.2 Semantics . . . 63 6.4 A Must-Have-Been-Initialized Dataflow Analysis . . . 65 6.4.1 Informal Presentation . . . 66 6.4.2 Formal Specification . . . 67 6.4.3 Implementation . . . 71 6.5 A Three-Valued Initialization State Analysis . . . 71 6.5.1 MHBI Analysis is Too Dependent on the Control Flow Analysis . . . 71 6.5.2 Specification of the Analysis . . . 73 6.6 Towards an Implementation . . . 76 6.6.1 Handling the Full Bytecode . . . 76 6.6.2 Scaling the Analysis . . . 77 6.7 Related Work . . . 78 6.8 Conclusion and Future Work . . . 79

7 Secure Object Initialization 81

7.1 Introduction . . . 81 7.2 Related Work . . . 82 7.3 Context Overview . . . 82 7.3.1 Standard Java Object Construction . . . 83 7.3.2 Attack on the Class Loader and the Patch From Oracle . . . 83 7.4 The Right Way: A Type System . . . 85

(25)

CONTENTS xxv 7.5 Formal Study of the Type System . . . 89 7.5.1 The language . . . 89 7.5.2 Initialization Types . . . 90 7.5.3 Typing Judgment . . . 91 7.6 Extensions . . . 92 7.6.1 Introducing Dynamic Features . . . 92 7.6.2 Handling Arrays . . . 93 7.7 Experimental Results . . . 93 7.7.1 Implementation . . . 93 7.7.2 A Case Study: Oracle’s JRE . . . 94 7.8 Conclusion and Future Work . . . 96

8 Conclusion 97

(26)

(27)

Chapter 1

Introduction

Software bugs are common, so common that developers and editors do not want to be re-sponsible. Thus, software licenses usually include a disclaimer of warranty and liability such as the following one (extracted from the GNU General Public License).

“In no event [...] will any copyright holder [...] be liable to you for damages, including any general, special, incidental or consequential damages arising out of the use or inability to use the program [...], even if such holder or other party has been advised of the possibility of such damages.”

Software may not perform as promised, and may result in data or financial loss for the user. Even if the developer was informed of the defect, he often takes no responsibility for it.

Despite these disclaimers and limitations, software bugs usually still cost to the developer. Bugs may cost its popularity to the developer. Bugs may also carry a cost because of a less-limited warranty. E.g., some licenses offer to reimburse the loss directly caused by the software within the limit of the price of the software. Bugs also cost resources when the developer needs to fix the bug and distribute a patch. For largely-deployed unconnected devices, it may be very expensive. The developer may also be the user, in which case the developer directly suffers from the consequences of bugs in his software. For those reasons, despite warranty and liability disclaimers, most companies developing software do invest in software quality.

1.1

Improving Software Quality

Several tools exist to improve software quality. The one in which companies invest the most is certainly tests. During testing, the code is run on several test sets and the output of the program for those sets is checked by an oracle (which can be a human, a previous version of the program, a model of the program, etc.). Testing is not exhaustive: it is impossible to prove the absence of a class of bugs using testing because it is impossible to test programs on all their possible entries. Therefore, although testing allows gaining some confidence in the quality of the software, bugs may still happen on the software. Another kind of approach is to completely prove correct a formal specification of a program, and then extract the code from the specification.1 It has been industrially used with the Atelier B and the B Method [Abr96] and in more academic research with proof assistants such as Coq [Coq] or Isabelle/HOL [NPW02]. This approach requires a highly technical expertise and is usually

1_{There is another approach where the proof is done directly on the code, for example within the JML}

framework, but we can see this approach as a special case where the code is the specification.

(28)

2 CHAPTER 1. INTRODUCTION

time consuming. In industry, it is only used where the cost of a bug may be huge, like in the transport industry where a bug may cost the lives of hundreds of people. It is also preventively introduce in domains where it may be required by law or standards in the future, such as in the aircraft or smart-card industry. Finally, the one that is arguably the most used, although people usually do not think about it, is probably static analysis (SA). Indeed, almost all developments are done in languages that integrate type systems, like C, C# or Java, which are a kind of SA. An analysis of software is static if it is performed without actually running the studied software. It is a powerful technique that enables automatic verification of programs with respect to various properties such as type safety or resource consumption.

As opposed to test, SAs may be exhaustive: they can give information on the software that is valid for all executions of the program and in particular that does not depend on the inputs. An advantage over manual proofs of correctness is that SAs are usually fully automatic. However, this comes at the price of undecidability in the general case: a SA will inevitably fail to prove that some correct programs are indeed correct (in the sense that they respect the property of interest).

A static analyzer checks that some code (source or machine code, a small piece of code or a complete program) respects some property. If the analyzer finds that the program violates the property at some point, it issues an alarm, called apositive. An analyzer may report many positives for one analyzed code. E.g., all the lines of the source code that call a particular method. As a result of undecidability, most analyzers cannot report the exact set of points that do not respect the property. Hence, they issue false positives or false negatives. A false positive is an alarm that is issued when, in fact, the code respects the property but the analyzer was unable to prove it. A false negative is an alarm that is not issued despite the code violates the property because the analyzer did not notice it. A sound analysis reports no false negatives. A complete analysis reports no false positives.

To face incompleteness, different approaches may be used by SAs.

• SAs may use a more pragmatic approach and try to differentiate programs that may be correct from programs that may be incorrect, using heuristics or user-trusted annota-tions, and only reporting the latter ones. Although this is unsound (it introduces false negatives), it also allows reducing the number of false positives. Developers then only concentrate on alarms that are very likely to be real issues. Those tools are known as bug finders. This is notably the case of FindBugs [HSP06].

• Some SAs rely on user-untrusted annotations. Checking a proof is often easier than proving, and user annotations may be seen as partial proof that an analysis checks instead of proving them. Untrusted annotations may also be seen as “tips” reducing the search space of the analysis and allowing for more precise analyses. E.g., the Java compiler requires the user to put type annotations on each variable. This reduces the number of false positives.

• SAs may also focus on languages that are easier to reason about. For example, data are arguably easier to track in functional languages where, by default, there are no references, and definitions associate directly a value to a name. Despite a rich type system (which makes the search space extremely large), core ML is provided with type inference. Conversely, in Java, all variables are mutable (even final fields when look-ing at the Java bytecode), their declaration is separated from their initialization, and

(29)

1.2. JAVA VERSUS JAVA BYTECODE 3 initialization of fields, objects and classes in Java is particularly difficult, as this thesis will illustrate.

• Finally, SA may be used to infer invariants, either helping the development (refactoring, reverse engineering), an assisted proof of correctness, or another SA.

As this thesis will try to demonstrate, Java (or Java bytecode) is not a language easy to reason with. It is a full-featured language, used in the industry, and using complex initializa-tion schemes. Building sound and precise analyses for Java is therefore a difficult task. This thesis proposes sound analyses and tools for the actual Java bytecode. They may be used directly to ensure security properties (as proposed in Chapter 7), or as a basis to make the development of other analyses easier and the analyses more precise.

1.2

Java versus Java bytecode

Java [GJSB05] is a source language. It is usually compiled to Java bytecode, the low-level programming language interpreted by the Java Virtual Machine (JVM) [LY99].

As a source language, Java has many constructs which have similar effects, but which may be easier to use or to read by developers. E.g., a for loop can be encoded into a

while loop, and a switch instruction can be encoded intoif/then/else conditionals. All loops in Java are compiled into conditional and unconditional jumps at the bytecode level. The same occurs with other language constructs and the Java bytecode contains therefore a lot less constructs.2 Another issue with Java is that it evolves more quickly. E.g., generics, annotations, asserts, autoboxing and unboxing, enum types, foreach loops, variable arity methods and static imports have been added to the Java language without changing the Java bytecode language. Finally, when one wants to analyze a program, the source may not be available. This may be the case if an external library is used, if the compiler is not trusted, or if a user wants to check code he has downloaded. E.g., the Java ByteCode Verifier (BCV), a checker integrated in the JVM, analyzes the bytecode before executing it, when the source code is no more available. For those reasons, the work presented in this thesis targets the Java bytecode, although part of it also applies to Java.

Although Java bytecode is not a source language, it is not as low level as the assembly language of standard microprocessors: it is a typed and based language. The stack-based architecture helps to ensure the independence from the hardware. E.g., the number of registers available in the microprocessor is not needed. Being typed means that all data are labeled with a type, e.g., ensuring that when a field is read from an object, as in o.f, the objectois an instance of a class that declares a fieldf. The Java bytecode, like Java, is a full-featured language: it supports objects, classes, interfaces, arrays, basic types such as 8, 16, 32 and 64-bit integers, 32 and 64-bit floating-point numbers, Booleans, characters, strings, multi-threading, 5 different types of method calls, exceptions, subroutines, unstructured control-flow, etc. To compact the code and for efficiency reasons, an operation can be encoded in several ways. E.g., to push an integer onto the stack, one may use the instruction bipush,

sipush,ldcorldc w. Most of the time, those details do not affect the analyses we may build. Thus, although the analyses we present in this thesis are targeted to the Java bytecode, we do

2_{Although there are more than 200 Java bytecode instructions, there is no expression in bytecode and many}

(30)

4 CHAPTER 1. INTRODUCTION

x, y∈Var jmp∈ L=N

p ∈ Prog ::= { classes∈ P(Class), main∈Meth,} c ∈ Class ::= { super∈Class⊥, fields∈ P(Field)}

f ∈ Field ::= { ftype∈Type } m ∈ Meth ::= { instrs∈Instr array}

e ∈ Expr ::= null|x|e.f

ins ∈ Instr ::= x←e|x.f ←y |x←newc|if (?) jmp|return

Figure 1.1: Language Syntax

not formalize the analyses directly on the bytecode but on another language, BIR (Bytecode Intermediate Representation), that will be presented in Chapter 2.

1.3

Background on Static Analysis Through a Tutorial

This thesis formalizes analyses using constraint systems, dataflows equations or type (and) effect systems. Each analysis is presented in the formalism we think is the most appropriate. Of course, theses analysis could all have been presented in the standard framework of abstract interpretation [CC77]. It could have been of interest to prove the optimality of our analyses or to introduce widening operators. However, having a proof of optimality was not one of our main objectives and we did not use any widening operator.

In this section, we propose a tutorial to introduce SA. We present a language with an abstract syntax and show how a program in this language may look like with an example. We also introduce type systems with an example, and show that it is equivalent to a constraint system. Finally, we explain how such a constraint system can be solved.

Figure 1.1 presents the (abstract) syntax of a very small language based on the one that is presented in Chapter 2. We use this language as a base to demonstrate the basics of SA. A program in this language is a record composed of a fieldclasses, which contains the classes of the program, and a field main, which is the only method of the program. Having only one method avoids introducing method calls. A class c is composed of two fields: super, which contains the superclass if the class has one or ⊥otherwise, andfields, which contains the set of fields defined in class c. A field only contains a type annotation. This type annotation is not yet specified and it can be changed depending on the type system we want to specify. A method contains an array of instructions. An expression is the null constant, a local variable, or a field read. An instruction may be an assignment of an expression to a local variable, an assignment of a local variable to a field, an assignment of a newly allocated object to a local variable, or a conditional. All instructions are standard but the object allocation, which runs no constructor, and the conditional, which is a non-deterministic jump: it abstracts standard conditionals and avoids introducing Booleans in our language.

A program in this language may not be valid for several reasons. The instructionif(?) jmp

may jump outside the instruction array if jmp is greater than the instruction array of the method, thesuper field may not describe a class hierarchy, the last instruction of the array may not be a return instruction, one may try to dereference the null constant, or one may try to access a field which is not defined.

(31)

1.3. BACKGROUND ON STATIC ANALYSIS THROUGH A TUTORIAL 5 these flaws, with the exception of the dereferencing. Before executing the code, at load time, the Java Virtual Machine (JVM) executes the BCV on each class to check some properties on the code. Among these properties, the BCV ensures that there may be no jump outside the code array, the number of local variables used by each method is below the number of local variables it declares to use, that methods are given the right number of arguments when they are called, etc. The absence of null-pointer dereferencing is not checked at load time by the BCV, it is checked at run time and leads toNullPointerExceptionwhen it occurs.3 To demonstrate static analysis, we assume that the code has already been partially checked and that there is no jump outside the instruction array, that the last instruction is a return and that the relation described by superis indeed a hierarchy. This allows us to define a simple analysis to check the latter property: when a field of an object is accessed, the field is indeed defined in the class of the object or in one of its superclasses.

If the program contains a field access x.f, we need to check that each instance that x

may point to is of a class that defines f. Like for the Java language, we consider an instance has a field if it is defined in its class or in one of its parents. To check this property, we could try to compute all the objects that may be referenced by x, and check that their class defines f; but this is not computable in general, i.e. for some program, such an analysis would not terminate. The main issue is that the number of objects allocated by a program is unbounded (or only by an unknown and huge value, e.g., the number of objects that may fit in the memory of a computer). For the problem to be computable, we need to simplify it, and this can be achieved by abstracting some information. Many abstractions may be defined, we will use here a standard approach for object-oriented languages: we will abstract all objects that may be referenced by a variable by a single class.

Letsuperclasss∈Class×Classbe the relation such thatc1 superclass c2 iffc2.super=c1.

We call c1 the (direct) superclass of c2. Let parent be the transitive closure ofsuperclass. If

c parent c0, we say thatcis a parent of c0, or thatc0 is a subclass ofc, wri