Jsoup (parseur HTML)       


Description

   Jsoup est une librairie pour parser du HTML.

Expérience personnelle

    J'ai utilisé Jsoup dans un projet interne, et cela m'a sauvé des heures de développement. De plus, je n'ai pas fait les tests unitaires que j'aurais du faire avec une librarie que j'aurais développée moi-même.

Commentaires

   Le parsage du HTML est une tâche complexe et ça ne vaut pas la peine de coder soi-même les classes pour faire ce travail.  

Exemple

  Problème:
  Vous devez retirer les balises HTML du texte suivant:
"<p>An <a href='http://example.com/'><b>example</b></a> link.</p>"
  Afin d'obtenir:
"An example link."
  Solution:
  Vous faites simplement::
String html = "<p>An <a href='http://example.com/'><b>example</b></a> link.</p>";
Whitelist whitelist = Whitelist.simpleText();
String text = Jsoup.clean(html, whitelist);

Références