JDOM ו-Tidy
כדי לעבוד עם ה-DOM של דף HTML צריך קודם כל לוודא שהוא Well formed, כלומר שהמבנה שלו הוא כמו XML - כל ה-Tags סגורים וכו'. עבור דף HTML שמורידים מאתר כלשהו ניתן להריץ עליו את תוכנת ה-
Tidy שבודקת אם המבנה תקין וגם יכולה לתקן את הדף. אחרי שהדף תקין ניתן לעבוד עם ספריה בשם
JDOM שמאפשרת לעבוד עם ה-DOM של הדף. פרטים נוספים בלינקים המצורפים.