HTML Parsing

tc2000

New member
HTML Parsing

אני רוצה לקבל קוד HTML של אתר ואז לנתח אותו. השתמשתי באובייקטים WebRequest ו-WebResponse כדי לבצע את הבקשה ולקבל Stream של קוד העמוד. אבל, אני לא רוצה לקבל רק string של כל הקוד, כי זה מאוד קשה לעשות עליו parsing. ב-XML אי אפשר כי הוא לא well-formed. האם אתם מכירים דרך שבה אני אוכל לנתח את הקוד של העמוד לא כטקסט אלא כעץ של אובייקטים כמו שה-Internet Explorer מנתח אותו (לדוגמה: אובייקט עמוד שבתוכו אובייקט טבלה שבתוכה אובייקט תמונה וכו')?
 

tc2000

New member
...

התוכנה היתה ספציפית ל-Parsing של סוגי פונטים ב-HTML. תודה בכל מקרה, השגתי את מבוקשי באתר הזה.
 
למעלה