HTML Parsing
אני רוצה לקבל קוד HTML של אתר ואז לנתח אותו. השתמשתי באובייקטים WebRequest ו-WebResponse כדי לבצע את הבקשה ולקבל Stream של קוד העמוד. אבל, אני לא רוצה לקבל רק string של כל הקוד, כי זה מאוד קשה לעשות עליו parsing. ב-XML אי אפשר כי הוא לא well-formed. האם אתם מכירים דרך שבה אני אוכל לנתח את הקוד של העמוד לא כטקסט אלא כעץ של אובייקטים כמו שה-Internet Explorer מנתח אותו (לדוגמה: אובייקט עמוד שבתוכו אובייקט טבלה שבתוכה אובייקט תמונה וכו')?
אני רוצה לקבל קוד HTML של אתר ואז לנתח אותו. השתמשתי באובייקטים WebRequest ו-WebResponse כדי לבצע את הבקשה ולקבל Stream של קוד העמוד. אבל, אני לא רוצה לקבל רק string של כל הקוד, כי זה מאוד קשה לעשות עליו parsing. ב-XML אי אפשר כי הוא לא well-formed. האם אתם מכירים דרך שבה אני אוכל לנתח את הקוד של העמוד לא כטקסט אלא כעץ של אובייקטים כמו שה-Internet Explorer מנתח אותו (לדוגמה: אובייקט עמוד שבתוכו אובייקט טבלה שבתוכה אובייקט תמונה וכו')?