Parsing ל HTML

  • פותח הנושא ut29
  • פורסם בתאריך

ut29

New member
Parsing ל HTML

אני מחפש PARSER ל HTML , ב PHP שמקבל את ה SOURCE ןיודע להוציא מתוכו חלקים שאני בוחר, דוגמא: רק את הBODY או את כל הלנינקים... יש למישהו מושג? עוט
 

orenphp

New member
די פשוט, preg_match_all

לכל דבר: תוצאות של חיפוש, לינקים וכו´ יש תבנית. אתה צריך לדעת איך להוציא מתוך הקיים את הרצוי, כדי שתיקרא על הפונקציה preg_match_all מphp.net ותתחיל לעבוד איתה.. בקשר ללינקים לדוגמא. $pattern = "/<a*.*href=´(.*?)´*.*>/"; preg_match_all($pattern, $text, $matches); ואז כל התוצאות ישמרו במערך ב $matches (תקרא על זה באתר) ומתוך זה תוכל להוציא את כל הלינקים, ועל אותו עיקרון את השאר.
 

ut29

New member
תודה...

עם הלינקים והאימג´ים הסתדרתי, אבל משום מה לחתוך את ה BODY אני לא מצליח (אני צריך לנקות את ה SOURCE ולהשאיר רק את התוכן של ה BODY בלי התגיות של BODY ו BODY/ אם יש לך עוד רעיון... תודה בכל אופן עוט
 

orenphp

New member
כן... נסה את זה

$text = fopen($myfile,"r+"); $begin = strpos($text,"<body>"); $body_text = substr($text, $begin, strpos($text, "</body>"));
 

orenphp

New member
סליחה.. חסר לך גם

חסר לך גם ההוצאה של הסטרינג עצמו מהקובץ, זה לא משנה, העיקרון כתוב. :) מקווה שעזרתי. אורן
 

ut29

New member
תודה...

כך חשבתי, ניסיתי עם REGULAR EXPRESSIONS אבל זה לא ככ הצליח... תודה בכל אופן , עזרת
 
למעלה