נקיון HTML ב #C

sharon669

New member
נקיון HTML ב #C

איך אפשר לתקן דף HTML ולהפוך אותו ל XHTML בשפת #C שאלתי לפני שבוע , אבל קיבלתי תשובה ב ASP האם יש כלים סטנדרטיים במסגרת NET. ? תודה .
 

sharon669

New member
אני לא עובד ב ASP

אני כותב אפליקציה חלונאית ב #C לכן לא יכול להשתמש ב RESPONSE אני חושב שיש דרך לטפל בקובץי HTML ולהפוך אותם ל XHTML בעזרת הספריות XML של NET. אין לי מושג מאיפה להתחיל לחפש . תודה .
 

sharon669

New member
תודה גלעד , אבל ... ../images/Emo4.gif

אני מצאתי את זה די מזמן , ואני מנסה שלא להשתמש בספריות חיצוניות (SgmlReader , Tidy ) אין איזה משהו מובנה ?? הבנתי שהספריות XML של מיקרוסופט מאד חזקות , אולי עם אחת מספריות ה XML ? תודה .
 

yuval k

New member
../images/Emo26.gif

כדי להחליף על String - ראה פה, מה-MSDN
 

sharon669

New member
איך בדיוק עוזר לי RegEx

?? המשימה של להפוך HTML ל XHTML הרבה יותר מתוסמכת מאשר החלפת טקסטים פשוטה . תודה .
 

yuval k

New member
אז זהו...

ש-RegExp זה הרבה מעבר להחלפת טקסטים פשוטה
RegExp זה תבניות. אתה מגדיר תבנית, ומחליף לפיה... וזה הרבה יותר חזק מהחלפה פשוטה של טקסטים. ראה שם על RegExps
 

sharon669

New member
תודה יובל , אבל (חרוז ../images/Emo3.gif)

אני יודע ומכיר את ספריית RegExp , אבל זה לא מה שאני צריך , תחשוב על המצב הבא : HTML :
<font>this is an error in font tag</front>​
ספריה של XML אמורה לעלות על הטעות ולתקן אותה , RegExp לא מסוגל לעשות את זה . תודה .
 

gilad g

New member
המממ

אני חושב שהבנתי למה אתה מתכוון. אתה יכול לנסות לטעון את הקובץ בעזרת XmlTextReader (או משהו כזה, לא זוכר את שם הקלאס המדויק), כדי לבדוק האם הוא חוקי. אבל זה לא יבדוק האם הקובץ הוא קובץ XHTML חוקי, כי הבדיקה הזאת לא בודקת ששמת את ה-attributes הנכונים לתגיות הנכונות. בשביל זה תצטרך להריץ בדיקת RegExp ידנית.
 

yuval k

New member
ראיתי את זה ../images/Emo26.gif

זה... אין סיבה שזה לא יעבוד גם על המנוע של הדוט נט ל-RegExps (ראה בעניין ההתאמה של תג סוגר לפותח שיש שם). ככה אתה יכול להשתמש בתבנית בתוך ה-RegExp שלך, ולבדוק למשל האם תג מסויים נסגר. אבל אתה תקוע בעניין של וידוא attributes... איך לוודא שהם תחומים במרכאות זה לא כ"כ קשה עם RegExp. אם אתה צריך לוודא לפי שם, אני לא יודע איך לעשות את זה יעיל
 

sharon669

New member
RegExp

ציטוט : " ולבדוק למשל האם תג מסויים נסגר " אחת הבעיות הגדולות זה שלא תמיד אני יודע איזה תגים יש . וגם , אני אצטרך לכתוב חוקים עבור כל תג ותג ובנוסף יש טקסטים בעמוד HTML שאין להם תגים בכלל כמו מלל רגיל , תגים אלו חייבים להיות תחומים ב <P> ובנוסף יש המון בעיות סמנטיות ש RegExp לא עונה עליהם , לכן נכתבו תוכנות כמו http://tidy.sourceforge.net/ שמנקה את HTML ועושה tagBalancing אני חשבתי שיהיה קל למצוא ספריה של XML שתתן מענה לבעיה, אבל .....
 

gilad g

New member
אבל אין...

מה לעשות, מיקרוסופט סיפקו פלטפורמה, וכמות בסיסית של ספריות. הם לא יעשו בשבילך את העבודה, אחרת בשביל מה קיים המתכנת?
 
למעלה