זקוקה לעזרה באיסוף data

זקוקה לעזרה באיסוף data

למי שקרא כבר בפורום אחר, סורי על הכפילות * התיזה שלי, על קצה המזלג, עוסקת בניתוח אוטומטי של טקסטים מלאים של ספרים (fiction בלבד). עבור זה כמובן אני צריכה קבצי טקסט שמכילים את הטקסטים המלאים האלו. יש כמה אתרים שמאפשרים הורדה חופשית של ספרים, למשל Project Gutenberg ודומים לו. כבר הורדתי כל מה שניתן משם אבל הבעיה היא שמדובר בספרים קצת ישנים, בעיקר מהמאה ה-19 ואחורה. אם מישהו פה יודע/מכיר/שמע על מקורות אחרים לספרים קצת יותר מודרניים אני אשמח לשמוע. כמו כן, אם אתם מכירים אתרים שבהם כחלק מקידום מכירות נותים לפעמים להוריד ספרים - בכלל טוב. אם למישהו יש ספרים שהוא הוריד ובא לו לחלוק איתי, ואפילו אחד או שניים, זה מאד יעזור לי. הכל חוקי חוקי, אני לא מפיצה כלום ולא מעבירה הלאה. כמה דברים טכניים: - הספרים צריכים להיות מהז'אנר של fiction - באנגלית - בפורמט של טקסט (ז"א לא תמונות. הכי טוב TXT, אם לא אז RTF, PDF או אפילו XML או HTML אני אוכל להמיר) cheers
 

חייםלוי

Member
מנהל
ברוכה הבאה ../images/Emo24.gif

באתרים האלה יהיו בדר"כ ספרים ישנים משום שהם לא עוברים על זכויות יוצרים. זכות יוצרים על ספר פגה 70 שנה אחרי מותו של המחבר. כך בארץ וכך בעולם. תבדקי את האתר הזה http://www.bibliomania.com/0/0/frameset.html הוא לא גדול כמו פרוייקט גוטנברג אבל יש בו חומר. אם טוב לך גם עברית תבדקי בפרוייקט בן יהודה http://benyehuda.org תכתבי בגוגל fiction full texts ותקבלי די הרבה אתרים. החומר יהיה ישן בגלל זכויות היוצרים. באתר הזה יש גם חומר יותר מודרני http://www.contemporarywriters.com/authors/
 
הבעיה הרגילה של זכויות יוצרים ../images/Emo10.gif

אכן רוב האתרים החוקיים די מקבילים לגוטנברג. עברית לא טוב לי בכלל, אבל אני אבדוק את האתר שציינת. תודה! דרך אגב, לא ידעתי על עניין 70 השנה, כל יום לומדים משהו חדש
 
למעלה