על היוזמה

עיתונות מן העבר היא אחד הכלים החשובים שדרכם אפשר להתוודע לתקופות שחלפו, לקרוא על מאורעות היסטוריים, לעקוב אחרי תהליכים בהתהוותם, לפגוש אישים ולקרוא מפרי עטם, להיתקל במידע מפתיע, ולחוות את העבר מזוויות מגוונות: יומיומיות, כלכליות, תרבותיות, אידיאולוגיות ועוד. עיתונות היסטורית היא לפיכך מקור חשוב ביותר למחקר, כמו גם אשנב למעוניינים לקרוא את העבר באותן מלים עצמן בהן קראו אותו בני הזמן.

הספרייה הלאומית מחזיקה במחסניה אוסף חשוב של פרסומים תקופתיים בשפה הערבית שהופיעו בארץ ישראל/פלשתינה/פלסטין (להלן: "הארץ") החל מראשית המאה העשרים. פרסומים אלה כוללים עיתונים יומיים בעלי דגש חדשותי ואחרים הומוריסטיים, כתבי עת חברתיים, חינוכיים ותרבותיים שהתפרסמו באופן סדיר פחות או יותר (שבועונים, דו-שבועונים, ירחונים וכו'). המוציאים לאור היו בחלקם גופים ציבוריים וחלקם אנשים פרטיים. אחדים מאלה פעלו לאורך כל התקופה או רובה, בעוד אחרים החזיקו מעמד לאורך פרקי זמן קצרים יותר.

עיתונים בערבית הופיעו בארץ לראשונה בשלהי המאה התשע-עשרה, ועד שנת 1948 הגיע מספרם המצטבר לכ-250. כמחצית הכותרים מצויים באוסף של הספרייה הלאומית, בצורה מלאה או חלקית. מדובר באוסף חשוב ביותר שקשה למצוא לו מקבילה בעולם. סכנת פגעי הזמן הגורמים להתפוררות הנייר הניעה אותנו לפעול לשימורו של האוסף המיוחד הזה באמצעות דיגיטציה, אשר מאפשרת גם את הנגשתו בצורה נוחה לקהל הרחב. האוסף מקיף פריטים משנת 1908 ועד שנת 1948. בשלב הראשון, הניסיוני, בחרנו להעמיד לרשות המשתמשים עיתונים משני פרקי זמן בקצות התקופה: האחד משנת 1908 ועד שנת 1920; והשני משנת 1945 עד שנת 1948. בשלב הבא נרחיב את המאגר המונגש ונכלול בו עיתונות שיצאה לאור בין שתי תקופות הקצה האלה, דהיינו, בשנים 1944-1921.

למידע נוסף על העיתונות הערבית בשנים הללו אתם מוזמנים לקרוא את המאמר "מבוא: תולדות העיתונות הערבית בארץ" של פרופ' עמי איילון וד"ר נביה בשיר:

https://blog.nli.org.il/history-of-the-arabic-press/

לקראת השלב הבא של הפרויקט, אנו מחפשים שותפים — הן מוסדות והן אספנים פרטיים — שיוכלו לתרום להרחבת מאגר העיתונות ו/או להשלמת חוסרים של כותרים שכבר נמצאים באתר. באם הינכם מעוניינים לסייע לנו בפיתוח המאגר, אנא

צרו קשר.

— ד"ר רחל יוקליס, אוצרת אוסף האסלאם והמזרח התיכון

הוועדה האקדמית המייעצת של הפרויקט ממליצה ומסייעת בבחירת הכותרים העולים לאתר, וכן תורמת לתחום התוכן.

חברי הוועדה:

פרופסור עמי איילון, אוניברסיטת תל אביב

ד"ר נביה בשיר

פרופסור מוצטפא כבהא, האוניברסיטה הפתוחה

פרופסור הלל כהן, האוניברסיטה העברית בירושלים

פרופסור מחמוד יזבק, אוניברסיטת חיפה

ד"ר אביגיל יעקבסון, האוניברסיטה העברית בירושלים

ד"ר מרב מאק, מכון טרומן לחקר השלום באוניברסיטה העברית בירושלים

ד"ר יוני מנדל, אוניברסיטת בן גוריון בנגב

ד"ר יוני פורס, אוניברסיטת חיפה

היבטים טכנולוגיים

הטכנולוגיות העומדות בבסיס הפרויקט

1— טכנולוגיית סריקה:

סריקת העיתונים המופיעים באתר נעשתה מאחד משני המקורות האפשריים: נייר העיתון המקורי או מיקרופילם, כאשר ההעדפה היא תמיד למצוא את העותק הטוב ביותר מבחינת איכות, והשלם ביותר מבחינת מצאי של גיליונות. זו משימה לא פשוטה, מכיוון שעיתונים היסטוריים נמצאים בתהליך מתמיד של שחיקה והתפוררות, והאוספים כמעט תמיד חלקיים בשלמותם. במובן הזה, מאמצי הסריקה של חומר ארכיוני בכלל, ועיתונים היסטוריים בפרט, הינם חלק ממשימה חשובה של הצלת מידע, שאחרת עלול לאבד לנצח. הבחירה בין צילום נייר עיתון לסריקה ממיקרופילם נעשתה בכל כותר לפי שיקולים של מצב החומר ושלמות האוסף — עם מתן עדיפות לסריקה ממקור הנייר, ככל שהדבר היה אפשרי.

כל החומרים המופיעים באתר נסרקו/ צולמו במרכז הדיגיטציה של הספרייה הלאומית במיוחד לצורך פרויקט זה. העיתונים שנסרקו ממיקרופילם מופיעים בשחור-לבן (בינארי) או בגווני אפור. במקרים בהם צילמנו/ סרקנו חומר ממקור נייר שהיה צבעוני, השתדלנו לצלם בצבע כדי לשמור על נאמנות מרבית לחומר המקורי.

איכות הסריקה/ צילום של החומרים הנכללים בפרויקט היא של 300 DPI (בחלק מהחומרים גם 400 DPI).

החומרים שמקורם בנייר עיתון נסרקו/ צולמו במצלמת Z645 PENTAX, סורק PANASONIC KV-S5055C , ומצלמת CANON 5D.

החומרים שמקורם במיקרופילם נסרקו בסורק מיקרופילמים Eclipse by Nextscan.

לאחר הסריקה/ צילום כל החומר עבר QA קפדני ועיבוד גרפי מינימלי (לפי הצורך).

2— פלטפורמת הנגשת החומרים והקלדה ידנית של כותרות ושמות מחברים:

בפרויקטים רבים של עיתונות היסטורית שקיימים ברשת כל החומרים הסרוקים עוברים סריקת טקסט בטכנולוגיית זיהוי כתב— Optical Character Recognition) OCR). בפרויקט זה החלטנו, לאחר ניסיונות רבים עם תוכנות OCR שונות, לא להשתמש בטכנולוגיה זו. הסיבה היא שתוצאות ה-OCR המתקבלות בשפה הערבית נמוכות למדי (30-20% הצלחה). אי לכך — אין בהן די תועלת לצרכי ביצוע חיפושים בטקסט. כדי להתמודד עם המכשול הזה בחרנו בשיטה המשלבת הקלדה ידנית של כותרות המאמרים ושמות המחברים כדי לאפשר לבצע חיפוש ברמת כותרת מאמר/ שם מחבר. שיטה זו אינה מיטבית — בוודאי בהשוואה ל-OCR מלא — אך יתרונה הוא שהיא מאפשרת לעקוף במידת מה את קשיי ה-OCR בערבית.

ההקלדה הידנית של הכותרות ושמות המחברים הציבה בפנינו דילמה: מה עושים כאשר מילה מסוימת הודפסה עם "טעות" — שייתכן וכלל איננה טעות, אלא רק שיטת איות שונה שהייתה מקובלת אז. ההחלטה העקרונית אותה קיבלנו הייתה לא לתקן שום "טעות", אלא להקליד בצורה מדויקת את מה שהודפס בטקסט המקורי. לדבר זה יש השפעה על תוצאות החיפוש כמובן, ולכן, אם לא תמצאו את מבוקשכם, כדאי לשחק קצת עם אופן כתיבת מילת החיפוש, והדבר תקף במיוחד במילים שמקורן לא בערבית (לדוגמא — איות של ايتالية במקום ايطالية).

המאגר כולו עבר לאחרונה למערכת הנגשה וסביבת טכנולוגיה חדשה של חברת התוכנה וורידיאן. למידע נוסף אודות החברה וההיבטים הטכנולוגיים אתם מוזמנים ללחוץ כאן.

קישורים למאגרים ואוספים דיגיטליים נוספים

ברחבי הרשת ניתן למצוא עוד מספר לא מבוטל של פרויקטים ואתרים שמציגים עיתונים היסטוריים מהמזרח-התיכון. בחרנו לרכז כאן עבורכם כמה פרויקטים המציגים עיתונים מארץ ישראל:

אוסף דיגיטלי של עיתונים בריטיים רשמיים שיצאו בפלשתינה המנדטורית בשנים 1948-1919. פרויקט: ספרייה אלקטרונית ערבית ומזרח-תיכונית, אוניברסיטת ייל

אוסף דיגיטלי של 24 עיתונים וכתבי-עת היסטוריים (1950-1900), בעיקר מפלסטין, מספריית מסגד אל-אקצא במזרח ירושלים. פרויקטe

אוסף דיגיטלי של עיתונים וכתבי-עת יהודיים, הכולל כותרים מארץ ישראל העות'מאנית ומתקופת המנדט הבריטי. פרויקט: JPRESS, עיתונות יהודית היסטורית של הספרייה הלאומית של ישראל ואוניברסיטת ת"א