מדעי הרוח הדיגיטליים תשפ״ו

מטרות הקורס

לימוד העקרונות וההיסטוריה המחקרית של מדעי הרוח הדיגיטליים והבנה ותרגול של מתודות וכלים בחקר חישובי של מדעי הרוח והחברה. כמו כן, התלמידים ייחשפו לפרויקטים דיגיטליים שונים העושים שימוש בנתוני עתק (Big Data), וילמדו כיצד לנהל פרויקטים כאלה באופן עצמאי, החל ממחשוב/ספרות המידע, ניהול מאגרי מידע וציטוטים, עיבוד מידע תמונתי וגיאוגרפי, ופרסומם במרשתת.

תוכן הקורס

מאז שהאב רוברטו בוסה החליט להשתמש בכוח המחשב שזה עתה נוצר ליצור אינדקס של כתבי תומס אקווינס בשנות ה-40 של המאה הקודמת, התפתח רבות תחום המחקר שמכונה כיום מדעי הרוח הדיגיטליים. הקורס בנוי כפרו-סמינר המחולק לארבעה יחידות. הפרויקט המרכזי של הקורס הוא כתיבה ופרסום של ערך ויקיפדיה מחקרי בעברית - תהליך שמלמד כיצד להפוך ידע אקדמי לתוכן דיגיטלי נגיש. לאורך הקורס נחקור את הכלים והשיטות של מדעי הרוח הדיגיטליים: קריאה רחוקה, זיהוי ישויות (NER), דיגיטציה (OCR/VLM), מיפוי גיאוגרפי, ניתוח רשתות ובינה מלאכותית - וניישם אותם על מקורות ראשוניים מגוונים. בסיום הקורס יציגו התלמידים את ממצאיהם ויפרסמו את הערך בויקיפדיה.

מחברות Python לתרגול

הקורס יתרגל עבודה ביצירת קוד בניגוד לכתיבת קוד. שש מחברות פייתון אינטראקטיביות מלוות את הקורס. בכל מחברת ניתן להריץ קוד ישירות דרך Google Colab ללא התקנה מקומית.

1 ויקיפדיה ורשתות ידע — מבנה הידע הדיגיטלי, גרף הקישורים בין ערכים, ואוסף נתונים אוטומטי

2 קריאה מרחוק — ניתוח תדירות מילים, Voyant Tools, ו-n-grams על קורפוס עברי

3 OCR ו-VLM לטקסטים עבריים — דיגיטציה עם Tesseract, השוואה למודלי ראייה (Gemini Vision), ועבודה עם JPress

4 NLP וזיהוי ישויות — עיבוד שפה טבעית, זיהוי ישויות בשם (NER) בעברית, ו-Topic Modeling לעבודה עצמאית

5 בינה מלאכותית למדעי הרוח — הנדסת פרומפטים לצורכי מחקר, מודלי שפה גדולים (LLMs), ואתיקה של AI

6 ויזואליזציה ומפות — גרפים, רשתות, ומפות GIS אינטראקטיביות עם Python ו-Folium

7 ניתוח רשתות ידע — חישוב מדדי רשת, קהילות וצמתים מרכזיים בגרף הויקיפדיה