מחברות פייתון לתרגול

מחברות Python אינטראקטיביות המלוות את יחידות הקורס. ניתן לפתוח כל מחברת ישירות ב-Google Colab ללא כל התקנה מקומית — רק צריך חשבון Google.


מה זה גוגל קולאב?

Google Colab (קולאב) היא סביבת עבודה חינמית של גוגל להרצת קוד Python, ישירות בדפדפן — ללא התקנה של שום דבר על המחשב שלכם.

חשבו עליה כ-מסמך Google Docs, אך במקום טקסט — קוד שרץ באמת.

מה מיוחד ב-Colab

מאפיין פרטים
חינמי כולל GPU/TPU לחישובים כבדים
ענן כל העיבוד מתבצע בשרתי גוגל, לא על המחשב שלכם
שיתוף שיתוף פעולה בזמן אמת כמו Google Docs
שמירה שמירה אוטומטית ב-Google Drive
אין התקנה עובד מכל מחשב עם Chrome / Firefox

איך פותחים מחברת

  1. לחצו על הכפתור הכחול “Open in Colab” ליד כל מחברת בדף זה:

Open In Colab
  1. התחברו עם חשבון Google שלכם (אם נדרש)
  2. חשוב מאוד: בחרו File → Save a copy in Drive כדי לשמור עותק אישי — אחרת השינויים לא יישמרו!

איך מריצים קוד

המחברת מחולקת לתאים (Cells) — כל תא מכיל קוד או הסבר טקסטואלי.

להרצת תא:

  • לחצו על לחצן בצד שמאל של התא, או
  • לחצו Shift + Enter — מריץ תא ועובר לבא אחריו
  • לחצו Ctrl + Enter — מריץ תא ונשאר בו
הריצו לפי הסדר!

חשוב להריץ את התאים מלמעלה למטה לפי הסדר. דילוג על תא עלול לגרום לשגיאות בתאים הבאים.

שמירה והגשה

בסיום השיעור:

  1. File → Save a copy in Drive — ודאו שהמחברת שמורה
  2. File → Download → Download .ipynb — הורידו את הקובץ לשליחה ב-Moodle

שאלות נפוצות

שאלה: הכל נעלם ו-Colab מבקש ממני להריץ מחדש.
תשובה: Colab מתנתק לאחר ~90 דקות של אי-פעילות. יש להריץ מחדש מהתחלה — זה תקין.

שאלה: קיבלתי הודעת שגיאה אדומה — מה עושים?
תשובה: קראו את ההודעה (בדרך כלל מסבירה מה קרה), ואז שאלו את Gemini ב-Google AI Studio — העתיקו את השגיאה ושאלו ״מה זאת אומרת ואיך לתקן?״

שאלה: למה אין כפתור ▶ בחלק מהתאים?
תשובה: תאים אפורים/לבנים הם תאי טקסט/הסבר — אי אפשר להריץ אותם, זה מכוון.

שאלה: איפה מקבלים מפתח Gemini API (חינמי)?
תשובה: נכנסים ל-aistudio.google.com/apikey, לוחצים “Create API Key”, ומעתיקים את המחרוזת שמתקבלת.


הנחיה: לחצו על כפתור ה-Colab הכחול ▶ בכל מחברת כדי להריץ אותה בענן. הקוד בנוי כך שרץ לפי שלבים — תרגלו, שנו, ובדקו.


מחברת 1 — ויקיפדיה ורשתות ידע

📚 נושא: ויקיפדיה כמקור נתונים ורשתות ידע דיגיטלי

מה נלמד: כיצד ויקיפדיה משמשת מקור נתונים מובנה, מהו גרף הקישורים בין ערכים, וכיצד לאסוף נתונים אוטומטית.

כלים: wikipedia-api, networkx, pyvis

Open In Colab

🕸️ רשת הידע האינטראקטיבית — צפייה ישירה


מחברת 2 — קריאה מרחוק

📖 נושא: Distant Reading — ניתוח טקסטואלי חישובי

מה נלמד: ניתוח תדירות מילים, יצירת ענן מילים, n-grams, וסנטימנט אנליזה על קורפוס עברי.

כלים: pandas, matplotlib, wordcloud, nltk

Open In Colab

מחברת 3 — OCR ו-VLM לטקסטים עבריים

📷 נושא: דיגיטציה — מזיהוי תווים אופטי למודלי ראייה

מה נלמד: כיצד ממירים תמונה של טקסט לטקסט דיגיטלי, שימוש ב-Tesseract לעברית, והשוואה שלב-אחר-שלב מול מודלי ראייה (VLM) כגון Gemini Vision. עבודה עם ארכיון JPress לעיתונות עברית היסטורית.

כלים: pytesseract, PIL (Pillow), google-generativeai (Gemini Vision)

Open In Colab

מחברת 4 — NLP וזיהוי ישויות

🔬 נושא: עיבוד שפה טבעית (NLP) וזיהוי ישויות בשם (NER)

מה נלמד: טוקניזציה, נרמול טקסט, וזיהוי ישויות בשם (אנשים, מקומות, ארגונים) בעברית — בשיעור. מידול נושאים עם LDA — לעבודה עצמאית בבית.

כלים: spacy (Hebrew), gensim, pyLDAvis

Open In Colab

🔍 מפת נושאים אינטראקטיבית (LDA) — צפייה ישירה


מחברת 5 — בינה מלאכותית למדעי הרוח

🤖 נושא: הנדסת פרומפטים ו-LLMs לצורכי מחקר הומניסטי

מה נלמד: כיצד לנסח פרומפטים לצורכי מחקר (חיפוש מקורות, סיכום, ניתוח טקסט), עקרונות מודלי שפה גדולים, שימוש ב-Gemini API (חינמי!) ואתיקה של AI במחקר אקדמי.

כלים: google-generativeai (Gemini — חינמי), openai, anthropic

Open In Colab

🤖 תוצאות ניתוח AI — סיווג טקסטים היסטוריים


מחברת 6 — ויזואליזציה ומפות

🗺️ נושא: ויזואליזציה של נתונים ומיפוי גיאוגרפי

מה נלמד: יצירת גרפים, רשתות ומפות אינטראקטיביות מנתונים הומניסטיים.

כלים: plotly, folium, geopandas, networkx

Open In Colab

🗺️ מפת אתרים ארכאולוגיים אינטראקטיבית — צפייה ישירה

📅 ציר זמן היסטורי אינטראקטיבי — צפייה ישירה


מחברת 7 — ניתוח רשתות ידע

🕸️ נושא: ניתוח כמותי של רשתות ידע בויקיפדיה

מה נלמד: חישוב מדדי רשת (מרכזיות, צפיפות, קוטר), זיהוי קהילות וצמתים מרכזיים, והשוואת רשתות ידע בנושאי מחקר שונים.

כלים: networkx, pyvis, community (Louvain)

בקרוב

מחברת 7 תפורסם לקראת שיעור 9 (28/05).