מחברות פייתון לתרגול
מחברות Python אינטראקטיביות המלוות את יחידות הקורס. ניתן לפתוח כל מחברת ישירות ב-Google Colab ללא כל התקנה מקומית — רק צריך חשבון Google.
מה זה גוגל קולאב?
Google Colab (קולאב) היא סביבת עבודה חינמית של גוגל להרצת קוד Python, ישירות בדפדפן — ללא התקנה של שום דבר על המחשב שלכם.
חשבו עליה כ-מסמך Google Docs, אך במקום טקסט — קוד שרץ באמת.
מה מיוחד ב-Colab
| מאפיין | פרטים |
|---|---|
| חינמי | כולל GPU/TPU לחישובים כבדים |
| ענן | כל העיבוד מתבצע בשרתי גוגל, לא על המחשב שלכם |
| שיתוף | שיתוף פעולה בזמן אמת כמו Google Docs |
| שמירה | שמירה אוטומטית ב-Google Drive |
| אין התקנה | עובד מכל מחשב עם Chrome / Firefox |
איך פותחים מחברת
- לחצו על הכפתור הכחול “Open in Colab” ליד כל מחברת בדף זה:
- התחברו עם חשבון Google שלכם (אם נדרש)
- חשוב מאוד: בחרו
File → Save a copy in Driveכדי לשמור עותק אישי — אחרת השינויים לא יישמרו!
איך מריצים קוד
המחברת מחולקת לתאים (Cells) — כל תא מכיל קוד או הסבר טקסטואלי.
להרצת תא:
- לחצו על לחצן ▶ בצד שמאל של התא, או
- לחצו Shift + Enter — מריץ תא ועובר לבא אחריו
- לחצו Ctrl + Enter — מריץ תא ונשאר בו
חשוב להריץ את התאים מלמעלה למטה לפי הסדר. דילוג על תא עלול לגרום לשגיאות בתאים הבאים.
שמירה והגשה
בסיום השיעור:
File → Save a copy in Drive— ודאו שהמחברת שמורהFile → Download → Download .ipynb— הורידו את הקובץ לשליחה ב-Moodle
שאלות נפוצות
שאלה: הכל נעלם ו-Colab מבקש ממני להריץ מחדש.
תשובה: Colab מתנתק לאחר ~90 דקות של אי-פעילות. יש להריץ מחדש מהתחלה — זה תקין.
שאלה: קיבלתי הודעת שגיאה אדומה — מה עושים?
תשובה: קראו את ההודעה (בדרך כלל מסבירה מה קרה), ואז שאלו את Gemini ב-Google AI Studio — העתיקו את השגיאה ושאלו ״מה זאת אומרת ואיך לתקן?״
שאלה: למה אין כפתור ▶ בחלק מהתאים?
תשובה: תאים אפורים/לבנים הם תאי טקסט/הסבר — אי אפשר להריץ אותם, זה מכוון.
שאלה: איפה מקבלים מפתח Gemini API (חינמי)?
תשובה: נכנסים ל-aistudio.google.com/apikey, לוחצים “Create API Key”, ומעתיקים את המחרוזת שמתקבלת.
הנחיה: לחצו על כפתור ה-Colab הכחול ▶ בכל מחברת כדי להריץ אותה בענן. הקוד בנוי כך שרץ לפי שלבים — תרגלו, שנו, ובדקו.
מחברת 1 — ויקיפדיה ורשתות ידע
📚 נושא: ויקיפדיה כמקור נתונים ורשתות ידע דיגיטלי
מה נלמד: כיצד ויקיפדיה משמשת מקור נתונים מובנה, מהו גרף הקישורים בין ערכים, וכיצד לאסוף נתונים אוטומטית.
כלים: wikipedia-api, networkx, pyvis
🕸️ רשת הידע האינטראקטיבית — צפייה ישירה
מחברת 2 — קריאה מרחוק
📖 נושא: Distant Reading — ניתוח טקסטואלי חישובי
מה נלמד: ניתוח תדירות מילים, יצירת ענן מילים, n-grams, וסנטימנט אנליזה על קורפוס עברי.
כלים: pandas, matplotlib, wordcloud, nltk
מחברת 3 — OCR ו-VLM לטקסטים עבריים
📷 נושא: דיגיטציה — מזיהוי תווים אופטי למודלי ראייה
מה נלמד: כיצד ממירים תמונה של טקסט לטקסט דיגיטלי, שימוש ב-Tesseract לעברית, והשוואה שלב-אחר-שלב מול מודלי ראייה (VLM) כגון Gemini Vision. עבודה עם ארכיון JPress לעיתונות עברית היסטורית.
כלים: pytesseract, PIL (Pillow), google-generativeai (Gemini Vision)
מחברת 4 — NLP וזיהוי ישויות
🔬 נושא: עיבוד שפה טבעית (NLP) וזיהוי ישויות בשם (NER)
מה נלמד: טוקניזציה, נרמול טקסט, וזיהוי ישויות בשם (אנשים, מקומות, ארגונים) בעברית — בשיעור. מידול נושאים עם LDA — לעבודה עצמאית בבית.
כלים: spacy (Hebrew), gensim, pyLDAvis
🔍 מפת נושאים אינטראקטיבית (LDA) — צפייה ישירה
מחברת 5 — בינה מלאכותית למדעי הרוח
🤖 נושא: הנדסת פרומפטים ו-LLMs לצורכי מחקר הומניסטי
מה נלמד: כיצד לנסח פרומפטים לצורכי מחקר (חיפוש מקורות, סיכום, ניתוח טקסט), עקרונות מודלי שפה גדולים, שימוש ב-Gemini API (חינמי!) ואתיקה של AI במחקר אקדמי.
כלים: google-generativeai (Gemini — חינמי), openai, anthropic
🤖 תוצאות ניתוח AI — סיווג טקסטים היסטוריים
מחברת 6 — ויזואליזציה ומפות
🗺️ נושא: ויזואליזציה של נתונים ומיפוי גיאוגרפי
מה נלמד: יצירת גרפים, רשתות ומפות אינטראקטיביות מנתונים הומניסטיים.
כלים: plotly, folium, geopandas, networkx
🗺️ מפת אתרים ארכאולוגיים אינטראקטיבית — צפייה ישירה
📅 ציר זמן היסטורי אינטראקטיבי — צפייה ישירה
מחברת 7 — ניתוח רשתות ידע
🕸️ נושא: ניתוח כמותי של רשתות ידע בויקיפדיה
מה נלמד: חישוב מדדי רשת (מרכזיות, צפיפות, קוטר), זיהוי קהילות וצמתים מרכזיים, והשוואת רשתות ידע בנושאי מחקר שונים.
כלים: networkx, pyvis, community (Louvain)
מחברת 7 תפורסם לקראת שיעור 9 (28/05).