.portfolio  .writings  .bio  .links  .blog  .home 

Sat, 13 April 2002

מדור מחשבים - מרץ

@כותרת:

חפש לי כבשה

 

@קרדיט:

יריב צור

 

@משנה:

 

@רציף:

כל אחד שאי פעם נגע במחשב או עבר ליד האינטרנט מכיר את השאלה הבא: "תגיד לי – איך אני מוצא אתר על ...?". זאת כנראה אחת השאלות הכי מטופשות ביקום (מקום שני ל"איפה אתה?" המיתולוגי שפותח כל שיחה בטלפון), אבל בשנה שנתיים האחרונות יש לה פתרון מאוד פשוט. אומרים לנודניק בקצה השני של השיחה – "לך חפש בגוגל" (בקרוב – הפועל "לך תגגל"). בזמן די קצר ובלי יותר מדי רעש, Google.com הפך לפתרון הכי פשוט, הכי מהיר והכי יעיל לחפש דברים באינטרנט, ולא רק. איך זה קרה?

 

@ביניים:

ארצ'י באנקר

 

@רציף:

בהתחלה, היו ארצ'י וורוניקה. השנה היא 1990, ורובנה עסקנו בשאלה האם סדאם יתקוף או לא. באותו הזמן, שתי דמויות הקומיקס נכנסו לנצח כשהפכו למנועי החיפוש הראשונים. ארצ'י חיפש בשרתי FTP, עוד לפני שרובנו ידענו מה זה HTML, כשאנשים עדיין גלשו בנטסקייפ 3, ואינטרנט אקספלורר עדיין היה בדיחה עצובה. באותה תקופה היה תחום שלם של מידע בפרוטוקול שנקרא gopher ובו חיפשה ורוניקה, אהבתו הנצחית של ארצ'י את כל המידע שרציתם לדלות. הבעיה העיקרית עם ארצ'י וורוניקה (מעבר לאהבתם הלא ממומשת) היתה שעל מנת להחליט איזה אתר יעלה בתשובה לאיזו מילת חיפוש, הוכנסו האתרים ידנית, ומה לעשות – זה לא עבד. אז באו כל מיני סטודנטים והמציאו רובוט. הרובוט תוכנן כך שהוא יתחיל מאתר אינטרנט ספציפי, ירשום אותו, ואז ילך לכל הכתובות שמופיעות בו, ירשום אותן, וכך הלאה. הרובוט, Wandex שמו, עבד לא רע, למעט העובדה ששרתי האינטרנט באותו הזמן היו קצת חלשים מדי בשביל לעמוד במשהו שממש מחפש בהם ולא אחת קרסו.

כלל יסוד של סרטי מדע בדיוני אומר שאם תשאירו רובוט מספיק זמן לבד – תסמכו עליו שהוא יתרבה (רק אם זה רובוט רע, כמובן). ואכן, ב- 1993 הגיעו עוד שלושה רובוטים לזירה, רק שעכשיו לא קראו להם רובוטים אלא עכבישים (כי הם עובדים על ה- Web. איזה הומור יש לאנשי מחשבים, הא?), והחידוש שבהם (של אחד מהם, בשם RBSE, אם אתם חייבים לדעת) היה דירוג של תוצאות החיפוש. לפני זה – לא היה דירוג. פשוט הביאו לכם את כל התוצאות האפשריות. איזה סטארטאפ מטורף. ב- 1994 כבר הופיע עכביש שמצא תוצאות לפי כל הטקסט בדף, ולא רק לפי הכותרת. כאן מתחילה הבעיה שבקרוב תפיל את מנועי החיפוש. מילת חיפוש שמופיעה במערכה הראשונה – תירה במערכה השלישית.

 

@ביניים:

אלטה לה ויסטה, בייבי

 

@רציף:

באפריל 1994 (בתקופה שבה בארץ השתעשעו ברעיונות כמו "טיויטל" וכאלה) שני סטודנטים מאוניברסיטת סטאנפורד החליטו להקים לעצמם קטלוג של אתרי אינטרנט שימושיים. במהרה – כולם באוניברסיטה רצו להשתמש בקטלוג שלהם. לא לקח יותר מדי והם הפכו את זה לחברה שהכניסה 717 מיליון דולר ב- 2001. לא, לא מייקרוסופט. יאהו. אבל גם ליאהו היתה בעיה – כל האתרים שמופיעים שם מוכנסים ידנית. אז מה עושים עם שאר 99 האחוזים של אתרים? כאן נכנסים לתמונה התותחים הכבדים – מנועי החיפוש המקצועיים. זה התחיל באלטה ויסטה (www.altavista.com), ומיד אחריו הוטבוט (www.hotbot.com). שני מנועי חיפוש מסחריים, מקצועיים (שקיימים עד היום). לטענת מפתחי הוטבוט הם יכולים לחפש על כל האינטרנט, בלי להזיע יותר מדי. קצת יומרני, אבל עדיין זה היה, יחד עם אלטה ויסטה, מנוע החיפוש העיקרי. איך קובעים מי מנוע החיפוש המוביל? התשובה פשוטה. במי יאהו בוחרים. כי כשאנחנו מחפשים משהו ביאהו, אם הוא לא מוצא את האתר הרלוונטי באתרים הרשומים ידנית אצלו, אז הוא מפנה למנוע חיפוש. במשך שנים יאהו הפנו לאלטה-ויסטה, והפכו אותו למנוע הכי שווה. למה? כי אלטה ויסטה היה הראשון שנתן חיפוש בוליאני (ראה מסגרת) ויותר מזה – הוא היה מאוד מהיר. אלטה-ויסטה היה יכול לשלוט בעולם לנצח, אם לא הבעיה הפשוטה – אנשים מצאו איך לתכמן.

 

@ביניים:

סקס סקס סקס סקס

 

@רציף:

בואו נבין שנייה איך מנוע חיפוש כמו אלטה-ויסטה מדרג את התוצאות שלו. נניח שאנחנו מחפשים את המילה "סקס". הוא הולך, ומוציא ממאגר הנתונים שלו את כל האתרים שהמילה "סקס" הופיעה בתוכן שלהם. עכשיו הוא צריך לדרג אותם. איך הוא עושה את זה? מאוד פשוט. כמה שהמלה סקס מופיעה יותר פעמים בטקסט – זה אומר שהטקסט יותר רלוונטי למילה שחיפשנו, ולכן הוא יהיה יותר גבוה ברשימת התוצאות. מעולה, נכון? אז זהו שלא. כרגיל, היו אלו אנשי הפורנו באינטרנט שעלו ראשונים על הטריק הבא – ניקח את האתר שלנו, ונשתול את המילה "סקס" כמה שיותר פעמים בתוך הטקסט. זה לא חייב להיות במקום שבו המשתמש רואה את זה. זה יכול להיות בצבע שבלתי נראה על רקע האתר. אבל מנוע החיפוש כן רואה את זה, ולכן – ידרג אותנו גבוה. אם זה לא מספיק, אז מנועי חיפוש מסוימים, ובראשם www.goto.com, התחילו למכור מקומות בתוצאות מנועי החיפוש. כן, כן. הרעיון הוא שכל מילה שמישהו מחפש מוצעת למכרז – מי שמשלם יותר, מקבל מקום יותר גבוה. למשל – המקום הראשון עבור המילה "סקס" נמכר ב- 20 סנט. מעט? לא כל כך. כי כל פעם שמישהו מחפש "סקס" ונכנס ללינק שזכה במכרז (לא נגיד לכם איזה, תחפשו לבד), אותו אתר משלם ל- goto 20 סנט. זה מצטבר ללא מעט כסף. לאט לאט אבל בבטחה, נהיה בלגן. היה מאוד קשה למצוא משהו באינטרנט הזה. כל דבר שחיפשתם נתן אחד משניים – אתר מסחרי שמנסה לעשות עליכם כסף, או אתר פורנו שמנסה לעשות עליכם כסף. היה צריך לחכות לאביר על הסוס הלבן, וכמו בכל סרט אמריקאי טוב – הוא הגיע.

 

@ביניים:

עשר בחזקת מאה

 

@רציף:

במפתיע או שלא, הישועה שוב הגיעה מסטאנפורד. שני סטודנטים בשם לארי פייג' וסרגיי ברין נפגשו שם ב- 1995. הם שנאו אחד את השני מהרגע הראשון, אבל היה להם רצון לפתור את בעיית מנועי החיפוש. את השם לחברה (ולמנוע) הם לקחו מהביטוי המתמטי גוגול (googol) שפירושו 1 ו-100 אפסים אחריו. יעני – ימבה. מתוך גישה שיש ימבה מידע, וימבה משתמשים, פייג' וברין חיפשו גישה חדשה. לקח להם עד אמצע 1998 בשביל לשכלל את הרעיון, אבל אז זה התחיל לעבוד. זה התחיל לעבוד מחוות מחשבים שהם בנו בחדר במעונות של פייג'. ב- 7 לספטמבר, 1998, הוקמה גוגל בע"מ, בגאראג' (כמו עוד חברת היי-טק מתחילת שנות השמונים) של חברים. הם גייסו מיליון דולר ויצאו לדרך. לאט לאט החברה נבנתה, כששתי מטרות מרכזיות עומדות לנגד עיניה – לתת ללקוחות מוצר פשוט וטוב, ולבנות חברה שתהיה הכי מגניבה באיזור. מייד נדבר על המוצר, אבל שתבינו מה הכוונה בחברה 'מגניבה' – למשרדים שלהם הם קראו googleplex, שזה משחק מילים על בתי קולנוע מרובי אולמות. משהו כמו רב-גוגל, בתרגום חופשי. הם שכרו טבח לחברה, שהיה הטבח של הגרייטפול דד, ופעמיים בשבוע סגרו את מגרש החנייה בשביל לשחק הוקי. בקיצור – מגניבות בכל מחיר. אבל היו הרבה חברות סטארט-אפ שהיו מגניבות לאללה (הח"מ עבד בכמה מהן) ובכל זאת – לא הצליחו כמו גוגל. למה זה?

 

@ביניים:

הוליסטיקה להמונים

 

@רציף:

הגישה הבסיסית של גוגל היתה – אנחנו עושים דבר אחד, ועושים אותו טוב. מה זה הדבר הזה? לחפש דברים באינטרנט. הקונספט הפשוט אך הגאוני בבסיס של השיטה שלהם היה PageRank. פייג'ראנק דירג תוצאות חיפוש לא לפי מספר המילים כמו מנועי החיפוש המסורתיים, כי אם לפי העקרון הבא: נניח שאני מחפש את המילה "בלייזר". יש 400 אתרים שבהם המילה "בלייזר" מופיעה. איך אני מדרג אותם? ככל שיותר אתרים מצביעים לאתר ברשימה – זאת אומרת שהוא יותר רלוונטי ולכן ערכו יעלה. כלומר, הדירוג מציג בעצם עד כמה אתרים/אנשים אחרים 'חושבים' שהאתר רלוונטי. זהו, זה כל הקסם. תוסיפו לזה את הממשק הכי נקי בעולם הסטארט-אפ: דף ראשי שבו יש רק תיבה להכניס את הטקסט ושני כפתורים והופ! יש לנו מוצר מנצח. ברמה הטכנית, גוגל היו בין הראשונים שהבינו מה שהיום הוא סטנדרד – עדיף הרבה מחשבים זולים שעושים עבודה, מאשר מחשב אחד גדול וכבד.

תוסיפו לזה את אחת ההמצאות היותר חכמות של גוגל – שמירת הדפים המוצגים ברשימת התוצאות בזכרון, ככה שגם אם הדף שמצאתם לא קיים, לחיצה על לינק ה- Cached המופיע לידו תביא את מה שהיה פעם הדף שרציתם.

 

בשלב שבו יאהו! זנחו את אלטה-ויסטה לטובת גוגל, כולם כבר הבינו שמדובר בסיפור הצלחה, אבל בגוגל לא קפאו על השמרים, והמשיכו להוסיף עוד יכולות – הם קנו והוסיפו למאגר שלהם את מאגר ההודעות של deja.com, אולי המאגר הכי גדול בעולם של שאלות ותשובות שנשאלו בכל נושא שאתם יכולים לדמיין, הרחק בימי Usenet העליזים. הם הוסיפו חיפוש תמונות, חיפוש כתובות, תרגום דפים משפה לשפה, ממשקים ביותר מ- 70 שפות (ביניהן קלינגונית. הומור של אנשי מחשבים כבר אמרנו?) ולאחרונה – חיפוש בקטלוגים של חברות.

מה מתוכנן בעתיד? העתיד הוא בין השאר מנוע חיפוש שישב בתוך מכוניות של BMW, שיפור ביכולות התרגום של דפים בשפות זרות, פתיחת google למפתחים חיצוניים (למהירים מביניכם – יש תחרות שנסגרת ב- 30 לאפריל - www.google.com/programming-contest/), וחיפוש בעוד הרבה הרבה דברים שאפשר רק לחלום עליהם.

כמו שאמרנו תמיד – מי שעושה דבר אחד, ועושה אותו טוב, אין סיבה שלא יצליח. מי שבמשרד שלו מתרוצצים כלבים חופשי – על אחת כמה וכמה. לכו תגגלו.

 

 

@כותבוקסה:

החוקים

 

@רציף:

חמשת הדרכים לתקן תקלה במחשב

1.   לעשות ריסטרט.

2.   להוציא מהחשמל ולהכניס

3.   לנסות להתקין מחדש את התוכנה שעושה בעיות

4.   להתקשר למישהו שחושב שהו מבין יותר מכם ולשמוע ממנו את דרכים 1 עד 3.

5.   בעיטה צדית, מכוונת היטב, לגוף המחשב. כמעט תמיד עובד.

 

 


The views expressed within this site pretty much represent those of the author.
Copyright 1997-2003© Yariv Zur.