AlphaGo

לוגו AlphaGo

en:Master (software) AlphaGo היא תוכנת מחשב שמשחקת במשחק הקופסא Go. התוכנה פותחה ע״י חברת DeepMind Technologies שבהמשך נרכשה ע״י חברת Google. פיתוח התוכנה החל בשנת 2014^[1]. מאז יוצרו מספר גרסאות של התוכנה, בין היתר כאלו שהתחרו מול שחקני Go מקצועיים. למשל גרסה בשם Master שזכתה להצלחה רבה (Master software). לאחר שפרש ממשחק תחרותי, AlphaGo Master הוחלף על ידי גרסה חזקה יותר המכונה AlphaGo Zero אשר הייתה אוטודידקטית לחלוטין – כלומר למדה לשחק מבלי ניתוח של משחקים אנושיים. AlphaGo Zero הוחלפה מאוחר יותר בתוכנת AlphaZero, ששיחקה משחקים נוספים מלבד Go, כולל שחמט ושוגי. בשנת 2019 שוחררה גרסה מתקדמת יותר בשם MuZero שביכולתה ללמוד לשחק באותם משחקים מבלי לדעת מראש את כללי המשחק.

AlphaGo משתמשת באלגוריתם חיפוש מונטה קרלו בעצים (Monte Carlo tree search) על מנת למצוא את מהלכיה על סמך ידע שנרכש בעבר תוך שימוש בלמידת מכונה שנשענת על רשת עצבית מלאכותית. הרשת העצבית מאומנת לזהות את המהלכים הטובים ביותר ואת אחוזי הזכייה של המהלכים הללו. רשת עצבית זו משפרת את יעילות החיפוש בעץ, וכתוצאה מכך בחירת מהלכים נעשת טובה יותר מאיטרציה לאיטרציה.

באוקטובר 2015, תוכנת AlphaGo התחרתה מול שחקן ה Go פאן חוי (Fan Hui) וניצחה. בכך הפכה התוכנה לראשונה שהצליחה לנצח שחקן Go מקצועי ללא פיצוי (handicap) ועל לוח משחק מלא בגודל 19 על 19. במרץ 2016, התוכנית ניצחה את שחקן ה Go המקצועי לי סדול (Lee Sedol) בתחרות שכללה חמישה משחקים (AlphaGo versus Lee Sedol) עם תוצאה של 4-1 לטובתה. בכך הפכה התוכנה לראשונה שהצליחה לנצח שחקן Go בדרגת דן 9^[2] ללא פיצוי. על ניצחון זה צולם סרט בשם AlphaGo ^[3]. ב 22 בדצמבר, 2016, הניצחון של AlphaGo נבחר ע״י Science כאחת מפריצות השנה.

במאי של 2017, הגרסה AlphaGo Master ניצחה עם תוצאה של 2-1 את השחקן קה גיי (Ke Jie) שנכון לקיום המשחק דורג ראשון בעולם. על ניצחון זה האסוציאציה הסינית Chinese weiqi Association זיכתה אותה בדרגת דן 9. לאחר הניצחון על קה גיי, הושקה AlphaGo Zero שלומדת לשחק באופן אוטודידקטי. AlphaGo Zero השיג ניצחון 100–0 מול גרסת ה Master. יורשו של AlphaGo Zero בשם AlphaZero נתפס נכון לשנת 2019 כשחקן בעל הדירוג הגבוה ביותר ב Go ואולי גם בשחמט^[4]^[5].

הִיסטוֹרִיָה[עריכה]

Go הינו משחק בעל כמות המשכים אפשריים גדולה מאוד אחרי כל מהלך. עובדה זו מקשה מאוד על המחשבים ללמוד את המשחק ע״י מתודות למידת המכונה המוכרות כמו גיזום אפלא-ביתא ושיטת היוריסטיקה.

כמעט שנתיים לאחר שמחשב יבמ בשם DeepBlue ניצח את אלוף העולם דאז, גארי קספרוב, בשחמט בשנת 1997, תוכנות המחשב החזקות ביותר שישיחקו Go הגיעו רק לרמה חובבנית (דן 5 ומטה) ועדיין לא יכלו לנצח שחקני Go מקצועיים ללא פיצוי בתחילת המשחק.

בשנת 2012, התוכנה Zen הצליחה לנצח פעמיים את מאסאקי טאקאמיה (Masaki Takemiya) שדירוגו היה דן 9. עם זאת ניחון זה הושג עם פיצוי של 4-5 אבנים לטובת התוכנה. בשנת 2013 התוכנה Crazy Stone ניצחה את יושיאו לשידא (Yoshio Ishida) שהיה בעל דן 9. גם במקרה זה הניצחון הושג עם פיצוי של 4 אבנים לטובת התוכנה.

המשחק מול פאן חוי[עריכה]

באוקטובר של שנת 2015, הגרסה הקיימת של AlphaGo ניצחה 5-0 את אלוף אירופאה דאז, פאן חוי. דירוגו נכון לזמן המשחק היה דן 2 (מתוך 9). זאת הייתה הפעם הראשונה בה תוכנת מחשב ניצחה שחקן Go מקצועי על לוח משחק מלא וללא פיצוי לטובת התוכנה. פרסום תוצאות המשחק התרחש רק בינואר 2016, במקביל לפרסום מאמר בכתב העת המדעי Nature המתאר את אלגוריתם הלמידה בו השתמשה התוכנה^[6].

המשחק מול לי סדול[עריכה]

בשנת 2016, בתאריכים 9, 10, 12, 13 ו-15 במרץ, במלון ארבעת העונות בסיאול, נערכו חמישה משחקים בין AlphaGo לבין שחקן ה Go הדרום קוראני המקצועי בשם לי סדול. נכון לזמן התחרות דירוגו היה דן 9 (מתוך 9). המשחקים שודרו בשידור חי בכלי תיקשורת רבים. AlphaGo ניצחה את לי בארבעת מתוך חמשת המשחקים: בשלושת המשחקים הראשונים ובמשחק החמישי. במשחק הרביעי הצליח לי לגבור על AlphaGo. המשחק היחיד בו ניצח לי הפך אותו לאדם היחיד בעולם שניצח אי-פעם את AlphaGo מתוך כל 74 משחקיה הרשמיים.

AlphaGo רצה על גבי הענן של גוגל תוך שימוש בשרתים הממוקמים בארצות הברית. המשחק עשה שימוש בחוקים סיניים עם 7.5 נקודות קומי (komi), ולכל צד היו שעתיים של חשיבה בתוספת שלוש תקופות ביויומי (byoyomi) של 60 שניות. הגרסה של AlphaGo ששיחקה נגד לי השתמשה בכמות מחשוב דומה כמו שהייתה בשימוש במשחק מול פאן חוי. חשוב לציין ש AlphaGo לא אומנה באופן ספציפי לנצח את לי (כלומר לא אומנה ספציפית נגד סגנון המשחק של לי), אלה אומנה באופן באופן כללי, ללא מטרה ספציפית לנצח אדם ספציפי.

הפרס בתחרות היה מיליון דולר. מכיוון ש AlphaGo זכתה בארבעה מתוך חמשת המשחקים בסדרה, הפרס נתרם לעמותות, כולל יוניסף. לי קיבל 150 אלף דולר על השתתפות בכל חמשת המשחקים ותוספת של 20 אלף דולר עבור זכייתו במשחק 4.

ביוני 2016, בכנס שהתקיים באחת האוניברסיטאות בהולנד, חשף אג'ה הואנג, אחד מצוות DeepMind, כי הם זיהו ותיקנו את נקודת התורפה של AlphaGo שגרמה לתוכנה להפסיד ללי במהלך המשחק הרביעי ביניהם.

60 משחקים ברשת[עריכה]

ב- 29 בדצמבר 2016, חשבון חדש בשרת תיגי׳ם (Tygem) בשם "מגיסטר" (שהוצג כ 'מגיסט' בגרסה הסינית של השרת) מדרום קוריאה החל לשחק משחקים עם שחקנים מקצועיים. החשבון שינה את שמו ל- "Master" ב- 30 בדצמבר, ואז עברה לשרת FoxGo ב -1 בינואר 2017. ב -4 בינואר אישרה DeepMind כי "Magister" ו- "Master" הם חשבונות בהם משחקת הגרסה המעודכנת של AlphaGo, הנקראת AlphaGo Master. החל מה -5 בינואר 2017, AlphaGo Master קבע שיא של 60 ניצחונות ו- 0 הפסדים, כולל שלושה ניצחונות על השחקן בעל הדירוג הגבוה ביותר נכון לזמן המשחק, קה גיי. לאחר שנודע על ההפסדים של גיי לתוכנת המאסטר, שחקן ה Go גו לי (Gu Li) הציע סכום של 100,000 יואן (14,400 דולר) לשחקן האנושי הראשון שיכול להביס את מאסטר.

במהלך שישים המשחקים ברשת, המאסטר שיחק בקצב של 10 משחקים ביום. רבים חשדו במהרה שמדובר בשחקן AI בגלל מנוחה מועטה בין המשחקים. יריביו כללו אלופי עולם רבים . כל 60 המשחקים פרט לאחד היו משחקים מהירים עם שלושה ביויומיים באורך 20 או 30 שניות. המאסטר הציע להאריך את הביויומי לדקה כאשר שיחק עם ני ווייפינג בהתחשב בגילו. לאחר שניצח במשחקו ה -59, מאסטר חשף את עצמו בחדר הצ'אט.

לאחר השלמת המשחקים הללו, מייסד שותף של Google DeepMind, דמיס חסביס, אמר: "אנו מצפים לשחק בהמשך כמה משחקים רשמיים באורך מלא בשיתוף ארגוני Go ומומחים".

מומחי Go התרשמו מביצועי התוכנית וסגנון המשחק הלא אנושי שלה; קה גיי הצהיר כי "אחרי שהאנושות השקיעה אלפי שנים בשיפור הטקטיקה שלה, מחשבים אומרים לנו שבני אדם טועים לחלוטין ... הייתי מרחיק לכת ואומר שאף בן אדם לא נגע בקצה האמת של Go.

פסגת גו של 2017[עריכה]

בפסגה גו שהתקיים בוווז'ן במאי 2017, AlphaGo Master שיחק שלושה משחקים עם Ke Jie, השחקן המדורג במקום הראישון בעולם, כמו גם שני משחקים עם כמה אנשי מקצוע סיניים מובילים, משחק גו זוג אחד ואחד נגד שיתוף פעולה צוות של חמישה שחקנים אנושיים. ^[7]

Google DeepMind הציעה פרסים זוכים של 1.5 מיליון דולר למשחק שלושת המשחקים בין Ke Jie ו- Master בעוד שהצד המפסיד לקח 300,000 דולר. ^[8] ^[9] מאסטר ניצח את שלושת המשחקים נגד Ke Jie, ^[10] ^[11] ולאחריו הוענק 9-dan (הדרגה הגבוה ביותר ב Go) מקצועי על ידי התאחדות Weiqi הסינית ל AlphaGo.^[12]

לאחר שניצחה את שלושת המשחקים שלה מול Ke Jie, שחקן ה- Go העולמי המדורג ביותר, אלפאגו פרש. DeepMind פירקה גם את הצוות שעבד על המשחק כדי להתמקד במחקר AI בתחומים אחרים.^[13] לאחר הפסגה צוות Deepmind פרסם 50 משחקי AlphaGo נגד עצמו באורך מלא, כמתנה לקהילת ה- Go.^[14]

AlphaGo Zero ו- AlphaZero[עריכה]

ב -19 באוקטובר 2017 הצוות של AlphaGo פרסם מאמר בכתב העת Nature, בו הציג את AlphaGo Zero, גרסה ללא נתונים אנושיים וחזקה יותר מכל גרסה קודמת שמנצחת אלוף אנושי. בכך שהיא שיחקה משחקים נגד עצמה, AlphaGo Zero עלתה על כוחה של AlphaGo Lee תוך שלושה ימים בכך שניצחה 100 משחקים ל -0, הגיעה לרמה של מסטר ב AlphaGo תוך 21 יום, ועברה את כל הגרסאות הישנות תוך 40 יום.^[15]

במאמר שפורסם ב- arXiv ב -5 בדצמבר 2017, טען DeepMind כי היא היכללה את גישתו של AlphaGo Zero לאלגוריתם יחיד של AlphaZero, שהשיג תוך 24 שעות רמה של משחק על אנושי במשחקי השחמט, השוגי ו- Go על ידי ניצחון על התוכנות אלוף העולם Stockfish, Elmo, וגרסת 3 ימים ל- AlphaGo Zero בכל מקרה.

כלי הוראה[עריכה]

ב־11 בדצמבר 2017, DeepMind פרסמה את כלי ההוראה של AlphaGo באתר האינטרנט שלה ^[16] כדי לנתח את שיעורי הזכייה של פתחי Go שונים כפי שחושב על ידי AlphaGo Master .^[17] כלי ההוראה אוסף 6,000 פתחי Go מ -230,000 משחקים אנושיים שכל אחד מהם נותח עם 10,000,000 סימולציות על ידי AlphaGo Master. רבים מהפתחים כוללים הצעות למהלך אנושי.

גרסאות[עריכה]

גרסה מוקדמת של AlphaGo נבדקה על חומרה עם מספר שונה של מעבדים ו- GPUs, הפועלים במצב אסינכרוני או מבוזר. שתי שניות של זמן חשיבה ניתנו לכל מהלך. דירוגי Elo המתקבלים מפורטים להלן. במשחקים עם יותר זמן לכל מהלך מושגים דירוגים גבוהים יותר.

תצורה וביצועים
תְצוּרָה	מספר תהליכונים	מספר המעבד	מספר GPU	דירוג Elo
יחיד ^{עמ ' 10–11}	40	48	1	2,181
יחיד	40	48	2	2,738
יחיד	40	48	4	2,850
יחיד	40	48	8	2,890
מופץ	12	428	64	2,937
מופץ	24	764	112	3,079
מופץ	40	1,202	176	3,140
מופץ	64	1,920	280	3,168

במאי 2016 חשפה גוגל " יחידות עיבוד טנזור " חומרה קנייניות משלה, שלדבריה כבר נפרסו במספר פרויקטים פנימיים בגוגל, כולל המשחק AlphaGo נגד לי סדול. ^[18] ^[19]

בפסגת העתיד של Go במאי 2017, DeepMind חשפה כי הגרסה של AlphaGo ששימשה בפסגה זו הייתה AlphaGo Master,^[20] ^[21] וגילתה שהיא מדדה את חוזק הגרסאות השונות של התוכנה. AlphaGo Lee, הגרסה המשמשת נגד Lee, יכולה לתת ל- AlphaGo Fan, הגרסה המשמשת ב- AlphaGo vs. אוהד האו, שלוש אבנים, ו- AlphaGo Master היו אפילו שלוש אבנים חזקות יותר. ^[22]

תצורה ועוצמה^[23]
גרסאות	חוּמרָה	דירוג Elo	תַאֲרִיך	תוצאות
אוהד AlphaGo	176 GPUs,^[24] מופצים	3,144 ^[25]	אוקטובר 2015	5: 0 נגד פאן הוי
AlphaGo Lee	48 TPUs, מופץ	3,739	מרץ 2016	4: 1 נגד לי סדול
מאסטר AlphaGo	4 TPU, מכונה אחת	4,858	מאי 2017	60: 0 נגד שחקנים מקצועיים; </br> העתיד של פסגת גו
AlphaGo Zero (40 חסימות)	4 TPU, מכונה אחת	5,185	אוקטובר 2017	100: 0 נגד AlphaGo Lee 89:11 נגד AlphaGo Master
AlphaZero (20 חסימות)	4 TPU, מכונה אחת	5,018	דצמבר 2017	60:40 נגד AlphaGo Zero (20 חסימות)

אַלגוֹרִיתְם[עריכה]

החל משנת 2016, האלגוריתם של AlphaGo משתמש בשילוב של טכניקות למידת מכונה וחיפוש עצים, בשילוב אימונים נרחבים, הן ממשחק אנושי והן ממחשב. היא משתמשת בחיפוש עצים במונטה קרלו, המונחה על ידי "רשת ערכים" ו"רשת מדיניות ", שניהם מיושמים באמצעות טכנולוגיית רשת עצבית עמוקה.^[26]^[27]כמות מוגבלת של עיבוד מקדים של זיהוי תכונות ספציפיות למשחק (למשל, כדי להדגיש אם מהלך תואם לתבנית nakade ) מוחל על הקלט לפני שהוא נשלח לרשתות העצביות.^[27]

הרשתות העצביות של המערכת הושקו בתחילה ממומחיות משחק אנושית. בתחילה הוכשרה AlphaGo לחקות משחק אנושי על ידי ניסיון להתאים למהלכים של שחקנים מומחים ממשחקים היסטוריים מוקלטים, תוך שימוש במאגר של כ -30 מיליון מהלכים.^[28] לאחר שהגיעה למידה מסוימת של בקיאות, היא הוכשרה בהמשך על ידי כך שהיא הוגדרה לשחק מספר רב של משחקים מול מקרים אחרים של עצמה, תוך שימוש בלמידת חיזוק לשיפור המשחק שלה.^[29] כדי להימנע מבזבוז זמן "של כבוד" של יריבו, התוכנית מתוכנתת במיוחד להתפטר אם הערכת ההסתברות שלה לזכות נופלת מתחת לסף מסוים; למשחק נגד לי, סף ההתפטרות נקבע ל -20%. ^[30]

סגנון המשחק[עריכה]

טובי מאנינג, שופט המשחק של AlphaGo vs. Fan Hui, תיאר את סגנון התוכנית כ"שמרני ".^[31] סגנון המשחק של AlphaGo תומך בחדות בהסתברות גדולה יותר לזכות בפחות נקודות לעומת בהסתברות נמוכה יותר לזכות בנקודות רבות יותר.^[32] האסטרטגיה שלה למקסם את הסיכוי שלה לזכות נבדלת ממה שהשחקנים האנושיים נוטים לעשות שהוא למקסם את הרווחים הטריטוריאליים, ומסבירה כמה מהמהלכים המוזרים למראה. ^[33] זה עושה הרבה מהלכי פתיחה שמעולם או לעיתים רחוקות נעשו על ידי בני אדם, תוך הימנעות ממהלכי פתיחה רבים מהשורה השנייה ששחקנים אנושיים אוהבים לבצע. הוא אוהב להשתמש shoulder hits, במיוחד אם היריב מרוכז יתר על המידה.שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.^[^{דרוש מקור]}

תגובות לניצחון ב2016[עריכה]

קהילת הבינה המלאכותית[עריכה]

הניצחון של AlphaGo במרץ 2016 היה אבן דרך מרכזית במחקר הבינה המלאכותית. ^[34] לפני כן, Go נחשב כבעיה קשה בלמידת מכונה שהייתה צפויה להיות מחוץ להישג יד לטכנולוגיה של אז. ^[34]^[35]^[36] רוב המומחים חשבו שתוכנית Go חזקה כמו AlphaGo נמצאת במרחק של חמש שנים לפחות; ^[37] חלק מהמומחים חשבו שייקח לפחות עשור נוסף עד שהמחשבים ינצחו את אלופי הגו. ^[38]^[39] רוב הצופים בתחילת המשחקים ב -2016 ציפו כי לי ינצח את AlphaGo. ^[34]

עם משחקים כמו דמקה (ש"נפתרה" על ידי הצוות שפיתח את צ'ינוק), שחמט, וכעת גם גו שנוצחו על ידי מחשבים, ניצחונות במשחקי לוח פופולריים כבר לא יכולים לשמש אבני דרך מרכזיות לבינה מלאכותית באופן שבו היו בעבר. מוריי קמפבל, מהיוצרים של Deep Blue כינה את הניצחון של AlphaGo "סוף עידן ... משחקי לוח הם פחות או יותר פתורים וזה הזמן לעבור הלאה." ^[34]

בהשוואה ל- Deep Blue או Watson, האלגוריתמים הבסיסיים של AlphaGo הם כלליים יותר ועשויים להוות עדות לכך שהקהילה המדעית מתקדמת לעבר בינה מלאכותית כללית. יש פרשנים שמאמינים כי הניצחון של AlphaGo מהווה הזדמנות טובה לחברה להתכונן להשפעה עתידית אפשרית של מכונות בעלות אינטליגנציה כללית. כפי שציין היזם גיא סוטר, AlphaGo יודעת רק לשחק ב- Go ואינה מחזיקה באינטילגנציה למטרות כלליות; "[זה] לא יכול פשוט להתעורר בוקר אחד ולהחליט שזה רוצה ללמוד להשתמש בנשק חם." ^[34] חוקר ה- AI סטיוארט ראסל אמר כי מערכות בינה מלאכותית כמו AlphaGo התקדמו מהר יותר והפכו לחזקות מהצפוי, ואנחנו לכן צריכים לפתח שיטות להבטיח שהם "יישארו תחת שליטה אנושית". ^[40] מספר חוקרים, כמו סטיבן הוקינג, הזהירו (במאי 2015 לפני המשחקים) כי חלק מהבינה המלאכותית המשפרת את עצמה עשויה להשיג אינטליגנציה כללית, ולהוביל להשתלטות בלתי צפויה של AI;חוקרים אחרים לא מסכימים: מומחה ה- AI, ז'אן גבריאל גנסקיה, סבור ש"דברים כמו 'שכל ישר' ... אולי לעולם לא ינתנו לשחזור [אצל מכונות]", ^[41] ואומר" אני לא מבין למה לדבר על על פחדים. להפך, זה מעלה תקווה בתחומים רבים כמו בריאות וחקר החלל. "^[40] מדען המחשבים ריצ'רד סאטון אמר" אני לא חושב שאנשים צריכים לפחד ... אבל אני חושב שאנשים צריכים לשים לב. "^[42]

בסין, AlphaGo היה רגע המעבר שעזר לשכנע את ממשלת סין לתעדף ולהגדיל באופן דרמטי את המימון לבינה מלאכותית. ^[43]

בשנת 2017 צוות AlphaGo בDeepMind קיבל את מדליית IJCAI מרווין מינסקי המיועדת להישגים יוצאי דופן בבינה מלכותית. "AlphaGo הוא הישג נפלא, ודוגמא מושלמת למה שמדליית מינסקי נוצרה על מנת להכיר בו", אמר פרופסור מייקל ווולדריג ', יו"ר ועדת פרסי IJCAI. "מה שהרשים במיוחד את IJCAI היה ש- AlphaGo משיגה את מה שהיא עושה באמצעות שילוב מבריק של טכניקות AI קלאסיות, כמו גם טכניקות לימוד מכונה משוכללות ש- DeepMind קשורה אליהן כל כך. זו הפגנה עוצרת נשימה של AI עכשווי, ואנחנו שמחים להיות מסוגלים להכיר אותו בפרס זה. "^[44]

קהילת הגו[עריכה]

גו הוא משחק פופולרי בסין, ביפן ובקוריאה ובמשחקים ב2016 צפו בהערכה מאה מיליון איש ברחבי העולם. ^[34]^[45] שחקני Go מובילים רבים איפיינו את המהלכים הלא שגרתיים של AlphaGo כמהלכים שנראים מפוקפקים בהתחלה, אך היו הגיוניים בדיעבד: ^[38] "כל שחקני ה- Go מלבד הטובים ביותר מעצבים את סגנונם על ידי חיקוי של שחקני הצמרת. נראה כי ל- AlphaGo יש מהלכים מקוריים לחלוטין שהוא יוצר בעצמו. "[67] נראה כי באופן מפתיע, AlphaGo התחזקה הרבה יותר, אפילו בהשוואה למשחק באוקטובר 2015 ^[46], שם מחשב ניצח שחקן גו מקצועי לראשונה ללא יתרון (חוקים רגילים). יום אחרי התבוסה הראשונה של לי, ג'ונג אהרם, כתב הגו הראשי של אחד העיתונים היומיים הגדולים של דרום קוריאה, אמר "אמש היה קודר מאוד ... אנשים רבים שתו אלכוהול." ^[47] איגוד "קוריאה בדוק", הארגון שמפקח על שחקני גו מקצועיים בדרום קוריאה, העניקו ל- AlphaGo תואר דן 9 של כבוד (תואר לשחקני גו) על הצגת מיומנויות יצירה ודחיפת קדימה של המשחק. ^[48]

קה גיי הסיני Ke Jie, צעיר בן 18 שהוכר כשחקן הגו הטוב ביותר בעולם באותה תקופה, ^[49]^[50] טען בתחילה כי הוא יצליח לנצח את אלפא גו, אך סירב לשחק נגדו מחשש שהוא "יעתיק את הסגנון שלי". כשהתקדמו המשחקים, קי ג'י חזר בו ואמר כי "סביר ביותר שאוכל להפסיד" לאחר ניתוח שלושת המשחקים הראשונים, ^[51] אך חזר לו הביטחון לאחר ש- AlphaGo הראה חולשות במשחק הרביעי. ^[52]

טובי מאנינג, שופט המשחק של אלפא-גו נגד פאן הוי, והג'ין לי, מזכ"ל הפדרציה הבינלאומית של גו, סבורים כי בעתיד, שחקני גו יקבלו עזרה ממחשבים כדי ללמוד מה הם עשו לא נכון במשחקים וכדי לשפר את הכישורים שלהם.

לאחר המשחק השני לי אמר שהוא מרגיש "ללא מילים": "כבר מההתחלה של המשחק, לא הצלחתי לקבל יתרון אפילו לא למהלך אחד. זה היה ניצחון מוחלט של AlphaGo." ^[53] לי התנצל על הפסדיו, ואמר לאחר המשחק השלישי ש"הערכתי לא נכון את היכולות של AlphaGo והרגשתי חסרי אונים. "^[34] הוא הדגיש כי התבוסה היא "תבוסתו של לי ס'דול ולא תבוסה של האנושות". ^[54]^[41] לי אמר שההפסד בסופו של דבר למכונה היה "בלתי נמנע" אך ציין כי "רובוטים לעולם לא יבינו את יופיו של המשחק באותה צורה שאנחנו בני האדם מבינים." לי כינה את ניצחונו במשחק ארבעה כ"זכייה יקרה מפז שלא הייתי מחליף בשום דבר".

מערכות דומות[עריכה]

פייסבוק גם עבדה על מערכת משלה שמשחקת גו שנקראת "יער אפל" (darkforest), שגם היא מבוססת על שילוב של למידת מכונה וחיפוש מונטה קרלו בעצים. ^[27] אף על פי שהמערכת של פייסבוק ניצחה תוכנות גו אחרות במחשב, נכון לתחילת 2016 היא עדיין לא ניצחה שחקן אנושי מקצועי. ^[55] יער אפל הפסידה לCrazy Stone וZen והוערכה להיות בעלת יכולות דומות.

DeepZenGo, מערכת שפותחה עם תמיכה מאתר שיתוף הווידיאו Dwango ומאוניברסיטת טוקיו, הפסידה 2–1 בנובמבר 2016 למאסטר ה- Go צ'ו צ'יקון, המחזיק בשיא המספר הגדול ביותר של זכיות גו ביפן. ^[56]^[57] en:Master (software) מאמר שפורסם ב-Nature ב-2018 ציין את גישתו של AlphaGo כבסיס לאמצעי חדש לחישוב מולקולות של תרופות פוטנציאליות. ^[58]

הערות שוליים[עריכה]

↑ שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.Timeline of AlphaGo - Timelines, timelines.issarice.com (בEnglish)
↑ שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.{{{מחבר}}}, Go ranks and ratings, Wikipedia, 2021-02-15
↑ שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.AlphaGo Movie, AlphaGo Movie (בEnglish)
↑ שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.Pete (Pete), AlphaZero Crushes Stockfish In New 1,000-Game Match, Chess.com (בen-US)
↑ שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.David Silver, Thomas Hubert, Julian Schrittwieser, Ioannis Antonoglou, A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play, Science 362, 2018-12-07, עמ' 1140–1144 doi: 10.1126/science.aar6404
↑ שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Mastering the game of Go with deep neural networks and tree search, Nature 529, 2016-01-01, עמ' 484–489 doi: 10.1038/nature16961
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.Zen computer Go program beats Takemiya Masaki with just 4 stones!, web.archive.org, ‏2016-02-01
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ ^27.0 ^27.1 ^27.2 שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.AlphaGo: Mastering the ancient game of Go with Machine Learning, Google AI Blog (בEnglish)
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "Citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "Citation/CS1" אינה קיימת.
↑ ^34.0 ^34.1 ^34.2 ^34.3 ^34.4 ^34.5 ^34.6 שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ ^38.0 ^38.1 שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ ^40.0 ^40.1 שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ ^41.0 ^41.1 שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת ציטוט: תג <ref> לא תקין; לא נכתב טקסט עבור הערות השוליים בשם goratings.org 2016
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת ציטוט: תג <ref> לא תקין; לא נכתב טקסט עבור הערות השוליים בשם koreatimes beatable
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.
↑ שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

This article "AlphaGo" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:AlphaGo. Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.

This page exists already on Wikipedia.

Facebook Page

🐤 Twitter Follow us on Twitter !

Read or create/edit this page in another language[עריכה]

AlphaGo in English

[1] שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.Timeline of AlphaGo - Timelines, timelines.issarice.com (בEnglish)

[2] שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.{{{מחבר}}}, Go ranks and ratings, Wikipedia, 2021-02-15

[3] שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.AlphaGo Movie, AlphaGo Movie (בEnglish)

[4] שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.Pete (Pete), AlphaZero Crushes Stockfish In New 1,000-Game Match, Chess.com (בen-US)

[5] שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.David Silver, Thomas Hubert, Julian Schrittwieser, Ioannis Antonoglou, A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play, Science 362, 2018-12-07, עמ' 1140–1144 doi: 10.1126/science.aar6404

[6] שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Mastering the game of Go with deep neural networks and tree search, Nature 529, 2016-01-01, עמ' 484–489 doi: 10.1038/nature16961

[7] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[8] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[9] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[10] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[11] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[AlphaGo_9-dan2-12] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[AlphaGo's_Designers_Explore_New_AI2-13] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[50_games2-14] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[Deepmind201710182-15] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[16] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[sina201712112-17] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[18] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[19] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[sina0524-20] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[21] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[22] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[sohu0524-23] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[Deepmind20171018-24] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[25] שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.Zen computer Go program beats Takemiya Masaki with just 4 stones!, web.archive.org, ‏2016-02-01

[googlego-26] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[:0-27] 27.0 ^27.1 ^27.2 שגיאת לואה ביחידה package.lua בשורה 80: module 'יחידה:PV-options' not found.AlphaGo: Mastering the ancient game of Go with Machine Learning, Google AI Blog (בEnglish)

[MetzWired20162-28] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[googlego2-29] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[30] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[:02-31] שגיאת תסריט: היחידה "Citation/CS1" אינה קיימת.

[pcworld_unusual2-32] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[33] שגיאת תסריט: היחידה "Citation/CS1" אינה קיימת.

[latimes_milestone-34] 34.0 ^34.1 ^34.2 ^34.3 ^34.4 ^34.5 ^34.6 שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[35] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[36] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[37] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[cbc_sweeps-38] 38.0 ^38.1 שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[39] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[phys.org_eye-40] 40.0 ^40.1 שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[phys.org_challenge-41] 41.0 ^41.1 שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[42] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[43] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[44] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[45] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[46] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[47] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[48] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[goratings.org_2016-49] שגיאת ציטוט: תג <ref> לא תקין; לא נכתב טקסט עבור הערות השוליים בשם goratings.org 2016

[telegraph_china-50] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[51] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[52] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[53] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[koreatimes_beatable-54] שגיאת ציטוט: תג <ref> לא תקין; לא נכתב טקסט עבור הערות השוליים בשם koreatimes beatable

[55] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[56] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[57] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[58] שגיאת תסריט: היחידה "citation/CS1" אינה קיימת.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]