הדוגמה הבולטת ביותר באחרונה היא מאמר שבו מככבים הארי, הרמיוני ורון וכותרתו: "מי זה הארי פוטר?". המאמר שופך אור על טכניקה חדשה המסייעת למודל שפה גדול לשכוח מידע באופן בררני. זו משימה בעלת חשיבות עליונה בתעשייה הבינה המלאכותית: מודלים גדולים של שפה, המניעים בינה מלאכותית גנרטיבית, בנויים על כמויות אדירות של נתונים מקוונים, כולל חומר המוגן בזכויות יוצרים ותוכן בעייתי אחר. מצב זה הוביל לתביעות ולביקורת ציבורית על כמה חברות בינה מלאכותית.
מחברי המאמר, אנשי מיקרוסופט מארק רוסינוביץ' ורונן אלדן, טענו כי הוכיחו שניתן לשנות או לערוך מודלים של בינה מלאכותית כדי להסיר כל ידע על קיומם של ספרי הארי פוטר, כולל דמויות ועלילות, מבלי להקריב את יכולת קבלת ההחלטות, היצירה והניתוח הכוללת של מערכת הבינה המלאכותית.
לדברי צמד החוקרים, הם בחרו בספרים אלה בגלל מעמדם וחשיפתם הציבורית. "האמנו שלאנשים בקהילת המחקר יהיה קל יותר להעריך את המודל הנובע מהטכניקה שלנו, וכך לאשר בעצמם שהתוכן אכן 'לא נלמד'", אמר רוסינוביץ', "כמעט כל אחד יכול להמציא הנחיות למודל שיבדוק אם הוא 'מכיר' את הספרים או לא. אפילו אנשים שלא קראו את הספרים יהיו מודעים למרכיבי עלילה ודמויות".
במחקר אחר, חוקרים מאוניברסיטת וושינגטון בסיאטל, אוניברסיטת קליפורניה בברקלי וממכון אלן לבינה מלאכותית פיתחו מודל שפה חדש בשם "סילו", שיכול להסיר נתונים כדי להפחית סיכונים משפטיים. עם זאת, ביצועי המודל ירדו משמעותית אם הוכשר רק על טקסט בסיכון נמוך, כגון ספרים שאינם מוגנים בזכויות יוצרים או מסמכים ממשלתיים – כך כתבו מחברי המאמר, שפורסם מוקדם יותר השנה.
החוקרים השתמשו בספרי הארי פוטר כדי לראות אם קטעי טקסט בודדים משפיעים על הביצועים של מערכת בינה מלאכותית. הם יצרו שני מאגרי מידע, או אוספים של אתרים ומסמכים. הראשון כלל את כל הספרים שפורסמו בסדרה, מלבד ספר הארי פוטר הראשון; האחר כלל את כל הספרים בסדרה מלבד השני, וכן הלאה. "כאשר ספרי הארי פוטר מוסרים ממחסן הנתונים, הבלבול הולך ומחמיר", אמרו החוקרים ביחס למדד הדיוק של הבינה המלאכותית.
מחקרי בינה מלאכותית משתמשים בהארי פוטר כבר עשור לפחות, אבל הנוהג הפך נפוץ יותר ככל שאקדמאים וטכנולוגים התמקדו בכלי בינה מלאכותית שיכולים לעבד ולהגיב לשפה טבעית עם תשובות רלוונטיות.
עם הארי פוטר, "שפע הסצנות, השיחות והרגעים הרגשיים הופכים אותו לרלוונטי מאוד לתחום הפרטני של עיבוד שפה טבעית", הסבירה ליילה והבה, חוקרת מאוניברסיטת קרנגי מלון, שניהלה מערך ניסויים בשנת 2014 שאספו נתונים של סריקת מוח ב־MRI, שבוצעה על אנשים בעת שקראו ספרי הארי פוטר כדי להבין טוב יותר את מנגנוני השפה. ב־arXiv, מאגר מחקר מדעי בגישה פתוחה, המאמרים כוללים גם מחקרים על "למידת מכונה לפיתוח שיקויים בהוגוורטס", "מודלים גדולים של שפה פוגשים את הארי פוטר", ו"זיהוי לחשים בספרות פנטזיה עם בינה מלאכותית".
גם כאשר הוא לא מהווה מרכיב מרכזי במחקר, הארי פוטר בכל זאת מועדף על חוקרים. מחקר אחד, למשל, השתמש בכתביה של רולינג כדי לבדוק את הביצועים של מערכות בינה מלאכותית כמו אלה שהולידו את הצ'אטבוט ChatGPT, נושא שעורר לאחרונה סערה.
טרנס סיינובסקי, המנהל את המעבדה לנוירוביולוגיה חישובית במכון סאלק למחקרים ביולוגיים, טען במאמר שבוטים רק משקפים את התבונה וההטיות של המשתמשים שלהם, כמו המראה של מראת ינפתא בספר הראשון של הארי פוטר, המשקפת בחזרה לאדם את כל רצונותיו: "הארי פוטר אהוד בקרב חוקרים צעירים יותר", אמר והבי, "הם היו קוראים את הספרים כילדים או מתבגרים, וכך חושבים עליהם בבחירת קורפוס טקסטואלי כתוב או מדובר".