ایان گراهام و آینده استفاده از داده در فوتبال
مصاحبه کننده: سایمون کوپر برای فاینشنال تایمز
طرح: لئونی وودز
ترجمه: بابک علیپور
لازم بذکر است این مصاحبه طبق اعلام وبسایت فاینشنال تایمز، بهطور خلاصه و برای شفافیت بیشتر ویرایش شده است.
ایان گراهام از سال ۲۰۱۲ تا ۲۰۲۳ مدیر تحقیقات ورزشی سابق باشگاه لیورپول بود که وظیفه داشت تحلیل دادهها را در سیاستهای نقل و انتقالاتی باشگاه به کار گیرد. در این دوره، این باشگاه در استفاده از دادهها پیشگام بود. گراهام که مدرک دکترای فیزیک از دانشگاه کمبریج را دارد اکنون مدیر اجرایی شرکت مشاوره ورزشی Ludonautics است که خود تأسیس کرده و مشتریان این شرکت شامل باشگاههای فوتبال نیز میشود. به بهانه کتاب جدید او، چگونه قهرمان لیگ برتر شویم، نویسنده و روزنامه نگار تحقیقی مشهور؛ سایمون کوپر با او به گفتگو نشسته تا در مورد چشم انداز استفاده از داده در تصمیمگیری های ورزشی گفتگو کند.
سایمون کوپر: ایان، باشگاههایی مثل برایتون، برنتفورد و لیورپولِ تحت مالکیت FSG از تحلیل دادهها سود بردهاند. اما در سایر باشگاههای لیگ برتری تعداد مدیرانی که از این روش پیروی می کنند خیلی کم است؛ در کتاب جدیدت که آن را خوانده ام و بسیار هم عالی است، نوشتهاید: «حتی امروز، اکثر باشگاههای لیگ برتری تحلیل دادهها را جدی نمیگیرند.» پس چرا اینطور است؟
ایان گراهام: این یک مشکل ساختاری و انسانی است. همه مالکان؛ که من حتی FSG را هم شامل آن میدانم، میگویند: «همین که از در باشگاه وارد شدیم، کارها را بهشکل حرفهای انجام میدهیم» ولی گفتن این جمله با اینکه دستوراتم واقعاً اجرا شود، دو چیز کاملاً متفاوت است. خیلی از افراد زیردست یا بالادست شما چنین بینش و اعتمادی به استفاده از داده ندارند، بهویژه در یک ورزش محافظهکاری مثل فوتبال. میدانی راحتترین راه برای گرفتن یک شغل جدید در فوتبال، این است که در حد متوسط باقی بمانی. مدیر متوسط باشی، بازیکن متوسط باشی، مربی متوسط باشی و چیزهایی شبیه به این. البته این روش در سطوح بالای فوتبال جواب نمیدهد، اما بیشتر افراد هم در آن سطوح نیستند. به عنوان یک مالک، مربی یا بازیکن اگر ریسکی بکنی و کاری متفاوت انجام دهی و در نهایت شکست بخوری، داغ آن شکست تا آخر عمر به پیشانیات خواهد چسبید. ولی اوضاع در حال تغییر است. نسل جدید مدیران و مربیان فوتبال، در حال پذیرش این دیدگاه به شکل متفاوتی از نسل قدیمیتر خودشان هستند.
کوپر: پس استفاده از دادهها در حال گسترش است؟
گراهام: خیلی کُندتر از چیزی است که از بیرون به نظر میرسد، چون مردم معمولاً علاقه دارند خود را باهوشتر از آنچه هستند نشان دهند و در مسائلی که مطرح می کنند اغراق کنند. تحلیلگران داده، اطلاعات زیادی دارند، حتی آدمهای متخصصی دارند که آنها را تحلیل کنند، اما این تحلیلها لزوماً تصمیمگیری را هدایت نمیکند. واقعاً مقدار زیادی میوهی دمدستی وجود دارد که اصلاً چیده نمیشود. بیشتر باشگاهها هنوز در انتقال بازیکنان، تحلیلهای پایهای را هم انجام نمیدهند. نه اینکه تحلیل پیچیدهای بخواهیم؛ بلکه حتی تحلیلهای ساده هم انجام نمیشود.
کوپر: کمی گیج شدم چون دو روایت متفاوت توی حرفهات بود؛ یکی اینکه فوتبال دارد باهوشتر میشود، و یکی دیگر اینکه هنوز مقاومت در برابر تغییر وجود دارد.
گراهام:بله، چون هر دو روایت درستاند. با تمام انتقادهایی که از روند کُند پذیرش تحلیل داده در لیگ برتر دارم، باز هم این لیگ در مقایسه با بقیه دنیا، عملکرد بهتری دارد. اسپانیا بهویژه بسیار کُند و سنتی عمل میکند. در خود لیگ برتر، این تغییر تقریباً در نیمهی راه است. مثلاً منچستریونایتد هنوز به این سمت نرفته. چلسی هم چون قبلاً با آن روش کار نمیکرده، حالا درگیر مشکلات تغییر است. وقتی من در لیورپول شروع به کار کردم، واقعاً فقط لیورپول بود که این کار را میکرد. آرسنال هم پشتصحنه مشغول بود، ولی تأثیر محسوسی نداشتند.
کوپر: برداشت خود من این است که هنوز به نظر میرسد که بیشتر باشگاهها اهمیت بیشتری برای انتخاب سرمربی قائلاند تا استفاده از دادهها.
گراهام: در ایتالیا و اسپانیا، رویکرد سنتی مربیمحور هنوز رایج است و تیمهای آنها هم در بازی های اروپایی عملکرد خوبی دارند. در این رویکرد همهچیز حول مربی و تاکتیک او میچرخد و اینطور فرض میشود که این تنها عامل پیروزی در بازی است. اما تعداد مربیانی که واقعاً تفاوت ایجاد میکنند، محدود است. این دیدگاه یعنی همه تخممرغها را در سبد مربی میگذاری، دقیقاً مثل انتقالهایی است که شکست میخورند، میتوانی با انتخاب مربی هم همین اشتباه را بکنی. مثلاً بگویی «ما میخواهیم گواردیولای بعدی را استخدام کنیم»، ولی واقعاً احتمال موفقیت چقدر است؟ اصلاً گواردیولای بعدی آن بیرون وجود دارد؟
اگر مربی تصمیمگیر اصلی در جذب بازیکن باشد، آن هم محدودیت های خاص خودش را دارد. مربی هفتهای دو بازی دارد و وقتی برای بررسی و جذب بازیکنان دیگر تیم ها برایش باقی نمی ماند. مثال واضحش خریدهای اریک تنهاگ در منچستریونایتد است؛ او بازیکنان زیادی از لیگ هلند را جذب کرد، چون آنها را میشناخت. بازیکنان خوبی هم بودند، اما نه برای سطح یک باشگاه لیگ برتری.
کوپر: بهطور سنتی، باشگاههای فوتبال بهصورت خودکامه اداره میشوند؛ یا مربی همهچیز را تصمیم میگیرد، یا مالک باشگاه، که معمولاً هر دو بر اساس احساسات تصمیم میگیرند، نه داده. ولی در لیورپول و برنتفورد، کمیتههایی برای تصمیمگیری در نقلوانتقالات وجود دارد. آیا فوتبال بهسمت یک نوع خرد جمعی دموکراتیک حرکت میکند؟
گراهام: مالکان همیشه دوست دارند خودشان دخالت کنند و تصمیمی خارج از چارچوب بگیرند. مثلاً میگویند: «فایدهاش چیست که من صاحب باشگاه هستم، ولی نمی توانم بازیکن مورد علاقهام را بخرم و مجبور باشم به چیزی که یک فایل اکسل میگوید گوش کنم؟» فکر میکنم مدل مربیِ دیکتاتور بیشتر خاص انگلستان است و دارد منقرض می شود. پس بله، احتمالا الان بیشتر داریم به سمت «خرد جمعی» حرکت میکنیم.
کوپر: با این حال، به نظر میرسید که یورگن کلوپ، سرمربی سابق لیورپول، در پایان دورانش آنقدر قدرت پیدا کرده بود که شخصاً تصمیمگیر اصلی شده بود.
گراهام: یورگن موفقیت زیادی برای باشگاه بههمراه آورد، پس طبیعی بود که مسیر به آن سمت برود. داستان معروفی است که من و همکارانم بودیم که یورگن را در سال ۲۰۱۷ متقاعد کردیم به جای یولین برانت، محمد صلاح را بخرد. در سال ۲۰۲۲ هم، او داروین نونیز را (با مبلغ ۷۰ میلیون پوند بهاضافه بندهای متغیر) به جای الکساندر ایساک انتخاب کرد. البته هر دو بازیکن جزو بهترین مهاجمان جوان اروپا و بخشی از لیست سه نفره ای بودند که تیم دیتای باشگاه آنها را شناسایی کرده بود. نفر اول آن لیست [ارلینگ] هالند، قرار بود به سیتی برود و از توان مالی ما خارج بود. یورگن نیز برخلاف نظر تیم ما، نونیز را ترجیح داد. البته بیانصافی است بگویم «اشتباه کرد که تصمیم را خودش گرفت»، وقتی قبلاً بارها نظر ما را پذیرفته بود. حتی در مورد نونیز هم، ما یکی از بهترین مهاجمان جوان اروپا را جذب کردیم و فراموش نکنید اون در لیست ما نفر سوم بود.
کوپر: حدود بیست سال است که باشگاهها دادههای رویدادی[1] دارند که اقدامات بازیکن روی توپ را اندازهگیری میکند؛ مانند پاس، شوت، تکل. اما حالا دادههای ردیابی[2] را هم داریم که حرکت بازیکنان را هم در زمین اندازهگیری میکند. این دادهها چه دیدگاه جدیدی ارائه میدهند؟
گراهام :از سال ۲۰۱۶ به بعد، دادههای ردیابی با کیفیت ۲۵ فریم در ثانیه برای ۲۲ بازیکن فراهم شد. استخراج یک بینش صحیح از این دادهها به منابعی در سطح بسیار بالاتر نیاز دارد. اینجا مرز پیشرفت است. سطح بعدی این است که بهجای یک نقطه برای هر بازیکن، ۲۹ نقطه برای هر بازیکن در هر فریم داشته باشیم؛ یعنی موقعیت همه مفاصل بدن، چشمها، بخشهایی از سر و غیره. این یعنی میتوانیم ببینیم که یک بازیکن در حال پریدن است، دیگری در حال شوت زدن است، یا یکی دارد پشت سرش را نگاه میکند. این اطلاعات در حال حاضر از دادههای ردیابی بهدست نمیآید. تقریباً هیچ باشگاهی منابع لازم برای استفاده از چنین دادهای را ندارد.
کوپر: آیا دادههای ردیابی میتوانند به ارزیابی بهتر بازیکنان دفاعی، که بیشتر فعالیتشان بدون توپ است، کمک کنند؟ و این باعث افزایش قیمتشان بشود؟
گراهام: سختترین پُست برای تحلیل، مدافع میانی است. چون آنها بیشتر زمان بازی را بدون توپ سر می کنند. برای مثال، ابراهیما کوناته که از لایپزیش به لیورپول آمد، در مدل داده های ردیابی ما امتیاز بسیار بالاتری نسبت به داده های رویدادی داشت. چرا؟ چون سبک بازی لایپزیش خیلی هجومی بود و او باید پنج بار در هر بازی نصف زمین را برای تیم دفاع می کرد. مدل رویدادی میگفت: «کوناته منشأ تهدیدات زیادی است» اما مدل ردیابی میگفت: «او تنها بازیکنی است که در آن منطقه برای دفاع حضور دارد». دادههای ردیابی درک عمیقتری از عملکرد بازیکن و تصمیمگیریهایش میدهد. میتوانیم بپرسیم: «آیا این بازیکن دائماً بهترین گزینه را انتخاب میکند؟» دادههای رویدادی گزینههای دیگر را نمیبیند، اما دادههای ردیابی دقیقاً نشان میدهد بازیکن چه گزینههایی در مقابل خود داشته است و کدام را انتخاب کرده است.
کوپر: برویم سمت موضوع روز؛ هوش مصنوعی، چطور ممکن است که هوش مصنوعی تحلیل دادهها را تغییر دهد؟
گراهام: تصور عمومی این است که «من همهی این دادهها را وارد مدل هوش مصنوعی میکنم و مدل من، لیونل مسی بعدی را شناسایی میکند.» چنین چیزی امکان پذیر نیست. جایی که هوش مصنوعی تفاوت ایجاد میکند، قطعا در جمعآوری دادههاست. دادههای ردیابی از الگوریتمهای بینایی کامپیوتری استفاده میکنند که در واقع الگوریتمهای هوش مصنوعی هستند. ما یک مقاله با دیپمایند (موسسه تحقیقاتی هوش مصنوعی شرکت آلفابت گوگل) نوشتیم که در آن پیشبینی میکردیم بازیکنان در ۱۰ ثانیه آینده کجا خواهند دوید. برای ۱۰ تا ۱۵ ثانیه بعد از پاس یا چالش بین دو بازیکن، این پیشبینیها خیلی دقیق هستند. این را هم بگویم من هوش مصنوعی را دوست ندارم چون یک نوع «جعبه سیاه» است. پیشرفتهایی داشته، اما هنوز برای توضیح دادن دلایل خود به شما مشکل دارد. وقتی مدلهای داده ردیابی را میبینید، معمولاً با یک مدل ساده شروع میکنید که اگر از من بپرسید: «چرا مدل شما اینطور میگوید؟»، میتوانم تک تک بخشها را تجزیه و تحلیل کنم و توضیح بدهم که «چرا» اینطور است. اما این مدلها سادهسازی شدهاند چون فوتبال بازی پیچیدهای است. هدف ما این است که آن بخشهای سادهسازی شده را حذف کنیم، مدلهای هوش مصنوعی پیچیدهتری را وارد کنیم که توضیح دادنشان سختتر است، اما میتوانیم تفاوتهایی که این مدلها ایجاد میکنند، ببینیم. میتوانیم بفهمیم مدل ما چه چیزی را از دست داده و هوش مصنوعی در پیشبینی چه چیزی بهتر است.
کوپر: چه سوالاتی ممکن است که یک تحلیلگر باشگاه دو سال دیگر از هوش مصنوعی بپرسد؟
گراهام: یکی از بزرگترین مشکلات این است که بگوییم: «این بازیکن در سیستم تیم ما چطور عمل خواهد کرد؟» میتوانی از مدلهای ساده استفاده کنی که بررسی کنی این بازیکن در تیم فعلی چقدر به توپ میرسد، یا در تیم ما چقدر فرصت به دست میآورد. هوش مصنوعی احتمالاً میتواند جواب بهتری نسبت به مدلهای دستی بدهد.
کوپر: بنابراین، بهطور نظری، هوش مصنوعی میتواند کمک کند تا مشخص شود یک بازیکن که در تیم لیل بازی میکند، در تیمی مثل منچسترسیتی چه عملکردی خواهد داشت؟
گراهام: بله، البته ما همین الان هم تلاش میکنیم این کار را انجام دهیم، اما هوش مصنوعی میتواند جواب دقیقتری برای این سوال بدهد.
کوپر: چه تغییراتی را در استفاده از دادهها برای جذب بازیکن و شکلدهی به تاکتیکها در آینده انتظار دارید؟
گراهام: جذب بازیکن مهمترین کاری است که باشگاهها انجام میدهند، بنابراین درست انجام دادن آن مهمترین اولویت است. وقتی من در لیورپول بودم، تأثیرگذارترین کاری که میتوانستی انجام دهی این بود که بازیکنان خوب بخری و امیدوار باشی که آنها در زمین تأثیر بگذارند، چون مربیان در زمینه تاکتیکها متخصص هستند. در آن زمان، تغییر دادن تاکتیکها خیلی سخت بود. اما امروز، نسل جدیدی از تحلیلگران و مربیان این سوال را مطرح میکنند: «شما میتوانید درباره جذب بازیکن حرف بزنید، چرا نمیتوانید به من بگویید درباره بازیام چه فکر میکنید؟ بگویید کجا در موقعیتم اشتباه کردهام.» جالب بود که با یک مدافع صحبت میکردم. او گفت: «حتی اگر اشتباه بگویید، برای من جالب است که چطور به بازی من نگاه میکنید. من علاقهمند به انتقال بعدیام هستم. چه چیزی باعث میشود که من در نظر تحلیلگران داده خوب یا بد به نظر بیایم؟»
کوپر: به عنوان آخرین سئوال، کدام نوع داده که الان در دسترس نیست، دوست دارید در آینده برای بازیکنان جمعآوری شود؟
گراهام: بخش روانی بازی خیلی مهم است و اندازهگیری آن بسیار سخت است. خب، شما میتوانید دادههایی را از رسانههای اجتماعی بازیکنان و مصاحبهها و غیره جمعآوری کنید. شاید بتوانید نشانههایی پیدا کنید یا تفاوتهایی در صحبتهایشان پیدا کنید؛ مثلاً اگر همیشه مثبت حرف میزدند، حالا کمی کمتر مثبت شوند. جمعآوری دادههای بزرگ و پیچیدهای مانند زبان بدن و حالات صورت در مصاحبهها کار سختی است، اما دقیقاً همان چیزی است که هوش مصنوعی در آن قوی است. ما این ایده را به دیپمایند ارائه دادیم، اما آنها تصمیم گرفتند که آن را انجام ندهند. فکر میکنم به دلایل اخلاقی یا حفط حریم خصوصی افراد بوده است. بهطور کلی، بحث اخلاقی مطرح میشود: آیا باید این کار را انجام داد؟ من میفهمم که چرا آنها از این کار دست کشیدند.